Cerebras 紹介
Cerebras Systemsは、AIトレーニングと推論ワークロードを加速するために設計された世界最大かつ最速のAIプロセッサーであるWafer Scale Engine (WSE)を構築する先駆的なAIコンピューティング会社です。
もっと見るCerebrasとは
2015年に設立されたCerebras Systemsは、サニーベールに本社を置くアメリカの人工知能会社で、サンディエゴ、トロント、バンガロールにオフィスがあります。同社は、複雑な深層学習アプリケーション向けの革命的なウエハースケールコンピューターチップとAIシステムの開発を専門としています。彼らの主力製品であるCerebras Wafer Scale Engine (WSE)は、直径がディナープレートほどの大きさで、1.2兆個以上のトランジスタを含む、これまでに作られた中で最大のコンピューターチップです。同社は最近IPOを申請し、40億ドル以上の評価を受けており、AIハードウェア市場における重要な地位を示しています。
Cerebrasはどのように機能しますか?
Cerebrasの技術は、計算、メモリ、インターコネクトファブリックを1つの巨大なチップに統合したWafer Scale Engine (WSE)とCSシステムを中心に展開されています。データをメモリと計算コアの間で移動させるのに苦労する従来のGPUとは異なり、Cerebrasのアーキテクチャはすべてのモデル層をチップ上に直接保存し、はるかに高速な処理を可能にします。最新のWSE-3チップは125ペタフロップスの計算能力を提供し、44GBのオンチップSRAMメモリと21PB/sの帯域幅を備えています。Cerebras Inferenceサービスを通じて、彼らはAPIを介して技術へのアクセスを提供し、開発者がMetaのLLaMA 3.1のようなAIモデルを秒間最大2,100トークンの速度で実行できるようにします - GPUベースのソリューションよりも大幅に高速です。
Cerebrasの利点
Cerebrasのソリューションは、いくつかの重要な利点を提供します:GPUベースの代替品と比較して最大20倍の高速性能を提供し、消費電力はわずか1/6です;推論のために16ビットドメインに留まることで最先端の精度を維持します;モデル全体が1つのチップに収まるため、分散コンピューティングの複雑さを排除します;そして、推論コストが従来のクラウドプラットフォームの3分の1と報告されているコスト効果の高いソリューションを提供します。これらの利点は、特に医療、エネルギー、科学計算などの分野でリアルタイムまたは高ボリュームのAIアプリケーションに取り組む開発者にとって非常に魅力的です。
もっと見る