Sinovation VenturesとCE0の会長であるKai-Fu Lee氏が設立した大規模模型会社「Zero One Everything」が製作した大型モデルで、Yi-6BとYi-34Bの2つのバージョンがあります。
Hugging Face EnglishオープンソースコミュニティプラットフォームとC-Chinese評価リストによると、Yi-34Bは発売時に多くのSOTA国際ベストパフォーマンスインデックスの認定を達成し、LLaMA2やFalconなどのオープンソース競合他社を打ち負かし、グローバルなオープンソース大規模モデルの「ダブルチャンピオン」となった。
この件を受けて、機械の心臓部も0と1の事を検証しました。 Zero One Thingは次のように答えた。
GPTは業界で認められている確立されたアーキテクチャであり、LLaMAはそれをGPTにまとめています。 R&Dモデルの構造設計は、GPTの成熟した構造に基づいており、業界トップの公開実績に基づいており、モデルの理解とZero One Everythingチームによるトレーニングに基づいて多くの作業が行われており、これが最初のリリースと優れた結果の基礎の1つです。 同時に、Zero One Everythingは、モデルの構造レベルでの本質的なブレークスルーの探求も続けています。
LLaMAに基づいているが、テンソル名を変更したことで、Kai-Fu Leeの大規模モデルが論争を巻き起こし、公式の回答が来た
出典: Heart of the Machine
少し前に、オープンソースの大規模モデルの分野で新しいモデルが登場しました - コンテキストウィンドウのサイズは200kを超え、一度に400,000文字の漢字を処理できる「Yi」。
Sinovation VenturesとCE0の会長であるKai-Fu Lee氏が設立した大規模模型会社「Zero One Everything」が製作した大型モデルで、Yi-6BとYi-34Bの2つのバージョンがあります。
Hugging Face EnglishオープンソースコミュニティプラットフォームとC-Chinese評価リストによると、Yi-34Bは発売時に多くのSOTA国際ベストパフォーマンスインデックスの認定を達成し、LLaMA2やFalconなどのオープンソース競合他社を打ち負かし、グローバルなオープンソース大規模モデルの「ダブルチャンピオン」となった。
しかし、最近、一部の研究者は、Yi-34Bモデルが基本的にLLaMAのアーキテクチャを採用しているが、2つのテンソルの名前を変更していることを発見しました。
投稿には次のようにも書かれています。
そして数日前、Zero One Everything Huggingfaceコミュニティで、開発者も次のように指摘しました。
これを見ると、数日前にアリを去ってビジネスを始めた賈陽慶が友人の輪の中で言及した会社もわかります。