4 月 16 日、Create 2024 Baidu AI Developer Conference が深センで開催され、Baidu の創設者、会長兼 CEO の Robin Li 氏が「誰もが開発者である」というテーマで基調講演を行い、もはやコーディング スキルの世界に限定されない世界について説明しました。自然言語を媒体として誰もが創作に参加できる時代。
Baidu の Wenxin Large Model 4.0 ツール バージョンのリリースにより、Robin Li 氏が説明したビジョンが現実に大きく近づきました。このツールを使用すると、開発者は自然言語対話を通じて複雑なデータやファイルを処理できるだけでなく、チャートやファイルを生成してデータの特性を迅速に把握し、変化する傾向を分析し、その後の意思決定に効率的かつ正確なサポートを提供することもできます。 。
同時に、ロビン・リー氏は基調講演で、エージェント開発ツール「AgentBuilder」、AIネイティブアプリケーション開発ツール「AppBuilder」、モデルカスタマイズツール「ModelBuilder」の3つの主要な開発ツールを発表した。これらのツールにより開発の敷居が大幅に下がり、開発者はわずか数ステップで強力で使いやすく便利な AI アプリケーションを作成できるようになりました。
画像出典:百度
Robin Li 氏は、「インテリジェント エージェントは、将来的にはすべての人にとって大規模なモデルを使用する最も近い、最も主流の方法になる可能性があります。強力な基本モデルに基づいて、インテリジェント エージェントをバッチで生成し、さまざまなシナリオに適用できます。Baidu は Wenxin をアップグレードしたばかりです」と指摘しました。インテリジェンス これまでに 30,000 人以上のエージェントが作成され、50,000 人以上の開発者と数万の企業がそこに定着しました。」
Robin Li 氏の見解では、将来のアプリケーション開発は、短いビデオを撮影するのと同じくらい簡単になるでしょう。誰もが開発者になる可能性があり、誰もがクリエイターです。 「今日では、コードの書き方を知らなくてもアプリケーションを作成でき、プログラミングをしなくてもインテリジェント エージェントを作成できます。AI は創造性の革命を引き起こしています。将来的には、アプリケーションの開発は短いビデオを作成するのと同じくらい簡単になるでしょう。私たちは皆開発者であり、誰もがクリエイターです。」
ロビン・リー氏はスピーチの中で、バイドゥが AI ネイティブ アプリケーションを開発するために過去 1 年間に実装した具体的なアイデアとツールを共有しました。同氏は、「大規模な言語モデル自体が直接価値を生み出すわけではありません。大規模なモデルに基づいて開発された AI アプリケーションのみが、実際の市場のニーズを満たすことができます。今日私が皆さんと共有したいのは、大規模な言語モデルに基づいて AI ネイティブ アプリケーションを開発するためのいくつかの具体的なアイデアとツールです」これは、Baidu が過去 1 年間の実践に基づいて、数え切れないほどの落とし穴を乗り越え、高い授業料を支払ったことで得たものです。」
以下は、Geek Park によって編集された、「Everyone is a Developer」に関する Robin Li の基調講演の書き起こしです。
皆さんこんにちは。Create 2024 Baidu AI Developer Conference へようこそ。Create カンファレンスが広東・香港・マカオ大湾区で開催されるのは今回が初めてです。今日のイベントには 5,000 人以上の開発者とテクノロジー愛好家が集まりました。
過去 1 年間、私は多くの起業家や開発者とコミュニケーションをとってきましたが、誰もが「FOMO」(逃すことへの恐怖)の状態にあると感じました。彼らは楽しみながらも、逃すことを恐れています。実際、大規模モデルと生成 AI は開発者コミュニティを完全に変えるでしょう。
ここ数か月で、Wenxin Big Model はコード生成、コード解釈、コード最適化などの一般的な機能においてさらに大幅な改善を達成し、国際トップレベルに達しました。
本日、Wenxin Big Model 4.0 のツール バージョンを正式にリリースしました。このツール バージョンでは、自然言語インタラクションを通じて、複雑なデータやファイルを処理および分析したり、チャートやファイルを生成したりすることができます。ファイルは、データの特性を迅速に洞察し、変化する傾向を分析し、その後の意思決定に効率的かつ正確なサポートを提供できます。
Wenxin 大型モデルは、中国で最も主導的で最も広く使用されている AI 基本モデルとなっています。
Baidu はチップ、フレームワーク、モデル、アプリケーションの 4 層アーキテクチャでフルスタック レイアウトを採用しているため、推論コストを 1% に削減しながらパフォーマンスを向上させることができ、エンドツーエンドの最適化を通じてコストを削減し続けています。これにより、より多くの人が大規模なモデルを使用して AI アプリケーションを効率的かつ低コストで作成できるようになります。
2024年も大型モデルに関する話題が引き続きホットであることは間違いなく、さまざまな技術的ブレークスルーが次々と生まれてくるでしょう。メディアは今後も「ショックリリース」や「壮大なアップデート」などのタイトルを使ってそれを表現することに熱心になるだろう。ただし、私が強調したいのは、大規模モデル自体が直接価値を生み出すわけではないということです。大規模モデルに基づいて開発された AI アプリケーションのみが、真の市場ニーズを満たすことができます。
AI ネイティブ アプリケーションを開発するための具体的なアイデアとツールを共有します。「私は数え切れないほどの落とし穴を踏み、高い授業料を払ってきました。」
今日皆さんと共有したいのは、大規模モデルに基づいて AI ネイティブ アプリケーションを開発するための具体的なアイデアとツールです。これは、Baidu がこの 1 年間、無数の落とし穴を踏み、高額な授業料を払いながら実践してきた成果です。
基本的なエージェントのみが必要な場合、プラットフォームは自動的に充填を完了します。ただし、「シンガポール観光局」はプロのインテリジェントエージェントであることを期待しているため、高度な設定が必要です。シンガポール百科事典の項目や公式 Web サイトのリンクをナレッジ ベースに追加し、毎日更新することができます。次に、ホテルの問い合わせ、アトラクションのチケット購入などのツールを追加して、サービス機能を強化します。現在、Ctripと協力してホテル、観光スポット、チケット販売などの旅行サービスツールを提供しています。このようにして、シンガポール観光局のインテリジェント エージェントが準備され、さらにプレビューおよび調整できるようになります。
Kai Tak Educationでは、このエージェントがビジネスと学生を理解する留学コンサルタントであることを期待しています。アメリカに行きたいのかオーストラリアに行きたいのか、修士号が欲しいのか学士号が欲しいのか、IELTSやTOEFLのスコアは何点なのかなど、学生のさまざまな状況に基づいて専門的に分析し、正確な回答を与えることができます。等知識、役割、ツールなどのいくつかのモジュールを追加することで、より高度なインテリジェント エージェントを作成できます。
知識モジュールでは、プライベートドメインの知識をアップロードし、プラットフォームがリアルタイムで分析し、対話資料を自動的に生成します。役割モジュールでは、ビジネス範囲外の留学国をフィルタリングスキームに追加します。これにより、改善が可能になります。ツールモジュールにおけるユーザーヒントの効率化、店舗への予約などのサービスの追加。これらの簡単な操作により、専門的な機能を備えた Qi Tak 教育用インテリジェント エージェントが完成します。
百度ライブラリを開き、「周楚三悪を滅ぼす」というトピックを入力してください。これは、「晋の書」と「史書新友」に書かれているもので、ライブラリを検索した後、元のテキストに基づいてストーリーを生成することもできます。ストーリーの内容を変更し、右側の AI ツールバーをクリックして、このコミックの作成を開始します。
私は今、Xiaodu に簡単なニュースの問い合わせから複雑なスケジュールのニーズまで、いくつかの質問をしました。同じXiaoduと通信しているように見えますが、実際にはその裏では別のモデルが呼び出されています。私の質問を受け取ると、最初に小規模モデル ERNIE Tiny で「モデル ルーティング」作業を実行し、気象問題については、気象クエリの結果に基づいて ERNIE Lite に基づいて微調整されたモデルを呼び出しました。 SFT の ERNIE Lite によって処理され、服装の提案が提供されます。より複雑なスケジュールの場合は、最高のパフォーマンスを誇る大型モデルである Wenxin 4.0 を使用して、今夜から明日の朝までのさまざまな手配が計算されます。
現在、Xiaodu が行うすべての質問は、実行のためにさまざまなモデルに割り当てられます。アプリケーションの API インターフェイスを呼び出すときは、ERNIE Functions モデルが使用され、子供たちに質問を説明するときは、Wenxin Big Model 3.5 または 4.0 が使用されます。インテリジェント アシスタントは、キャラクターの一貫性を向上させ、ユーザーのチャットへの欲求を刺激するために、ERNIE キャラクター モデルを使用して構築されました。
この大規模モデルと小規模モデルの組み合わせたスケジューリング方法により、Xiaodu は「頭脳置換作戦」を成功裡に完了し、新しい AI ネイティブ オペレーティング システム DuerOS X をインストールしただけでなく、他のすべてのモデルと比較して、効果、速度、コストの最適な組み合わせを形成しました。 Wenxin大型モデルのフラッグシップバージョンで、応答速度は2倍に向上し、コストは99%削減されます。私が今話していた Xiaodu Tiantian AI タブレット ロボットは、昨日すべての主要プラットフォームで発売されました。興味のある友人はすぐに注文して体験することができます。
中国の起業家や開発者は、新しいテクノロジーを使用してアプリケーションを開発するのが非常に上手です。私は、Wenxin Big Model が中国の AI 起業家や開発者にとっての最初の選択肢となり、Wenxin Big Model に基づいて構築されるアプリケーションがますます増えていくと信じています。また、より多くの起業家や開発者が私たちに参加して、豊かな AI エコシステムを構築してくれることを楽しみにしています。
私はまったく異なる判断をしています。大規模ビジュアル モデルの最大の応用シナリオは自動運転です。 Baidu はこの分野で最高であり、自動運転の世界的リーダーです。私たちは AI にビデオを生成する方法を訓練するだけでなく、現実世界で何が起こっているかを理解し、未来を予測するよう AI を訓練します。
Baidu AI 開発者カンファレンスでの Robin Li のスピーチ: 数え切れないほどの落とし穴を踏んだ後、Baidu は何を知っていたのでしょうか?
作者: リアン・ラン
編集者: 鄭玄
出典: ギークパーク
「自然言語は次世代のプログラミング言語となり、誰もが開発者になれるでしょう。」
4 月 16 日、Create 2024 Baidu AI Developer Conference が深センで開催され、Baidu の創設者、会長兼 CEO の Robin Li 氏が「誰もが開発者である」というテーマで基調講演を行い、もはやコーディング スキルの世界に限定されない世界について説明しました。自然言語を媒体として誰もが創作に参加できる時代。
Baidu の Wenxin Large Model 4.0 ツール バージョンのリリースにより、Robin Li 氏が説明したビジョンが現実に大きく近づきました。このツールを使用すると、開発者は自然言語対話を通じて複雑なデータやファイルを処理できるだけでなく、チャートやファイルを生成してデータの特性を迅速に把握し、変化する傾向を分析し、その後の意思決定に効率的かつ正確なサポートを提供することもできます。 。
同時に、ロビン・リー氏は基調講演で、エージェント開発ツール「AgentBuilder」、AIネイティブアプリケーション開発ツール「AppBuilder」、モデルカスタマイズツール「ModelBuilder」の3つの主要な開発ツールを発表した。これらのツールにより開発の敷居が大幅に下がり、開発者はわずか数ステップで強力で使いやすく便利な AI アプリケーションを作成できるようになりました。
画像出典:百度
Robin Li 氏は、「インテリジェント エージェントは、将来的にはすべての人にとって大規模なモデルを使用する最も近い、最も主流の方法になる可能性があります。強力な基本モデルに基づいて、インテリジェント エージェントをバッチで生成し、さまざまなシナリオに適用できます。Baidu は Wenxin をアップグレードしたばかりです」と指摘しました。インテリジェンス これまでに 30,000 人以上のエージェントが作成され、50,000 人以上の開発者と数万の企業がそこに定着しました。」
Robin Li 氏の見解では、将来のアプリケーション開発は、短いビデオを撮影するのと同じくらい簡単になるでしょう。誰もが開発者になる可能性があり、誰もがクリエイターです。 「今日では、コードの書き方を知らなくてもアプリケーションを作成でき、プログラミングをしなくてもインテリジェント エージェントを作成できます。AI は創造性の革命を引き起こしています。将来的には、アプリケーションの開発は短いビデオを作成するのと同じくらい簡単になるでしょう。私たちは皆開発者であり、誰もがクリエイターです。」
ロビン・リー氏はスピーチの中で、バイドゥが AI ネイティブ アプリケーションを開発するために過去 1 年間に実装した具体的なアイデアとツールを共有しました。同氏は、「大規模な言語モデル自体が直接価値を生み出すわけではありません。大規模なモデルに基づいて開発された AI アプリケーションのみが、実際の市場のニーズを満たすことができます。今日私が皆さんと共有したいのは、大規模な言語モデルに基づいて AI ネイティブ アプリケーションを開発するためのいくつかの具体的なアイデアとツールです」これは、Baidu が過去 1 年間の実践に基づいて、数え切れないほどの落とし穴を乗り越え、高い授業料を支払ったことで得たものです。」
以下は、Geek Park によって編集された、「Everyone is a Developer」に関する Robin Li の基調講演の書き起こしです。
皆さんこんにちは。Create 2024 Baidu AI Developer Conference へようこそ。Create カンファレンスが広東・香港・マカオ大湾区で開催されるのは今回が初めてです。今日のイベントには 5,000 人以上の開発者とテクノロジー愛好家が集まりました。
過去 1 年間、私は多くの起業家や開発者とコミュニケーションをとってきましたが、誰もが「FOMO」(逃すことへの恐怖)の状態にあると感じました。彼らは楽しみながらも、逃すことを恐れています。実際、大規模モデルと生成 AI は開発者コミュニティを完全に変えるでしょう。
これまで、開発者はコードを使用して世界を変えてきましたが、将来は自然言語が新しい世界共通のプログラミング言語になるでしょう。話すことができさえすれば、開発者になって創造性を発揮して世界を変えることができます。
その日はそう遠くないでしょう。強力な基本的な大規模モデルと多くの低しきい値またはゼロしきい値の開発ツールにより、開発者の生産性が大幅に向上することがわかりました。
たとえば、Wenxin の大規模モデルに基づくインテリジェントなコード アシスタントである Comate は、100 以上の言語とすべての主流 IDE プラットフォームをサポートするだけでなく、コードの推奨、コード コメントの生成、コードの欠陥の検出、最適化ソリューションの提供を行うことができます。また、コード ライブラリを深く解釈し、プライベート ドメインの知識を関連付けて新しいコードを生成することもできます。 1 年以上の採用後、Comate は Himalaya、Mitsubishi Elevator、iSoftStone などの数万の企業で使用され、生成されたコードの採用率は Baidu によって追加されたコードの 46% に達しました。日、27% は Comate によって生成されました。
現在では、コードを書かずに AI アプリケーションを作成でき、プログラミングをしなくてもインテリジェント エージェントを作成できます。 AI は創造性の革命を引き起こします。将来、アプリケーションの開発は、誰もが開発者であり、クリエイターになるでしょう。
テクノロジー企業としての Baidu の役割は、社会全体の創造性を継続的に向上させるために必要な開発ツールを可能な限りすべての人に提供することです。具体的には、フラッグシップバージョンのERNIE3.5、ERNIE4.0と軽量バージョンのERNIE Speed、Lite、Tinyなどを含む強力なベーシックモデルシリーズであるWenxinラージモデルシリーズを提供しています。
また、エージェント開発ツール AgentBuilder、AI ネイティブ アプリケーション開発ツール AppBuilder、さまざまなサイズのモデル カスタマイズ ツール ModelBuilder など、大規模モデルに基づいてさまざまなアプリケーションを開発するためのツールも提供しています。これら 3 つのツールはすべて、高度な生産性を表します。以下、一つずつご紹介していきます。
Wenxin Yiyan のユーザー数は 2 億人を超え、Wenxin Big Model 4.0 ツール バージョンがリリースされました
まず、Wen Xin Yi Yan と Wen Xin Big Model の最新の進歩について話しましょう。
昨年3月16日に『Wen Xin Yiyan』が公開されてから1年1か月が経った。当社のユーザー数は 2 億人を超え、1 日の平均 API コールも 2 億件を超え、サービスを提供する顧客の数は 85,000 に達し、Qianfan プラットフォームを使用して開発された AI ネイティブ アプリケーションの数は 190,000 を超えました。
さあ、みんなはウェン・シンイーヤンと何をしているの?
ビデオに登場する実在の人物は氷山の一角にすぎません。ウェン・シンイーヤン氏がより多くの人々の仕事と生活を変えていることがわかります。
Wen Xin の言葉をサポートする基本モデルは、Wen Xin の大型モデルです。過去 1 年間で、バージョン 3.0 から 3.5、そしてバージョン 4.0 へと進化しました。 Wenxin 4.0 は、理解、生成、ロジック、メモリという 4 つの主要な機能の点で業界をリードするレベルに達しています。
ここ数か月で、Wenxin Big Model はコード生成、コード解釈、コード最適化などの一般的な機能においてさらに大幅な改善を達成し、国際トップレベルに達しました。
本日、Wenxin Big Model 4.0 のツール バージョンを正式にリリースしました。このツール バージョンでは、自然言語インタラクションを通じて、複雑なデータやファイルを処理および分析したり、チャートやファイルを生成したりすることができます。ファイルは、データの特性を迅速に洞察し、変化する傾向を分析し、その後の意思決定に効率的かつ正確なサポートを提供できます。
Wenxin 大型モデルは、中国で最も主導的で最も広く使用されている AI 基本モデルとなっています。
それだけでなく、1 年前と比較して、Wenxin 大規模モデルのアルゴリズム トレーニング効率は 5.1 倍に増加し、週平均トレーニング効率は 98.8% に達し、推論パフォーマンスは 105 倍増加し、推論コストは 1 倍に増加しました。元の1%まで下がりました。
つまり、顧客は当初 1 日に 10,000 回電話をかけていましたが、現在は同じ料金で 100 万回電話をかけることができるようになります。おそらくメディアは99%のコスト削減に興奮しないだろう。しかし、企業であっても開発者であっても、一度使ってみると最も重要なのはその効果とコストです。
Baidu はチップ、フレームワーク、モデル、アプリケーションの 4 層アーキテクチャでフルスタック レイアウトを採用しているため、推論コストを 1% に削減しながらパフォーマンスを向上させることができ、エンドツーエンドの最適化を通じてコストを削減し続けています。これにより、より多くの人が大規模なモデルを使用して AI アプリケーションを効率的かつ低コストで作成できるようになります。
2024年も大型モデルに関する話題が引き続きホットであることは間違いなく、さまざまな技術的ブレークスルーが次々と生まれてくるでしょう。メディアは今後も「ショックリリース」や「壮大なアップデート」などのタイトルを使ってそれを表現することに熱心になるだろう。ただし、私が強調したいのは、大規模モデル自体が直接価値を生み出すわけではないということです。大規模モデルに基づいて開発された AI アプリケーションのみが、真の市場ニーズを満たすことができます。
AI ネイティブ アプリケーションを開発するための具体的なアイデアとツールを共有します。「私は数え切れないほどの落とし穴を踏み、高い授業料を払ってきました。」
今日皆さんと共有したいのは、大規模モデルに基づいて AI ネイティブ アプリケーションを開発するための具体的なアイデアとツールです。これは、Baidu がこの 1 年間、無数の落とし穴を踏み、高額な授業料を払いながら実践してきた成果です。
まずはMoEです。将来的には、大規模な AI ネイティブ アプリケーションでは、基本的に MoE アーキテクチャが使用されることになります。ここで述べた MoE は、一般的な学術概念ではなく、すべての問題を解決するために 1 つのモデルに依存するのではなく、大規模なモデルと小規模なモデルの混合です。ただし、小規模なモデルをいつ呼び出すのか、いつ大規模なモデルを呼び出すのか、いつモデルを呼び出さないのか、これらすべてに技術的な内容が含まれており、さまざまなアプリケーション シナリオに応じて一致させる必要があります。
2つ目は小型モデルです。小規模モデルは推論コストが低く、応答時間が短い場合があります。特定のシナリオでは、SFT によって微調整された小規模モデルのパフォーマンスが大規模モデルのパフォーマンスに匹敵する場合があります。これが、Speed、Lite、Tiny の 3 つの軽量モデルをリリースした理由です。大規模なモデルを圧縮および抽出して基本モデルを作成し、そのデータをトレーニングに使用します。これは、オープンソースに基づいてトレーニングされたモデルよりも優れており、高速で、安価です。モデル。 。
3つ目はインテリジェントエージェントです。インテリジェント エージェントは現在注目のトピックです。インテリジェント エージェントの機能が向上するにつれて、多数の新しいアプリケーションが登場し続けます。インテリジェント エージェント メカニズムには、理解、計画、反映、進化が含まれており、機械が人間のように考えて行動し、環境内で学習を続け、自己反復と進化を実現することができます。一部の複雑なシステムでは、さまざまなエージェントが相互に対話し、連携して、より高品質のタスクを完了できるようにすることもできます。私たちはこれらのエージェント機能を開発しており、開発者に完全にオープンです。
MoE、小規模モデル、エージェントの 3 つの方向において、Baidu はすべての人に「すぐに使える」ツールを提供してきました。次に、エージェント開発ツール AgentBuilder、AI ネイティブ アプリケーション開発ツール AppBuilder、およびさまざまなサイズのモデル カスタマイズ ツール ModelBuilder の 3 つのツールを紹介します。
エージェント開発ツール AgentBuilder
1 つ目は、エージェント開発ツール AgentBuilder です。エージェントは、将来、すべての人にとって大規模なモデルを使用するための最も近い、最も主流の方法になる可能性があります。強力な基本モデルに基づいて、エージェントをバッチで生成し、さまざまなシナリオに適用できます。
Baidu は、Wenxin インテリジェント エージェント プラットフォームをアップグレードしたばかりです。これまでに3万人以上のエージェントが誕生し、5万人以上の開発者と数万社が定住している。私たちの目標は、すべての人と組織がインテリジェント エージェント開発者になれるようにし、中国で最も完全なインテリジェント エージェント エコシステムを構築できるようにすることです。
では、この目標を達成するにはどうすればよいでしょうか?それは、ゼロしきい値のエージェント開発ツール AgentBuilder をすべての人に提供することです。
まず、「シンガポール観光局」を例として、インテリジェント エージェントがどのように作成されるかを見てみましょう。
まず、Wenxin エージェント プラットフォームを開きます。作成ページにはゼロ コードとロー コードの 2 つのモードがあり、初心者は「ゼロ コード モード」を直接選択し、自然言語を使用して数文でエージェントを作成できます。
最初にエージェントに「シンガポール観光局」という名前を付け、旅行計画の作成、質問への回答、ホテルのチケット予約サービスの提供に必要な設定を指定しました。これらの設定は、エージェントが何を行うかを説明するために使用されます。 。
基本的なエージェントのみが必要な場合、プラットフォームは自動的に充填を完了します。ただし、「シンガポール観光局」はプロのインテリジェントエージェントであることを期待しているため、高度な設定が必要です。シンガポール百科事典の項目や公式 Web サイトのリンクをナレッジ ベースに追加し、毎日更新することができます。次に、ホテルの問い合わせ、アトラクションのチケット購入などのツールを追加して、サービス機能を強化します。現在、Ctripと協力してホテル、観光スポット、チケット販売などの旅行サービスツールを提供しています。このようにして、シンガポール観光局のインテリジェント エージェントが準備され、さらにプレビューおよび調整できるようになります。
次に、Baidu アプリを開き、「シンガポールを訪れる人の数が最も少なくなるのはいつですか?」を検索します。旅行中は誰もが混雑を避けたいと考えているからです。エージェントは複数のソースからの情報を組み合わせて、「1 月から 3 月が最も人が少ない」という答えを生成します。また、エージェントをクリックして、シンガポール旅行のヒント、シンガポールのおすすめホテルトップ 3 など、さらに対話することもできます。また、ワンストップ ソリューションであるユニバーサル スタジオ シンガポールのチケットを直接予約するために使用することもできます。私たちのニーズに応え、ユーザーの時間を大幅に節約します。
Wenxin インテリジェント エージェント プラットフォームには、シンガポールに加えて、大連や瀋陽などの文化および観光のインテリジェント エージェントもオンラインであり、知識、創造、学習、エンターテイメントなどのさまざまなインテリジェント エージェントもすべて AgentBuilder によって作成されています。 。
昨年、Wen Shinyiyan が初めてリリースされたとき、私は Wen Shinyiyan がすべての企業に影響を与えるだろうと言いました。強力な自然言語の理解、表現、推論機能により、あらゆる企業を顧客に近づけることができます。
現在、すべての販売者とすべての顧客は、Baidu 上で独占的なインテリジェント エージェントを持つことができます。プロセス全体にプログラミングはまったく必要ありません。プロンプトの言葉に似た情報を入力し、いくつかの簡単な手順を調整するだけで、インテリジェントなエージェントがすぐに生成され、24 時間年中無休でオンラインのゴールド メダル販売員になることができます。
ビジネス インテリジェンス エージェントがどのように作成されるかを見てみましょう。
Kai Tak Education は、全国に 60 以上の支社を持ち、海外にも多数の支社を構える有名な教育会社です。幅広い国をカバーしており、高い応対スキルが求められます。顧客からの問い合わせに24時間対応し、受付レベルを向上させ、運用コストを削減するにはどうすればよいでしょうか。
Kai Tak Education は、Baidu の AgentBuilder を使用して独自のインテリジェント エージェントを作成しています。
基本的な機能を備えたインテリジェント エージェントを構築する方法を見てみましょう。プラットフォーム上でエージェントのアバター、名前、業務内容、ウェルカムメッセージを入力し、年齢や学歴などユーザーが提供する必要がある情報を設定するだけです。 5 分以内にしきい値ゼロで、インテリジェント エージェントの準備が整います。
Kai Tak Educationでは、このエージェントがビジネスと学生を理解する留学コンサルタントであることを期待しています。アメリカに行きたいのかオーストラリアに行きたいのか、修士号が欲しいのか学士号が欲しいのか、IELTSやTOEFLのスコアは何点なのかなど、学生のさまざまな状況に基づいて専門的に分析し、正確な回答を与えることができます。等知識、役割、ツールなどのいくつかのモジュールを追加することで、より高度なインテリジェント エージェントを作成できます。
知識モジュールでは、プライベートドメインの知識をアップロードし、プラットフォームがリアルタイムで分析し、対話資料を自動的に生成します。役割モジュールでは、ビジネス範囲外の留学国をフィルタリングスキームに追加します。これにより、改善が可能になります。ツールモジュールにおけるユーザーヒントの効率化、店舗への予約などのサービスの追加。これらの簡単な操作により、専門的な機能を備えた Qi Tak 教育用インテリジェント エージェントが完成します。
ここで「オーストラリア留学の応募条件」を検索してみると、必要な語学力や専攻選択など7つの条件をすぐに提示してくれるほか、さまざまな悩みを解決するための留学コンサルティングプランも提供してくれることがわかります。答えられ、すべてのリクエストに答えられます。
Kai Tak Educational Intelligence は非常に人気があり、発売から 1 週間で 155 万回の配信と 58,000 回のユーザーとのやり取りに成功し、見込み客のコンバージョン数は直線的に増加し、有効な見込み客のコンバージョン コストは大幅に削減されました。作業効率が大幅に向上しました。
次に、家庭産業のインテリジェントエージェントを紹介します。
ソフィアは、家全体のカスタマイズに焦点を当てたホームファニシングブランドです。このように、非常に単純な情報を入力するだけで、基本的なビジネス インテリジェンスを作成することもできます。しかし、家具業界にとっては、消費者のオフライン体験の方が重要であるため、ソフィアはオンラインでの金メダルの販売を創出し、オフラインの受信体験を復元したいと考えています。
したがって、さらなる設定では、役割モジュールの表示方法としてデジタル人物を選択し、次にデジタル人物に適切な背景と音声を選択し、プラットフォームのインテリジェントな分析機能と組み合わせて、一連の販売テクニックを自動的に要約しました。その結果、ユーザーのさまざまなニーズに24時間対応し、ハイレベルなサービスを提供できる、穏やかで親切、プロフェッショナルな会話力を備えた金メダルの販売員が誕生しました。
Baidu 検索ユーザーが装飾リクエストを持っている場合、Sophia エージェントは Wenxin ラージ モデルの機能を使用して、最初に質問に対する回答を提供します。また、装飾の種類や予算など、お客様の具体的なニーズを積極的に確認し、近くのオフライン店舗をおすすめします。
Sophia Merchant Intelligence の立ち上げ以来、実効リードコストは 30% 減少しました。つまり、有効な顧客を獲得するために、以前は100元かかっていたコストが、今では70元で済むということです。
現在、10,000 を超える Baidu の顧客がマーチャント インテリジェンスを利用しており、教育とトレーニング、不動産と家具、機械と設備、ビジネス サービスなど 30 以上の業界をカバーしています。
上記では、3 つのデモを通じて、開発者と販売者が AgentBuilder を使用してさまざまな業界向けのインテリジェントなエージェントを作成する方法を示しました。
さて、インテリジェント エージェントの作成にはほんの数分しかかかりません。しかし、ここで問題が発生します!トラフィックがなく、配布がなく、検索もされず、誰も使用しなければ、開発者や販売者には収入がありません。収入がなければ、モチベーションはありません。この問題点を解決するにはどうすればよいでしょうか?
弊社の Wenxin エージェント プラットフォームは、開発者にトラフィックを収益化する方法を提供します。 Baidu Search に加えて、Xiaodu、Maps、Tieba、Cheji など、Baidu エコシステム内の他の製品はすべてインテリジェント エージェントの関連機能に接続でき、開発者のトラフィック分散の問題を解決し、実際のデータを取得できます。利点。
分散がある場合はデータ フィードバックがあり、データ フィードバックがある場合はフライホイールが回転し、インテリジェント エージェントは独立して反復できるようになり、使えば使うほど賢くなっていきます。 Wenxin エージェント プラットフォームでは、エージェントのデータ分析および質問と回答の調整モジュールも開始されており、さらに多くの新機能が間もなく開始される予定です。 Wenxin インテリジェント エージェント プラットフォームは、インテリジェント エージェントが、配信 - 診断 - 収益のデータ フライホイールを通じて、品質の向上、トラフィックの改善、収益の増加という好循環を形成するよう推進します。
AppBuilder: 自然言語を使用して 3 つのステップでアプリケーションを開発できます
次に、2 つ目の開発ツールである AppBuilder を紹介します。これは現在、最高の AI ネイティブ アプリケーション開発ツールです。 AppBuilderでは、AIネイティブアプリケーションの開発に必要なさまざまなコンポーネントやフレームワークを事前にカプセル化してプリセットしており、開発の敷居を大幅に下げています。
開発者は最速 3 ステップで自然言語を使用した AI ネイティブ アプリケーションを開発でき、簡単にリリースしてさまざまなビジネス環境に統合できます。いくつかのケースを見てみましょう:
今年の初めに、私たちは AI ネイティブ アプリケーション開発チャレンジを開催しました。そのコンペのテーマは、AppBuilder を使用して、観光客が遊び場の行列状況をよりよく理解し、パーソナライズされた遊びルートを設計できるようにすることでした。限られた時間内で最高のゲーム体験を。
このコンテストの優勝者は、コードを 1 行も書かずにアプリケーションを開発し、Baidu が提供する 10 万元の大賞を獲得しました。このトピックのコードを書くことができれば、コードを書くのは難しくありませんが、コードを 1 行も書かずにコードを書くことができる場合でも、基本モデルと AppBuilder ツールの機能に大きく依存します。
AppBuilder を使用してこの AI アプリケーションを構築する方法を見てみましょう。
まずはコンテストの質問を確認してみましょう。 「ユニバーサルスタジオ」の各プロジェクトの待ち時間や刺激指数を想定しており、限られた時間内で最も刺激指数の高い体験を得ることが今回の課題となる。
まず、AppBuilder の開発インターフェイスを開き、アプリケーションに「Playground Queuing Assistant」という名前を付けます。次に、コード インタープリターの呼び出し、一定時間内での最適な組み合わせの計算、結果の出力など、特定の要件をロールの指示に記述します。 ; 3 番目のステップは、ツール コンポーネントに移動し、計算を支援するコード インタープリターを追加することです。
次に、右側に「3 時間半ありますが、最もエキサイティングなプレイ方法は何ですか?」という質問を入力して、この質問をコードに変換して呼び出します。データ理解ツール。既知の条件を分析します。一連の計算の結果、「ハリー・ポッターと禁じられた旅」、「ジュラシック・アドベンチャー」、「ディセプティコン・ジェットコースター」、「バンブルビー・スピナー」の 4 つのプロジェクトを組み合わせることで最良の結果が得られるという結論に達しました。テストに問題がない場合は、「公開」をクリックすると、コードを含まないアプリケーションが生成されます。
今回、AppBuilder はさらにアップグレードされ、作成プロセス中にすべてのユーザーが「AI 最適化構成」機能を使用して、開発者がロール指示やコンポーネント構成などを自動的に最適化できるようになり、開発効率がさらに向上しました。
別の例を見てみましょう。
今年の初め、華北電力大学は、学校全体の教師と学生にインテリジェントで独占的なサービスを提供したいと提案しました。 Baidu の AppBuilder に基づいて、Huadian AI アシスタントを共同で作成しました。次に、Huadian AI アシスタントがどのように作られるかを説明します。
ステップ 1: AppBuilder を開き、作成ページに入り、[AI] をクリックして構成を自動的に生成します。まずはアプリの名前、紹介文、アバターなどの基本情報を設定します。
ステップ 2: 自然言語を使用して、タスク、コンポーネントの機能、要件、制限など、役割の指示の特定の要件を説明します。
ステップ 3: キャンパス アシスタントがインテリジェントなサービス機能を備えられるように、本の貸し出しの問い合わせ、授業スケジュールの問い合わせ、学生の成績の問い合わせなどのカスタマイズされたコンポーネントを挿入します。次に、Campus Assistant の開始ステートメントを追加すると、アプリケーションが構成されます。
次に、ユーザーの質問に基づいて、プレビュー インターフェイスでアシスタントをデバッグします。たとえば、CET-4 および CET-6 試験の登録時間を尋ね、各コンポーネントの自動呼び出しの効果をテストします。
このように簡単な操作でアプリが完成します。現在、小規模なテストで開始されており、システムの確認、コースの確認、ミールカードのチャージ、本の貸出などの高頻度のシナリオに接続されており、大多数の教師と生徒にサービスを提供しています。校内で。今後は華北電力大学と連携し、アプリケーション連携をさらに深め、より豊富で便利なサービスを提供してまいります。
Baidu には、クロスモダリティにおける長年の技術蓄積もあります。 AppBuilder では、テキストの段落または数文を入力するだけで、コミックや子供の絵本などの描画アプリケーションを迅速に作成できる特定のクロスモーダル機能も提供しています。
プロセスも非常に簡単です。AppBuilder を開き、クリックして「アプリケーションの作成」に入り、ロールの指示を入力し、「ヴィンセント画像の追加」コンポーネントを選択し、推奨される質問を 3 つ入力し、クリックして公開します。アプリ完成後は、大まかなキャラクターやプロットを入力するだけで、AppBuilderが自動でストーリーを生成し、絵を出力することができます。
Baidu Wenku の最新のスマート コミックと絵本の生成機能は、AppBuilder で提供されるこのようなコンポーネントを利用しています。 Baidu Wenku のコミック生成機能を使用して、クリエイティブなアイデアを持つ誰もがどのように優れた作品を制作できるかを見てみましょう。
古典的な「周忠は三悪を滅ぼす」を例に考えてみましょう。
百度ライブラリを開き、「周楚三悪を滅ぼす」というトピックを入力してください。これは、「晋の書」と「史書新友」に書かれているもので、ライブラリを検索した後、元のテキストに基づいてストーリーを生成することもできます。ストーリーの内容を変更し、右側の AI ツールバーをクリックして、このコミックの作成を開始します。
コミック制作インターフェイスに入ると、Wenku がストーリーラインに基づいてコミックのストーリーボードを自動的に生成し、光と影、リアリズム、漫画などのさまざまなスタイルからストーリーに最適なコミック スタイルを選択します。キャラクターに従って、コミックの生成が完了します。
コミックが生成された後、Baidu Wenku のスマート コミック エディターで完全なコミックを閲覧できます。同時に、ライブラリは各画像の編集、変更、微調整をサポートします。たとえば、左側の「周忠と白虎」の画像を選択し、「編集」をクリックして、「キャラクターの顔は次のとおりです」という画像の説明を追加します。 「くっきり、絵が明るい」などの微調整ができるので、よりニーズに合ったコミックを呼び出してください。ご覧のとおり、Baidu Wenku のコミック機能は、キャラクターとシーンの文体の一貫性という点で優れた仕事をしています。
Baidu Wenku のインテリジェントなコミック機能により、コミック作成の効率が大幅に向上し、コミック作成のコストと敷居が下がり、より思慮深く創造的な人々がコミック作成の夢を実現できるようになりました。
Baidu Wenku は、漫画の生成に加えて、ユーザーが閾値ゼロで絵本を作成できるようになりました。ご存知ないかもしれませんが、中国の子どもたちは一人当たり年間に絵本を読むのがわずか10冊ですが、欧米諸国では約50冊です。 AIによって、絵を描く能力のない親でも、自分の子どものために専用の絵本を作ることができるようになりました。このイラスト付きオーディオブックを見てみましょう!
昨年からAIを活用してBaidu Wenkuを再構築し、ユーザーにとっての「コンテンツ制作の出発点」となっています。今回、AppBuilder のサポートにより、Baidu Wenku が新しく開始したスマート コミックおよびスマート絵本機能は、より興味深いクロスモーダル創作分野にシーンを拡張しました。
Baidu の AppBuilder を使用して AI ネイティブ アプリケーションを作成する方法を 3 つのケースを使って説明しました。誰もが AppBuilder の 2 つの明らかな利点を実感できるはずです。
まず、強力です。 Wenxin 4.0 の指示を理解して従う能力を利用して、当社の AppBuilder はコールド スタートが良好なレベルに達することを保証します。パフォーマンスの低下により、開発の敷居が大幅に低下するため、チューニングに長い時間がかかることはありません。検索強化テクノロジー RAG を活用することで、ナレッジ Q&A などの一般的なシナリオにおいて、Q&A の正確性とフレンドリーな回答レベルは 95% 以上に達し、他の同様の製品を大幅に上回っています。 AppBuilder は、Baidu の長年の技術蓄積に基づく Baidu 検索やその他の AI 機能コンポーネント、大規模モデル機能コンポーネント、Baidu 独自のオープン ビジネス コンポーネントなど 55 のコンポーネントを含む、豊富で完全なコンポーネント ツールのセットも提供します。フライト クエリや紙のクエリなど、一部の主流シナリオ用のサードパーティ API も利用できます。また、カスタム コンポーネントもサポートしたばかりなので、お客様は独自のツールやデータを直接接続できます。これらの豊富なコンポーネントは、AI ネイティブ アプリケーションの効率的な開発を共同でサポートします。
2番目に、シンプルで使いやすいです。 AppBuilder を使用すると、3 つのステップでアプリをすばやく作成し、ワンクリックで配布できます。また、二次開発を容易にするオープンソース SDK もサポートしています。
モデルカスタマイズツール ModelBuilder: 効率的かつ低コストでモデルを作成
次に、プロの開発者に適したツールである ModelBuilder を紹介します。ModelBuilder は、開発者のニーズに応じて任意のサイズのモデルをカスタマイズし、細分化されたシナリオに基づいて SFT をさらに微調整することで、より良い結果を得ることができます。効果を達成しました。開発者にとって、大規模なモデルを有効に活用するために非常に重要なことの 1 つは、モデルを微調整する方法を習得することです。
教育業界における小論文添削シナリオを例に挙げてみましょう。なぜなら、作文添削には明確な採点基準があり、学年によって作文要件や採点基準が異なるからです。これには、大規模なモデルの出力結果を特定の要件とより一致させるために、モデルを微調整する必要があります。
ModelBuilder がエッセイの採点のためにモデルの微調整を実装する方法を見てみましょう。
ステップ 1: データセットを作成します。モデルの微調整の有効性は、データの品質に大きく依存します。この場合、元のデータは 180 項目しかなく、品質が十分ではありません。データ クリーニング、データ アノテーション、データ拡張の 3 つの機能を使用する必要があります。データクリーニングを行うことで、データの欠落や文字化けなどの問題を素早く解消できます。データの注釈に関しては、コンテンツの深さ、記述テクニック、その他の評価など、構成にさらに多くの要素を追加しました。データ拡張機能は、データ拡張用に類似しているが重複しないデータを生成できます。拡張後、ModelBuilder は 920 個の高品質データを生成しました。
2 番目のステップは、モデルの微調整段階に入ります。まず、微調整用のベースモデルを選択する必要があります。ここではベースモデルとして ERNIE Speed を選択します。次に、プラットフォームの推奨値に従ってパラメーターを構成します。今回は、推奨される反復ラウンドに従ってデータが 1,000 ラウンドに近づき、構成は 10 ラウンドになり、モデルのトレーニングを開始できます。
ステップ 3: モデルをプラットフォームにデプロイすると、微調整プロセス全体が完了します。
中学校の作文を使用して、微調整されたモデルの効果をテストしてみましょう。作文のタイトルは「成長を楽しみにしています」とし、テーマに制限はなく、800字以上とします。
生徒の作文と修正形式の要件を、微調整の前後で 2 つのモデルに入力します。両モデルの比較と先生のコメントを見てみましょう。微調整された大規模モデルは、より専門的な教師のコメント思考と、より優れたフォーマット準拠性を備えていることがわかります。もともと教師が完了するのに長い時間がかかったエッセイの添削タスクは、大規模なモデルの助けを借りて数秒で迅速に完了できるようになり、学生へのフィードバックの速度と効率が大幅に向上しました。現在、このタイプの微調整されたモデルは、教育業界の多くの大手企業で使用されています。
先ほど、大規模な AI ネイティブ アプリケーションは一般的に MoE であると述べました。では、これらのモデルを組み合わせて最高のコストパフォーマンスを実現するにはどうすればよいでしょうか?次に、Xiaodu を使用して MoE モデル ルーティングのケースを示します。まず、Xiaodu がビッグモデルの恩恵でより賢くなったかどうかを見てみましょう。
ロビン:シャオドゥ・シャオドゥ
シャオドゥ: こちらです
ロビン:今日のニュースは何ですか?
Xiaodu: Xiaodu はその日の 3 ~ 5 つのニュース速報を放送します
ロビン:シャオドゥ・シャオドゥ。最近能力が上がったって聞いたんですが?シャオドゥ: あなたとチャットできるだけでなく、AI スケジュール アシスタントにもなれます
ロビン:それでは、あなたをテストしてみます。今日のイベントの後、張さんと夕食をとり、その後ホテルで経営会議があり、10時までに終わるといいのですが。 '時計。明日の朝、朝のランニングに行って天気の様子を見てから、午前8時に朝のミーティングをするつもりです。スケジュールを調整してください。
Xiaodu: お客様のニーズに基づいて、Xiaodu は次のように最適なスケジュールを作成します。
張さんとの夕食は18:00~19:30の予定で、その後20:00から経営会議に出席し、21:30頃に終了となります。
目覚まし時計は、明日の朝 6 時に起きて朝のランニングに行くように通知します。明日の朝 8 時の朝の会議に遅れないよう、ランニング時間は 1 時間以内に制御する必要があります。 。
明日の朝は晴れ、気温は25度です。外出の際は半袖を着用し、日焼け止めを着用することをお勧めします。
もっと新しいスキルを持っている私があなたの秘書になれると思いますか?
ロビン: とてもよかったです (Xiaodu に感謝)、これらのスケジュールを私の携帯電話に同期してください。
私は今、Xiaodu に簡単なニュースの問い合わせから複雑なスケジュールのニーズまで、いくつかの質問をしました。同じXiaoduと通信しているように見えますが、実際にはその裏では別のモデルが呼び出されています。私の質問を受け取ると、最初に小規模モデル ERNIE Tiny で「モデル ルーティング」作業を実行し、気象問題については、気象クエリの結果に基づいて ERNIE Lite に基づいて微調整されたモデルを呼び出しました。 SFT の ERNIE Lite によって処理され、服装の提案が提供されます。より複雑なスケジュールの場合は、最高のパフォーマンスを誇る大型モデルである Wenxin 4.0 を使用して、今夜から明日の朝までのさまざまな手配が計算されます。
現在、Xiaodu が行うすべての質問は、実行のためにさまざまなモデルに割り当てられます。アプリケーションの API インターフェイスを呼び出すときは、ERNIE Functions モデルが使用され、子供たちに質問を説明するときは、Wenxin Big Model 3.5 または 4.0 が使用されます。インテリジェント アシスタントは、キャラクターの一貫性を向上させ、ユーザーのチャットへの欲求を刺激するために、ERNIE キャラクター モデルを使用して構築されました。
この大規模モデルと小規模モデルの組み合わせたスケジューリング方法により、Xiaodu は「頭脳置換作戦」を成功裡に完了し、新しい AI ネイティブ オペレーティング システム DuerOS X をインストールしただけでなく、他のすべてのモデルと比較して、効果、速度、コストの最適な組み合わせを形成しました。 Wenxin大型モデルのフラッグシップバージョンで、応答速度は2倍に向上し、コストは99%削減されます。私が今話していた Xiaodu Tiantian AI タブレット ロボットは、昨日すべての主要プラットフォームで発売されました。興味のある友人はすぐに注文して体験することができます。
これらの ModelBuilder の例は、効率的かつ低価格でモデルを作成できる Baidu の能力を示しています。最も強力な基本モデル Wenxin 4.0 により、効果、応答速度、推論コストなどのさまざまな考慮事項を考慮して、ニーズに応じてさまざまなシナリオに適した小規模なモデルを調整し、微調整と事前トレーニングをサポートできます。このように、次元削減によって切り出されたモデルは、同じサイズでソースから直接調整されたモデルよりも大幅に優れており、同じ効果でもコストは明らかに低くなります。人々は以前はオープンソースを使用していて、それが安いと考えていました。実際、大規模なモデルのシナリオでは、オープンソースが最も高価です。したがって、オープンソースモデルはますます後退することになるでしょう。
誰でも簡単にすぐに始められるように、ModelBuilder には最も包括的で豊富な大規模モデルがプリセットされています。一般的な複雑なシーンに適し、強力な機能を備えたフラッグシップ大型モデルである ERNIE3.5 と ERNIE4.0 に加え、ERNIE Speed、Lite、Tiny の 3 つの軽量大型モデルと、さらに 2 つのモデルがあります。垂直シーンのモデルとして、ERNIE Character はロールプレイングに適しており、ERNIE Functions は外部ツールの使用や、対話または質疑応答のシナリオでのビジネス機能の呼び出しに適しています。もちろん、ModelBuilder は国内外のサードパーティの主流モデルもサポートしており、その数は合計 77 であり、中国で最も多くの大型モデルを備えた開発プラットフォームとなっています。
第 2 回「文新杯」起業家精神コンテストが正式にスタート: 特別賞金は 5,000 万台湾ドルに設定
開発者に対しては、これらの開発ツールの提供に加えて、財政的およびリソース的なサポートも提供します。
昨年5月、Baiduは、大規模モデルエコシステムの繁栄を促進し、よりダイナミックなエコシステムを構築し、起業家や開発者がさまざまなAIネイティブアプリケーションを開発できるように支援することを期待して、「Wenxin Cup」起業家コンテストを開始しました。第 1 回「Wenxin Cup」起業家コンテストでは、起業家チームから 1,000 近い登録があり、Baidu は優勝チームのうち 15 チームに 1 億元近くの投資支援を提供し、引き続き包括的なテクノロジー、チーム、オリエンテーションのサポートを提供しました。
本日、第 2 回「Wenxin Cup」起業家コンテストが正式に開始されたことを発表します。今回は、プロジェクト審査の範囲を拡大し、サブフィールドを設定し、グローバル市場と大学生をターゲットにし、起業家イノベーションチームを募集します。あなたの起業家としての方向性がAIネイティブアプリケーションである限り、公式Webサイトに登録できます。競争。同時に、起業家への支援も強化し、より充実した投資資金と豊富な経営資源を提供し、特に優れたプロジェクトには最大50件の受賞機会を与える「特別賞」も新設しました。現金と資源の支援。
中国の起業家や開発者は、新しいテクノロジーを使用してアプリケーションを開発するのが非常に上手です。私は、Wenxin Big Model が中国の AI 起業家や開発者にとっての最初の選択肢となり、Wenxin Big Model に基づいて構築されるアプリケーションがますます増えていくと信じています。また、より多くの起業家や開発者が私たちに参加して、豊かな AI エコシステムを構築してくれることを楽しみにしています。
大規模ビジュアルモデルの最大の応用シナリオは自動運転です
先ほど説明したツールとケースのほとんどは、大規模な言語モデルに基づいています。将来に向けて、私はマルチモーダル大規模モデル、つまりテキスト、画像、音声、ビデオ、その他のマルチモーダル モードの融合が、基本モデルの非常に重要な長期開発の方向性であり、AGI への唯一の方法であると信じています。 Baidu はこれらの分野に長期的に投資しており、テクノロジーの進歩をタイムリーに更新していきます。
私はまったく異なる判断をしています。大規模ビジュアル モデルの最大の応用シナリオは自動運転です。 Baidu はこの分野で最高であり、自動運転の世界的リーダーです。私たちは AI にビデオを生成する方法を訓練するだけでなく、現実世界で何が起こっているかを理解し、未来を予測するよう AI を訓練します。
Baidu は、中国の複雑な都市での 1 億キロメートルを超える路上テスト走行距離データに基づいて、Apollo 視覚認識大型モデルをトレーニングしました。これには、検出、追跡、理解、マッピングという 4 つの基本機能があります。これにより、Baidu はよりスマートで適応性が高く、より安全な自動運転ソリューションが実現します。
Baidu Maps は、大規模な視覚認識モデルを地図製作の分野に適用することでも先導しました。現在、世界最大の車線レベルの地図データが全国 360 都市で公開されています。百度地図ナビゲーションが可能な限り、スマート運転で運転できます。
今年の春節の後、百度のキャロットランは長江の「最初のスパン」を完成し、武漢の一部の地域ではサービスを24時間365日達成した。武漢に1,000台の自動運転車を配備し、年内に実施する予定です。
これは、自動運転が真に実用化されるための画期的なイベントであり、単なる地域的な実証ではなく、都市レベルでの応用実証という新たな段階に入りました。 Luobo Kuaipao は武漢市の面積 3,000 平方キロメートル以上、人口 770 万人以上をカバーしており、世界最大の自動運転運用エリアとなっています。
「梱包して持ち帰って、いつでも使いたいときに使えます。」
先ほど、Baidu Wenxin の大型モデル シリーズと、AgentBuilder、AppBuilder、ModelBuilder という 3 つの開発ツールを紹介しました。これらは、いつでもすぐに取り出して使用できるツールボックスです。
今この瞬間、私は開発者であり起業家としてここに立っていて、他の皆さんと同じように興奮しています。現在、中国には 10 億人のインターネット ユーザーがおり、強力な基本的な大規模モデル、十分な AI アプリケーション シナリオ、そして世界で最も完全な産業システムがあり、「人工知能 +」の取り組みを積極的に奨励し、支援しています。すべての企業は、これらのツールを最大限に活用するだけで、無限の創造性と生産性を発揮できます。
今日では、誰でも開発者になれるのです。そしてその未来は間違いなく開発者が一緒に創る未来です。