李彥宏百度AI 開發者大會演講：踩了無數坑以後，百度知道了什麼

ForesightNews

2024-04-18 06:56:08

只要會說話，就可以成為開發者。

撰文：連冉

編輯：鄭玄

來源：極客公園

「自然語言會成為下一代的程式語言，人人都能成為開發者。」

4 月16 日，Create 2024 百度AI 開發者大會在深圳召開，百度創始人、董事長兼首席執行官李彥宏發表了《人人都是開發者》的主題演講，描述了一個不再局限於編碼技能的世界，而是以自然語言為媒介，人人都能參與創造的時代。

百度的文心大模型4.0 工具版的發布，將李彥宏描述的願景向現實推進了一大步。這個工具不僅能夠讓開發者透過自然語言互動進行複雜數據和文件處理，還能產生圖表或文件，快速洞察數據中的特點、分析變化趨勢、為後續的決策提供高效和精準的支撐。

同時，李彥宏在主題演講上發布了三大開發工具，包括智慧體開發工具AgentBuilder、AI 原生應用程式開發工具AppBuilder 以及模型自訂工具ModelBuilder。這些工具大幅降低了開發門檻，讓開發者只需簡單幾步操作，就能創造出功能強大、易用便捷的AI 應用。

圖片來源：百度

李彥宏指出，「智能體可能是未來離每個人最近、最主流的大模型使用方式，基於強大的基礎模型，智能體可以批量生成，應用在各種各樣的場景。百度剛剛升級了文心智能體平台。

在李彥宏看來，未來的開發應用程式將會像拍短片一樣簡單，人人都有可能成為開發者，人人都是創造者。「今天，你不會寫程式碼，也可以做出一個應用；不用編程，也可以做出一個智能體。AI 正在掀起一場創造力革命，未來開發應用就會像拍短視頻一樣簡單，人人都是開發者，人人都是創造者。

在演講中，李彥宏分享了百度過去一年實踐出來的、開發AI 原生應用的具體思路和工具。他強調：「大語言模型本身並不會直接創造價值，基於大模型開發出來的AI 應用才能滿足真實的市場需求。今天我想跟大家分享的是一些基於大模型開發AI 原生應用的具體思路和工具。

以下為李彥宏《人人都是開發者》主題演講實錄，由極客樂園整理。

大家好，歡迎參加Create 2024 百度AI 開發者大會，這是Create 大會首次在粵港澳大灣區舉辦。今天現場來了5000 多位開發者和科技愛好者。

過去這一年，我跟很多創業家、開發者交流，感覺大家都處在一種「FOMO」狀態，也就是Fear of Missing Out，既興奮、又害怕錯過。確實，大模型和生成式AI，將徹底改變開發者這個群體。

過去，開發者用程式碼改變世界；未來，自然語言將成為新的通用程式語言，你只要會說話，就可以成為一名開發者，用自己的創造力改變世界。

這一天並不遙遠，我們看到，因為有了強大的基礎大模型，有了很多低門檻，甚至零門檻的開發工具，開發者的生產力大大提高了。

例如，基於文心大模型的智慧程式碼助理Comate，不僅支援100 多種語言和所有主流IDE 平台，可以推薦程式碼、產生程式碼註解、尋找程式碼缺陷、給出最佳化方案，還可以深度解讀程式碼庫、關聯私域知識產生新的程式碼。上崗一年多，Comate 已經走入了喜馬拉雅、三菱電梯、軟通動力等上萬家企業，生成的代碼採納率達到了46%，百度每天新增的代碼中，已經有27% 是由Comate 生成的。

今天，你不會寫程式碼，也可以做出一個AI 應用；不用編程，也可以做出一個智能體。 AI 正在掀起一場創造力革命，未來開發應用程式就像拍短影片一樣簡單，人人都是開發者，人人都是創造者。

身為科技公司，百度的角色定位，就是盡可能提供大家所需的開發工具，不斷提升整個社會的創造力。具體來說，我們提供1 個強大的基礎模型系列，就是文心大模型系列，這包括旗艦版的ERNIE3.5，ERNIE4.0，也包括輕量版的ERNIE Speed、Lite、Tiny 等等。

我們也提供基於大模型來開發各種應用的工具，包括智慧體開發工具AgentBuilder，AI 原生應用程式開發工具AppBuilder，以及各種尺寸的模型自訂工具ModelBuilder。這三個工具，都代表了先進生產力。下面，我會給大家一一展示。

文心一言用戶超2 億，文心大模型4.0 工具版發布

首先講一下，文心一言和文心大模型的最新進展：

文心一言從去年3 月16 日發布，到今天是一年又一個月的時間。我們的用戶數突破了2 億，API 日均呼叫量也突破了2 億，服務的客戶數達到了8.5 萬，利用千帆平台開發的AI 原生應用數超過了19 萬。

我們看看，大家都在用文心一言做什麼？

影片中的真人真事只是冰山一角。我們可以看到，文心一言正在改變更多人的工作和生活。

支撐文心一言的基座模型，就是文心大模型。過去一年，它經歷了從3.0 版本到3.5，再到4.0 版本的進化。文心4.0 在理解、生成、邏輯、記憶四大能力方面，均達到了業界領導水準。

近几个月来，文心大模型在代码生成、代码解释、代码优化等通用能力方面实现了进一步的显著提升，达到国际领先水平。

今天，我們正式發布文心大模型4.0 的工具版，現在，大家可以在工具版上，體驗代碼解釋器功能，透過自然語言交互，就能實現對複雜數據和文件的處理與分析，還可以生成圖表或文件，能夠快速洞察數據中的特徵、分析變化趨勢、為後續的決策提供高效精準的支撐。

文心大模型已經成為了中國最領先、應用最廣泛的AI 基礎模型。

不僅如此，相較於一年前，文心大模型的演算法訓練效率提升到了原來的5.1 倍，週均訓練有效率達到98.8%，推理表現提升了105 倍，推理的成本降到了原來的1%。

也就是說，客戶原來一天呼叫1 萬次，同樣成本現在可以呼叫100 萬次。媒體可能不會因為成本下降99% 而感到興奮。但是企業也好，開發者也好，一旦用起來，最關注的就是效果和成本。

我們能在提升效能的同時，把推理成本降到1%，正是因為百度在晶片、框架、模型、應用這四層架構上有著全端的佈局，透過端對端優化，不斷地把成本打下來，讓更多人都可以有效率、低價地用大模型來做AI 應用。

毫無疑問，大模型相關的話題，在2024 年依然會很熱，各類技術突破還會不斷出現。媒體也會繼續熱衷於以「震撼發布」「史詩級更新」這樣的標題來渲染。但我想強調的是，大模型本身並不會直接創造價值，基於大模型開發出來的AI 應用才能滿足真實的市場需求。

分享開發AI 原生應用的具體思路和工具：「踩了無數的坑，交了高昂學費」

今天想跟大家分享的是一些基於大模型開發AI 原生應用的具體想法和工具。這是我們百度根據過去一年的實踐，踩了無數的坑，交了高昂的學費換來的。

第一是MoE。未來大型的AI 原生應用基本上都是MoE 架構，這裡所說的MoE 不是一般的學術概念，而是大小模型的混合，不依賴一個模型來解決所有問題。但什麼時候調用小模型、什麼時候調用大模型、什麼時候不調用模型，這都是有技術含量的，要針對應用的不同場景做匹配。

第二是小模型。小模型推理成本低，反應速度快，在一些特定場景中，經過SFT 精調後的小模型，它的使用效果可以媲美大模型。這就是我們發布Speed，Lite、Tiny 三個輕量模型的原因。我們透過大模型，壓縮蒸餾出來一個基礎模型，然後再用資料去訓練，這比從頭開始訓小模型，效果好很多，比基於開源模型訓出來的模型效果更好，速度更快，成本更低。

第三是智能體。智能體是當下很熱的話題，隨著智能體能力的提升，會不斷催生出大量的新應用。智能體機制，包括理解、規劃、反思和進化，它讓機器像人一樣思考和行動，可以自主完成複雜任務，在環境中持續學習、實現自我迭代和進化。在一些複雜系統中，我們也可以讓不同的智能體互動，互相協作，更有品質地完成任務。這些智能體能力，我們已經開發出來了，並且向開發者全面開放。

在MoE、小模型、智能體這三個方向上，百度都已經為大家做好「開箱即用」的工具了。下面，我就跟大家介紹三種不同的工具，分別是：智能體開發工具AgentBuilder、AI 原生應用開發工具AppBuilder、各種尺寸的模型自訂工具ModelBuilder。

智能體開發工具AgentBuilder

首先是智能體開發工具AgentBuilder。智能體可能是未來離每個人最近、最主流的大模型使用方式，基於強大的基礎模型，智能體可以批量生成，應用在各種各樣的場景。

百度剛剛升級了文心智能體平台。截至目前，已經有3 萬多個智能體被創建、5 萬多名開發者和上萬家企業進駐。我們的目標是，讓每個人、每個組織都成為智慧體的開發者，打造國內最完整的智能體生態。

那要如何實現這個目標呢？就是提供大家零門檻的智能體開發工具AgentBuilder。

下面我們就先以「新加坡旅遊局」為例一起看看，一個智能體是如何做出來的。

首先，我們打開文心智能體平台，創建頁面有著零代碼、低代碼兩種模式，新手可以直接選擇“零代碼模式”，用自然語言，幾句話就能創建一個智能體。

我們先給智能體取名為「新加坡旅遊局」，然後在設定裡寫明需要打造旅遊方案、解答問題，提供飯店門票預訂服務，這些設定都是用來指導智能體的，告訴它都能做什麼。

如果只需要基礎智能體，平台會自動完成填寫。但我們希望「新加坡旅遊局」是專業的智能體，所以要進行高階配置。我可以把新加坡百科詞條和官網連結都加入知識庫裡，讓它每天更新。然後添加一些工具，如飯店查詢、景點門票購買等，增強它的服務能力。目前我們已經跟攜程合作，提供了飯店、景點、票務等旅遊服務工具。這樣，一個新加坡旅遊局的智能體就做好了，可以進一步預覽、調校。

現在打開百度APP，搜尋「什麼時候去新加坡人最少」，因為大家出去旅遊都想避開人潮。智能體會綜合多個來源的訊息，產生一個答案，「1-3 月人最少」。我們還可以點擊智能體，和它進一步互動，例如去新加坡旅遊的注意事項，推薦新加坡排名前三的酒店，還能讓它直接預訂新加坡環球影城的門票，一站式解決需求，大大節省了用戶時間。

除了新加坡之外，大连、沈阳等文旅类智能体也都在文心智能体平台上线，还有知识类、创作类、学习类、娱乐类等各式各样的智能体，这些都是用 AgentBuilder 做出来的。

去年文心一言剛發布的時候，我就說過，文心一言會影響到每一家公司。因為它強大的自然語言理解能力、表達能力、推理能力，可以讓任何一家公司離自己的客戶更近。

今天，每個商家、每個客戶，都能在百度擁有專屬的智能體。整個過程完全不需要編程，透過類似提示詞的資訊輸入，和簡單的幾步操作調優，就能迅速生成一個智能體，成為7X24 小時在線的金牌業務員。

我們來看一下，一個商家智能體是怎麼做出來的。

啟德教育是一家知名教育企業，在全國有60 多家分支機構，還有很多海外分公司，涵蓋國家廣，對接待的話術要求很高。如何能全天24 小時回覆客戶的諮詢，並且提高接待水平、降低營運成本？

啟德教育運用百度的AgentBuilder，打造了專屬的智能體。

讓我們來看看，如何打造一個具備基本能力的智能體。很簡單，在平台上填寫智能體的頭像、名稱、經營業務範圍和歡迎語，再設定一些需要用戶提供的信息，例如年齡、學歷。 5 分鐘、零門檻，一個智能體就做好了。

啟德教育也希望這個智能體是個懂業務、懂學生的留學顧問。它可以針對學生的不同情況，例如想去美國還是澳洲、是碩士還是學士、雅思和托福考了多少分等等，做出專業分析，給出精準回答。我們可以透過加入知識、角色、工具這幾大模組，來打造一個更高級的智能體。

在知識模組中，上傳私域知識，讓平台即時解析，自動產生對話語料；在角色模組，把一些不在經營範圍內的留學國家，增加到過濾方案中，可以提高用戶線索的有效率；在工具模組，加入預約到店等服務。透過這樣幾步簡單操作，一個擁有專業能力的啟德教育智能體就做好了。

現在，我們來搜尋「澳洲留學申請條件」，可以看到智能體快速給出了需要的語言能力、專業選擇等七大必備條件，還給能出相應的留學諮詢方案，對各種難題都有問必答、有求必應。

啟德教育智能體非常的受歡迎，上線第一周，就成功分發了155 萬次，與用戶互動了5.8 萬次，線索轉換量直線成長、有效線索的轉換成本明顯降低，經營效率大幅提升。

下面，我再給大家介紹一個家居產業的智能體。

索菲亞是專注全屋訂製的家居品牌。就像剛剛展示的，它也可以透過填寫極其簡單的訊息，創造出一個基礎的商家智能體。但對於家居產業，消費者的線下體驗更重要，所以索菲亞希望能在線上打造出一個金牌銷售，還原線下的接待體驗。

因此在進一步的設定中，它在角色模組，選擇了數位人作為展示方式，然後給數位人選取了合適的背景和聲音，並且結合平台的智慧解析能力，自動總結了一套銷售話術。最終打造出一位溫柔親切、話術專業的金牌銷售，她能24 小時滿足用戶的各種需求，提供高水準的服務體驗。

當百度搜尋用戶有裝修訴求時，索菲亞智能體會運用文心大模型的能力，優先給出問題的答案。除此之外，她還會主動與客戶確認特定需求，如裝潢類型、預算等，並推薦附近的線下門市。

索菲亞商家智慧體上線以來，有效線索成本下降了30%。也就是說，它獲得一個有效客戶，如果過去的成本是100 塊，現在只需要70 塊了。

目前，已有超過1 萬百度的客戶擁有了商家智能體，涵蓋了教育訓練、房產家居、機械設備、商務服務等超過30 個產業。

上面，透過三個Demo，我展示了開發者和商家，如何利用AgentBuilder，製作不同產業智慧體的過程。

現在，製作一個智能體，真的就是分分鐘的事。但問題來了！如果沒流量、沒分發、找不到、沒人用，那麼開發者和商家就沒有收益，沒有收益就沒有動力。怎麼解決這個痛點呢？

我們的文心智能體平台，為開發者提供了流量變現的通路。除了百度搜索，百度生態的其他產品，如小度、地圖、貼吧、車機等，都能接入智能體的相關能力，為開發者解決流量分發的後顧之憂，獲得實打實的收益。

有分發，就會有數據回饋；有數據回饋，飛輪轉起來，智能體就能夠自主迭代，越用越聰明。文心智能體平台也上線了智能體的數據分析與問答調優模組，不久後將會有更多的新能力上線。文心智能體平台將透過分發- 診斷- 收益的數據飛輪，驅動智能體形成質量更優、流量更好、收益更大的正循環。

AppBuilder：自然語言三步驟就能發展一個應用

下面，我跟大家介紹第二個開發工具，AppBuilder。它是目前最好用的AI 原生應用程式開發工具。在AppBuilder 上面，我們事先封裝並預置了開發AI 原生應用程式所需的各種元件和框架，大幅降低開發門檻。

最快只需三步，開發者就可以用自然語言開發出一個AI 原生應用，並且能夠方便地發布、整合到各種各樣的業務環境中。我們來看幾個案例：

今年年初，我們搞過一期AI 原生應用開發挑戰賽，賽題是利用AppBuilder 打造一款「遊樂場排隊規劃助手」，幫助遊客更好地了解遊樂場排隊情況，設計個性化的遊玩路線，在有限時間內獲得最佳的遊玩體驗。

這期比賽的冠軍選手，沒寫一行程式碼，就開發出了應用，拿到了百度提供的10 萬元大獎。這個題目如果會寫程式碼的話，你寫一個並不難，但是你一行程式碼都不寫還能做出來，那還是非常依賴基礎模型和AppBuilder 這個工具的能力的。

我們來看下，怎麼用AppBuilder，把這個AI 應用程式做出來。

我們先回顧一下賽題。它假定了「環球影城」各個項目的排隊時間和刺激指數，那麼在有限的時間內獲得刺激指數最高的體驗，就是這期賽題要解決的問題。

首先，打開AppBuilder 的開發介面，為應用程式命名「遊樂場排隊助手」；第二步，我們在角色指令中描述特定要求，包括呼叫程式碼解釋器、算出在固定時間內的最佳組合、輸出結果等；第三步就是到工具組件中，把程式碼解釋器加進來，幫助運算。

現在，我們來測下效果，在右側輸入問題「我有3 個半小時時間，怎麼玩最刺激？」，可以看到，代碼解釋器將這個問題翻譯成了代碼，再調用數據理解工具，對已知條件進行分析。經過一系列計算，得出將《哈利波特禁忌之旅》、《侏羅紀大冒險》、《霸天虎過山車》、《大黃蜂迴旋機》，這四個項目組合遊玩，效果最佳。測試沒問題，點擊發布，在零程式碼的情況下，一個應用程式就產生了。

現在，AppBuilder 又進一步升級了，在創建的過程中，全部可以透過「AI 優化配置」功能，自動幫助開發者優化角色指令、元件配置等環節，進一步提高開發效率。

我們再看一個例子。

今年年初，華北電力大學提出，希望為全校師生提供智慧化的專屬服務。基於百度的AppBuilder，我們共同打造了一個華電AI 助理，下面，我來給大家展示一下，華電AI 助理是怎麼做做出來的：

第一步：開啟AppBuilder，進入建立頁面，點選AI 自動產生設定。首先為應用程式設定名稱、簡介、頭像等基本資訊。

第二步：透過自然語言在角色指令中描述具體要求，包括任務、組件能力、要求與限制。

第三步：插入自訂的圖書借閱查詢、課表查詢、學生成績查詢等組件，讓校園助理能夠具備智慧化服務的能力。之後再為校園助手加上一個開場白，這樣應用程式就配置好了。

接下來，我們在預覽介面中，結合使用者提問，對助手進行除錯。例如詢問四、六級考試的報名時間，測試各元件自動呼叫的效果。

大家可以看到，透過這些簡單的操作，這個應用程式就建置完成了。目前已經小規模測驗上線，接入了查制度、查課程，充飯卡、借書籍等高頻場景，服務了學校廣大師生。後續，我們將與華北電力大學一起，進一步深化應用合作，提供更豐富且便利的服務。

百度在跨模態方面，也有著多年技術累積。在AppBuilder 上面，我們也提供了一定的跨模態能力，你只需要給一段文字，或是幾句話，就可以快速創造繪畫類別的應用，像是漫畫、兒童畫本等。

過程也很簡單：開啟AppBuilder，點擊進入「應用程式建立」，輸入角色指令，選擇「新增文生圖」元件，再輸入三個推薦問題，就可以點擊發布了。應用程式做好後，我們只需要輸入一個大概想要的角色或劇情，AppBuilder 就可以自動產生故事、輸出圖畫。

百度文庫最新推出的智慧漫畫和畫本產生功能，就利用了AppBuilder 上提供的這類元件。讓我們來看看，百度文庫的漫畫生成功能，是如何讓每個有創想的人，都能做出好作品的。

以經典的《週處除三害》為例。

打開百度文庫，輸入主題《週處除三害》，這在《晉書》和《世說新語》裡都有寫到，文庫搜尋後，會根據原文生成故事，我們也可以再對故事內容進行修改；然後點擊右側的AI 工具欄，開始創建這篇漫畫。

進入漫畫製作介面，文庫將根據故事情節為我們自動生成漫畫分鏡；然後從光影、寫實、卡通等多種風格中，選擇最貼合故事的漫畫風格；最後根據角色選擇不同的人物形象，這樣就完成了漫畫的生成。

漫畫生成後，我們可以在百度文庫的智慧漫畫編輯器裡，瀏覽完整的漫畫。同時，文庫支援對每個畫面進行編輯、修改和精調，例如，在左側選中畫面「週處與白額虎」，點擊編輯，增加畫面描述「人物面容清晰，畫面明亮」，就能精調出更符合需求的漫畫。大家看到，百度文庫的漫畫功能在角色和場景的風格一致性方面，都做得非常好。

百度文庫的智慧漫畫能力，大大提高了創作漫畫的效率，降低了漫畫創作的成本和門檻，可以讓更多有想法、有創意的人實現自己的漫畫創作夢想。

不只生成漫畫，百度文庫現在還可以幫助用戶零門檻的創作畫本。大家可能不知道，中國小孩一年的人均繪本閱讀量只有10 本，而歐美國家是50 本左右。現在，AI 能夠讓完全沒有繪畫能力的父母，也可以為自己的孩子創作一個專屬的兒童畫本了。下面我們就來看看這個圖文並茂的有聲畫本吧！

從去年開始，我們用AI 重建了百度文庫，使它成為用戶「內容生產的起點」。如今，在AppBuilder 的支援下，百度文庫新推出的智慧漫畫和智慧畫本功能，更是把場景延伸到了更有趣的跨模態創作領域。

剛才我用三個案例，展示如何用百度的AppBuilder，做出AI 原生應用程式。大家應該要能感受到AppBuilder 的兩個明顯優勢：

一是功能強大。依托文心4.0 對指令的理解與遵循能力，我們的AppBuilder，能確保冷啟動就能達到一個不錯的水平，不會因為效果差，再花很長時間去調優，大大降低了開發門檻。依托檢索增強技術RAG，在知識問答等典型場景，我們的問答準確率和友善回覆程度都達到了95% 以上，大幅超越其他同類產品。 AppBuilder 也提供豐富完整的元件工具，包括百度搜尋等基於百度多年技術累積的AI 能力元件、大模型能力元件，還有百度獨家開放的業務元件等55 個元件。以及一些主流場景的第三方API，例如航班查詢、論文查詢等。我們也剛剛支援了自訂元件，客戶可以直接對接自己專有的任何工具和資料。這些豐富的元件，共同支撐起了AI 原生應用的高效開發。

二是簡單易用。使用AppBuilder，只需三個步驟即可快速建立應用程式、一鍵分發。我們也支援開源的SDK，方便大家進行二次開發。

模型自訂工具ModelBuilder：高效能低價生產模型

以下我再介紹一下更適合專業開發者使用的工具，那就是ModelBuilder，它可以根據開發者的需求自訂任意尺寸的模型，並根據細分場景對模型進一步精進SFT，這樣就能達到更好的效果。對開發者來說，用好大模型很重要的一件事兒，就是掌握模型精調的方法。

我們以教育產業的作文批改場景來舉例。因為作文批改有明確的評分標準，而且不同年級對作文的要求和評分標準，也是不同的。這就需要模型精調，讓大模型輸出的結果，更符合特定的要求。

我們就來看一下，ModelBuilder 是如何實現作文批改的模型精進的。

第一步：建立資料集。模型精調的效果很大程度依賴於我們的資料品質。在這個案例中，原始資料只有180 條，品質也不夠高。我們就需要用到三個功能：資料清洗、資料標註、資料增強。資料清洗，可以快速去除資料的空缺、亂碼等問題。資料標註方面，我們對作文增加了更多維度，例如內容深度、寫作手法等評價。數據增強功能，可以產生同類但不重複的數據，進行數據擴充。擴充後，ModelBuilder 為我們產生了920 條高品質資料。

第二步，就進入模型精調階段了。首先，我們需要選擇一個進行精調的基礎模型，這裡我們選擇了ERNIE Speed 作為基礎模型。然後，我們根據平台建議值來配置參數，這次資料接近1000 條，按照建議的迭代輪次，配置為10 輪，然後就可以讓模型開始訓練了。

第三步：把模型部署在平台上，這樣整個精調過程就完成了。

我們來用一篇中學作文，測試下精調後的模型效果。作文題目是《期待長大》，題材不限，不下800 字。

我們將一篇學生的作文及批改格式要求，輸入到精調前後的兩個模型裡。來看下，兩個模型及老師點評三者的比較。可以看到，精調後的大模型擁有了更專業的老師評論思維、更好地做了格式遵循。原本老師需要較長時間才能完成的作文批改任務，現在藉助大模型，幾秒鐘就可以快速完成，大大提升了給學生回饋的速度和效率。目前，這一類精調後的模型，已經在多個教育產業的頭部企業中應用起來了。

我前面談到大型AI 原生應用一般都是MoE。那麼，該如何組合使用這些模型，以獲得最佳的性價比呢？下面，我就用小度來展示一個MoE 模型路由的案例。我們先來看看，有了大模型的加持，小度是不是變得更聰明了：

Robin：小度小度

小度：在呢

Robin：今天有什麼新聞？

小度：小度播3-5 條當日新聞快訊

Robin：小度小度。聽說你最近長本事了？小度：我不單能陪你聊天，還能做你的AI 日程助手

Robin：那我要來考考你了。幫我安排行程，今天活動結束後，我會和張總一起用晚餐，之後在飯店有個管理層的會議，大概需要1 個半小時，希望10 點前可以結束。明早我準備晨跑，看看天氣如何，然後早上8 點有個早會，請幫我安排好行程。

小度：根據您需求，小度給您最優的行程如下

您與張總晚餐安排在18：00-19：30，結束後，您將在20:00 參加管理層會議，21:30 左右結束

明早6 點鬧鐘將提醒您起床去晨跑，跑步時長控制在1 小時以內，確保明早8 點早會不遲到

明早天氣晴朗，氣溫25 度，建議您穿短袖外出，做好防曬

您看我能不能當你的秘書，我還有更多新技能呢

Robin：挺好的，很棒（向小度豎起大拇指），把這些日程同步到我的手機上吧。

剛剛，我向小度提出了好幾個問題，其中既有簡單的新聞問詢，也有複雜的日程安排需求。看起來是跟同一個小度在交流，其實背後調用了不同的模型。當它接受到我的問題後，先是由小模型ERNIE Tiny 執行了「模型路由」的工作；對於天氣問題，它根據天氣查詢的結果，調用基於ERNIE Lite 打造的精調模型，也是經過SFT 的ERNIE Lite，給出了穿衣建議；對於更複雜的日程安排，則調用了性能最好的大模型——文心4.0，來計算出從今晚到明早的各項事項安排。

今天，我們提給小度的每個問題，都會這樣分配給不同模型來執行，呼叫應用的API 介面時，會用ERNIE Functions 模型，給孩子講題時，用文心大模型3.5 或4.0，智能助理的打造則用了ERNIE Character 模型，提高人設一致性、激發使用者聊天慾望。

透過這種大小模型的組合調度方式，小度不僅順利完成了「換腦行動」，裝上了全新的AI 原生操作系統DuerOS X，而且形成了效果、速度和成本的最優組合，相比全部使用文心大模型的旗艦版，讓反應速度提升2 倍，成本下降了99%。剛才和我對話的這個小度添添AI 平板機器人，昨天已經在各大平台全面開售，有興趣的朋友們可以即刻下單體驗了。

這幾個關於ModelBuilder 的例子，展示的是百度高效能低價生產模型的能力。因為有了最強大的基礎模型文心4.0，我們可以根據需要，兼顧效果、響應速度、推理成本等各種考慮，裁剪出適合各種場景的更小尺寸模型，並且支持精調和post pretrain。這樣透過降維裁剪出來的模型，比直接拿開源調出來的模型，同等尺寸下，效果明顯更好，同等效果下，成本明顯更低。大家以前用開源覺得開源便宜，其實在大模型場景下，開源是最貴的。所以開源模型會越來越落後。

為了方便大家快速上手，ModelBuilder 預置了最全面、最豐富的大模型。包括了ERNIE3.5 和ERNIE4.0，這是旗艦版的大模型，它適合通用的複雜場景，能力強大；還有三個輕量級的大模型，ERNIE Speed、Lite、Tiny；另外還有兩個垂直場景的模型，ERNIE Character 適合角色扮演；ERNIE Functions 適合對話或問答場景中的外部工具使用和業務函數呼叫。當然ModelBuilder 也支援國內外第三方主流模型，總數量達77 個，是國內擁有大模型數量最多的開發平台。

第二屆「文心盃」創業比賽正式啟動：設5,000 萬元特別大獎

對於開發者，我們除了提供這些開發工具，還提供資金和資源的支援。

去年5 月份，百度啟動了「文心盃」創業大賽，希望推動大模型生態繁榮，打造更有活力的生態系統，幫助創業家、開發者開發各種AI 原生應用。第一屆「文心盃」創業大賽，我們收到了近1000 支創業團隊報名，百度為其中的15 支優勝團隊，提供了近億元的投資支持，並且在技術、團隊和資源上持續提供全方位扶持。

今天我宣布，第二屆「文心盃」創業大賽正式啟動。這次我們將擴大專案篩選範圍、設置分賽場，面向全球市場及大學學子，招募創業創新團隊，只要你的創業方向是AI 原生應用，都可以在大賽官網報名參賽。同時，我們也加大了對創業者的支持力度，提供更充足的投資資金、更豐富的業務資源，還首次設立了「特別大獎」，特別優秀的項目將有機會獲得最高5000 萬人民幣的現金和資源支持。

中國的創業者和開發者，非常善於利用新技術來開發應用。我相信，文心大模型將成為中國AI 創業者和開發者的首選，越來越多的應用會建立在文心大模型之上。我也期待，更多創業者和開發者加入我們，一起建構繁榮的AI 生態。

視覺大模型最大的應用場景是自動駕駛

前面我們談到的這些工具和案例，大部分都是基於大語言模型的。面向未來，我認為多模態大模型，或文字、圖片、語音、視訊等多模態的融合，是基礎模型非常重要的長期發展方向，是通往AGI 的必經之路。百度在這些領域有著長期投入，並將及時更新技術進展。

我有一個非常不一樣的判斷：視覺大模型最大的應用場景是自動駕駛。百度在這個方向上是最好的，是自動駕駛的全球領導者，我們不只訓練AI 如何生成視頻，更訓練AI 理解真實世界發生的事情並預測未來。

基於超過1 億公里的、中國複雜城市道路測試里程數據，百度訓練出來了Apollo 視覺感知大模型。它具備偵測、追蹤、理解、建圖四大基礎能力。這讓百度擁有了更智慧、更適應性、更安全的自動駕駛方案。

百度地圖也率先將視覺感知大模型應用到了製圖領域。現在，全球最大規模的車道級地圖數據，已經上線全國360 座城市。只要百度地圖導航能去的地方，智駕都能開。

今年春節後，百度的蘿蔔快跑實現了萬裡長江「第一跨」，我們把服務從長江的北岸延伸到了南岸，在武漢的部分區域，我們已經實現了7X24 小時的全天候運營，還計劃年內在武漢部署1000 台無人駕駛車輛。

這是自動駕駛走向真正商業化的一個標誌性事件，它不再只是區域性的示範，而是進入了城市級應用示範的新階段。蘿蔔快跑在武漢覆蓋了3,000 多平方公里、770 萬人口，是全球最大規模的自動駕駛營運區域。

「打包帶走，隨取隨用」。

剛才，我為大家展示了百度文心大模型系列，以及三個開發工具──AgentBuilder、AppBuilder、ModelBuilder，他們組成了一個工具箱，你們可以馬上打包帶走，隨取隨用。

此時此刻，我站在這裡，其實也是一個開發者、一個創業者，跟大家一樣興奮。今天的中國，有10 億網路用戶，有強大的基礎大模型，有足夠多的AI 應用場景，有全球最完整的產業體系，國家也在大力鼓勵和支持「人工智慧+」行動，每一個人，每一家企業，只需要充分利用這些工具，就可以釋放無限的創造力和生產力。

今天，人人都可以成為開發者。而未來，也必將是一個由開發者一起創造出來的未來。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

讚賞
點讚
留言
轉發
分享

留言

0/400

暫無留言

ForesightNews

熱門話題查看更多
#2025Gate年度帳單
3.82萬熱度
#加密市場小幅回暖
2190 熱度
#現貨黃金再創新高
523 熱度
#日本央行明年或兩次加息
439 熱度
#2026行情预测
543 熱度

熱門 Gate Fun查看更多

1
DogdDogd
市值:$3579.31持有人數:1
0.00%
2
07860786
市值:$3654.11持有人數:2
0.14%
3
wlwife less
市值:$3548.27持有人數:1
0.00%
4
oxSunoxSun
市值:$3565.51持有人數:1
0.00%
5
GSNOWGate Snow
市值:$3565.51持有人數:1
0.00%