自研大模型，誇克豹變

2023-11-17 02:08:41

原文來源：未來科技力

圖片來源：由無界 AI生成

11月14日，阿裡巴巴智慧資訊事業群宣佈正式推出誇克大模型。據介紹，誇克大模型是基於Transformer架構、全部技術均為自研，同時參數規模達千億級的多模態大模型;其應用場景除了基礎的通用搜索，還將包括醫療健康、教育學習和職場辦公等更垂直的領域。

從其應用方向來看，**誇克大模型的推出很符合當前大模型“重落地”的發展趨勢。 **

推出之前，誇克大模型已經組建了數百人的研發團隊，在上述垂直領域進行了預訓練和精調。官方發佈的數據至少顯示，誇克大模型並非是一個「趕時髦」的產物，而是有著想做到行業頂尖的野心——

11月16日，在C-和CMMLU兩大權威評測榜單的最新評測結果中，誇克大模型分別以89和以77.08的均分登頂;國內專業考試測試方面，它在中考、高考和研究生考試中均超過了GPT-4，包括在臨床執業醫師資格考試、計算機等級考試、公務員考試、教師資格證考試等評測中，也均優於GPT-4（其中臨床執業醫師資格考試成績為486分，遠高於360分的及格線）。

如果進一步結合阿裡巴巴在AI生態的佈局，就會發現誇克大模型的誕生有著很強的戰略屬性，阿裡巴巴智慧資訊事業群連同大模型在其中的地位一起，都被提到了相當的高度。

AI技術基因

需要指出的是，智慧資訊事業群屬於阿裡巴巴“1+6+N”中的N公司，同閑魚、釘釘等公司於集團內的序列類似。

阿裡巴巴智慧資訊事業群更注重產品創新和技術研發，這也是內外部對其的認知之一。

該事業群成立於2021年4月，定位於資訊服務方向的智能化創新，旗下包括了誇克App、UC瀏覽器和書旗小說等產品。

同年10月，智慧資訊事業群升級組織架構，圍繞誇克App成立了誇克事業部。該動作被外界解讀為是在加碼資訊服務賽道，誇克則有望承擔起創新突破的使命。包括此次推出的誇克大模型，研發路線也是為了服務誇克的業務戰略。

**隨著AI時代的到來，資訊服務領域的使用者價值和商業價值仍處在高速增長的初期，誇克開始被置於更高的發展優先順序。 **

**今年9月，阿裡集團宣佈了使用者為先、AI驅動的兩大戰略重心，將加大對「技術驅動的互聯網平台業務」。、」AI驅動的科技業務」等業務的戰略性投入。 **

吳泳銘指明的阿裡巴巴未來的戰略投入方向，誇克顯然是AI生態中的一份子，誇克大模型的推出已經是一個證明。

為什麼是誇克

誇克當前的定位將關係到誇克大模型將如何應用。

把時間拉回至幾年前，當時出現在人們眼中的誇克還是一款極度簡潔的小眾產品，專注於優化使用者的搜索體驗。也因為體驗做得好，在極客和App玩家裡圈了一大波粉絲，月活也達到了百萬級。

後來誇克所有的探索，也都是在此基礎上展開的，各種變化也一直圍繞著誇克的成長。

對於當時已經擁有一定體量的誇克來說，一條分岔路其實已經擺在了面前——作為一款資訊服務產品，它必然要考慮後續的發展方向，單一的功能定位能贏得當下，卻不一定爭取到更大的市場。誇克需要在克制的前提下做加法，然而對於這樣一款對用戶體驗有著執念的搜索為主的應用而言，做加法不是個容易的過程。

期間誇克進行過一些嘗試，譬如垂直領域的專業搜索，以及不同形態的優質內容生態建設。

但就在人們以為誇克要走上內容付費時，它又結合使用者需求和市場變化迅速對自己的業務體系進行了梳理。

2021年誇克事業部成立，按照阿裡巴巴智慧資訊事業群總裁吳嘉的說法，**誇克已進入新的階段，正在從一個好用的搜索App，邁向個人學習、生活和工作的智慧助手。 **

此前，誇克已經在搜索業務的基礎上延展出了一些資訊服務，譬如輔助考生進行志願篩選的高考資訊服務，包括健康百科和健康精選問答在內的健康資訊搜索，以及內容涵蓋簡歷、PPT、論文、合同、表格和期刊等在內的文檔等。此外，工具屬性更強的誇克網盤也在2019年就已上線。

**這些服務在“智能資訊”的概念出現之前，還是較為分散的，而當明確要做使用者“個人學習、生活和工作的智慧助手”之後，誇克的定位也逐漸清晰起來。 **

依然是在不犧牲使用者體驗的原則上，誇克後續又對這些服務進行了更深入的優化，並在2022年推出另一款工具產品誇克掃描王，補足了掃描場景下的用戶體驗。也是在2022年，誇克App的Slogan正式由“新生代智慧搜索”升級為“你的高效拍檔”，**自此完成了從一個“小而美”的App走向新一代智慧資訊產品的生態化發展的蛻變。 **

由於服務場景更貼合學生以及年輕的上班族，誇克也在更新自己的同時，積累起了一批畫像更加年輕的使用者——據QuestMobile發佈的《2023年輕人群智慧效率應用研究》報告，誇克App在泛學生人群和新生代職場人群的使用者佔比最高，年輕使用者使用時長位列行業第一;此外，在誇克服務的數千萬級使用者中，25歲以下使用者佔比超過一半。

這些統統構成了誇克區別於其他同類應用的差異化用戶心智。

**很顯然，對於誇克這樣致力於幫助使用者提高效率、有更強實用性質的應用來說，大模型的引入在現階段是適配的，也符合大模型的進化規律。誇克的發展已經從單一服務變成產品矩陣形態，這也給大模型提供了足夠多的落腳點。 **

大模型將如何“升級”誇克

當我們提大模型對某個應用的改造，一定是建立在這個應用原有的業務基礎之上。

誇克首先作為一個搜索工具，在過去幾年已經積累起了海量的中文數據，並號稱有“最全面的中文資料庫”。訓練大模型最核心的三要素之一就是數據，**誇克過去的積累首先給了大模型能更好理解、評估和提煉中文知識體系的前提。 **

而在更細分的領域，誇克的知識內容體系也相對更完整。

比如高考服務，到今年誇克已經連續五年提供高考資訊服務，各省市的高考數據非常齊全，同時也涵蓋了豐富的圖文、視頻和直播等針對不同省份、分數段學生的填報技巧內容;健康服務方面，誇克也聯合數百位院士、醫療專家和專業協會建立起了誇克健康百科，並且和數十家行業頭部醫療機構合作建立起了健康精選問答體系;至於文檔服務，其內容也包括了實用範文、求職簡歷、合同範本、PPT範本、教育教學、表格範本和研究報告等八大類，精選文檔也已上線了超千萬份…

更重要的是，**這些數據和內容背後，包含的是非常豐富的用戶場景，對於大模型理解和認知不同使用者對工作、學習和生活上的真實需求，亦是加分項。 **

某種程度上，大模型的加持和誇克一直以來的技術傳統是一脈相承的。

AI此前就在誇克的各項服務中多有應用，就高考和健康服務來說，已經在錄取預測、類比填報以及針對病例、藥品的篩查等等使用場景下藉助過AI説明;誇克網盤也在今年先後上線了AI自然語言搜索以及播放器AI字幕生成功能;誇克掃描王在識別的準確性上，也一直離不開AI的貢獻。

誇克可以說對浪潮的到來早有準備，而大模型一旦加碼融入，對誇克各項功能服務的影響可以預見地也將十分顯著。

想像這樣一種場景，在掃描工具的使用中，使用者的痛點通常在於相機識別出的內容不夠準確，儘管此前藉助AI已經能在諸如版式、公式和手寫內容等的識別上提升準確度，但此類AI往往在語義和前後文的理解上較為機械。而大模型最強的能力恰恰就在於認知，因此當大模型被用於掃描場景，識別準確性又可以提升一個量級。

**類似的大模型應用場景，幾乎可以匹配到誇克當前的每一項服務，從而帶來更多體驗上的變革。 **

而在大模型現階段普遍存在的幻覺問題方面，誇克也提出了自己的應對，建立了從內容、搜索再到推理的一套可辨別知識真偽的技術體系，尤其是在通用知識、圖文知識、專業知識、推理知識和寫作增強等方面，有望讓大模型提供的內容更具有準確性和專業性。

在給用戶帶來改變前，誇克先積極擁抱了變化，改變了自己。

吳泳銘幾天前在世界互聯網大會上的預判是，“在可見的未來，會有更智慧的下一代產品進入人們的生活，AI助理會無處不在，成為每個人工作、生活、學習中的助手”。誇克已經到了邁向下一代搜索的臨界點，大模型也將成為推動誇克持續進行產品體驗創新的技術底座。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

1人點讚了這條動態

讚賞
1
留言
轉發
分享

留言

0/400

暫無留言

巴比特_

熱門話題查看更多
#2025Gate年度帳單
5.08萬熱度
#加密市場小幅回暖
8897 熱度
#現貨黃金再創新高
6047 熱度
#日本央行明年或兩次加息
2227 熱度
#2026行情预测
2156 熱度

熱門 Gate Fun查看更多

1
BEATBEAT
市值:$0.1持有人數:1
0.00%
2
BTC&ETHBitCoin and Ethereum
市值:$3579.31持有人數:1
0.00%
3
DOPEDopamine Drip
市值:$3636.3持有人數:2
0.10%
4
GYEGate Year End
市值:$3621.77持有人數:2
0.04%
5
芝麻人生芝麻人生
市值:$3555.17持有人數:1
0.00%