0.6秒出圖!手機跑Stable Diffusion創下最快速度,而這僅僅是開始

原文來源:機器之心

如今,隨著將大模型塞進手機的進程加快,普通使用者也能親自體驗生成式 AI 的魅力了。

圖片來源:由無界 AI生成

2023 已經行至尾聲,這一年大模型和生成式 AI 成為人工智慧圈的主流趨勢。 自 ChatGPT 出現以來,各式各樣通用、專業的 AI 大模型層出不窮,噴湧之勢已經不可阻擋。 隨著量化、網路剪枝和知識蒸餾等模型壓縮技術進步,手機等終端設備 AI 算力持續增強,大模型在雲端部署之外正在向終端落地邁進。

對於這場已經拉開了序幕的「終端側革命」,晶元巨頭和手機廠商們成為主力軍,他們不斷嘗試在手機等終端設備上部署運行生成式 AI 大模型,時不時給人們一點小小的驚喜和震撼。

今年 2 月,我們第一次看到了在手機上運行超過 10 億參數的文生圖大模型 Stable Diffusion。 那是在一部搭載高通第二代驍龍 8 移動平臺的安卓手機上運行的,不到 15 秒的時間執行 20 步推理,生成了一張 512×512 像素的圖像。 這也創造了當時智能手機上最快的推理速度。

你以為這就是手機運行 Stable Diffusion 的速度極限了嗎?顯然不是。 在上個月舉行的 2023 驍龍技術峰會上,不到 15 秒的生成時間又被整整縮短數十倍。 高通最新旗艦移動平臺第三代驍龍 8(以下簡稱驍龍 8 Gen 3)讓速度飛升成為可能。

在峰會現場,高通用搭載了驍龍 8 Gen 3 的手機運行相同的 Stable Diffusion 大模型,這次不到 1 秒(0.6 秒)的時間便在本地生成了一張圖像。 從 15 秒到 0.6 秒,終端側生成式 AI 大模型的進化速度讓我們驚歎不已。

這隻是高通在本屆驍龍技術峰會上展示其終端側 AI 能力的牛刀小試。 除了生成速度(從 15 秒到 0.6 秒)有了質的飛躍,驍龍 8 Gen 3 將支援運行的大模型參數規模(從 10 億到百億)提升一個量級。

大模型賦能平臺也不再局限於手機,高通下一代 AI PC 晶片驍龍 X Elite 亮相,將百億參數大模型「塞進」PC 平臺,極大拓展了生成式 AI 應用的廣度。

至此,高通在終端側 AI 領域積累起來的領導力和技術領先性進一步得到加強,更賦予了手機、PC,甚至耳機等廠商更多終端 AI 落地的想像力和可能性。

雙平台並進,讓生成式 AI 更加觸手可及

自今年 2 月以來,高通先後在搭載第二代驍龍 8 移動平臺的安卓手機上運行 Stable Diffusion、ControlNet,讓大模型跑在手機端成為現實。 此次驍龍峰會上發佈的驍龍 8 Gen 3 將大模型終端側落地的潛力提升到了新的高度,使其自身繼續在該領域引領潮流。

據瞭解,驍龍 8 Gen 3 採用的高通 AI 引擎擁有面向行動終端的強大 Hexagon NPU,集成了升級後的硬體加速單元、微切片推理單元、加強張量、標量和向量單元,所有單元共用 2 倍頻寬的大容量共用記憶體。 同時支援 INT8+INT16 的混合精度以及 INT4、INT8、INT16 和 FP16 的所有精度。 性能較前代提升 98%,能效提升 40%。

驍龍 8 Gen 3 集成的高通感測器中樞也更強,擁有 2 個始終感應 ISP、2 個 micro NPU 和 1 個 DPS,記憶體增加了 30%,支援 INT4 精度,AI 性能提升了 3.5 倍。

可以說,驍龍 8 Gen 3 賦予了手機前所未有的強大終端側 AI 性能,成為高通首個專為生成式 AI 打造的移動平臺。 那麼這款旗艦級移動平臺是否名副其實呢?這是我們大家最為關心的問題。

在該平臺上,高通 AI 引擎首次支援多模態生成式 AI,包括了多種大語言模型、視覺語言模型等。 尤其是在終端側,驍龍 8 Gen 3 首次支援運行 100 億參數的模型,規模邁入百億量級。 同時將 Stable Diffusion 生成圖像的時間降到了 1 秒之內,再次創下最快速度。

在跑 Meta 大語言模型 Llama2-7B 時,驍龍 8 Gen 3 每秒可以生成 20 個 token,同樣是手機終端側最快之一。

高通公司產品管理高級副總裁 Ziad Asghar

現在,驍龍平臺已經支援運行 OpenAI、Meta、微軟、安卓、stability.ai、BLOOM、百度、智譜、百川智慧、有道等企業或機構的大模型,既為這些廠商將自身大模型能力「下放」到終端側提供契機,也為用戶體驗生成式 AI 帶來了豐富的選擇項。

牽一髮而動全身,隨著高通在賦能大模型終端落地上的進一步動作,採用驍龍8 Gen3移動平臺的手機廠商快速跟進,加速了大模型集成到手機的進程。

以首發搭載驍龍 8 Gen 3 移動平臺的小米 14 系列新機為例,AI 大模型技術已經集成到小米全新澎湃 OS 中,並上線各種終端側應用。 有了大模型能力加持,小米 14 支援了 AI 妙畫、AI 搜圖、AI 寫真、AI 擴圖等多項功能,讓輸入法、WPS、相冊煥發新的活力。

vivo 旗下品牌 iQOO 12 系列同樣搭載了驍龍 8 Gen 3 移動平臺,全新高通 AI 引擎使其影像體驗大幅升級,照片質感和細節拉滿。 同時該系列手機預裝的 OriginOS 4 系統引入生成式 AI 功能,AI 助手藍心小 V 可以進行超能語義搜索、超能問答、超能寫作、超能創圖、超能智慧交互,智慧化程度明顯提升。

此前在驍龍峰會上,榮耀CEO趙明宣佈新旗艦手機榮耀Magic 6將搭載驍龍8 Gen3移動平臺,已支援70億參數的終端側 AI 大模型,為使用者提供更加智慧化的體驗。 他在現場演示了終端側 AI 進行照片搜索、生成視頻等智慧操作,效果著實不錯。

手機終端融合大模型能力催生了大量或好玩、或有助於提升生產力的生成式 AI 應用。 未來更加豐富的生成式 AI 應用會讓更多使用者切身體驗到 AI 的魅力,提升自身互動體驗,這也正是高通致力於在終端側打造生成式 AI 能力的重要源動力之一。

在持續利用 AI 賦能手機移動平臺之外,高通也在尋求利用並把握好大模型及生成式 AI 的發展契機,以此來重塑 PC 行業,擴大自身在 AI 領域的領先優勢。

生成式 AI 有了「第二陣地」

高通發佈了面向PC平臺的全新處理器驍龍 X Elite,它採用 4nm 製程工藝,集成定製的高通 Oryon CPU,運行速度是英特爾 12 核處理器的 2 倍,功耗比英特爾競品低 68%,高峰時段的運行速度比蘋果 M2 快了 50%。

如果這些參數還無法讓你相信驍龍 X Elite 的強悍,那就跑個分吧。 驍龍 X Elite 擁有兩個版本:分別是注重續航表現的 23W 版本和主打性能的 80W 版本。 Geekbench 6 測試下的單核和多核得分情況如下圖所示,單核性能尤為亮眼。

圖源:fonearena

同樣地,驍龍 X Elite 專為 AI 打造。 它採用業界領先的、集成高通 Hexagon NPU 的高通 AI 引擎,異構算力高達 75TOPS,Hexagon NPU 算力為 45TOPS,為創意應用、視頻會議和生產力助手的變革性體驗提供了算力基礎。 高通 AI 引擎還支援了大量的加速應用程式和體驗,創造無限可能性。

超強生成式 AI 能力也成為驍龍 X Elite 的一大標籤,截止到發佈時,它已支援在端側運行超過 130 億參數的生成式 AI 模型,面向 70 億參數大模型每秒生成 30 個 token,AI 處理速度是競品的 4.5 倍。 下圖為 PC 端 AI 作畫能力的展示。

從手機到PC,多樣化的端側平臺為釋放生成式AI能力提供了更多管道。 這也表明,高通在終端側生成式 AI 落地這條賽道上繼續「加碼」,背後既離不開技術上的厚積薄發,也是其在大模型時代自身 AI 發展戰略的延續。

手機、PC 加速迎來全新 AI 時代

在當今大模型時代,終端側部署生成式 AI 這條路線越來越明晰。 基於此,高通始終秉持「混合 AI 是 AI 的未來」這一理念和戰略,注重雲端與終端的協同發展,並認為終端側 AI 是擴展生成式 AI 至全球更廣泛範圍的關鍵。

遵循這一前瞻性認知,高通一步步積累,逐漸在自身佈局中構建了強大、全面的終端側 AI 能力,並引領了端側大模型及生成式 AI 的革新與進步。 毫無疑問,此次驍龍峰會上發佈的驍龍 8 Gen 3、驍龍 X Elite 將進一步夯實高通作為終端側 AI 領導者的地位。

* *高通全棧 AI 優化方案

如果大模型繼續保持當前的落地步伐,我們將可以在手機、PC 甚至 XR 可穿戴設備、智慧網聯汽車等智慧終端上體驗到更多生成式 AI 應用,讓人機交互更加自然且個人化。 反過來,這些生成式 AI 應用以及帶來的體驗變革也將對這些終端設備產生深遠影響,甚至改變它們的核心驅動力,重新定義它們。

我們以與人們工作、生活息息相關的手機為例,在追求絕對性能之外,人們越來越多地關注一些創意性應用。 這就需要 AI 大顯身手,生成式 AI 性能更是成為下一代手機處理器角逐的核心競爭力。

因此,驍龍移動平臺近年來持續發力於此也在意料之中了。 從去年的驍龍 8 Gen 2 到此次驍龍峰會上的驍龍 8 Gen 3,AI 早已無處不在,生成式 AI 一躍成為「AI 皇冠上的新明珠」,受到了廣泛關注和青睞。

隨著大模型及生成式 AI 在手機終端落地的範圍越來越廣、成熟度越來越高,我們或許可以看到:傳統智慧手機被生成式 AI 能力全方位加持的「AI 手機」所取代。 小米等手機廠商新發佈的旗艦機在這方面已經初具雛形,利用生成式 AI 增強一些場景的使用體驗和效率,為未來顛覆手機的質變做好了充分的量變。

同時,PC 終端的革新也有類似向生成式 AI 能力傾斜的發展趨勢。 在這方面,集成到 Windows 中的微軟 Copilot 是一個很好的例證。 當然還有更多生成式 AI 變革人與 PC 交互的場景和方式,藉此實現更高效的智慧協作、更簡化的工作流程、更強大的生產力、更定製化的使用體驗。

驍龍 X Elite 一出手便瞄準生成式 AI,勢必會為當前的 PC 市場注入新鮮血液。 在第六屆虹橋國際經濟論壇 ——「智慧科技與未來產業發展」分論壇上,高通公司中國區董事長孟樸發表了主題演講,認為下一代PC將進入一個全新的「AI PC」時代,以智慧、高性能、高效等為特點, 並將對辦公效率等方面產生重要意義。 相信未來高通會在驍龍 8 Gen 3 等移動平臺和驍龍 X Elite 等 PC 平臺的基礎上,繼續加強自身在大模型和生成式 AI 上的基礎能力。 加之更多搭載這些平臺的廠商發佈全新旗艦手機和PC產品,他們不斷增強的自主性及自研能力可以讓我們期待更多樣化生成式 AI 應用的亮相。

不過,在「AI 手機」和「AI PC」的 時代真正到來之前,還要看生成式 AI 能力是否能讓用戶產生強烈感知、是否能準確滿足他們的需求、是否能對相關應用產生依賴性、以及是否能帶動他們換機的慾望,這些都是高通和手機廠商現在及未來要考慮的問題。

結語

自發佈以來,驍龍 8 Gen 3、驍龍 X Elite 展現出的強大生成式 AI 能力留給人們無限的想像空間。 正如高通公司總裁兼CEO安蒙所言,「我們正在進入將改變用戶體驗的生成式 AI 時代,也將創造一個行動產業和計算行業的全新週期。 」

在這一進程中,作為終端側領導者的高通正擔負起應有的時代角色。 一方面,利用自身強大的全棧 AI 優化能力匯聚軟硬體各方,助力終端側 AI 生態快速發展;另一方面,全新的跨平台技術「Snapdragon Seamless」實現安卓、Windows 和其他操作系統無縫銜接,這種多終端體驗有望將 AI 在手機、PC 等終端上的落地進一步拓展開來。

可以預見,基於驍龍生態的 AI 體驗會非常快速鋪展開來,各種應用落地的速度也將大大加快。 未來,高通將繼續保持自身在終端側 AI 的技術優勢,推動大模型在部署應用時更便捷、更豐富、更有吸引力。 同時攜手各大廠商創新基於大模型的生成式 AI 應用,降低普通使用者使用生成式 AI 的門檻。

隨著新的生成式 AI 時代開啟,高通是否能持續滿足人們的期待,我想這次驍龍峰會已經給了我們答案。

參考連結:

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
  • 熱門 Gate Fun查看更多
  • 市值:$3638.78持有人數:2
    0.25%
  • 市值:$3575.86持有人數:1
    0.00%
  • 市值:$3579.31持有人數:1
    0.00%
  • 市值:$3607.43持有人數:3
    0.14%
  • 市值:$3548.27持有人數:1
    0.00%
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)