Mistral 推出 Mistral 3:新一代企業級與邊緣 AI 開源模型

重點摘要

Mistral 剛剛發布了 Mistral 3,一個全新家族的 10 個開放權重模型,設計可運行於從消費級雲端到筆記型電腦、無人機及機器人等各種設備上。

Mistral Introduces Mistral 3: Versatile Family Of 10 Open-Weight Models

AI 新創公司 Mistral 發布了最新一代的模型 Mistral 3,包含三款緊湊高效能的密集模型,分別為 14B、8B 和 3B 參數,以及目前最先進的模型 Mistral Large 3——這是一款稀疏專家混合系統,使用 41B 個活躍參數和 675B 個總參數進行訓練。所有模型均採用 Apache 2.0 授權,開源提供多種壓縮格式,支援分散式 AI 應用。

Ministral 模型設計著重於卓越的效能與成本效率,而 Mistral Large 3 則定位為領先的指令微調開源模型之一。Mistral Large 3 在 3,000 顆 NVIDIA H200 GPU 上從零開始訓練,是自 Mixtral 系列以來公司首次發布的專家混合模型,也是預訓練技術的一大突破。經後訓練後,該模型在一般提示下可媲美頂尖指令微調開放權重模型,並展現先進的圖片理解及優異的多語言對話能力。

Mistral Large 3 在 LMArena 排行榜首次亮相即獲得 #2 in the OSS non-reasoning models category and #6 的總排名。基礎版與指令微調版皆以 Apache 2.0 授權釋出,為企業及開發者客製化提供堅實平台,未來還計畫推出推理版本。

Mistral 與 NVIDIA、vLLM 及 Red Hat 合作提升 Mistral 3 的可及性與效能

透過與 vLLM 和 Red Hat 的合作,Mistral Large 3 已大幅提升對開源社群的可及性。NVFP4 格式的檢查點經 llm-compressor 優化,可在 Blackwell NVL72 系統或單一 8×A100 或 8×H100 節點上高效執行,使用 vLLM。

先進開源 AI 模型的開發仰賴硬體與軟體的深度優化,這需與 NVIDIA 合作完成。所有 Mistral 3 模型(包含 Large 3 與 Ministral 3)皆在 NVIDIA Hopper GPU 上訓練,利用高頻寬 HBM3e 記憶體以應對大規模工作負載。NVIDIA 的協同設計方法結合硬體、軟體與模型,讓 Mistral 3 系列透過 TensorRT-LLM 與 SGLang 實現高效能低精度推論。

為了支援 Large 3 的稀疏專家混合架構,NVIDIA 實作了 Blackwell 注意力和 MoE 核心,新增 prefill/decode 分離服務,並合作開發 speculative decoding,使開發者能在 GB200 NVL72 系統及其他平台上處理長上下文、高吞吐量的工作負載。Ministral 模型亦針對 DGX Spark、RTX PC 和筆電以及 Jetson 裝置最佳化,能從資料中心到邊緣應用,提供一致的高效能體驗。Mistral 感謝 vLLM、Red Hat 與 NVIDIA 的支持與合作。

Ministral 3:專為邊緣與本地部署打造的先進 AI 效能

Ministral 3 系列專為邊緣與本地部署設計,提供 3B、8B 和 14B 三種參數規格。每一規格皆有基礎版、指令版和推理版,全部支援圖片理解,並以 Apache 2.0 授權釋出。結合原生多模態與多語言能力,Ministral 3 家族為企業與開發者應用帶來多元解決方案。

該系列在開源模型中展現極佳的效能/成本比,指令版在生成 token 數大幅減少的同時,效能達到或超越同類模型。當準確度為首要考量時,推理版可進行更深層計算,以在其權重級別內達到領先精度,例如 14B 模型在 AIME ’25 測試中達到 85%。

目前可透過 Mistral AI Studio、Amazon Bedrock、Azure Foundry、Hugging Face (Large 3 與 Ministral)、Modal、IBM WatsonX、OpenRouter、Fireworks、Unsloth AI 及 Together AI 存取 Mistral 3,未來也將登上 NVIDIA NIM 及 AWS SageMaker。

Mistral 仍為歐洲 AI 模型生態系統與開源倡議的領導貢獻者,儘管其最新旗艦模型在效能、速度及成本等方面仍不及業界頂尖競爭者。較小的 Ministral 變體或許更具實用性,為不同應用場景與多元設備部署提供彈性選擇。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)