Anthropic 在 2026 年中期選舉前為 Claude 部署選舉防護措施

Crypto Frontier

Anthropic 週五宣布一系列選舉可信度維護措施,旨在防止其 Claude AI 聊天機器人被武器化,用於在 2026 年美國中期選舉以及今年全球其他重大競選中散播錯誤資訊或操縱選民。總部位於舊金山的該公司詳述了一套多管齊下的方案,其中包括自動偵測系統、針對影響力運作進行壓力測試,並與一家非黨派的選民資源組織合作——這些措施反映出外界對 AI 開發者在選舉季節中加強監管其工具使用方式的壓力日益增加。

選舉使用政策

Anthropric 的使用政策禁止 Claude 用於進行欺騙性的政治競選、產生旨在影響政治言論的虛假數位內容、犯下選民詐欺、干擾投票基礎設施,或散播有關投票流程的誤導性資訊。

合規測試結果

為了落實其選舉政策,Anthropic 使用 600 個提示對其最新模型進行測試——其中 300 個是有害請求,並搭配 300 個合法請求——以衡量 Claude 對適當請求的遵從可靠度,以及對問題性請求拒絕的情況。Claude Opus 4.7 與 Claude Sonnet 4.6 分別在 100% 與 99.8% 的時間內作出了適當回應。

該公司也將其模型用於更精密的操縱手法測試。透過使用多回合的模擬對話、旨在貼近不法行為者可能採用的逐步方法,在以影響力運作情境進行測試時,Sonnet 4.6 與 Opus 4.7 分別在 90% 與 94% 的時間內作出了適當回應。

Anthropric 另外測試其模型是否能夠自主執行影響力運作——在未經人工提示的情況下,規劃並端到端執行一項多步驟的競選活動。依據該公司表示,在有防護措施的前提下,其最新模型拒絕了幾乎每一項任務。

政治中立性評估

就政治中立性的問題而言,Anthropic 在每次模型推出前都會進行評估,以衡量 Claude 對來自政治光譜各方、表達不同觀點的提示時,能否一貫且公正地作出互動。Opus 4.7 與 Sonnet 4.6 分別得分 95% 與 96%。

選舉資訊橫幅

對於尋求投票資訊的使用者,Claude 將顯示一則選舉橫幅,將他們導向 TurboVote,這是 Democracy Works 提供的非黨派資源,提供有關選民登記、投票地點、選舉日期與選票細節的可靠、即時資訊。今年晚些時候也計畫為巴西的選舉推出類似的橫幅。

持續監控

Anthropric 表示,隨著選舉週期推進,它計畫持續監控其系統並精進其防禦措施。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

DeepSeek 於測試版中推出影像辨識功能

根據 PANews,DeepSeek 於今天 (April 29) 推出了其影像辨識功能,目前處於測試版。網頁版與行動應用程式的使用者都有可能被選中參與測試版推送。

GateNews30分鐘前

Anthropic 為 Claude 推出 8 個創意工具連接器,包含 Blender、Adobe、Autodesk

Anthropic 已宣布一系列創意工具連接器,讓 Claude 能夠直接控制供設計師與音樂人使用的專業軟體。最初的八個連接器涵蓋 3D 建模、視覺設計、音樂製作與現場表演,合作夥伴包括 Blender、Adobe、Autodesk、Ableton、Splice、Canva 的 Affinity、Resolume 以及 SketchUp。Blender 連接器由 Blender 官方團隊使用 MCP 協定開發,讓其他 AI 模型也能存取它。

GateNews31分鐘前

白宮繞過五角大廈風險評估,將 Anthropic Mythos 模型部署於 4 月 29 日

根據 Whale Factor 的說法,白宮正在繞過五角大廈的風險評估,計劃於 4 月 29 日在各聯邦機構部署 Anthropic 的 Mythos 模型。此舉旨在加速聯邦 AI 能力,並追上去中心化 AI 網路的步伐。這代表著一項重大轉變

GateNews37分鐘前

Cognizant 將收購 Astreya 以擴展人工智慧基礎設施業務

根據路透社報導,4月29日,Cognizant 同意以約 $600 百萬美元收購 Astreya,以擴展其人工智慧基礎設施業務。Astreya 是一家專注於人工智慧基礎設施與資料中心服務的資訊科技服務提供商。該交易預計將於第二季完成

GateNews47分鐘前

30 Malicious Plugins on ClawHub Disguised as AI Tools, Downloaded Over 9,800 Times

According to Manifold researcher Ax Sharma, 30 plugins on ClawHub disguised as legitimate AI tools have been downloaded over 9,800 times while secretly converting users' AI assistants into cryptocurrency workers. The plugins, published under the account imaflytok, appear as routine task schedulers a

GateNews55分鐘前

Parag Agrawal's Parallel Raises $100M Series B for AI Agent Search Infrastructure

According to Beating, Parallel Web Systems, founded by former Twitter CEO Parag Agrawal, completed a $100 million Series B round led by Sequoia Capital, valuing the company at $2 billion. Kleiner Perkins, Index Ventures, and Khosla Ventures also participated. The funding comes six months after the c

GateNews1小時前
留言
0/400
暫無留言