Gate 广场|3/2 今日话题: #贵金原油价格飙升
🎁 带话题发帖,抽 5 位锦鲤送出 $2,500 仓位体验券!
中东局势突变!美以联手空袭,伊朗反击并封锁霍尔木兹海峡。航运受阻引发原油跳涨,避险情绪驱使资金疯狂涌入黄金,贵金属飙升。动荡之下,财富机会何在?
💬 本期热议:
1️⃣ 原油、贵金属还能涨多远?关键点位在哪?
2️⃣ 这波你在 Gate TradFi 布局了吗?欢迎晒收益。
3️⃣ 美伊后续怎么走?会如何影响原油、金属和加密市场?
分享观点,瓜分好礼 👉️ https://www.gate.com/post
Gate TradFi 👉️ https://www.gate.com/tradfi
📅 3/2 15:00 - 3/4 12:00 (UTC+8)
OpenAI 发布了评估 AI 代理破解智能合约能力的基准测试 - ForkLog:加密货币、人工智能、奇点、未来
OpenAI 公司联合 Paradigm 推出了 EVMbench——一种用于评估人工智能代理识别、修复和利用智能合约漏洞能力的基准测试。
该工具基于从40次审计中筛选出的120个漏洞示例。大部分示例来自公开的代码分析平台。它还包括一些来自 Tempo 区块链安全检测的攻击场景——Tempo 是由 Stripe 和 Paradigm 为高性能、低成本的稳定币支付而开发的第一层专用网络。
与 Tempo 的集成使得基准测试中加入了支付智能合约——这是“稳定币”和人工智能代理预计会广泛应用的领域。
为了创建测试环境,OpenAI 对现有的利用脚本和攻击脚本进行了适配,并事先确认其实际应用的可行性。
EVMbench 评估三种能力模式:
人工智能模型的表现
OpenAI 在所有三种模式下测试了先进模型。在 Exploit 模式中,GPT-5.3-Codex 达到72.2%,GPT-5 达到31.9%。而在漏洞检测和修复方面的表现则相对较弱——许多问题仍然难以发现和修复。
在 Detect 模式中,人工智能代理有时在发现一个漏洞后就停止,而不是进行完整的审计。在 Patch 模式下,它们目前难以修复那些不明显的问题,同时保持合约的完整功能。
提醒一下,2025年11月,微软推出了人工智能代理测试环境,并揭示了现代数字助手存在的漏洞。