OpenAI і Paradigm представили EVMbench — бенчмарк для оцінки здатності AI-агентів виявляти, виправляти та експлуатувати вразливості у смарт-контрактах. Інструмент інтегрує різні сценарії атак і оцінює моделі AI у виявленні, виправленні та експлуатації, підкреслюючи виклики, з якими стикаються при підтримці функціональності контракту та забезпеченні безпеки.