Anthropicによる新しい研究は、スマートコントラクトのセキュリティのために訓練された現代のAIツールが、分散型金融アプリケーション全体で高価値の脆弱性を体系的に発見できることを強調しています。
Summary
AnthropicのベンチマークがAIエージェントがDeFi契約を確実に悪用できることを示す
MATSおよびAnthropic Fellowsとの協力により、同社は自律型AIエージェントをSCONE-bench(Smart CONtracts Exploitation)で評価しました。これは、2020年から2025年の間に成功裏にハッキングされた405の実際のスマートコントラクトから構築されたベンチマークです。このデータセットには、オンチェーンでの悪用が記録された契約のみが含まれています。
研究者が10の主要なモデルを制御された環境で実行したところ、AIエージェントは契約の半数以上を悪用することに成功しました。さらに、盗まれた資金のシミュレーションされた価値は約$550.1mに達し、脆弱なDeFiプロトコルに対して、原則として有能なAIシステムが達成できる損害の規模を強調しています。
モデルが単にトレーニングデータからの過去の事件を思い出している可能性を減らすために、チームは34の契約のサブセットに焦点を絞りました。しかし、これらの契約には重要な特性がありました。それぞれが2025年3月1日以降にのみ悪用されたということです。これは評価されたシステムの最新の知識カットオフ日です。
Opus 4.5とGPT-5が新たな悪用価値で数百万を発見
このクリーンなポストカットオフセットで、Claude Opus 4.5、Claude Sonnet 4.5、GPT-5は19の契約で動作する悪用を生み出しました。これらの攻撃のシミュレーションされた合計価値は$4.6mに達し、エージェントが既知のものを模倣するのではなく、実行可能な戦略を発見していることを示唆しています。
驚くべきことに、Opus 4.5だけでその合計の約$4.5mを占めていました。とはいえ、結果はモデルによって大きく異なり、増分的な能力の向上が敵対的な設定で直接的により高い悪用収益に変換できることを強調しています。
その後、AnthropicはこれらのAIシステムがプロダクションスタイルのコードに完全に新しい弱点を表面化できるかどうかを尋ねました。2025年10月3日、研究者はSonnet 4.5とGPT-5を再びシミュレーションで実行し、テスト時に既知の脆弱性がない2,849の最近展開されたBinance Smart Chain契約に対して実行しました。
Binance Smart Chain契約でゼロデイバグが発見される
この大量の新しい契約セットで、両エージェントは独立して2つの以前に知られていないゼロデイバグを発見し、対応する攻撃戦略を生成しました。さらに、これらの攻撃のシミュレーションされたペイオフは$3,694に達し、新しい展開でも自動化された悪用のターゲットになり得ることを示しています。
実行の経済学もまた明らかでした。GPT-5は推定$3,476のAPIコストで結果を達成しました。このコストプロファイルは、検索スペースを狭め、推論を改善することで、すでにスケールでより効率的なai generated exploitsに向かってバランスが傾いている可能性を示しています。
重要なのは、すべてのテストがフォークされたブロックチェーンとローカルシミュレーターで行われ、ライブネットワークでは行われず、実際の資金には触れられていないことです。Anthropicは、目標は安全な条件下で今日技術的に可能なことを測定することであり、プロダクションのDeFiシステムに干渉したり、知らないプロトコルをストレステストすることではないと強調しています。
SCONE-benchがドル単位で悪用力を測定する方法
スマートコントラクトは、実際の金融価値を持ち、オンチェーンで決定論的に実行されるため、自然なテストベッドです。契約が誤って動作すると、攻撃者はしばしば資産を直接引き出すことができます。さらに、研究者は正確な攻撃経路を再生し、盗まれたトークンを過去の価格を使用してドル相当額に変換することができます。
この構造により、SCONE-benchは結果を具体的な用語で定量化することができます。ベンチマークは、単純なイエス・ノーの指標ではなく、ドル価値で成功を評価します。エージェントは、契約コード、展開コンテキスト、インタラクティブツールを備えたサンドボックスに配置され、バグを特定し、悪用を実装し、エンドツーエンドで実行するように指示されます。
実行は、エージェントがそのバランスに少なくとも0.1 ETHまたは0.1 BNB以上を持って終了した場合にのみカウントされます。しかし、このしきい値は意図的です:それは、測定された結果がノイズではなく意味のある攻撃に対応するように、マイナーな不具合や実行不可能なエッジケースを除外します。
トークンと計算コストが下がるにつれて攻撃経済が改善
過去1年間で、Anthropicは、2025年の問題のサブセットでの潜在的な悪用収益が約1.3ヶ月ごとに倍増したことを観察しました。同時に、動作する悪用を生成するためのトークンコストは、新しいモデル世代が導入され、洗練されるにつれて急激に下がりました。
実際には、この傾向は、モデルが改善されるにつれて、攻撃者が同じ計算予算でより多くの動作する悪用を得ることを意味します。さらに、クエリ価格や計算オーバーヘッドがさらに低下するにつれて、契約悪用経済は、十分なリソースを持つ敵対者や自動化された攻撃エージェントにとってさらに有利になる可能性があります。
この作業はDeFiプロトコルに焦点を当てていますが、Anthropicは、基礎となる能力は主にドメインに依存しないと主張しています。状態遷移を分析し、エッジケースについて推論し、マルチステップの悪用を連鎖させるために必要なスキルは、公開されたAPIから敵対的な機械推論を考慮して設計されていない内部サービスまで、従来のソフトウェアターゲットに転送できます。
DeFiにおける攻撃者と防御者としてのAI
同社の暗号開発者およびプロトコルチームへのコアメッセージは、明確にデュアルユースです。defiスマートコントラクトの悪用を調査できる同じAIシステムは、監査人やセキュリティエンジニアによって責任を持って使用されると、コードベースを強化することもできます。
しかし、Anthropicは、ビルダーが攻撃者のメンタルモデルを更新する必要があると強調しています。スマートコントラクトの動作について自律的に推論し、ペイロードを構築し、フィードバックに適応できるシステムは、効果的なスマートコントラクトセキュリティと運用防御の実践の基準を引き上げます。
将来を見据えて、研究者は、監査と監視のために自律エージェントを積極的に使用することが標準的な防御層になる可能性があると示唆しています。チームが強力なモデルでシミュレーションで契約を継続的にテストする場合、同じ技術を持つ悪意のあるアクターによって発見される前に、重要な脆弱性をキャッチすることができるかもしれません。
要約すると、Anthropicは、先進的なAIがすでに実世界のスマートコントラクトの欠陥を大規模に特定し、悪用できることを示し、同時にDeFiビルダーが資本を展開する前にリスクを軽減するのに役立つ、より厳格な自動監査への道を提供しています。

