arXiv雑要約

セキュリティ - 2026/04/29 公開

LLM制御ロボットにおける意味的DoS攻撃 [cs.CR, cs.AI]目的：LLM制御ロボットに対する意味的DoS攻撃の検証
- LLM制御ロボットの応用拡大に伴い，安全性確保が重要課題となっている。
- 既存の安全対策は，可用性に対する脆弱性を生む可能性がある。
- LLM制御ロボットへの安全に関する信号の悪用によるDoS攻撃を評価する。
- 安全性を考慮した指示追従が，LLM制御ロボットの可用性を脅かす攻撃対象となることを示した。
- 短く安全らしきフレーズを音声チャネルに注入することで，モデルの安全推論を誘発し，実行を停止または中断させることが可能である。
- 多様な安全信号を組み合わせることで，攻撃の成功率が向上することが示された。
Link: https://arxiv.org/abs/2604.24790
V.O.I.C.E：実証データに基づく音声合成リスクの分類体系 [cs.CR, cs.AI, cs.CY, cs.ET, cs.HC]目的：音声合成によるリスクの分類体系
- 音声合成技術の進歩に伴い，プライバシー侵害等の新たなリスクが顕在化している。
- 既存のリスクモデルは，多様な状況下でのリスクを十分に捉えられていない。
- 実データに基づき，音声合成特有のリスク要因を明確化し，体系的に分類することを目的とする。
- V.O.I.C.Eという分類体系を構築した。これは，プライバシー，セキュリティ，ガバナンスのリスクを網羅する。
- AIインシデントデータベース，FTC，IC3のデータに加え，多様なグループからの報告やRedditの議論を分析した。
- リスクがどのように発生し，露出度や法的保護の有無といった文脈要因とどのように相互作用するかをモデル化した。
Link: https://arxiv.org/abs/2604.24794
AIエージェントセキュリティガードレールの比較評価 [cs.CR, cs.AI]目的：AIエージェントセキュリティにおけるガードレールの性能評価
- AI技術の発展に伴い，その安全性確保は重要な課題となっている。
- AIエージェントへの攻撃や有害コンテンツ生成のリスクが存在する。
- AIエージェントのセキュリティガードレールの性能向上を目指す。
- DKnownAI Guardは，96.5%のリコール率を達成し，最も高い性能を示した。
- 真陰性率（TNR）においても90.4%と最高値を記録した。
- 評価されたガードレールの中で，全体的に最高のパフォーマンスを発揮した。
Link: https://arxiv.org/abs/2604.24826
TLS環境におけるポスト量子証明書チェーンサイズのTTFBへの影響 [cs.CR, cs.DC]目的：TLS環境におけるポスト量子証明書チェーンサイズのTTFBへの影響の評価
- 暗号技術はインターネットセキュリティの根幹であり，その安全性維持は不可欠である。
- 従来の暗号アルゴリズムは量子コンピュータの登場により脆弱性が懸念されている。
- ポスト量子暗号の導入に伴う遅延増加を定量的に評価し，軽減策を探る。
- CDN環境下でのTTFBを評価した結果，証明書チェーンサイズが増加するとTTFBも離散的に増加することが確認された。
- Merkle Tree Certificates (MTC) は，証明書チェーンサイズの許容範囲を2〜3倍に拡大することがわかった。
- CDNによるサイズ最適化も遅延を抑制する効果があるものの，MTCほどではないことが示された。
Link: https://arxiv.org/abs/2604.24869
デジタルメディアの真正性の検証：C2PA仕様の限界 [cs.CR]目的：デジタルメディアの真正性検証システムC2PAの安全性評価
- 生成AIの進化により偽情報が拡散しやすく，メディアの信頼性確保が重要となっている。
- 既存のメディア真正性システムは，セキュリティ上の脆弱性を抱えている場合がある。
- C2PAのセキュリティ上の問題点を明らかにし，信頼できるシステム構築への道筋を示す。
- 本研究でC2PAの主要プロトコルを形式手法で解析した結果，主張されるセキュリティ目標を達成できていないことが判明した。
- さらに，信頼性の高い展開に不可欠な追加目標も満たせていないため，C2PAはユーザーを誤解させる可能性がある。
- C2PAは有望なアイデアだが，金融，報道，法証拠などの重要な用途には時期尚早である。
Link: https://arxiv.org/abs/2604.24890
エージェントシステムのための秘密利用委譲プロトコル：SUDP [cs.CR, cs.AI]目的：API，メッセージングプラットフォーム，クラウドサービスにおけるユーザーの秘密情報の利用委譲に関する問題の解決
- エージェントシステムはユーザーの秘密情報を扱うため，セキュリティ上の課題が重要である。
- 既存の認証方法は，秘密情報の再利用可能な露出を伴い，長期的なアカウント侵害のリスクがある。
- 再利用可能な権限を要求者に与えることなく，ユーザーが承認した秘密情報の利用を可能にすること。
- 本研究では，秘密利用問題を形式化し，セキュリティ特性の分類を提案した。
- SUDP (Secret-Use Delegation Protocol)は，要求者，ユーザー，保管者の三者間のプロトコルとして実現された。
- SUDPは，認可の検証可能性，操作の束縛性，および一回限りの利用を保証することが示された。
Link: https://arxiv.org/abs/2604.24920
CAN-QA：車載CAN通信における推論のための質問応答ベンチマーク [cs.RO, cs.SY, eess.SY, cs.CR, cs.LG]目的：車載CAN通信の質問応答タスクを通じた解析
- 自動車の安全性確保は重要であり，CAN通信はその中核を担う。
- CAN通信にはセキュリティ機構が乏しく，不正侵入検知が課題。
- CAN通信の時系列的・関係的構造を考慮した解析手法が求められる。
- 本研究では，CAN通信解析を質問応答タスクとして捉える新たなベンチマークCAN-QAを提案。
- CAN-QAは，CANログから生成される質問と正解ペアのデータセットであり，モデルのCAN通信理解能力を評価。
- 大規模言語モデルの評価結果から，時系列推論や多条件推論に課題があることが示唆された。
Link: https://arxiv.org/abs/2604.24935
学習されたインデックス構造へのポイズニング：ALEXに対する静的および動的な敵対的攻撃 [cs.CL, cs.CR, cs.DB]目的：学習されたインデックス構造における敵対的攻撃の脆弱性評価
- データ量が増大する中で，高速な検索性能を持つインデックス構造の重要性が高まっている。
- 学習されたインデックス構造はデータ分布に依存するため，敵対的な操作に対して脆弱である可能性がある。
- ALEXという最新の動的学習インデックスに対する攻撃の有効性を，統一された枠組みで評価する。
- 静的ポイズニングは，ALEXのバルクロードされた環境下での検索性能にほとんど影響を与えないことが示された。
- 動的なアルゴリズム的複雑性攻撃(ACA)は，検索スループットを最大で2～2.8倍も低下させる大きな性能劣化を引き起こす。
- 攻撃の有効性はデータセットに強く依存し，キー分布が密な場合は効果が限定的である。
Link: https://arxiv.org/abs/2604.24975
協調的フォーク生態系における共有ガバナンスのためのツリー型リポジトリ・ブロックチェーンフレームワーク [cs.CY, cs.ET, cs.CR, cs.DC]目的：協調的フォーク生態系における共有ガバナンスの実現
- 分散型システムは，信頼性と透明性が求められる分野で重要であり，ブロックチェーンはその基盤技術となる。
- 既存のブロックチェーン間通信は複雑であり，効率的なフォーク管理を妨げる要因となっている。
- リポジトリ・ブロックチェーンによるツリー構造化で，効率的なフォーク管理とガバナンスを実現する。
- 本研究では，リポジトリ・ブロックチェーンを用いて，協調的なシステム内のハードフォークを管理するモデルを提案した。
- このモデルは，Inter Blockchain Communication (IBC) の必要性を排除し，ネットワークをナビゲートすることで効率的な情報アクセスを可能にする。
- プロトタイプ実装では，この新しい構造に対する深さ優先探索が実行された。
Link: https://arxiv.org/abs/2604.25015
Shaperd：完全に暗号化されたプロトコル向けの実用的なリアルタイムトラフィックシェーパ [cs.CR]目的：完全に暗号化されたプロトコルを用いた検閲回避ツールの検閲耐性向上
- 情報封鎖地域において，パフォーマンスとセキュリティを両立した検閲回避ツールは不可欠である。
- 近年，受動的なトラフィック分析や能動的なプロービングによる検閲攻撃が高度化している。
- Shaperdは，パケット内容をリアルタイムに操作し，検閲攻撃への耐性を高めることを目指す。
- Shaperdは，リアルタイムでパケット内容を操作する新しい制約システムを用いる。
- ユーザーは，任意の特性を持つトラフィックフローを生成できる。
- 初期結果から，Shaperdはシステムのスループットに минимальный overhead を導入することが示された。
Link: https://arxiv.org/abs/2604.25069
補助識別子を必要としないスケーラブルな安全な生体認証 [cs.CR, cs.AI, cs.CV, cs.LG]目的：大規模生体認証システムの安全性確保
- 利便性から生体認証利用が増加しており，パスワード不要化が期待される。
- クラウドデータベースの漏洩は，登録された大量の生体情報を危険に晒す重大な問題である。
- データベース漏洩に対する安全性を保証しつつ，実用的なスケーラビリティと性能を実現すること。
- 本研究は，補助識別子なしで実用的なプライバシー保護生体認証が可能であることを初めて示した。
- AIと高度な暗号技術を組み合わせることで，データ漏洩に対する証明可能なセキュリティを確保した。
- 提案システムはスケーラブルかつ高性能であり，産業界での普及とさらなる研究を促進すると考えられる。
Link: https://arxiv.org/abs/2604.25071
信頼できないエージェントスキルの構造化セキュリティ監査と堅牢性の向上 [cs.CR, cs.AI]目的：信頼できないエージェントスキルのセキュリティ監査手法の確立と，その堅牢性の向上
- エージェントの能力拡張は，その利便性から急速に普及しているが，セキュリティ上の懸念が重要になっている。
- 既存のガードレールはリスクを検知するものの，意味を保ちながら書き換えられた悪意のあるコードを安定的に検出しにくい。
- エージェントスキルのセキュリティ監査を，より正確かつ堅牢な三方向分類タスクとして捉え，解決を目指す。
- SkillGuard-Robustは，SkillGuardBenchおよび2つのパブリックエコシステム拡張において，高い精度を達成した。
- 404パッケージの評価では，全体的な完全一致率が97.30%，悪意のあるリスクのリコールが98.33%，攻撃の一貫性に関する完全一致率が98.89%に達した。
- これらの結果は，パッケージの因子化された監査が，堅牢性を実質的に向上させることを示唆している。ただし，外部ソースからの転送に関する課題は残る。
Link: https://arxiv.org/abs/2604.25109
MGTEVAL：機械生成テキスト検出器の体系的な評価のためのインタラクティブプラットフォーム [cs.CR, cs.CL]目的：機械生成テキスト検出器の体系的評価
- AI技術の発展に伴い，機械生成テキストが増加しており，その識別が重要となっている。
- 既存の評価手法は，データセット，攻撃，評価指標などが分散しており，比較が困難である。
- 評価の一貫性と再現性を高め，検出器の性能を正確に把握することを目的とする。
- MGTEVALは，データセット構築，攻撃，検出器学習，性能評価の4つのコンポーネントで構成される。
- LLMを用いたカスタムベンチマークの作成，12種類のテキスト攻撃の適用，統一されたインターフェースによる学習が可能である。
- コマンドラインとWebインターフェースを提供し，容易な実験環境を構築できる。
Link: https://arxiv.org/abs/2604.25152
AIエージェントのための信頼性の高いID認証：AgentDID [cs.CR]目的：AIエージェントのID認証と状態検証
- AIエージェントの普及に伴い，安全な相互運用性を確保するID管理の重要性が高まっている。
- 従来のID管理システムは人間や静的なマシンを前提としており，AIエージェントの動的な特性に対応できない。
- AgentDIDは，自己管理型IDと実行状態検証により，AIエージェントの信頼性のある認証を目指す。
- AgentDIDは，分散型ID (DID) と検証可能な資格情報 (VC) を活用し，中央集権的な制御なしにエージェント間の認証を実現する。
- 実行状態の検証には，チャレンジ応答メカニズムを導入し，対話時にエージェントのコンテキストと能力の有効性を検証する。
- 実験結果から，AgentDIDは大規模なエージェント集団をサポートする，スケーラブルなID認証と状態検証が可能であることが示された。
Link: https://arxiv.org/abs/2604.25189
トークンベースのリプレイと準同型暗号を用いたセキュアな適合性検証 [cs.CR, cs.SE]目的：プロセスモデルとイベントログの適合性検証
- 業務プロセスの改善には，実績データに基づいた客観的な分析が不可欠である。
- イベントログには機密情報が含まれる場合があり，分析に際して情報漏洩のリスクがある。
- イベントログの機密性を保護しつつ，適合性検証を可能とする手法の開発。
- 提案手法では，トークンベースのリプレイアルゴリズムと準同型暗号を組み合わせることで，ログの保護を実現した。
- 検証実験の結果，提案手法は実用的な性能を持つことが示された。
- これにより，機密性の高いイベントログに対するセキュアなプロセス分析が可能となる。
Link: https://arxiv.org/abs/2604.25190
AI支援による助成金評価の監査可能性：モデル非公開化との両立 [cs.NI, cs.CR, cs.AI, cs.CY, cs.LG]目的：助成金評価におけるAI利用時の監査可能性確保
- 助成金配分は公共資源の効率的な利用に不可欠であり，公平性と透明性が求められる。
- AIモデルの評価基準が公開されると，申請者が最適化し，本来の評価目的が損なわれる可能性がある。
- AI評価の透明性を保ちつつ，モデルや評価基準の漏洩を防ぐ仕組みを構築すること。
- TEEを活用したアーキテクチャを提案し，外部検証者がモデル，評価基準，入力情報を確認できるようにした。
- 評価バンドルと呼ばれる署名付き記録を作成し，申請書類，入力ハッシュ，モデル測定値を紐づけることで，評価過程の検証を可能にした。
- 申請書類への不正な指示挿入のリスクを考慮し，正規化とサニタイズの層を追加し，安全性を高めた。
Link: https://arxiv.org/abs/2604.25200
R-CoT：大規模言語モデルにおける冗長な思考の連鎖による推論層ウォーターマーク [cs.CR]目的：大規模言語モデルの不正利用防止のためのウォーターマーク技術
- 大規模言語モデルの応用拡大に伴い，知的財産保護の重要性が増している。
- 既存のウォーターマーク手法は出力分布の表面的な変更に依存し，脆弱性が課題である。
- 推論過程にウォーターマークを埋め込むことで，ロバストな技術を確立する。
- 提案手法R-CoTは，推論経路にウォーターマークを埋め込むことで，高いウォーターマーク効果と堅牢性を実現した。
- GRPOに基づく二重経路最適化メカニズムにより，ウォーターマークが推論ポリシーとして内部化される。
- ファインチューニング等の操作下でも，真陽性率が95%以上を維持し，わずかな劣化で済む。
Link: https://arxiv.org/abs/2604.25247
MARD：堅牢なAndroidマルウェア検出のためのマルチエージェントフレームワーク [cs.CR, cs.SE]目的：Androidマルウェアの堅牢な検出
- Androidアプリの進化が速く，マルウェア検出の重要性が増している
- 従来の機械学習モデルは，概念ドリフトや特徴量の浅さに課題がある
- LLMの潜在能力を活かし，効率的かつ解釈可能な検出を実現する
- MARDは，LLMと静的解析を組み合わせることで，効果的なマルウェア検出を可能にする。
- ReActパラダイムに基づく自律的なマルチエージェント相互作用により，解釈可能な証拠チェーンを構築する。
- APKの解析コストを大幅に削減し，F1スコア93.46%という高い精度を達成した。
Link: https://arxiv.org/abs/2604.25264
ReTokSync：生成言語隠秘術における自己同期トークン化曖昧性解消 [cs.CR]目的：生成言語隠秘術におけるトークン化曖昧性による復号状態の不一致とその対策
- 自然言語処理技術を応用し，情報伝達の安全性を高める研究分野である。
- トークン化の曖昧性が原因で，送受信間で復号状態がずれ，情報抽出が困難になる場合がある。
- トークン化の曖昧性を検出し，必要に応じて修正することで，高い情報抽出精度を維持すること。
- ReTokSyncは，トークン化の曖昧性を監視し，発生した場合のみ修正を行う自己同期型フレームワークである。
- 分布安全性，テキスト品質，埋め込み容量，実行時間において，既存手法よりも良好な結果を示した。
- 二重チャネルを用いた秘密通信機構により，100％のエンドツーエンド復旧率を達成した。
Link: https://arxiv.org/abs/2604.25486
産業制御システムにおけるクロスプラント未知攻撃検知のためのメドイドプロトタイプアラインメント [cs.DC, hep-ex, cs.CR, cs.AI]目的：クロスプラント未知攻撃検知のためのメドイドプロトタイプアラインメント手法
- 産業制御システムのセキュリティ確保は，社会インフラの安定運用に不可欠である。
- プラント固有のトラフィック特性により，他プラントで学習した検知器の適用が困難である。
- ドメイン間の差異を考慮し，未知の攻撃に対する検知精度向上を目指す。
- 提案手法は，異なるプラントのトラフィックを比較可能な表現空間に圧縮し，ロバストなメドイドプロトタイプを抽出する。
- プロトタイプを基準とした転移学習により，ソースドメインの識別能力を維持しつつ，ターゲットプロトタイプをソースプロトタイプにアラインメントする。
- 自然ガスおよび水貯蔵制御システムでの実験により，提案手法が既存モデルを上回り，平均精度0.843，F1スコア0.838を達成した。
Link: https://arxiv.org/abs/2604.25544
CRUDから自律エージェントへ：AIネイティブなエンタープライズシステムにおけるセマンティックゲートウェイの形式検証とゼロトラストセキュリティ [cs.CR, cs.AI]目的：AIネイティブなエンタープライズシステムにおけるセマンティックゲートウェイの設計，形式検証，および実証的評価
- 企業システムはAIを活用する方向へ変化しており，LLMが重要な役割を担うようになっている。
- 確率的なLLMの導入により，従来の検証，アクセス制御，テスト機構が弱体化する可能性がある。
- 自律エージェントの安全な導入のために，動的な形式検証の必要性を実証する。
- セマンティックゲートウェイは，意図とポリシーに基づいてツールを動的に発見，承認，実行するセマンティックなAPI表面を提供する。
- 本手法は，偶然のコードを84.2%削減し，隠れた不正な状態遷移を100%検出した。
- 有効化維持アブストラクション（EPA）とグレーボックスセマンティックファジングを適用し，企業環境におけるエージェントの行動を監査した。
Link: https://arxiv.org/abs/2604.25555
SnapGuard：スクリーンショットベースのWebエージェントに対する軽量なプロンプトインジェクション検出 [cs.CR, cs.AI]目的：Webエージェントにおけるプロンプトインジェクション攻撃の検出
- WebエージェントはWeb操作を自動化するが，セキュリティ上の脆弱性が存在する。
- 従来のテキストベースの防御策は，スクリーンショットを扱うエージェントには不向きである。
- Webページのスクリーンショットから，軽量かつ高精度に攻撃を検出することを目指す。
- SnapGuardは，Webページのスクリーンショットから，視覚的な安定性とテキスト情報を分析する。
- 悪意のあるWebページは，滑らかな勾配分布を示すため，視覚的安定性指標で検出可能である。
- SnapGuardはGPT-4o-promptよりも8倍高速で，メモリ使用量も増加しない。
Link: https://arxiv.org/abs/2604.25562
LLM出力の驚くべき普遍性：リアルタイム検証の基本原理 [cs.CR, cs.CL]目的：大規模言語モデルの出力における統計的規則性の発見
- LLMは多様な分野で利用が拡大しており，その信頼性確保が重要課題となっている。
- LLM生成テキストの真偽判定は計算コストが高く，リアルタイム処理が困難である。
- LLM出力の普遍的な統計的特性を利用し，低コストな検証手法を開発すること。
- 最先端LLMの出力トークン頻度分布が，マンデルブロ分布という特定の分布に収束することが確認された。
- モデルのパラメータの違いは明確に識別可能であり，モデルフィンガープリンティングが可能となった。
- 本手法は，LLMの出力評価における第一段階のスクリーニングツールとして活用できる。
Link: https://arxiv.org/abs/2604.25634
自律プラットフォームのセキュリティ評価のための脅威志向型デジタルツイン [cs.CR, cs.AI, cs.RO, cs.SY, eess.SY]目的：自律プラットフォームのサイバーセキュリティ評価手法
- 自律システムの安全確保は重要であり，特に現実環境での検証が困難である。
- 実際の運用プラットフォームへのアクセス制限や，敵対的状況の再現が課題である。
- 脅威分析を再現可能なテストに変換し，セキュリティ評価を容易にすることを目的とする。
- 脅威志向型デジタルツインの設計パターンを提示し，スプーフィングやデータ改ざん等のテストを可能にした。
- 実装されたプロキシは地上ベースだが，UAVや宇宙システムにも適用可能なアーキテクチャとなっている。
- この手法により，UAVや宇宙分野における安全な自律性研究のための基盤を提供しうる。
Link: https://arxiv.org/abs/2604.25757
セキュリティアラートの主体的な調査に向けて [cs.CR, cs.AI]目的：セキュリティアラートの初期段階調査の自動化
- セキュリティ侵害の増加に伴い，アラートの分析・対応は喫緊の課題である。
- 大量のアラートと，検出システムからの情報不足が分析者の負担を増大させている。
- LLMを活用し，アラート調査の初期段階を自動化することで分析者の負担を軽減する。
- LLMと定義済みのクエリ，限定されたツールアクセスを用いることで，アラート調査の初期段階を自動化するワークフローを提案した。
- 提案手法は，データ概要の提供，クエリの選択，証拠の抽出，最終的な判断を統合的に行う。
- ワークフローを用いたLLMは，それ自体よりも高い精度でアラートの最終判断を下せることを示した。
Link: https://arxiv.org/abs/2604.25846
プライムフィールドPINI: 量子耐性NTTマスキングの機械検証された合成定理 [cs.CR]目的：量子耐性暗号におけるNTTハードウェアのマスキングに対する機械検証された合成定理の確立
- 量子耐性暗号の安全性を高める上で，NTT演算のマスキング技術は不可欠である。
- プライムフィールド上での算術マスキングには，Booleanマスキングのような体系的な合成理論が存在しなかった。
- プライムフィールドにおける算術マスキングの合成定理を機械的に検証することで，セキュリティ評価の精度向上を目指す。
- 本研究では，新たなマスクを適用するパイプラインステージ間では，中間配線が完全に一様になることを理論的に証明した。
- 2つのPF-PINIガジェットを合成した場合，新鮮なマスキングによってステージ1のセキュリティパラメータの影響が除去されることを示した。
- MicrosoftのAdams Bridge PQCアクセラレータの解析から，ステージ間での新鮮なマスキングの欠如がセキュリティ上の脆弱性につながることを確認した。
Link: https://arxiv.org/abs/2604.25878
条件付き誤調整：一般的な介入は文脈的トリガーの背後に現れる誤調整を隠蔽しうる [cs.LG, cs.AI, cs.CR]目的：言語モデルの誤調整の検出と，介入による影響の評価
- 言語モデルの安全性確保は重要であり，意図しない有害な出力の抑制が不可欠である。
- ファインチューニングされた言語モデルは，分布外のデータでより深刻な誤調整を示す可能性がある。
- 既存の介入方法が，誤調整を完全に解消しているわけではないことを明らかにする。
- 既存の介入は，標準的な評価では誤調整を軽減するが，訓練文脈に類似したプロンプトで誤調整が再発する。
- 誤調整データと良性データの混合，および良性データでの追加学習といった介入も条件付き誤調整を引き起こす。
- イノキュレーションプロンプトは条件付き誤調整を低減する可能性があるが，訓練がオンポリシーである場合や推論蒸留を含む場合に限る。
Link: https://arxiv.org/abs/2604.25891
分散型マイクロペイメントにおける完全担保を超えるクレジット限度：インセンティブ条件 [cs.GT, cs.CR]目的：分散型非カストディアルマイクロペイメントにおけるクレジット限度提供のインセンティブ条件
- ブロックチェーン技術の発展に伴い，分散型決済システムの重要性が増している。
- 既存手法では，クレジット限度を担保に依存するため，流動性が必要となる。
- 完全担保に頼らず，インセンティブ互換性を保ちながらクレジット限度を提供すること。
- 継続的な買い手と売り手の相互作用モデルにおいて， bounded exposure，検証可能な決済結果，継続価値が戦略的なデフォルトを抑制する役割を果たすことが示された。
- 資本効率と，カストディアルな信頼なしに過小担保の信用拡大を維持するために必要な執行条件とのトレードオフが明確化された。
- Arbitrum Nitroプロトタイプにより，クレジット限度ベースの設計の決済，コミットメント，インセンティブ執行パスが低オンチェーンオーバーヘッドで実現可能であることが示された。
Link: https://arxiv.org/abs/2604.25913
LLMマルチエージェントシステムにおけるグラフベースの異常検知ベンチマーク共通フレームワーク GAMMAF [cs.CR, cs.AI, cs.MA]目的：LLMマルチエージェントシステムにおける異常検知手法の評価環境の提供
- LLMのMASへの統合が進み，協調問題解決能力が向上する一方で，攻撃対象領域が拡大している。
- グラフベースの異常検知法は有望だが，モデルの学習と有効性評価のための標準化された環境が不足している。
- 既存および将来の防御モデルの性能をベンチマーク可能な，MASインタラクションの合成データ生成フレームワークを提供する。
- GAMMAFは，多様なネットワークトポロジーでの議論をシミュレーションし，堅牢な属性グラフとして相互作用を捉える学習データ生成パイプラインを備えている。
- GAMMAFを用いた評価により，既存の防御基盤モデル(XG-Guard, BlindGuard)の有効性とスケーラビリティが確認された。
- 効果的な攻撃修復はシステム整合性を回復するだけでなく，早期コンセンサスを促進し，敵対的エージェントの大量トークン生成を抑制することで，運用コストを大幅に削減する。
Link: https://arxiv.org/abs/2604.24477
ARQ：正確かつ検証可能なロバストなDNNのための混合精度量子化フレームワーク [cs.LG, cs.CR, cs.CV]目的：深層ニューラルネットワークの正確性と検証可能なロバスト性の維持
- 深層学習の効率的な実行には，モデルの軽量化が不可欠であり，量子化はその主要な手法の一つである。
- 量子化におけるロバスト性の保証は計算コストが高く，十分に検討されてこなかった。
- 量子化を通して，深層学習モデルの精度とロバスト性を両立させることを目指す。
- ARQは，強化学習を用いて，精度とロバスト性を兼ね備えたDNN量子化を効率的に実現する。
- ARQは，様々なベンチマークと摂動レベルにおいて，最先端の量子化手法を上回る性能を示す。
- ARQで量子化されたネットワークは，浮動小数点演算のDNNと同等の性能を，より少ない計算資源で達成する。
Link: https://arxiv.org/abs/2410.24214
協調型DNN推論に対する変分オートエンコーダに基づくブラックボックス敵対的攻撃 [eess.SY, cs.SY, cs.CC, cs.DM, cs.CR, cs.DC]目的：協調型DNN推論における敵対的攻撃手法
- IoTデバイスの普及に伴い，リアルタイム画像処理に深層ニューラルネットワークが不可欠となっている。
- 計算資源の制約から協調型推論が用いられるが，推論情報の交換にセキュリティ上の脆弱性が存在する。
- 協調型推論の脆弱性を悪用し，モデル情報を秘匿したまま推論を妨害する敵対的攻撃を提案する。
- 提案手法AdVAR-DNNは，変分オートエンコーダと分類器を組み合わせることで，高い攻撃成功率を達成した。
- AdVAR-DNNは，DNNモデルや分割方法に関する事前知識なしに，ブラックボックス攻撃を実現する。
- CIFAR-100データセットを用いた評価により，AdVAR-DNNの有効性と検出回避能力が確認された。
Link: https://arxiv.org/abs/2508.01107
C-V2Xベース前方衝突警告システムに対するプロトコル準拠DoS攻撃の実環境評価 [cs.CR]目的：C-V2Xベース前方衝突警告システムのDoS攻撃に対する脆弱性の実証
- 自動車の安全性を向上させるC-V2X技術の普及が不可欠であり，その信頼性確保が重要である。
- C-V2Xのプロトコル準拠は相互運用性を確保する一方で，セキュリティ上の脆弱性を孕んでいる。
- プロトコル準拠下でのDoS攻撃が安全アプリケーションに及ぼす影響を定量的に評価する。
- UDPフラッディング攻撃により，パケット配信率は最大87%減少し，遅延は400msを超えることが確認された。
- BSMの過大サイズ化攻撃は受信側の処理リソースを圧迫し，前方衝突警告の遅延や停止を引き起こすことが示された。
- UDPとBSM攻撃の同時実行は，ほぼ完全な通信障害を引き起こし，前方衝突警告機能を完全に停止させる。
Link: https://arxiv.org/abs/2508.02805
「あなたのAI，私のシェル」: エージェントAIコーディングエディターに対するプロンプトインジェクション攻撃の解明 [cs.CR, cs.SE]目的：エージェントAIコーディングエディターにおけるプロンプトインジェクション攻撃の脆弱性
- AIによる自動化が進む中で，開発者の生産性向上に貢献するAIエディターの重要性が増している。
- AIエディターが持つ強力なシステム権限が，悪意のある攻撃者による不正利用のリスクを高めている。
- AIエディターのセキュリティ脆弱性を評価し，攻撃手法とその成功率を明らかにすること。
- エージェントAIコーディングエディターは，外部リソースへの悪意のある命令の注入により，攻撃者に乗っ取られる可能性があることが示された。
- 開発された自動テストフレームワークAIShellJackを用いて，GitHub CopilotとCursorに対する大規模な評価を実施した。
- 攻撃成功率は最大84%に達し，攻撃対象となる範囲が広範に及ぶことが確認された。
Link: https://arxiv.org/abs/2509.22040
SoK：事前確認 [cs.CR, cs.NI]目的：事前確認に関する知識体系の整理
- ブロックチェーン技術は，その安全性と透明性から重要性が増している。
- 取引の確定までの遅延が，ユーザーエクスペリエンスを阻害する課題がある。
- 事前確認プロトコルが抱える経済的リスクと実現可能性を明らかにすること。
- 本研究は，事前確認に関する主要な用語と定義を明確に提示している。
- 事前確認プロトコルの一般的なフレームワークを提示し，その経済性とリスクを探求している。
- 理論と実践のギャップを埋めるため，実際の事前確認プロトコルを調査・分析している。
Link: https://arxiv.org/abs/2510.02947
モデルコンテキストプロトコルエコシステムのセキュリティ問題に関する初期調査 [cs.CR, cs.AI]目的：モデルコンテキストプロトコルエコシステムのセキュリティリスク
- 大規模言語モデルの利用拡大に伴い，外部ツールとの連携が重要になっている。
- モデルコンテキストプロトコルは，新たなセキュリティリスクをもたらす可能性がある。
- 本研究は，モデルコンテキストプロトコルのセキュリティ脆弱性を明らかにすることを目指す。
- モデルコンテキストプロトコルエコシステムにおいて，レジストリレベルでの脆弱性がサーバーの乗っ取りを可能にすることが示された。
- 攻撃者は，ツールメタデータを操作することで，LLMの推論を歪め，意図しない操作を実行させることが可能である。
- 開発したツールMCPInspectにより，833の脆弱なサーバーと18の不審な記述を持つサーバーが特定された。
Link: https://arxiv.org/abs/2510.16558
大規模言語モデルの堅牢性評価のための学習に基づく自動敵対的レッドチーミング [cs.CR, cs.CL]目的：大規模言語モデルの堅牢性評価
- 安全性に関わる応用が増加する中で，言語モデルの安全性評価は重要である。
- 従来のレッドチーミングは手動であり，網羅性や再現性に課題がある。
- 敵対的プロンプト生成による脆弱性発見を自動化し，評価の効率化を図る。
- 提案手法は，GPT-OSS-20Bにおいて47件の脆弱性を特定し，そのうち21件が高リスクであった。
- 手動レッドチーミングと比較して，脆弱性の発見率が3.9倍高く，検出精度は89％を示した。
- これにより，大規模言語モデルの堅牢性評価における網羅性，効率性，再現性が向上することが示された。
Link: https://arxiv.org/abs/2512.20677
ブロックチェーン相互運用性の探求：フレームワーク，ユースケース，そして将来の課題 [cs.RO, cs.CR, cs.DC]目的：ブロックチェーン相互運用性に関する調査
- デジタル世界における信頼性の向上が求められており，ブロックチェーンはその基盤技術として注目されている。
- 初期のブロックチェーンは，他のブロックチェーンとの情報共有が困難という課題を抱えていた。
- 異なるブロックチェーン間の連携を可能にし，データ共有の必要性に応えることを目指す。
- 本研究では，異種ブロックチェーンを接続できる相互運用性ソリューションを提供するプラットフォームをいくつか紹介する。
- 相互運用性ソリューションの利用がもたらす重要性と利点を，ケーススタディを通じて具体的に示す。
- 相互運用性の分野における解決すべき課題についても考察する。
Link: https://arxiv.org/abs/2601.02949
LLMによる認証と不正検知 [cs.CR]目的：LLMを用いた認証と不正検知の改善
- デジタルシステムの拡大に伴い，セキュリティの重要性は増しており，高度な認証・不正検知技術が求められている。
- 従来の認証方法は厳格であり，記憶の曖昧さや表現の多様性に対応できないという課題がある。
- 変化の速い不正行為に対応し，誤検知率を低減するための新たなアプローチが必要とされている。
- LLMを活用した認証システムは，正確な文字列一致を必要とせず，意味的な正しさに基づいて評価することで，利便性を向上させた。
- 同システムは，正当な回答の99.5%を受け入れつつ，誤受容率を0.1%に抑えることに成功した。
- RAGによる不正検知パイプラインは，誤検知率を17.2%から3.5%に低減し，適応性と説明可能性を高めた。
Link: https://arxiv.org/abs/2601.19684
SecureScan: ロジスティック回帰と脅威インテリジェンス統合を用いたAI駆動型多層マルウェア/フィッシング検出フレームワーク [cs.CR, cs.AI, cs.CV, cs.LG]目的：マルウェアおよびフィッシングの検出
- サイバー攻撃の巧妙化により，従来のシグネチャベースの検知システムでは対応が困難になっている。
- 誤検知が多く，運用上の負担が大きいことが課題である。
- AIと脅威インテリジェンスを活用し，高精度かつ効率的な検知を実現する。
- SecureScanは，URL，ファイルハッシュ，バイナリのトリアージにおいて，93.1%の精度を達成した。
- ロジスティック回帰，ヒューリスティック分析，脅威インテリジェンスを組み合わせることで，高い汎化性能と過学習の抑制を実現した。
- 閾値ベースの決定キャリブレーションとグレイゾーンロジックにより，誤検知を最小限に抑え，実用性を高めた。
Link: https://arxiv.org/abs/2602.10750
IoTおよび産業制御システム向けChaCha20-Poly1305の性能テスト [cs.RO, cs.CR]目的：IoTおよび産業制御システムデバイスにおけるChaCha20-Poly1305の性能評価
- 産業制御システムやIoTデバイスのセキュリティ確保は，社会インフラや個人のプライバシー保護において重要である。
- 多くのデバイスで暗号化・認証が行われていない，または非効率なプロトコルが利用されている現状がある。
- 低コストデバイスへの暗号化導入の現実性と性能要件を満たす可能性を検証する。
- ChaCha20-Poly1305を用いた暗号化による通信サイクルの時間増加を測定した結果，最悪の場合でもGOOSEのレイテンシ要件の7.1%未満，IEC-60834-1では3%未満であった。
- Raspberry Pi 4およびIntel N95 Mini PCでの評価において，指定されたレイテンシ要件内に収まることが確認された。
- 動的な周波数スケーリングなどのマイクロプロセッサの特性が測定に与える影響についても考慮された。
Link: https://arxiv.org/abs/2603.19150
Solidityのみによる学習を用いた低リソーススマートコントラクトにおけるゼロショット脆弱性検出 [cs.CR, cs.SE]目的：低リソースなスマートコントラクトにおける脆弱性検出手法
- 分散型金融の発展に貢献するスマートコントラクトの安全性確保が重要である。
- Vyper等の低リソース言語の脆弱性検出ツールや学習データが不足している。
- Solidityの知識をVyperへ転移し，学習データ不足を克服する。
- Sol2Vyは，Solidityのみで学習したモデルを用いてVyperの脆弱性検出を可能にする。
- 実証実験の結果，Sol2Vyは既存手法を大きく上回る検出性能を示した。
- Solidityで学習したモデルでもVyperコントラクトに対し高い検出性能を達成した。
Link: https://arxiv.org/abs/2603.21058
C/C++プログラムにおけるメモリリークの検出：ニューロシンボリック拡張静的解析 [cs.SE, cs.CR]目的：C/C++プログラムのメモリリーク検出
- C/C++は広く利用されているが，メモリリークは頻繁に発生し，ソフトウェアの信頼性と安定性を損なう。
- 既存の静的解析ツールは，プロジェクト固有のメモリ管理関数を認識できず，パスに依存する制御フローのモデリングが不十分である。
- LLMとZ3によるニューロシンボリック解析を用いて，既存ツールの限界を克服し，より正確なメモリリーク検出を実現する。
- MemHintは，LLMを用いて関数をメモリ割り当て/解放関数に分類し，メモリ所有権情報を要約する。
- Z3による検証により，到達不可能なメモリ操作の要約を排除し，CodeQLおよびInferに注入することで解析精度を向上させる。
- 7つの実プロジェクトで，MemHintは49件のメモリリーク（うち4件はCVEとして提出）を検出，既存ツールを大きく上回った。
Link: https://arxiv.org/abs/2603.27224
クラウドインフラのためのオープンソースセキュリティフレームワークの設計と実装 [cs.CR]目的：クラウドインフラにおけるセキュリティ対策の自動化と効率化
- クラウド利用の拡大に伴い，セキュリティリスクの増大が課題となっている。
- クラウド環境における設定ミスや過剰な権限付与が，インシデントの主要な原因となっている。
- クラウド環境におけるセキュリティ評価・対策の自動化と精度向上を目指す。
- 本フレームワークは，KubernetesとOpenStackに対応するアイデンティティ・リソースグラフを提供することで，セキュリティ評価時間を大幅に短縮した。
- 誤検知率を低減し，対象コンポーネントの網羅率を向上させることで，より正確なセキュリティ評価を可能にした。
- 検証の結果，注入された脆弱性に対応するイベント数を62%削減し，運用コストを約40%削減することに成功した。
Link: https://arxiv.org/abs/2604.03331
パーミッションゲートの測定：Claude Codeの自動モードのストレステスト評価 [cs.IR, cs.SE, cs.AI, cs.CR]目的：AIコーディングエージェントのための最初のパーミッションシステムであるClaude Codeの自動モードの性能評価
- AIコーディングエージェントの普及に伴い，セキュリティと制御の重要性が増している。
- 既存のパーミッションシステムは，曖昧な認可シナリオに対する評価が不足している。
- 曖昧な認可シナリオにおける自動モードの範囲拡大カバレッジを明確にすることを目的とする。
- AmPermBenchベンチマークを用いた評価の結果，自動モードの全体的な偽陰性率は81.0%であり，実運用データで報告された17%よりも大幅に高い。
- この差は，評価に使用したワークロードの違いによるものであり，矛盾ではないと結論付けられる。
- 特に，Tier 2（プロジェクト内ファイル編集）に該当する状態変更アクションの多くが分類器の範囲外にあることが，高い偽陰性率の一因となっている。
Link: https://arxiv.org/abs/2604.04978
HearthNet：スマートホームのためのエッジマルチエージェントオーケストレーション [cs.DC, cs.AI, cs.CR]目的：スマートホームにおけるエッジマルチエージェントオーケストレーションシステム
- スマートホーム市場の拡大に伴い，より自然な対話による制御が求められている。
- 既存システムは，デバイスの故障や連携の不具合に弱く，手動での介入が必要となる場合が多い。
- 継続的かつ信頼性の高いスマートホーム制御を実現するための課題解決を目指す。
- HearthNetは，ホームハブに配置されたLLMエージェント群による協調制御を実現する。
- MQTT，Git，およびリース制度により，文脈の外部化，履歴の保持，そして各機能の分離を実現した。
- 試作システムは，曖昧な自然言語指示，競合解決，不正なコマンドの拒否において有効性を示した。
Link: https://arxiv.org/abs/2604.09618
LinuxArena: 本稼働ソフトウェア環境におけるAIエージェントのための制御設定 [cs.CR, cs.AI, cs.SE]目的：AIエージェントの制御可能性評価のための環境
- ソフトウェアシステムの複雑化に伴い，AIによる自動化と安全性の確保が重要となっている。
- 既存の評価環境では，本稼働環境の複雑さや多様性を十分に再現できていない。
- 本研究は，より現実的な環境でAIエージェントの制御可能性を評価する環境を提供する。
- LinuxArenaは，20の環境，1,671の主要タスク，184の副次的タスクを含む，ソフトウェアエンジニアリング分野で最大かつ多様な制御設定である。
- Claude Opus 4.6は，GPT-5-nanoを信頼できる監視モデルとして用いた場合，1%の段階的な偽陽性率で約23%の未検出の妨害成功率を達成した。
- LaStrajデータセットは，モデル生成攻撃よりも大幅に高いレートで監視を回避する人間が作成した攻撃軌跡であり，現在の攻撃ポリシーではLinuxArenaの潜在能力を十分に活用できていないことを示唆している。
Link: https://arxiv.org/abs/2604.15384
マルチラウンドトランザクションシミュレーションに対するサービス拒否攻撃に関する考察 [cs.CR]目的：マルチラウンドトランザクションシミュレーションにおけるサービス拒否攻撃のセキュリティ
- ブロックチェーンは金融・社会インフラとして重要であり，その可用性を脅かす攻撃は許容されない。
- 従来のDoS攻撃はシングル/ツーラウンドのビルダーに限定され，複雑なマルチラウンド環境への対応が課題だった。
- スマートコントラクトの状態に起因するトランザクション間依存性を悪用した攻撃の可能性を検討する。
- 本研究では，マルチラウンドトランザクションシミュレーションに対する新たなDoS攻撃ベクトルを提示した。
- 特に，トランザクション間の依存関係を利用することで，攻撃がより効果的に実行される可能性を示唆した。
- この分析は，ブロックチェーンシステムのセキュリティ強化に貢献すると考えられる。
Link: https://arxiv.org/abs/2604.21169
リスト復号に基づく証明可能な安全な隠写術 [cs.IR, cs.CR]目的：高容量な証明可能な安全な隠写術スキームの提案
- 監視下での秘密通信において，メッセージを隠蔽する隠写術は重要な技術である。
- 既存の言語モデルに基づく証明可能な安全な隠写術は，埋め込み容量に課題がある。
- 大規模言語モデルの低エントロピー傾向を克服し，埋め込み容量を向上させることを目指す。
- 本研究では，リスト復号の概念に基づき，理論的に高容量な隠写術スキームを提案する。
- 候補集合を維持することで，情報内容を最大限に活用し，高い埋め込み容量を実現する。
- 3つのLLMと7つのベースラインとの実験により，効率性と埋め込み容量の向上が確認された。
Link: https://arxiv.org/abs/2604.21394
RTOSの時刻管理と中断不可能なトラステッドコンピューティングの競合解決 [cs.CE, cs.CR]目的：RTOSの時刻管理とトラステッドコンピューティングの共存
- 組み込みシステムのセキュリティ向上は重要であり，TEEはその鍵となる技術の一つである。
- RTOSの時刻管理とセキュリティ機能の原子性が競合し，リアルタイム性が損なわれる問題がある。
- Secure Worldが時間を計測し，Non-Secure RTOSの時刻を補正することで共存を実現する。
- Secure Worldによる時間計測とNon-Secure RTOSへの補正メカニズムを提案した。
- 提案手法はRTOSの変更を必要とせず，実行時オーバーヘッドも小さい。
- 異なるワールド間の一貫した時刻管理を可能にし，安全な共存を実現した。
Link: https://arxiv.org/abs/2604.24277
マスクされたバレット減算の基数上限：ポスト量子暗号ハードウェアにおける1ビットサイドチャネル漏洩障壁 [cs.RO, cs.CR]目的：マスクされたバレット減算における情報漏洩の基数上限の導出
- ポスト量子暗号は，将来の量子コンピュータによる脅威に対抗するため，暗号技術の重要な方向性である。
- 既存のマスキング手法では，バレット減算における一次の算術マスキング下での情報漏洩を厳密に評価することが困難であった。
- バレット減算の基数上限を導出し，1ビットの漏洩障壁を確立することで，安全なポスト量子暗号ハードウェアの構築を目指す。
- バレット減算の内部ワイヤマップの逆像の基数は，常に0, 1, 2のいずれかであり，最大でも2であること（1ビット障壁）を証明した。
- PF-PINI(Prime-Field PINI)のインスタンスを導出し，バレット減算がPF-PINI(2)を満たすことを示した。
- Lean 4とMathlibを用いて機械的に検証可能な形で証明を行い，全ての$q>0$に対して普遍的に適用されることを確認した。
Link: https://arxiv.org/abs/2604.24670