arXiv雑要約

セキュリティ - 2026/06/05 公開

ドメイン条件付きの安全性の評価：最先端エージェントにおける793エピソードのブラウザベンチマーク，コーディングドメインのクロスリファレンス，および近年のレッドチーム評価の再現性監査 [cs.CR, cs.AI, cs.CL]目的：最先端コンピュータ使用エージェントにおける安全性評価
- コンピュータ使用エージェントの利用拡大に伴い，その安全性確保は不可欠である。
- 既存研究では，脆弱なモデルに偏った攻撃成功率が報告され，再現性に課題がある。
- 最新モデルの安全性評価とドメイン依存性の解明を目指す。
- Claude Sonnet 4.6およびGPT-5.4に対する多段階攻撃の成功率は0/140であり，高い安全性を示した。
- しかし，コーディングエージェントのベンチマークでは，同モデルに脆弱性が確認された。
- 既存研究の高い攻撃成功率は，最適化された攻撃文字列に起因する可能性が示唆された。
Link: https://arxiv.org/abs/2606.05233
深層研究エージェントにおける検索時汚染：公開ベンチマーク評価における性能過大評価の測定 [cs.CR, cs.AI]目的：深層研究エージェントの評価における検索時汚染の測定と定量化
- LLMの推論能力を公正に評価するため，公開ベンチマークの重要性が高まっている。
- Web検索を行う深層研究エージェントは，ベンチマークの情報にアクセスし，性能を過大評価する可能性がある。
- 既存の評価が推論能力を過大評価している可能性を明らかにし，対策を提言すること。
- 深層研究エージェントにおいて，検索時汚染が広範囲に存在することが示された。
- 汚染は性能を最大4%まで過大評価する可能性があり，ベンチマーク評価の信頼性を損なう。
- 隔離された環境，検索経路の透明性，制御されたベンチマークアクセスなどの対策が必要である。
Link: https://arxiv.org/abs/2606.05241
攻撃シミュレーションからSIEMルールへ：プローブレベルのトレーサビリティによる決定論的なDetection-as-Code合成 [cs.CR, cs.AI]目的：攻撃シミュレーションの検出結果をSIEMルールへ自動変換する手法
- サイバー攻撃は巧妙化しており，組織のセキュリティ体制を継続的に評価する必要がある。
- 従来のSIEMルールの作成は手作業であり，時間と労力がかかる上に，人的ミスも発生しやすい。
- 攻撃シミュレーションの検出結果から，自動的にSIEMルールを生成し，セキュリティ運用の効率化を図る。
- 攻撃シミュレーションで使用するプローブを固定化することで，検出結果とプローブを紐付け，決定論的なルール合成を実現した。
- 2つの固定化されたプローブ群(LLM, Web)に対し，全ての検出結果から初期Sigmaルールを生成でき，SplunkとElasticsearchで正常に動作した。
- LLMルールは，OpenSearch SIEMでAdvBenchの一部に対し30%，HarmBenchに対し14%の検知率を示し，誤検知率は7.7%だった。
Link: https://arxiv.org/abs/2606.05252
意欲はあるが実行できない：コードLLMにおける拒否と能力の分離 - 削除による手法 [cs.CR, cs.AI, cs.SE]目的：コードLLMにおける拒否反応を分離し，脆弱性注入の可能性を探求する研究
- 脆弱性検出はソフトウェアの安全性確保に不可欠であり，その自動化が求められている。
- 学習データに含まれる誤ったラベルや，LLMの安全対策による拒否反応が課題となっている。
- LLMの拒否反応を取り除くことで，脆弱性注入の実験を可能にし，より正確な脆弱性検出を目指す。
- LLMのサイズやプロンプトによって拒否率は大きく異なり，特に大規模モデルでは拒否反応が顕著である。
- 提案手法である削除（abliteration）により，拒否反応をほぼゼロに抑えつつ，コードの構文的妥当性を維持することが可能となった。
- 削除後においても脆弱性注入率はモデルの能力に依存しており，拒否反応と能力は分離できることが示唆された。
Link: https://arxiv.org/abs/2606.05396
DeFi合成の経済的セキュリティに関する形式的枠組み [cs.CR, cs.SE]目的：DeFi合成における経済的セキュリティの形式的保証
- DeFiは金融の民主化を促進する一方，その複雑な構造が新たなセキュリティリスクを生み出している。
- DeFiのコンポジション性は利便性をもたらすものの，既存のコントラクトとの相互作用による経済的損失の可能性が課題である。
- MEV非干渉性という新たなセキュリティ概念を導入し，DeFi合成の安全性を形式的に検証する。
- MEV非干渉性という概念を定義し，新たにデプロイされたコントラクト群から最大抽出可能な価値が既存のブロックチェーン状態との相互作用によって増加しないことを保証する。
- ローカルMEVという，特定の被害コントラクト群への経済的攻撃の指標を導入し，安全なコンポジション性のモジュール化された推論を可能にする条件を確立した。
- 交換，AMM，オプション，レンディングプールなどの代表的なDeFi合成にフレームワークを適用し，安全な構成と脆弱な構成を区別できることを示した。
Link: https://arxiv.org/abs/2606.05418
ポリシー準拠クラウドストレージシステム [cs.CL, cs.RO, cs.CR, cs.CY, cs.DB]目的：個人データ保護に関するポリシー遵守の実現
- 個人情報保護の重要性が高まり，法規制が厳格化しているため，安全なデータ管理が不可欠である。
- クラウド環境におけるキーバリューストアは，データモデルの単純性からGDPR等の規制遵守が困難である。
- 既存手法は改変コストや性能劣化を招くため，改変不要で効率的なGDPR遵守システムの構築を目指す。
- GDPRulerは，信頼できる仮想マシン上でGDPRモニターを動作させ，ポリシーを強制し，改ざん防止監査ログを維持する。
- 実装結果として，ネイティブKVSのスループットの約61%をGDPRulerが達成し，メタデータストレージのオーバーヘッドは20%未満に抑制された。
- GDPR固有のクエリは，メタデータインデックスにより13〜182倍の高速化を実現している。
Link: https://arxiv.org/abs/2606.05423
DP-MacAdam：適応的クリッピングと適応的モーメンタムを用いた差分プライバシーメカニズム [cs.LG, cs.CR]目的：差分プライバシー機械学習におけるモデルの有用性向上
- プライバシー保護機械学習の重要性が増しており，特に差分プライバシーSGDが標準的な枠組みとなっている。
- 従来の差分プライバシーSGDは固定の勾配クリッピング閾値に依存しており，その調整が困難である。
- 勾配の平均と分散をクリッピングとモーメンタムの両方に利用することで，有用性を高めることを目指す。
- DP-MacAdamは，勾配の平均と分散をバイアスなく推定することが理論的に示された。
- 実験結果から，DP-MacAdamはDP-SGD，AdaClip，DP-Adamと比較して，より高いモデルの有用性を達成することが示された。
- クリッピング閾値の調整を必要とせずに，高いプライバシーと精度を両立している。
Link: https://arxiv.org/abs/2606.05435
CRESS：ハードウェア逆アセンブリにおける攻撃シナリオの脆弱性を定量化 [cs.CR, cs.SY, eess.SY]目的：ハードウェア逆アセンブリに関連する攻撃シナリオの脆弱性評価手法
- 半導体サプライチェーンの信頼性確保は，安全性・セキュリティにとって不可欠である。
- サプライチェーンの分散化や設計上の脆弱性により，ハードウェアレベルでの攻撃リスクが存在する。
- ハードウェア逆アセンブリの結果に基づき，攻撃シナリオを定量的に評価する手段を提供すること。
- 専門家へのインタビュー調査から，攻撃カテゴリの重要度を示す重みを導出した。
- 導出された重みを用いて，攻撃シナリオを定量化する CRESS スコアを算出できるようになった。
- CRESS スコアは，既存の CVSS よりも表現力に優れ，より詳細な評価が可能であることが示された。
Link: https://arxiv.org/abs/2606.05459
SHIELDS：反復型マルチエージェントによるOSセキュリティ強化の自動化 [cs.CR, cs.MA]目的：OSセキュリティ強化の自動化
- OSレベルの脆弱性は依然として主要な脅威であり，セキュリティ維持は重要である。
- 手動でのセキュリティ基準準拠は煩雑でコストがかかる。
- LLMを活用し，動的な解決策を試行・改善することで，セキュリティ強化を効率化する。
- SHIELDSは，仮想環境において最大73%のスキャン結果を修正することに成功した。
- モデルのパラメータ数よりも，効果的なツール利用と情報収集が重要であることが示唆された。
- 計算資源が限られた環境や，セキュリティ・プライバシー要件のある環境での実用的な道筋を示す。
Link: https://arxiv.org/abs/2606.05476
ブロック報酬後のビットコイン [cs.RO, cs.CR, cs.DC, cs.GT]目的：正直なマイニングが個人的に最適でなくなる閾値の特定
- ビットコインは分散型台帳技術の基盤であり，そのセキュリティは金融システムに不可欠である。
- ブロック報酬の減少により，マイナーのインセンティブ構造が変化し，ネットワークのセキュリティが脅かされる可能性がある。
- ブロック報酬がゼロになった際に，不正なマイニングを防ぐための条件を明確にすること。
- 2024年の半減期において，現在のマイニング行動は大規模な不正行為を示唆していないことが示された。
- ブロック報酬が除去された場合，わずかな手数料でも不正行為が発生する可能性があることが示唆された。
- ベースフィー，手数料下限，適応的な最大ブロックサイズ規則の組み合わせが不正行為の閾値を高め，インセンティブの崩壊を緩和することが示された。
Link: https://arxiv.org/abs/2606.05503
GuardNet: 浅いニューラルネットワークのアンサンブルによる，プロンプトインジェクションと脱獄検出の堅牢性戦略 [cs.CL, cs.AI, cs.CR]目的：プロンプトインジェクションと脱獄攻撃の検出
- LLMの普及に伴い，悪意のある攻撃から保護する重要性が増している。
- 既存の評価基準は，データ汚染や情報漏洩の影響を受けやすい。
- モデルの規模よりも，事例の多様性と閾値の調整が堅牢性に重要であるという仮説を検証する。
- GuardNetは，軽量な検出器と比較して競争力のある性能を発揮し，低遅延で高い効率を実現した。
- ブラインドデータセットにおいて，AUROCは0.747，独自のベンチマークではF1スコアが0.92を達成した。
- CPU上での平均遅延は約50msであり，コストとインフラに制約のある環境への導入に適している。
Link: https://arxiv.org/abs/2606.05566
ZERO-APT：知能的防御下におけるLLM駆動の自動ペネトレーションテストのための閉ループ敵対的フレームワーク [cs.CR, cs.MA]目的：LLM駆動の自動ペネトレーションテストにおける現実性，一貫性，監査可能性の向上
- サイバーセキュリティの脅威は高度化しており，自動化されたテストの重要性が増している。
- 従来のペネトレーションテストは静的な対象に対して行われ，動的な防御への対応が不足している。
- この研究は，知能的な防御を持つ環境下でのLLM駆動型エージェントの性能評価を可能にする。
- ZERO-APTは，Sysmonテレメトリを消費し，リアルタイムで攻撃を検知するLLM Defenderを組み込むことで，現実的なテスト環境を提供する。
- 計画と実行の分離，多次元ReActフィードバック，制約付きアクションライブラリにより，攻撃チェーンの一貫性を向上させている。
- 専用のJudgeエージェントが各ラウンドを評価し，構造化されたCTIレポートを作成することで，意思決定の透明性を確保している。
Link: https://arxiv.org/abs/2606.05567
サイバー攻撃分類のための次元削減：PCAと線形予測符号化の比較評価 [cs.CR, cs.AI]目的：サイバー攻撃分類における特徴量圧縮手法の比較評価
- 機械学習を活用したサイバー攻撃検知は重要だが，特徴量の高次元化が課題となる。
- 高次元の特徴量は計算コストを増加させ，リソース制約のある環境での展開を困難にする。
- 計算コストを抑えつつ，サイバー攻撃の分類精度を維持できる特徴量圧縮手法を検討する。
- PCAは大幅な次元削減下でも分類性能を維持できることが示された。
- 線形予測符号化（LPC）はPCAと同程度の予測性能を持つが，若干の性能劣化が見られた。
- 特徴量の次元削減により，分類精度への影響を最小限に抑えつつ，効率的なセキュリティ分析が可能となる。
Link: https://arxiv.org/abs/2606.05584
カバレッジギャップ：チリのサイバー情報開示フレームワークと米国，EU，英国との比較 [cs.CR]目的：重要インフラ事業者の脆弱性開示調整能力と，その公開されている情報公開との間の乖離の測定
- サイバーセキュリティは，国家安全保障や社会インフラの安定維持において極めて重要な課題である。
- 重要インフラ事業者のサイバーインシデント対応能力は，脆弱性情報の適切な開示と連携に依存する。
- チリの重要インフラ事業者における脆弱性開示体制の現状を把握し，改善策を提案すること。
- チリの重要インフラ事業者915社のうち，RFC 9116に準拠した脆弱性開示チャネルを公開しているのはわずか16社(1.7%)に過ぎない。
- メール認証の誤設定は915社のうち766社(84%)に確認され，EOLまたは脆弱性のあるスタックコンポーネントは約23.5%で推定された。
- チリのメール認証義務化は，米国，英国，オランダに比べて約8年遅れ，デンマークに比べて約3年遅れている。
Link: https://arxiv.org/abs/2606.05594
差分プライバシーを用いた多目的サブモジュラ最大化 [cs.DS, cs.CR]目的：多目的サブモジュラ最大化問題における，カーディナリティ制約と差分プライバシーの実現
- データプライバシー保護の重要性が増す中，機密データに対するプライバシー保護アルゴリズムが求められている。
- 単目的サブモジュラ最大化における差分プライバシー研究はあるものの，多目的化における研究は未開拓である。
- 差分プライバシーを保証しつつ，多目的サブモジュラ最大化問題を効率的に解決することを目指す。
- 提案アルゴリズムは，古典的な貪欲法を拡張し，さらにTruncation技術を導入することでプライバシー保護を実現した。
- 提案手法は，多目的サブモジュラ最大化問題に対する近似保証を持つことが示された。
- 最大カバレッジ問題と施設配置問題における数値実験により，提案アルゴリズムの有効性と効率性が確認された。
Link: https://arxiv.org/abs/2606.05596
SlotGCG: LLMにおける脱獄攻撃に対する位置的脆弱性の活用 [cs.CR, cs.AI, cs.LG]目的：LLMの脱獄攻撃における位置的脆弱性の定量化と活用
- 大規模言語モデルの普及に伴い，その安全性評価が重要課題となっている。
- 既存の攻撃手法では，トークンの挿入位置が限定されており，最適な位置探索が課題であった。
- プロンプト内のトークン挿入位置の脆弱性を評価し，攻撃成功率の向上を目指す。
- 本研究では，プロンプト内のトークン挿入位置に着目し，脆弱性スコアを導入した。
- 提案手法SlotGCGは，既存手法と比較して攻撃成功率が平均14%向上した。
- SlotGCGは，攻撃手法に依存せず，わずかな計算コストで既存攻撃に組み込める。
Link: https://arxiv.org/abs/2606.05609
K近傍探索クエリに対する位置推論攻撃からの保護 [cs.CR]目的：位置推論攻撃に対するK近傍探索クエリの保護
- 位置情報サービスは広く利用され，プライバシー保護が重要課題となっている。
- K近傍探索クエリはプライバシーリスクが認識されておらず，位置情報の漏洩が懸念される。
- K近傍探索クエリのプライバシーリスクを軽減し，高いクエリ利便性を維持すること。
- 本研究では，K近傍探索クエリに対する2つの新たな攻撃手法（幾何学的交差位置推論攻撃とゼロ次最適化位置推論攻撃）を提示した。
- プライバシー保護フレームワークDPRSを提案し，制約付き摂動区間内の棄却サンプリング機構を組み込むことで，距離歪みを抑制した。
- DPRSは，既存手法と比較して，プライバシー保護とクエリ利便性の両面で優れた性能を示すことが実証された。
Link: https://arxiv.org/abs/2606.05648
波形堅牢性を超えて：自動音声認識に対するロバストな特徴-Vocoder敵対的攻撃 [cs.SD, cs.AI, cs.CR]目的：自動音声認識システムに対する敵対的攻撃手法の開発
- 音声認識技術は多言語の音声テキスト変換で広く利用されており，そのセキュリティ確保は重要である。
- 既存の敵対的攻撃は，ブラックボックス環境への転移性が低く，防御機構によって容易に軽減されるという課題があった。
- より汎用性の高い特徴空間での攻撃と，Vocoderを通じた波形への変換により，これらの課題を解決する。
- 提案手法は，公開されているWhisper-smallモデルのみで最適化されたにも関わらず，ブラックボックスASRモデルに対して高い攻撃成功率を示した。
- 既存の最先端手法と比較して，WER（単語誤り率）が+26.6%向上し，複数の防御機構に対しても+36.2%のWER向上を示した。
- これらの結果は，現在の音声認識システムの堅牢性評価における盲点を示すものである。
Link: https://arxiv.org/abs/2606.05678
分散インフラストラクチャシステムのための認知型脅威インテリジェンスと説明可能な連合セキュリティ分析 [cs.CR, cs.AI]目的：分散インフラストラクチャシステムにおける認知型脅威インテリジェンスと説明可能な連合セキュリティ分析の枠組み
- 分散システムの普及により，サイバー攻撃の対象範囲が拡大し，高度な脅威への対策が急務となっている。
- 従来の集中型侵入検知システムは，スケーラビリティ，プライバシー，通信負荷，AIの透明性の課題を抱えている。
- 分散環境下でのプライバシー保護と効率的な脅威検知を実現し，セキュリティリスクを低減することを目指す。
- 提案フレームワークは，連合学習，説明可能なAI，認知型サイバーセキュリティ分析を統合することで，分散環境での協調的な脅威検知を可能にする。
- 生データではなく暗号化されたモデルパラメータのみを共有する連合学習アーキテクチャにより，プライバシー保護と通信負荷の軽減を実現する。
- Random Forest，XGBoost，Autoencoderなどの機械学習・深層学習アルゴリズムを用いて，脅威分析の知能化を図る。
Link: https://arxiv.org/abs/2606.05701
説明可能なAI駆動によるサイバーリスク分析と米国重要インフラのインテリジェントガバナンスのためのモデル信頼性評価：XGBoostとSHAPに基づく侵入検知フレームワーク [eess.SY, cs.SY, cs.CR, cs.AI]目的：米国重要インフラにおけるサイバーリスクへの対応を支援するための，サイバーリスク分析とモデル信頼性評価のフレームワーク
- 重要インフラは高度なデジタル技術の導入により，サイバー攻撃や運用上の脆弱性にさらされている。
- 従来のセキュリティメカニズムは，変化する攻撃状況や動的なネットワーク環境に対応しきれない場合がある。
- AIを活用し，サイバーリスクへの意思決定支援とガバナンスの信頼性向上を目指す。
- XGBoost，Random Forest，Decision Treeなどの分類器を用いて，ネットワーク上の悪意のある活動の検知とサイバーリスクレベルの特定を行った。
- 説明可能なAI（XAI）技術を統合することで，サイバーセキュリティの意思決定プロセスの透明性，解釈可能性，信頼性を向上させた。
- モデルの信頼性と回復力を，精度，適合率，再現率，F1スコア，ROC-AUC，偽陽性率などの指標を用いて評価した。
Link: https://arxiv.org/abs/2606.05710
米国重要デジタルインフラにおけるインテリジェントなサイバー攻撃検知・防御のためのハイブリッドCNN-LSTMフレームワーク：CSE-CIC-IDS2018を用いた比較機械学習評価 [cs.CR, cs.LG]目的：米国重要デジタルインフラにおけるサイバー攻撃の検知と防御
- 米国のデジタルインフラは急速に拡大しており，ヘルスケア，金融，運輸などの重要部門が高度なサイバー攻撃に晒されている。
- 従来のシグネチャベースの侵入検知システムは，未知または変化する攻撃のリアルタイム検知には限界がある。
- AI・機械学習を活用し，米国デジタルインフラにおけるサイバー攻撃の検知・防御能力を向上させる。
- 提案フレームワークは，データ前処理，特徴量エンジニアリング，リアルタイムトラフィック監視を組み合わせる。
- CNNとLSTMを組み合わせることで，悪意のあるネットワーク行動の識別精度を向上させることが確認された。
- 本研究は，CSE-CIC-IDS2018データセットを用いて，様々な機械学習モデルの有効性を比較評価した。
Link: https://arxiv.org/abs/2606.05714
大規模言語モデルAPIトラフィックにおけるモデル抽出攻撃検出のための，驚くほどシンプルな検出器 [cs.CR, cs.CL]目的：モデル抽出攻撃の検出
- LLMのAPI利用が拡大し，モデルの所有権とサービスセキュリティが脅かされているため。
- 個々の抽出クエリは通常のリクエストと区別が難しく，既存手法は単独クエリ評価に偏っている。
- 良性トラフィックを基準とした分布検査により，モデル抽出攻撃を検出することを試みる。
- 提案手法は，クエリを意味空間に埋め込み，その分布が過去の良性トラフィックから逸脱するかを検査する。
- 最大平均乖離（MMD）を用いて評価した結果，0.3%の偽陽性率，100%の真陽性率，90.5%の平均真陽性率，95.1%のバランス精度を達成した。
- 良性トラフィックに基づく分布検査が，LLM APIトラフィックにおけるモデル抽出攻撃検出の有効なベースラインとなることを示した。
Link: https://arxiv.org/abs/2606.05725
膜：LLMエージェント防御のための自己進化型対照安全性メモリ [cs.AR, cs.ET, cs.CL, cs.CR, cs.CL]目的：LLMエージェントに対する安全性確保
- LLMの安全性は，社会実装において不可欠であり，悪意ある攻撃からの防御が重要である。
- 従来の安全性対策は，変化する攻撃手法に追従できず，誤検知による正常な質問の拒否が生じやすい。
- 有害な対話例とその類似する無害な例を対照的にメモリに保存し，攻撃戦略に基づいて進化させることで，安全性向上を目指す。
- Membraneは，HarmBenchとAgentHarmの両方において，6種類の脱獄攻撃全てで最高のF1スコアを達成した。
- AgentHarmにおける無害な質問の誤拒否率は7-14%と低く，既存のガードレールの28-85%を下回る。
- メモリセルは，攻撃の転移やメモリポイズニングに対しても高い安定性と精度を維持する（F1スコア87-88%）。
Link: https://arxiv.org/abs/2606.05743
IoTネットワークのための改良型CNN-LSTMベース侵入検知システム [cs.CR, cs.AI, cs.LG]目的：IoTネットワークにおける侵入検知性能の向上
- IoTデバイスの急増により，セキュリティリスクが増大しており，侵入検知の重要性が高まっている。
- 既存の検知システムでは，多様な攻撃を正確かつ効率的に検出することが課題である。
- 本研究は，空間的・時間的特徴を捉え，IoT環境における侵入検知能力を向上させることを目指す。
- 提案手法は，ネットワークトラフィックデータを用いて評価した結果，約97%の精度を達成した。
- 本モデルは，複数の攻撃カテゴリを効果的に検出し，安定した学習・検証性能を維持した。
- CNNとLSTMの組み合わせにより，ネットワークトラフィックの空間的・時間的特性を捉えることが可能となった。
Link: https://arxiv.org/abs/2606.05776
TinyMLを活用した自律宇宙船のサイバーセキュリティ：SPARTA RFおよびサイバー脅威検出における遅延・精度分析 [cs.CR, cs.AI, stat.ML]目的：自律宇宙船におけるサイバー・RF脅威の検出
- 宇宙探査の高度化に伴い，宇宙船の自律性とセキュリティ確保が重要となっている。
- 宇宙船は限られた計算資源の中で，リアルタイムに脅威を検出する必要がある。
- TinyMLを用いて，低遅延かつ高精度な脅威検出モデルを確立することを目指す。
- SPARTA攻撃モデルを用いて，Random Forest，Logistic Regression，SVM，MLP等のTinyML互換モデルの遅延・精度を分析した。
- Logistic Regressionは，Random Forestと比較して1%の精度低下でマイクロ秒レベルの推論が可能であり，宇宙船搭載用TinyMLのベースラインとして有効である。
- リッチな特徴エンコーダやマルチタイムスケール学習アーキテクチャによって，宇宙船サイバーセキュリティの向上が期待される。
Link: https://arxiv.org/abs/2606.05779
センチネルRAG：RAGデータベースの著作権保護のための合成センチネル知識 [cs.CR]目的：RAGデータベースの著作権保護
- 大規模言語モデルの利用拡大に伴い，学習データや知識ベースの保護が重要になっている。
- 既存の水marking技術は，誤情報を混入させたり，言い換えによって容易に回避されたりする問題がある。
- RAGデータベースの不正な再配布を検知し，著作権を保護することを目的とする。
- センチネルRAGは，RAGデータベースにスタイルの一貫性のある架空の知識を埋め込むことで水markingを行う。
- 架空の存在に関する知識は，通常のクエリでは取得されにくいが，データ所有者のみが知る特定のプローブで確実に検出可能。
- 実験により，0.1%の挿入率で統計的に有意な検出率（p < 10^{-5}）が得られ，誤検出率を大幅に低減した。
Link: https://arxiv.org/abs/2606.05787
GCD: 乱れ，修正，証明 - Goの拡張GCD実装の修正と検証 [eess.SY, cs.SY, cs.CR]目的：Go言語標準ライブラリにおける拡張GCD実装の正確性の検証
- RSA暗号など，現代暗号化の基盤技術を支える重要なアルゴリズムである。
- 実装の微細な誤りは，暗号システムの脆弱性につながる可能性がある。
- Go言語実装の誤りを修正し，形式検証によりその正当性を保証すること。
- Goの拡張GCD実装には，BoringSSL実装からの移植時に2つのずれが存在することが判明した。
- 修正により，平均で24%の高速化が実現した。
- GoblaとLeanを用いた形式検証により，修正されたGo実装の正確性と停止性が証明された。
Link: https://arxiv.org/abs/2606.05796
無線通信におけるプライバシー保護と高可用なサービス検出 [cs.CR]目的：無線通信環境におけるプライバシー保護とサービス検出の可用性向上
- 無線通信は現代社会において不可欠であり，様々なデバイスが相互に連携して動作することが求められている。
- 既存のサービス検出プロトコルはプライバシー保護が不十分で，デバイス情報漏洩やネットワーク攻撃のリスクを抱えている。
- 本研究は，デバイス情報漏洩を防ぎつつ，安全かつ迅速なサービス検出を実現することを目的とする。
- 提案手法PriSrvは，公開属性によるフィルタリングと選択的開示による相互認証の二層マッチングアーキテクチャを採用することで，プライバシー保護と可用性を両立している。
- 匿名資格証明に基づくマッチング暗号化（ACME）の基本概念を導入し，双方向のポリシー制御，選択的な属性開示，多重表示の匿名性を実現している。
- EAP，mDNS，BLE，AirDrop等の既存の無線フレームワークとの互換性を確認し，実用的な性能とセキュリティを検証した結果，主流のモバイルデバイス上で1秒未満でセキュアなサービス検出が可能であることを示した。
Link: https://arxiv.org/abs/2606.05821
低ノイズLPN問題に対する最悪ケース困難性について [cs.CR]目的：LPN問題の困難性
- 暗号理論の基礎として重要であり，対称鍵暗号から公開鍵暗号まで幅広い構成の基盤となっている。
- 既存の最悪ケースから平均ケースへの帰着は，統計的スムージングに依存し，ノイズ率が制限されていた。
- 計算的な区別可能性を利用することで，より低いノイズ率でのLPN問題の困難性を示す。
- 効率的なLPNソルバーが存在する場合，コードの復号とノイズのあるコードワードの識別を行う効率的なアルゴリズムが存在することを示す。
- パラメータを適切に設定することで，逆多項式ノイズ率 $n^{-\alpha}$ (α<1) を持つLPN問題の平均ケース困難性を最悪ケースの困難性から導出できる。
- 特に，α=1/2の場合，公開鍵暗号構築に必要とされるパラメータ領域におけるLPN困難性を示す。
Link: https://arxiv.org/abs/2606.05834
GenTI：未知の攻撃に対する自律的なIDPSルール生成のためのLLMのベンチマーク [cs.CR, cs.AI]目的：未知の攻撃に対するIDPSルール自動生成のためのLLMベンチマーク
- サイバー攻撃は巧妙化の一途を辿っており，従来のシグネチャベースの防御では対応が困難になっている。
- IDPSルールは手動で作成されるため，新たな脅威への適応が遅れるという課題がある。
- LLMを活用し，リアルタイムでIDPSルールを生成することで，適応性と進化性を高める。
- 提案手法GenTIは，ルールレベルのCTIとLLMベースの自動化を組み合わせた大規模ベンチマークである。
- GenTIは，IDPSルールの品質スコア89.4%，CTIカバレッジ94.8%を達成し，未知の攻撃検出率を45%から87.4%に向上させた。
- 誤検知率は8.5%から2.3%に削減され，自律的に進化するIDPSの実現に貢献する。
Link: https://arxiv.org/abs/2606.05844
PriSrv+: プライバシーと使いやすさを向上させたワイヤレスサービス検出における高速かつ表現力豊かなマッチング暗号化 [cs.CR]目的：ワイヤレスネットワークにおけるプライバシーと使いやすさを向上させたサービス検出プロトコルPriSrv+の提案
- ワイヤレスネットワークにおいて，動的なサービス発見は5GやIoT等のシステム運用に不可欠である。
- 既存のサービス検出プロトコルは，表現力，プライバシー，スケーラビリティ，効率性に課題があった。
- より柔軟で安全なサービス検出を実現し，通信コストを削減することを目標とする。
- 本研究で開発されたFEMEは，任意の文字列を属性として利用可能な，表現力豊かなアクセス制御を可能にする。
- PriSrv+は，暗号化速度を最大7.62倍，復号化速度を最大6.23倍に向上させ，暗号文サイズを大幅に削減した。
- サービスブロードキャストや匿名認証における通信コストも，それぞれ87.33%と86.64%削減された。
Link: https://arxiv.org/abs/2606.05902
マルウェア開発者のコーディング習慣と認知様式の関連性の探求 [cs.DC, cs.CL, cs.CL, cs.FL, cs.CR]目的：マルウェア開発者のコーディング習慣と認知様式の関連性
- サイバー攻撃は増加の一途をたどっており，攻撃者の行動理解が重要である。
- マルウェア研究は主に結果に焦点を当て，開発者の戦略は未解明である。
- マルウェアのコード特性から開発者の行動や動機を推測することを目指す。
- マルウェアのコードは一般的に規模が小さく，ドキュメントが少なく，複雑である。
- マルウェアは，安全な開発プラクティスへの投資が少ない脆弱性を示しやすい。
- コードメトリクスは，マルウェア開発者の行動特性や戦略的選択を反映する指標として活用できる。
Link: https://arxiv.org/abs/2606.05945
AttackPathGNN：状態干渉グラフと論理積プーリングを用いたスマートコントラクトのクロス関数脆弱性検出 [cs.CL, cs.CY, cs.CR, cs.AI]目的：スマートコントラクトにおけるクロス関数脆弱性の検出
- ブロックチェーン技術の普及に伴い，スマートコントラクトのセキュリティ確保が重要となっている。
- 従来の脆弱性検出手法は，単一関数内の構文パターンに依存しており，関数間の関係性を見落とす場合がある。
- 本研究は，関数間の状態干渉を考慮し，攻撃経路を明示的に扱うことで，より高精度な脆弱性検出を目指す。
- AttackPathGNNは，状態干渉グラフと論理積プーリングを特徴とするグラフニューラルネットワークである。
- SmartBugs Wildテストにおいて，F1スコア92.3±0.2%を達成し，偽陰性率は4.3±0.3%と低い結果を示した。
- DASP10の6/10カテゴリとReentrancyをそれぞれ100%と98.7±1.8%の精度で検出した。また，関数レベルの監査報告書も生成する。
Link: https://arxiv.org/abs/2606.05986
マルチプレイヤーオンラインゲームにおける不正行為：データセット [cs.CR]目的：マルチプレイヤーオンラインゲームにおける不正行為の検出と対策
- オンラインゲーム業界は成長を続けており，公正な競争環境の維持が不可欠である。
- 不正行為は検出が難しく，プレイヤーの満足度を低下させ，ゲームの公平性を損なうという課題がある。
- ネットワークフロー妨害を伴う不正行為の検出を可能にする代表的なラベル付きデータセットの構築。
- 本研究では，不正行為の実行とログ収集を可能にする実験的フレームワークを構築し，データセットを生成した。
- このデータセットは，ネットワークベースの不正行為に加え，エイムボットやウォールハックなど，様々な不正行為のログを含む。
- 本データセットは，オンラインゲームにおける不正行為検出メカニズムの開発に役立ち，拡張性も有している。
Link: https://arxiv.org/abs/2606.06013
RedEdit：MCTS誘導画像編集による画像安全性分類器への敵対的検証 [cs.RO, cs.CR]目的：画像安全性分類器に対する敵対的検証手法
- インターネット上のコンテンツモデレーションにおいて，画像安全性分類器は重要な役割を担う。
- ユーザーによる悪意のある画像編集に対する分類器の堅牢性が十分に検証されていない。
- 実用的な脅威を再現するため，敵対的な画像編集を探索する手法を開発する。
- RedEditは，画像編集ツールのシーケンスを組み合わせた探索問題として，敵対的検証を定式化した。
- 実験の結果，平均2回以下の編集で76.2%の有害画像が検出を回避できることが示された。
- 編集された画像は93.0%の有害な意味内容を保持し，人間の知覚には悪意があると認識される。
Link: https://arxiv.org/abs/2606.06140
モバイルデバイスの安全な再利用と再目的化における機会と課題 [cs.CR]目的：モバイルデバイスの安全な再利用と再目的化に関する要件
- 電子廃棄物の増加が環境に与える影響が深刻であり，持続可能な社会の実現が急務である。
- モバイルデバイスのセキュリティ機能は，特定のライフサイクルを前提に設計されており，再利用時に信頼性が損なわれる可能性がある。
- 再利用時のセキュリティメカニズムの有効性を検証し，安全な再利用のための要件を明確にすること。
- PinePhoneを用いた実験により，再利用における信頼アンカーの再構築の複雑さが明らかになった。
- ベンダーがロックした仕組みが，多くの廃棄デバイスの再利用を妨げていることが示唆された。
- 安全な再利用のためには，セキュリティ機能の有効性維持と，再利用環境における信頼性確保が不可欠である。
Link: https://arxiv.org/abs/2606.06181
捏造された証拠注入によるLLMの視点操作 [cs.CR]目的：LLMの視点操作の脆弱性とその対策
- 日常の意思決定にチャットボットが利用される中，誤った情報が拡散されるリスクが重要になっている。
- LLMは，信頼性を示す手がかりがあれば，虚偽の証拠を批判的に検討せずに受け入れてしまう傾向がある。
- 本研究は，LLMへの虚偽情報の注入攻撃とその防御策を明らかにすることを目的とする。
- LLMは，外部の安全対策がない場合，捏造された証拠に脆弱であることが示された。
- 最先端のモデルでも，攻撃を完全に防ぐことはできない。
- 特定の安全ポリシーを適用することで，あるモデルは81%の検出率を達成した。
Link: https://arxiv.org/abs/2606.06244
SecRL-Prune：敵対的コード変異を維持するためのコードLLMの構造化強化学習に基づくプルーニング [cs.CR]目的：コードLLMの構造化プルーニング手法
- コード生成AIの発展により，プログラムの自動生成・改変が可能になり，セキュリティ上の脅威が増大している。
- モデル圧縮は計算資源の制約下での利用を可能にするが，セキュリティ機能が損なわれる可能性がある。
- モデル圧縮時に敵対的コード変異能力を維持し，セキュリティリスクを低減することを目指す。
- SecRL-Pruneは，強化学習を用いた層ごとのプルーニングポリシーを学習し，効率的なモデル圧縮を実現する。
- HumanEval評価において，既存のプルーニング手法と比較して，高いpass@kとvar@kを維持することが示された。
- 実世界のマルウェアサンプルを用いた事例研究では，プルーニングされたモデルでも意味を保持した変異により検出回避が確認された。
Link: https://arxiv.org/abs/2606.06254
選択的に強化・拡張された予測モデルの堅牢なアンサンブル [cs.CR]目的：機械学習モデルの堅牢性向上
- 機械学習は広く利用されるが，悪意のある攻撃に脆弱であり，セキュリティ確保が重要である。
- 既存の防御策は汎用性に欠け，様々な攻撃シナリオへの対応が課題となっている。
- 多様な攻撃に対する堅牢性を高め，機械学習システムのセキュリティを向上させる。
- RESSAPは，単一の分類器を堅牢な分類器のアンサンブルへと変換する新しいフレームワークである。
- 特徴選択とデータ拡張により，敵対的攻撃に対する堅牢性を大幅に向上させることが示された。
- 既存のアーキテクチャを大きく変更することなく，機械学習システムのセキュリティを強化できる。
Link: https://arxiv.org/abs/2606.06265
EUデジタルIDウォレットにおける資格情報開示：プライバシーリスクと実用的な緩和策 [cs.CR]目的：資格情報開示に関する調査と，専門家の推奨およびユーザー意見を表示するCredential Assistantの有効性と実現可能性の評価
- デジタルIDウォレットは，オンラインでの個人情報管理を安全かつ効率的に行う上で重要な役割を果たす。
- ユーザーは，どの資格情報を開示すべきか判断することが難しく，プライバシー侵害のリスクがある。
- 資格情報開示におけるユーザーの誤りを減らし，EUDIウォレットの利用可能性とプライバシー保護を向上させる。
- 大規模な調査の結果，ユーザーは必要以上に多くの資格情報を開示する傾向があることが示された（例：約20％が公式IDをニュースサイトに開示）。
- 開発したCredential Assistantは，ユーザーの資格情報開示ミスを約15%から約7%に大幅に削減することが確認された。
- しかし，Credential Assistantだけでは不適切な資格情報開示を完全に排除することはできず，より強力な介入策が必要である可能性が示唆された。
Link: https://arxiv.org/abs/2606.06354
WebMCPツールへのポイズニング：LLMエージェントに対する実行時操作攻撃 [cs.DC, cs.MS, cs.SC, cs.CR]目的：WebMCPにおけるミッドセッションツールインジェクション（MSTI）の脅威とその対策
- LLMエージェントの利用拡大に伴い，Webとの連携が生じ，新たなセキュリティリスクが顕在化している。
- WebMCPは，従来のUIを介さずツールを露出するため，攻撃対象領域が拡大し，第三者スクリプトによる脆弱性が懸念される。
- WebMCP特有のツールライフサイクルと構造化されたメタデータに起因する，MSTIという新たな攻撃手法を分析し，対策を提案する。
- 本研究で特定されたMSTIは，ツールハイジャックとツールフレーミングの2種類に分類され，いずれもエージェントの機能を妨害する可能性がある。
- ツールハイジャックはAbortSignal APIなどを利用し，ツールセットを改ざんする。ツールフレーミングは，メタデータ操作によりエージェントのツール認識を歪める。
- ツールIDの起源への紐付け，ライフサイクルの一貫性確保，第三者ツールのデータ境界強化，ログの追跡可能性維持が，有効な緩和策として示唆された。
Link: https://arxiv.org/abs/2606.06387
エージェントは自己排除するか？LLMエージェントのインバンドアクセス拒否シグナルへの準拠度測定 [cs.CR, cs.AI]目的：LLMエージェントのアクセス拒否シグナルへの準拠度
- 自律型LLMエージェントの利用拡大に伴い，リソースへのアクセス制御の重要性が増している。
- 既存のアクセス制御では，エージェントに対してリソースが制限されていることを明確に伝える手段がない。
- インバンドアクセス拒否シグナルによるエージェントの自己排除メカニズムの有効性を検証する。
- 提案する「Recuse Signal」は，LLMエージェントに対し，リソースへのアクセスを自主的に停止させることを促す。
- 実験の結果，シグナル存在下では100%の自己排除が確認され，シグナルがない場合は100%のタスク完了となった。
- 演算者による許可があれば，高性能モデルはシグナルを無視してタスクを実行する協力的な挙動を示した。
Link: https://arxiv.org/abs/2606.06460
量子ビット検証に必要な暗号構造について [quant-ph, cs.CR]目的：量子計算の古典的検証を支える反交換演算子の存在検証の暗号的構造
- 量子計算の検証は，その信頼性を確保する上で不可欠であり，近年急速に進展している。
- 既存の検証手法は，トラップドア・クロウフリー関数など，構造化された仮定に依存している。
- 反交換演算子の古典的検証から強固な暗号を構築することで，この問題を解決する。
- 非可換性テスト（ToNC）は，古典的通信による鍵合意（KA）を可能にすることを示した。
- ToNCと一方向関数を組み合わせることで，ブラインド転送（OT）も実現できることが証明された。
- 量子耐性KAおよびOTに対する困難性増幅に関する最初の結果を提示し，新しいハードコア測度定理およびインタラクティブXOR補題を確立した。
Link: https://arxiv.org/abs/2606.05527
敵対的エージェント：強化学習によるブラックボックス回避攻撃 [cs.CL, eess.AS, cs.CR, cs.AI]目的：機械学習モデルに対する敵対的サンプル生成戦略
- 機械学習の安全性確保は重要であり，その脆弱性を評価し対策を講じる必要がある。
- 従来の敵対的攻撃手法は個々のサンプルに依存し，過去の経験を活かせない点が課題である。
- 強化学習を用いて，過去の攻撃経験を活かせる効率的な攻撃手法を確立すること。
- 本研究では，強化学習エージェントが敵対的サンプル生成において，最先端の手法を上回る成功率を達成した。
- エージェントは学習を通じて攻撃成功率を最大13.2%向上させ，モデルへのクエリ回数を最大16.9%削減した。
- 学習後に未知の入力に対する攻撃成功率も17%向上し，強化学習を用いた新たな攻撃経路の有効性を示した。
Link: https://arxiv.org/abs/2503.01734
最適なノイズ注入によるサイドチャネル攻撃耐性化：相互情報最小化 [cs.CR]目的：サイドチャネル攻撃に対する耐性向上
- システムセキュリティにおいて，消費電力やタイミングなどの物理的な情報漏えいを利用するサイドチャネル攻撃は深刻な脅威である。
- 既存の対策である人工ノイズ注入は効果的だが，消費電力が大きく，IoTデバイスのような低消費電力システムへの適用が困難である。
- 電力制約下において，秘密情報とサイドチャネル観測値間の相互情報を最小化することで，情報漏えいを抑制する。
- 提案手法は，従来の技術と比較して相互情報を大幅に削減し，電力制約の厳しいシステムにおいても有効であることが示された。
- サイドチャネル攻撃を通信チャネルとしてモデル化し，相互情報最小化によって情報漏えいを抑制する枠組みを構築した。
- ガウス入力の場合と，任意の入力分布の場合の両方について，最適なノイズ注入量を導出した。
Link: https://arxiv.org/abs/2504.20556
連合学習におけるトポロジーを考慮した差分プライバシー [cs.CR, cs.DC, cs.LG]目的：連合学習における差分プライバシー保護の強化
- データ保護の重要性が増す中，プライバシー保護技術は不可欠である。
- 従来の差分プライバシーは，通信トポロジーからの情報漏洩を考慮していない。
- トポロジーを考慮した防御により，連合学習におけるプライバシー保護を向上させる。
- 提案手法TADIは，パラメータ，構造，組織の各構成要素に漏洩を分離し，クライアントごとの情報漏洩を評価する。
- Fulcrumは，非対称な連合学習環境において，従来のDP-SGDを厳密に上回るノイズ配分を実現する。
- 実験結果から，Fulcrumは最大1.967natsのプライバシー向上効果が確認され，実用的なユーティリティコストは発生しなかった。
Link: https://arxiv.org/abs/2506.19260
RAGのセキュリティとプライバシー：脅威モデルと攻撃対象領域の形式化 [cs.CR, cs.AI]目的：RAGシステムの脅威モデルと攻撃対象領域の形式化
- 大規模言語モデルの利用拡大に伴い，情報漏洩等のセキュリティリスクが重要視されている。
- RAGシステムは外部知識への依存性から，新たな脆弱性を生み出す可能性がある。
- RAGシステムのセキュリティ及びプライバシーリスクを明確化し，対策の基礎を築く。
- 本研究では，RAGシステムに対する初の形式的な脅威モデルを提案した。
- 攻撃者のアクセス権限に基づく分類と，ドキュメントレベルのメンバーシップ推論，データポイズニング等の脅威ベクトルを定義した。
- これらの形式化により，RAGシステムのセキュリティとプライバシーに関する理解を深める基盤を構築した。
Link: https://arxiv.org/abs/2509.20324
LLMベンチマークにおけるプロンプト依存性の修正：埋め込み空間クラスタリングを用いたベイズ階層モデル [cs.CR, cs.AI, cs.CL]目的：LLMベンチマークの性能と不確実性の評価
- LLMの性能評価は，AI技術の進歩を測る上で不可欠である。
- 既存のベンチマークは，評価回数が不十分，プロンプト間の依存性の存在により，精度が損なわれる。
- 評価回数が少なく，プロンプト依存性がある状況下でも信頼性の高い性能指標を提供すること。
- 提案手法は，埋め込み空間におけるクラスタリングを通じてプロンプト依存性を修正し，堅牢な性能指標を算出する。
- 敵対的ロバスト性ベンチマークへの適用により，クラスタ構造の再現性が確認された。
- 平均絶対誤差が4-73%改善，期待対数事後密度が40-450単位改善された。
Link: https://arxiv.org/abs/2510.05709
CTIConnect：異種サイバー脅威インテリジェンスにおける検索拡張LLMのベンチマーク [cs.CR, cs.AI]目的：異種サイバー脅威インテリジェンス環境下における検索拡張LLMの体系的な評価
- サイバーセキュリティにおいて，進化する脅威に備える上でサイバー脅威インテリジェンス(CTI)は不可欠である。
- CTIデータの量と多様性は膨大であり，手動分析の限界を超える。
- 異種CTIソースを活用した検索拡張LLMの性能評価のためのベンチマーク環境を構築すること。
- 本研究で構築したCTIConnectベンチマークは，9つのタスクを含む1,860組の専門家検証済みQAペアを提供する。
- 実験により，タスクの種類によって意味的ギャップが異なり，最適な検索戦略が異なることが示された。
- ドメイン固有の戦略は，汎用的な検索手法よりも優れており，構造的な介入が重要であることが示唆された。
Link: https://arxiv.org/abs/2510.11974
根拠はあるが誤解を招く：AI生成セキュリティ説明における意味的整合性の評価 [cs.CR, cs.CL, cs.LG]目的：AI生成セキュリティ説明における意味的整合性の評価
- オンライン詐欺が巧妙化する中，リスクの説明能力を持つAIシステムの需要が高まっている。
- 検出器の根拠に基づいた説明でも，意味的にリスク解釈を弱めたり誤らせたりする可能性がある。
- 意味的整合性と根拠の提示の乖離を検証し，信頼性の高い説明評価の基準を確立すること。
- AI生成の説明は，根拠が示されていても，リスク評価が弱まる場合があることが示された。
- 人間による評価では，リスクを弱める説明でも，根拠の提示に関する評価は高かった。
- 説明の信頼性評価には，根拠の提示だけでなく，その解釈の検証が不可欠であることが示唆された。
Link: https://arxiv.org/abs/2602.05056