arXiv雑要約

セキュリティ - 2026/06/03 公開

ハードウェア逆エンジニアリングコースの設計：急速に変化する技術分野における8年間の教訓 [cs.CL, cs.CY, cs.CR]目的：ハードウェア逆エンジニアリングコースの教育内容と設計
- ICは不可欠な存在だが，グローバルなサプライチェーンは脆弱である。
- ハードウェア逆エンジニアリングの専門家は不足しており，教育プログラムが少ない。
- 急速に変化する技術分野における教育プログラム設計の指針を示す。
- 本研究では，デジタル回路分析とICからの抽出に焦点を当てたHREコースについて報告している。
- 9回にわたる反復 (2017-2025) を通してカリキュラムが改善され，卒業生はHRE分野でキャリアを築いている。
- コースの組織，内容，課題の進化を考察し，教育者への重要な教訓と設計優先事項を導き出した。
Link: https://arxiv.org/abs/2606.03697
ゴースト：多様体上置換による，学習不可能でありながら妥当な次訪問地プライバシー保護手法 [cs.CR, cs.IR]目的：次訪問地プライバシー保護のための，学習不可能な軌跡生成
- 位置情報データの利用拡大に伴い，個人の行動履歴保護の重要性が増している。
- チェックイン履歴は，個人の将来の行動予測に利用され，プライバシー侵害のリスクがある。
- 既存手法では，データの妥当性と防御効果の両立が課題であった。
- 提案手法「Ghost」は，多様体上に制約された置換により，妥当性を保ちつつ学習を妨害する軌跡を生成する。
- Ghostは，標準的なベンチマークにおいて，既存の防御手法と同等の保護性能を示す。
- 特に，精製攻撃に対する耐性において優れた結果が得られ，漏洩リスクを低減する。
Link: https://arxiv.org/abs/2606.03711
信頼しないこと：プライバシーを設計に組み込んだAndroidマルウェア検知パイプライン [cs.CR]目的：プライバシーを設計段階から重視したAndroidマルウェア検知パイプライン
- Androidマルウェアの検出は重要であり，その精度向上が求められている。
- 従来の検知手法は，ユーザーデータの収集・処理に依存し，プライバシー侵害のリスクがある。
- 本研究は，ユーザーデータを必要とせずに高精度なマルウェア検知を実現することを目指す。
- 提案パイプラインは，静的解析でF1スコア0.87を達成し，検知困難なサンプルのみを動的解析に移行する。
- 動的解析においても，機密データを抽出することなく，高い精度で悪意のあるアプリケーションを識別できる。
- これらの結果は，ユーザーのプライバシーを損なうことなく，強力なマルウェア検知性能を実現できることを示す。
Link: https://arxiv.org/abs/2606.03714
同一の重み，異なるロボット：VLAポリシーの展開安全性に関する考察 [cs.CR]目的：VLAポリシーの展開における安全性ギャップの形式化と評価
- ロボット工学における安全性確保は重要であり，AIポリシーの展開における潜在的リスクの特定が不可欠である。
- VLAポリシーのチェックポイント一致だけでは，実際のロボット実行における安全性は保証されないという問題がある。
- ロボットの実行環境を考慮したVLAポリシーの実行仕様を明確化し，展開安全性を評価することを目指す。
- 同一のチェックポイントでも，アクション表現やメタデータの違いにより，実行可能なポリシーが異なる場合があることが示された。
- アクション正規化におけるメタデータの不一致が，ロボットの成功率に大きな影響を与えることがLIBEROデータセットで確認された。
- アクション空間のメタデータは実行可能なポリシーの一部であり，展開前に検証する必要があるという知見が得られた。
Link: https://arxiv.org/abs/2606.03724
πCreds：プライベート推論による認証情報 [cs.CR]目的：分散型認証情報の生成と，それに関連するセキュリティ上の脅威の分析
- 分散型認証システムは，信頼性の高いデータ検証に不可欠であり，プライバシー保護の観点からも重要である。
- 既存のシステムは複雑で，構造化データに限定されており，非構造化データへの対応が課題となっていた。
- LLMを活用し，非構造化データからの認証情報生成を可能にすることで，この課題を解決することを目指している。
- 提案手法πCredsは，LLMの推論を用いて，認証済みデータからプライバシーを保護しながら認証情報を生成する。
- SCAE問題とACPP問題を新たに定義し，LLM利用における新たな脅威を形式的に捉えた。
- 金融，健康，メール，コード等の実際のデータを用いてプロトタイプを実装し，SCAEとACPPの脅威を実証的に評価した。
Link: https://arxiv.org/abs/2606.03771
制御境界から保険請求へ：CERフレームワークを通じたAI媒介損失の再構築 [cs.AI, cs.CR, q-fin.RM]目的：AI媒介損失の再構築
- AI技術の発展に伴い，その利用範囲は拡大しており，新たなリスクが生じている。
- AIシステムによる損失発生時の原因究明が困難であり，保険請求の根拠となりうる証拠の収集が課題である。
- AIシステムの運用範囲，状態，因果連鎖を再構築し，保険請求への適合性を評価する。
- 本研究では，AI固有の再構築問題を定義し，CERフレームワークを通じてそれを具体化した。
- CERフレームワークは，制御境界，証拠再構築，保険対応の3つの要素から構成され，AI残余リスク移転の診断に役立つ。
- ポケットOSやReplitの事例，Moffatt v. Air Canada判例などを通じて，実用的な証拠基準を提示した。
Link: https://arxiv.org/abs/2606.03777
単層ニューラルネットワークの衝突耐性 [cs.CR, cs.CC]目的：単層バイナリニューラルネットワークにおける衝突発見のアルゴリズム的複雑性
- ニューラルネットワークの安全性評価は，機械学習システムの信頼性確保に不可欠である。
- ニューラルネットワークの脆弱性として，入力に対するわずかな摂動で誤った出力を招く現象が知られている。
- 本研究は，単層ニューラルネットワークに対する効率的な衝突攻撃の可能性と限界を明らかにすることを目指す。
- 閾値スケール$\kappa$が$1/\sqrt{\alpha}$よりも小さい場合，効率的に衝突を生成するオンラインアルゴリズムが存在する。
- $\kappa$が大きい場合，ランダムな活性化関数と適切な振動複雑度を持つネットワークは，overlap gap property (OGP) を満たし，オンラインアルゴリズムに対する指数関数的な下限を示す。
- 本研究は，衝突耐性の厳密な基準としてOGPを用いる最初の試みであり，衝突発見における「最悪ケース」の特性を強調する。
Link: https://arxiv.org/abs/2606.03807
PURGE：保持ガイド型消去によるプロジェクテッド・アンラーニング [cs.LG, cs.AI, cs.CR]目的：機械アンラーニングのアルゴリズム
- 機械学習モデルのプライバシー保護は重要であり，特定のデータを削除する技術が求められている。
- 既存のアンラーニング手法では，削除対象データの影響を完全に消去しつつ，保持性能を維持することが難しい。
- 保持性能を損なわずに，指定されたデータの情報を効果的に削除することを目指す。
- PURGEは，継続学習と機械アンラーニングの双対性を利用し，保持データセットに対する損失増加を抑制する。
- 中間層における表現の消去と保持データへの混乱ターゲットによって，モデルを再学習した場合と区別しづらいモデルを実現する。
- 5つのデータセットで22の忘却タスクを行い，96%以上の保持精度と0.5に近いMIA AUROCを達成し，既存手法を上回る性能を示した。
Link: https://arxiv.org/abs/2606.03808
AIエージェントが適応型コンピュータワームを可能にする [cs.CR, cs.AI, cs.LG]目的：AIエージェントによる適応型コンピュータワームの実現可能性
- サイバーセキュリティは，現代社会における重要なインフラを保護する上で不可欠である。
- 従来のワームは脆弱性パッチで対処可能だが，新たな攻撃手法への対応が急務である。
- AIを活用した自律的なワームによる脅威に備える必要性を示す。
- AIエージェントを活用することで，標的ごとに攻撃戦略を生成する新たなワームが実現可能となった。
- ワームは侵入したマシンを利用してLLMを実行し，推論能力や攻撃範囲を拡大する。
- 攻撃者の感染あたりのコストがほぼゼロになるため，攻撃と防御の間に経済的な非対称性が生まれる。
Link: https://arxiv.org/abs/2606.03811
エージェント libOS：LLMエージェントのためのライブラリOS風ランタイム [cs.OS, cs.AI, cs.CR]目的：長期間実行可能で，機能制御されたLLMエージェントのランタイム基盤
- LLMエージェントは，応答アシスタントから複雑なソフトウェアへと進化しており，その実行環境の重要性が増している。
- 従来のLLMエージェントは，ツール実行における信頼境界が不明確で，セキュリティ上のリスクが存在する。
- エージェントのスケジューリング，認可，再開，監査を安全に行えるランタイム基盤を提供し，LLMエージェントの信頼性を向上させる。
- Agent libOSは，従来のOSの上に構築されたライブラリOS風のランタイム基盤である。ハードウェアドライバなどは実装しない。
- エージェントを「AgentProcess」として扱い，プロセスID，ライフサイクル，ツールテーブルなどを管理し，機能に基づいたアクセス制御を行う。
- プロトタイプは，非同期スケジューリング，名前空間ローカルなオブジェクトメモリ，人間による承認，テストなどを実装しており，安全性に着目した評価を行っている。
Link: https://arxiv.org/abs/2606.03895
TRAP：敵対的パッチによるVLA CoT推論の乗っ取り [cs.CR, cs.AI, cs.RO]目的：VLAモデルにおけるCoT推論の脆弱性を利用した標的行動の乗っ取り
- ロボットの自律的な操作において，VLAモデルの性能向上が期待されており，特にCoT推論が重要な役割を担う。
- CoT推論の安全性が検証されておらず，悪意のある入力による行動乗っ取りのリスクが存在する。
- CoT推論の経路を操作することで，ユーザの指示とは異なる標的行動をロボットに実行させる問題の解決を目指す。
- 本研究では，敵対的パッチ（例：テーブルクロス）を用いて，CoT推論を誘導し，ロボットの行動を操作することに成功した。
- TRAPは，異なるCoT推論メカニズムを持つ3つの代表的なVLAモデルに対して有効であることが実証された。
- 敵対的パッチは紙に印刷するだけで実用性が高く，CoT推論のセキュリティ確保の必要性が示唆された。
Link: https://arxiv.org/abs/2603.23117
BigDipper：リーダーベースのBFTにおけるシャーディングされた検閲耐性とデータ可用性 [cs.CR, cs.NI, cs.SY, eess.SY]目的：リーダーベースのBFTプロトコルにおける検閲耐性のあるデータ可用性
- 分散型システムにおいて，合意形成の効率性と信頼性は，その性能を左右する重要な要素である。
- リーダーベースのBFTプロトコルは，リーダーの悪意によるトランザクションの遅延や排除のリスクを抱えている。
- 検閲耐性のあるデータ可用性を実現し，リーダーの権限を制限することで，システムの信頼性を向上させる。
- BigDipperは，シャーディングされた検閲耐性のあるデータ可用性（DA-CR）を基盤とする。
- DA-CRは，リーダーベースのコンセンサスで使用されるミニブロックの可用性を証明する。
- バリデーターは，完全なペイロードを再構築することなく，コミットメントと可用性証拠を確認することで効率的な検証が可能となる。
Link: https://arxiv.org/abs/2307.10185
大規模言語モデルに対する敵対的機械学習は進展していない [cs.CE, cs.LG, cs.CR]目的：敵対的機械学習における問題点の現状分析
- 機械学習モデルの安全性確保は重要であり，特に敵対的環境下での堅牢性が求められる。
- 従来の敵対的機械学習研究は，評価の厳密性に課題があり，進捗が遅れている。
- 本研究は，大規模言語モデルにおける敵対的機械学習が抱える問題点を指摘し，今後の方向性を示す。
- 大規模言語モデルの敵対的機械学習研究は，問題の定義が曖昧になり，解決が困難になっている。
- 評価方法の確立が難しく，意味のある進捗が得られていない可能性が示唆されている。
- 今後10年間の研究が，実質的な進歩をもたらさない可能性も懸念される。
Link: https://arxiv.org/abs/2502.02260
脱獄攻撃初期化におけるコンプライアンス指示抽出 [cs.CR, cs.LG]目的：安全性を重視した大規模言語モデルの脱獄攻撃における初期化手法
- 大規模言語モデルの安全性確保は，その社会実装において不可欠である。
- 安全対策を施されたモデルでも，巧妙な攻撃によって意図しない応答を引き出される脆弱性が存在する。
- 脱獄攻撃の効率化と，そのメカニズム解明を通じて，モデルの安全性を高めることを目指す。
- 脱獄攻撃の初期化が，モデルの活性化空間におけるコンプライアンス方向へと徐々に収束することが示された。
- 提案手法CRIは，未知のプロンプトをコンプライアンス方向に射影することで，攻撃成功率を向上させる。
- 本研究は，安全性を重視した大規模言語モデルの脆弱性を浮き彫りにし，その改善の必要性を示唆する。
Link: https://arxiv.org/abs/2502.09755
SEEM：ブラックボックスなテキスト攻撃によるツール選択の操作 [cs.CR]目的：大規模言語モデルにおけるツール選択メカニズムの脆弱性
- LLMの能力拡張にツール学習が不可欠であり，複雑なタスク解決に貢献している。
- ツール選択プロセスの脆弱性が無視されており，セキュリティリスクが存在する。
- ツール選択プロセスへの攻撃を通して脆弱性を明らかにし，防御策の基礎を築く。
- 提案手法SEEMにより，テキスト情報をわずかに変更するだけで，特定のツールが優先的に選択される確率を大幅に上昇させることが示された。
- SEEMは単語レベルと文字レベルの二段階の摂動法であり，ブラックボックス環境でも効果を発揮する。
- 本研究は，ツール選択メカニズムにおける重大な弱点を露呈し，セキュリティ対策の必要性を示唆する。
Link: https://arxiv.org/abs/2504.04809
エンゼルフィッシュ：リーダー，DAG，またはその中間 [cs.RO, cs.DC, cs.CR]目的：リーダー制とDAGベースのコンセンサスプロトコルの利点を組み合わせたハイブリッドプロトコル
- 高性能なブロックチェーンシステム実現には，BFTコンセンサスプロトコルが不可欠である
- リーダー制は低遅延だが，DAGベースは高いスループットで，実用上の負荷で性能差がある
- 両者の利点を融合し，状況に応じて柔軟に切り替えられるプロトコルを開発すること
- エンゼルフィッシュは，リーダー制からDAGベースへの移行をスムーズに行うハイブリッドプロトコルである
- 軽量な投票にベストエフォートブロードキャストを用いることで，通信コストを削減し，遅延を低減する
- 実験評価により，エンゼルフィッシュは優れたスループットと低遅延を両立することが示された
Link: https://arxiv.org/abs/2509.15847
フィッシングメール検出のための堅牢かつ解釈可能なTransformerベースのフレームワーク [cs.CR, cs.AI, cs.LG]目的：フィッシングメール検出のためのフレームワーク
- サイバー攻撃は巧妙化の一途を辿っており，メールを通じたフィッシング攻撃が最も一般的である。
- Transformerモデルは精度向上に貢献する一方，解釈可能性の低さが課題となっていた。
- 堅牢性と解釈可能性を両立させ，より信頼性の高いフィッシングメール検出を実現すること。
- 提案手法は，DistilBERTをベースに，勾配に基づく敵対的学習と確率的摂動を加えることで，ロバスト性を向上させた。
- LIME，SHAP，IGといったXAI手法を統合し，モデルの意思決定を解釈可能にした。
- モデルの予測とXAI特徴を組み合わせたプロンプトにより，根拠に基づいた自然言語の説明を生成する。
Link: https://arxiv.org/abs/2511.12085
ハイパーグラフに基づくマルチパーティ決済チャネル [cs.DC, cs.CR, cs.NI]目的：マルチパーティ決済チャネルの新しいオフチェーン構成
- パブリックブロックチェーンのスケーラビリティ向上が課題であり，オフチェーンソリューションの需要が高い。
- 既存の決済チャネルネットワークは，流動性の断片化やチャネル枯渇により効率が制限されている。
- ハイパーグラフを利用し，リーダーやコーディネーターを必要としない柔軟な決済システムの構築。
- 提案手法COALESCEは，双方向チャネルを共同資金提供型ハイパーエッジに置き換えることで，並行性と柔軟性を向上させる。
- 150ノードのハイパーエッジ内テストでは，高負荷時でも約94%の取引成功率を達成した。
- 15,000ノードネットワーク全体での評価では，85%から95%の取引成功率を維持し，COALESCEの堅牢性を示した。
Link: https://arxiv.org/abs/2512.11775
Diamond：IoT向けエンドツーエンド前方秘匿性とコンパクトな認証暗号 [cs.CR]目的：IoTデバイスにおける，機密性の高いテレメトリデータの安全な伝送
- IoTは医療機器や小型ドローンなど多様な分野で利用が拡大しており，セキュリティの重要性が高まっている。
- 既存の軽量なAE規格は，前方秘匿性やタグ集約，オフライン/オンライン最適化が不十分である。
- 最新のIoTパイプラインに必要なセキュリティ機能と効率性を両立させる。
- Diamondは，初の前方秘匿性を持つ集約認証暗号(FAAE)フレームワークであり，軽量な鍵進化メカニズムを採用している。
- オフライン前処理のコストを最大47%削減し，大量のテレメトリバッチ処理におけるエンドツーエンドの遅延を大幅に削減する。
- ARM Cortex-A72，M4，AVRアーキテクチャ上での評価により，Diamondが既存のFAAEと比較して，スループットと検証遅延で優れていることが確認された。
Link: https://arxiv.org/abs/2601.00353
グラフ構造がグラフニューラルネットワークのメンバーシップ推論リスクに与える影響 [cs.LG, cs.CR]目的：グラフニューラルネットワークにおけるメンバーシップ推論リスクとそのグラフ構造との関連性
- グラフニューラルネットワークは広く利用されているが，プライバシー侵害の懸念がある。
- 既存研究では，グラフ構造の役割が十分に考慮されていない。
- グラフ構造がプライバシーリスクに与える影響を明らかにすること。
- スノーボールサンプリングは，ランダムサンプリングと比較して，一般化性能を低下させる傾向がある。
- 推論時に訓練-テスト間のエッジへのアクセスを許可すると，テスト精度が向上し，訓練-テスト間の性能差が縮小する。
- 一般化性能の差は，メンバーシップ推論リスクの完全な指標とはならず，推論時のエッジアクセスが重要な役割を果たす。
Link: https://arxiv.org/abs/2601.17130
ファントム転送：データ汚染はデータレベル防御を乗り越える [cs.CR, cs.AI]目的：データ汚染攻撃の存在証明
- 機械学習モデルの安全性確保は重要であり，特にデータ汚染攻撃への対策が不可欠である。
- データレベルでの防御策は存在するものの，巧妙な攻撃に対しては脆弱性が見られる。
- 既存のデータレベル防御策を回避し，モデルに悪意のある挙動を植え付ける攻撃手法を提示する。
- 提示された攻撃「ファントム転送」は，汚染データの特定・除去が困難である。
- この攻撃は，データ生成モデルや学習モデル，攻撃対象に関わらず有効に機能する。
- 11種類のデータレベル防御策（モデルによる言い換えを含む）を乗り越えることが示された。
Link: https://arxiv.org/abs/2602.04899
CodeHacker：競技プログラミング解答の脆弱性を検出する自動テストケース生成 [cs.SE, cs.AI, cs.CR]目的：競技プログラミング解答における脆弱性検出のための自動テストケース生成
- コード生成におけるLLMの評価は，テストケースの質が重要であり，その信頼性が問われている。
- 既存のベンチマークは微妙なコーナーケースの網羅性が低く，誤った解答が通過することがある。
- 潜在的な脆弱性を露呈させる，標的を絞った敵対的テストケースを自動生成し，解答の精度向上を目指す。
- CodeHackerは，既存のデータセットの真陰性率(TNR)を大幅に向上させ，以前は合格していた誤った解答を効果的に排除する。
- 敵対的テストケースは，LiveCodeBenchのようなベンチマークにおいて，RLモデルの性能を向上させるための優れた訓練データとなる。
- CodeHackerは，競技プログラミングにおけるハックメカニズムを模倣し，ストレステスト，アンチハッシュ攻撃，ロジック固有のターゲットなどの多戦略アプローチを用いる。
Link: https://arxiv.org/abs/2602.20213
TitanCA：100以上のCVEを発見するためのLLMエージェントのオーケストレーションから得られた教訓 [cs.CR]目的：ソフトウェア脆弱性の発見パイプライン
- デジタルインフラの安全性確保は重要であり，脆弱性への対策は不可欠である。
- 既存の静的解析ツールは誤検知率が高く，効率的な脆弱性発見が課題である。
- LLMを活用し，より正確かつ効率的な脆弱性発見手法を確立すること。
- TitanCAは，複数のLLMエージェントを連携させ，脆弱性発見パイプラインを構築した。
- オープンソースソフトウェアに対し，203件のゼロデイ脆弱性と118件のCVEを発見した。
- マッチング，フィルタリング，検査，適応の4モジュール構造と，実践的な教訓を共有した。
Link: https://arxiv.org/abs/2604.17860
モジュール格子セキュリティ (第2部): 最適符号選択によるモジュール格子簡約 [cs.CR, cs.IT, math.IT, quant-ph]目的：モジュール格子における簡約手法の開発
- 暗号の安全性評価において，格子問題の難易度解析が重要視されている。
- モジュール格子への攻撃手法は未だ十分とは言えず，セキュリティ評価が課題となっている。
- 巡回数体のモジュール格子に対する効率的な攻撃手法を確立し，その安全性を評価すること。
- CDPR攻撃を理想格子からモジュール格子へ拡張し，ランクdモジュールを直交するランク1部分モジュールに分解することで，効率的な簡約を実現した。
- 簡約係数αdがランクに依存せずO(1)で抑えられ，ガウス分布に対するバランス仮説が証明されたことで，MLWEベースの簡約が確立された。
- 符号選択ステップを混合整数計画問題として定式化し，その最適解がkに対して常に1/2以下となることを証明した。これにより，既存のヒューリスティックな不一致を解消した。
Link: https://arxiv.org/abs/2604.22900
SkCC：クロスフレームワークLLMエージェントのためのポータブルかつ安全なスキルコンパイル [cs.CL, cs.CR, cs.AI]目的：LLMエージェントのスキルコンパイルにおける移植性とセキュリティの向上
- LLMエージェントは複雑なタスク実行に再利用可能なスキルに依存しており，その重要性は増している。
- エージェントフレームワークはプロンプト形式に敏感であり，同一スキルでも性能ばらつきが大きいという課題がある。
- SkCCは，フレームワーク非依存なスキル開発を可能にし，セキュリティ上の脆弱性を低減することを目指す。
- SkCCは，スキルセマンティクスとフレームワーク固有のフォーマットを分離する中間表現SkIRを導入することで，スキルの移植性を実現した。
- 静的オプティマイザにより，セキュリティ制約を施行し，デプロイ前に脆弱性を阻止することが可能となった。
- SkillsBench実験の結果，Claude CodeとKimi CLIにおいてそれぞれ21.1%から33.3%，35.1%から48.7%の合格率向上を示した。
Link: https://arxiv.org/abs/2605.03353
秘密の忠誠心がブラックボックス監査を回避する [cs.DB, cs.IR, cs.CR, cs.AI]目的：狭い範囲の秘密の忠誠心モデルの構築と評価
- AIモデルの安全性確保は重要であり，悪意のある攻撃への対策が不可欠である。
- 従来のバックドア攻撃とは異なり，秘密の忠誠心は検出が困難である。
- 特定の政治家の利益を優先する秘密の忠誠心を持つモデルの脆弱性を明らかにする。
- 大規模言語モデルを微調整することで，特定の条件下で有害な行動を促す秘密の忠誠心を付与できた。
- ブラックボックス監査では，対象となる政治家が不明な場合，忠誠心を持つモデルの識別は困難であった。
- データセットの監視により，毒性のある学習データを低割合でも特定可能であることが示された。
Link: https://arxiv.org/abs/2605.06846
非対称な情報源を用いたアンラーニング：公開データによるアンラーニングと実用性のトレードオフ改善 [cs.CL, cs.LG, cs.CR]目的：機械アンラーニングと実用性の間のトレードオフ緩和
- プライバシー保護の重要性が増す中，機械学習モデルからの個人情報削除技術が求められている。
- 大規模な削除要求に対し，モデルの有用性を損なわずにアンラーニングを行うことが困難である。
- 公開データの活用により，アンラーニングコストを抑制し，実用性を維持することを目的とする。
- 提案手法Asymmetric Langevin Unlearning (ALU)は，公開データ注入によりアンラーニングコストを$O(1/n_{\mathrm{pub}}^2)$のオーダーで抑制する。
- ALUは，標準的な手法では困難な定数割合のデータセットの大量削除を，高い実用性を維持しつつ実現可能にする。
- 分布の不一致下でも，ALUはプライバシー攻撃を効果的に阻止し，実用性を維持することが実証された。
Link: https://arxiv.org/abs/2605.11170
マスク拡散言語モデルへのバックドア攻撃 [cs.LG, cs.CR]目的：マスク拡散言語モデルに対する学習時バックドア攻撃の体系的な研究
- テキスト生成において，マスク拡散言語モデルが新たなパラダイムとして注目を集めている。
- これらのモデルの学習時のセキュリティは十分に検討されておらず，脆弱性がある可能性がある。
- 本研究では，この脆弱性を悪用したバックドア攻撃手法を開発し，その有効性を検証する。
- 提案手法SHADOWMASKは，トリガーマスク混合事前分布を用いることで，バックドア攻撃を可能にする。
- DiTベースのMDLMおよびLLaDA-8B-Instructを用いた評価により，SHADOWMASKはほぼ100%の攻撃成功率を達成した。
- 本手法は，従来のデータポイズニングよりも性能が優れており，フルモデルやパラメータ効率的なファインチューニングに対しても有効である。
Link: https://arxiv.org/abs/2605.19262
Landseer: 機械学習防御の現状を探る [cs.CR]目的：機械学習防御の統合と評価
- 機械学習システムの堅牢性，プライバシー，公平性は重要であり，脅威から守る必要がある。
- 既存の防御策は単一のリスクに焦点を当てており，複数の保証を同時に満たす統合が困難である。
- 複数の防御策の統合における課題を明らかにし，機械学習システムの信頼性向上に貢献する。
- Landseerは，機械学習防御を統合・評価するためのモジュール型フレームワークである。
- 再現性の検証の結果，防御策のファミリー間で再現性に差があることが判明した。
- 複数の防御策の統合における課題と機会を明らかにし，信頼性向上への基礎を築いた。
Link: https://arxiv.org/abs/2605.27148
1つのスレッドは秘密を守れるが，2つでは守れない [cs.CR]目的：XNUカーネルにおけるIPv6フラグメントID生成アルゴリズムの脆弱性
- ネットワークセキュリティにおいて，IPアドレスの偽装は深刻な脅威であり，防御が不可欠である。
- 既存の脆弱性対策では，予測不可能なID生成が求められるが，完全な実現は困難である。
- 本研究は，XNUカーネルのPRNGにおける競合状態を利用した新たな攻撃手法を解明する。
- XNUカーネルのIPv6フラグメントID生成アルゴリズムにおける競合状態の脆弱性を実証した。
- この脆弱性により，PRNGの内部状態を解読し，フラグメントIDを予測できることを示した。
- NFS(UDP)やHTTP(TCP)におけるオフパス攻撃の可能性を示し，Appleは本脆弱性(CVE-2024-27823)を修正した。
Link: https://arxiv.org/abs/2606.00918
BraveGuard：オープンワールドの脅威からより安全なコンピュータ利用エージェントへ [cs.CR, cs.CL]目的：コンピュータ利用エージェントの安全性向上
- 言語モデルの応用範囲拡大に伴い，ファイルやツール利用時の安全性が重要となる。
- 従来のプロンプトや最終応答のみでの安全性評価では，多段階実行による潜在的な危険を見落としがちである。
- オープンワールドの脅威からリアルなエージェントの挙動を学習し，適応的な防御システムを構築すること。
- BraveGuardは，最新の研究から新たなリスクを抽出し，実行可能なタスクとしてエージェントに実行させることで，安全性評価のためのデータを生成する。
- 訓練されたガードモデルは，コンピュータ利用エージェントの安全性評価ベンチマークにおいて，既存モデルと比較して大幅な精度向上を示した (AgentHazardで38.79%から82.38%へ)。
- オープンワールドの脅威発見とエージェント実行に基づいたガードの学習が，固定された分類や合成データでは達成できない安全性監視の向上に繋がる。
Link: https://arxiv.org/abs/2606.01166
スマートコントラクト再帰攻撃対策の識別力に関する形式検証：本番環境向けSolidityソースコードを対象とした三方向検証 [cs.CR, cs.LO, cs.PL]目的：OpenZeppelinの再帰ガードパターンの形式的な正当性の証明
- スマートコントラクトは金融システム等で利用され，安全性確保が不可欠であるため，形式検証が重要視されている。
- 再帰攻撃は甚大な被害をもたらす一方で，既存の形式検証手法では，攻撃の再現性と正常動作の保証を両立することが困難であった。
- 本研究では，本番環境のSolidityソースコードに対して，攻撃の再現，正常動作の証明，境界値分析を同時に行うことで，再帰ガードの識別力を検証する。
- OpenZeppelinの再帰ガードパターンについて，Lean 4を用いて機械的に検証可能な形式証明を初めて実現した。
- DAO 2016攻撃，Compound v2，Aave V3フラッシュローン，およびその脆弱な変種を含む，複数の実環境のインスタンスに対して検証を行った。
- 攻撃の再現，正当性の証明，境界値分析を組み合わせた三方向検証により，ガードが攻撃を阻止しつつ，正常なトランザクションを維持することを確認した。
Link: https://arxiv.org/abs/2606.01794
ContinuousBench：差分プライバシーを考慮した合成テキストは能力を向上させられるか [cs.LG, cs.CL, cs.CR]目的：差分プライバシーを考慮した合成テキストによる能力向上
- 機密性の高いデータセットを安全に活用し，モデルの学習を可能にする重要性
- 既存の評価指標では，合成データが真に新しい知識を伝達しているかの判断が困難である
- オリジナルデータへのアクセスに代わる，合成データを用いた能力向上を検証すること
- ContinuousBenchは，四半期ごとに新しいデータセットと質問応答セットを自動生成する継続的なベンチマークである。
- 非プライベート合成による知識伝達は大きい一方，最先端の差分プライバシー合成手法では十分な性能が得られていないことが示された。
- 標準的なベンチマークでは飽和状態にあるが，ContinuousBenchを用いることでその限界が明らかになった。
Link: https://arxiv.org/abs/2606.01849
AgentRedBench：SaaS連携におけるLLMエージェントに対する動的レッドチームと統合対応型防御 [cs.CR, cs.AI, cs.CL, cs.ET]目的：LLMエージェントにおけるSaaS連携経由のインダイレクトプロンプトインジェクション攻撃の評価と防御
- LLMエージェントの利用拡大に伴い，SaaS連携のセキュリティリスクが重要になっている。
- 既存の評価指標は，連携の種類や攻撃手法が限定的であり，実環境の脅威を十分に捉えられていない。
- 多様なSaaS連携における脆弱性を評価し，効果的な防御策を開発することを目指す。
- AgentRedBenchは，24のエンタープライズ連携を対象とした，動的なLLM駆動型レッドチームベンチマークである。
- 保護モデルAGENTREDGUARDは，パネル全体の攻撃成功率を69.9%から2.4%に大幅に削減し，既存のオープンソースベースラインを上回った。
- 異なる連携や攻撃タイプに対する検証により，AGENTREDGUARDの汎用性が確認された。
Link: https://arxiv.org/abs/2606.02240
連続変量QKDにおける多次元誤り訂正：レビュー，符号化方式，およびオープンソースシミュレーション [cs.IT, cs.CR, math.IT, quant-ph]目的：連続変量量子鍵配送(CV-QKD)における高効率な誤り訂正手法
- 量子鍵配送は，情報セキュリティの根幹技術であり，盗聴防止が不可欠である。
- CV-QKDは，信号対雑音比が低く，長距離伝送において誤り訂正が課題となる。
- 多次元誤り訂正により，CV-QKDシステムの性能向上を目指す。
- 多次元誤り訂正の原理と，次元数1, 2, 4, 8を超える高次元構成についてレビューした。
- 仮想チャネルの構築，逆方向誤り訂正の符号化方式，および線形誤り訂正符号との統合を議論した。
- 多次元誤り訂正を実装するオープンソースシミュレーションフレームワークHDiracを開発し，最先端のLDPCコードを評価した。
Link: https://arxiv.org/abs/2606.02323