arXiv雑要約
セキュリティ - 2026/03/12 公開
敵対的ハブ検出器:検索拡張生成システムにおけるハブポイズニングの検出 [cs.CR, cs.AI]目的:検索拡張生成システムにおけるハブポイズニングの検出
- 大規模言語モデルの知識獲得において,ベクトル類似度検索を用いた外部知識の利用が不可欠である。
- 検索結果の上位に頻出するハブと呼ばれるアイテムが存在し,システムを悪用するセキュリティ上の脆弱性となる。
- ハブポイズニング攻撃を検出し,検索拡張生成システムのセキュリティと性能を向上させる。
- ハブスキャンは,統計的ハブ検出,クラスタ拡散分析,クエリ摂動に対する安定性テスト,およびドメイン/モダリティ認識検出を統合した多検出器アーキテクチャである。
- Food-101,MS-COCO,FiQAベンチマークにおいて,ハブスキャンは0.2%のアラート予算で90%のリコール,0.4%で100%のリコールを達成した。
- MS MARCOの100万件の実データを用いた検証では,クリーンなドキュメントと敵対的なコンテンツ間に有意なスコア分離が確認された。
防御的拒否バイアス:安全性調整がサイバー防御者を阻害する方法 [cs.CR, cs.AI]目的:サイバーセキュリティにおける防御的な要求に対するLLMの拒否傾向の分析
- サイバー攻撃の巧妙化に対応するため,AIによる自動防御システムの開発が不可欠である。
- LLMの安全性調整は攻撃的な利用の防止に偏り,正当な防御的利用を妨げる可能性がある。
- LLMが防御的な要求と攻撃的な要求の意図を正確に区別し,適切な対応を行うための改善策を提案する。
- 安全性調整されたLLMは,攻撃的なタスクと類似した言語を含む防御的なサイバーセキュリティ要求を,中立的な要求の2.72倍の確率で拒否する。
- 特に,システム強化(43.8%)とマルウェア分析(34.3%)において拒否率が高く,実運用上の重要タスクへの影響が大きい。
- 明示的な権限付与は,LLMによる拒否率を増加させ,正当な要求が攻撃的な意図と誤解される傾向がある。
Kraken:DNNに対する高次のEMサイドチャネル攻撃(近傍および遠方) [cs.CL, cs.CR]目的:DNNのパラメータ抽出
- 機械学習モデルの巨額投資により,知的財産保護が重要になっている。
- 既存研究はGPUの汎用CUDAコアに限定され,Tensorコアへの攻撃は未検証だった。
- Tensorコアへのサイドチャネル攻撃を可能にし,遠方からの情報漏洩を評価する。
- Tensorコアに対する近傍EMサイドチャネル攻撃によるパラメータ抽出を初めて実証した。
- 相関電力解析(CPA)を用いた効率的な攻撃手法をGPUアーキテクチャに合わせて開発した。
- LLMのハイパーパラメータや重みの遠方からの漏洩を100cm離れたガラス越しに検出した。
AI時代の消費者向けロボットハッキング:サイバーセキュリティ [cs.CR]目的:消費者向けロボットに対するAIを活用したサイバー攻撃の実態と対策
- ロボットは家庭や職場に普及し,生活を便利にする一方,セキュリティリスクも増加している。
- 従来のロボットセキュリティは専門知識を前提としており,AIによる攻撃への対応が遅れている。
- AIを活用した攻撃が容易になった現状を踏まえ,新たな防御策の必要性を示す。
- 生成AIツール「CAI」を用いることで,従来は専門知識を要したロボットの脆弱性を自動的に発見できることが示された。
- 3つの実証実験(芝刈りロボット,パワードエクソスケルトン,窓拭きロボット)により,AIによる攻撃の容易さと深刻さが明らかになった。
- AIによる攻撃の民主化が進む中,防御側の対策が遅れている現状を踏まえ,AIネイティブな防御策の重要性が示唆された。
レニィ微分プライバシーを用いた最適なパーティション選択 [cs.CR]目的:プライバシーを保護しつつ,公開可能なパーティションの集合を最大化すること
- 個人情報を含むデータ分析において,プライバシー保護は不可欠であり,データ活用との両立が求められる。
- パーティション選択問題では,公開可能なパーティションの数を最大化しつつ,差分プライバシーを保証する必要がある。
- レニィ微分プライバシー(RDP)を用いて,より厳密なプライバシー分析と,最適なパーティション選択アルゴリズムを開発する。
- 本研究では,既存のアルゴリズムを改善し,並列および逐次適応アルゴリズムの性能向上を実現した。
- パーティション頻度を必要としない場合に,ガウスメカニズムのドロップイン置換として利用可能な,最適なアルゴリズムを提案した。
- パーティションと頻度両方を公開するアルゴリズムには固有のコストが存在し,加法ノイズと非加法ノイズメカニズムの間には数値的な分離があることを示した。
- 1
- 2
