arXiv雑要約

セキュリティ - 2026/06/17 公開

エージェント型NetOpsおよびAIOpsのための大規模言語モデル：アーキテクチャ，評価，安全性 [cs.NI, cs.AI, cs.CR]目的：エージェント型NetOpsおよびAIOpsにおける大規模言語モデルの活用
- ネットワーク運用とIT運用は，ビジネス継続に不可欠であり，その自動化ニーズは高い。
- 既存の運用システムは，複雑な問題への対応や迅速な意思決定に課題を抱えている。
- 大規模言語モデルを活用し，信頼性と安全性を確保した自動運用システムの構築を目指す。
- 大規模言語モデルは，インシデント調査，根本原因分析，設定合成，限定的な自己修復など，NetOpsおよびAIOpsを支援する。
- 運用信頼性はモデル自体ではなく，モデルを取り巻く仕組みに依存することが重要である。
- 安全性，プライバシー，ガバナンスリスクへの対処が，運用制御における制約された自律性という観点から不可欠である。
Link: https://arxiv.org/abs/2605.12729
編集エラーに対するハイスピード公開鍵擬似乱数符号 [cs.CR]目的：編集エラーに対する公開鍵擬似乱数符号の構成
- AI生成コンテンツの信頼性確保が重要視され，改ざん検知技術の需要が高まっている。
- 従来の擬似乱数符号は置換エラーには強いが，編集エラーに対する性能は未解明な点が多い。
- 編集エラーに対するハイスピードな公開鍵擬似乱数符号の構成を目指す。
- 二項零ビット擬似乱数符号を編集エラーに強い符号へと変換する新たな手法を提示した。
- 十分大きな定数アルファベットを用いることで，レートが1に任意に近づく公開鍵擬似乱数符号を構成した。
- アルファベットサイズをセキュリティパラメータの多項式とした場合，挿入・削除チャネルに対するSingleton boundを達成可能な符号を構成した。
Link: https://arxiv.org/abs/2605.19402
最先端LLMはサイバーセキュリティの準備ができているか：二重モード脆弱性ベンチマークからの垂直型ファウンデーションモデルの証拠 [cs.CR, cs.AI]目的：最先端LLMのサイバーセキュリティにおける準備状況の評価
- サイバー攻撃の高度化・多様化に対応するため，自動化された脆弱性検出技術の重要性が高まっている。
- 既存のLLMは，セキュリティ特有の知識やテスト手法が不足しており，十分な性能を発揮できていない。
- セキュリティに特化したLLM（垂直型ファウンデーションモデル）の有効性を検証し，その開発を促進すること。
- 最先端LLMは，ホワイトボックス検出において10～50％の誤検出率を示し，脆弱性を過剰に予測する傾向が見られた。
- ブラックボックステストでは，最先端LLMの正答率が4～8％に留まり，外部ツール併用時でも10～19％に改善する程度であった。
- セキュリティテスト手法を組み込んだ専門モデルは，脆弱性検出率を50％以上に向上させ，規模よりも手法が重要であることが示された。
Link: https://arxiv.org/abs/2605.23243
CyberEvolver：セキュリティエージェントの動的構造自己進化 [cs.CL, cs.CY, cs.CR, cs.AI]目的：セキュリティエージェントの構造的自己進化
- サイバーセキュリティは重要性が増しており，高度な防御と攻撃技術が求められている。
- 既存のLLMベースエージェントは，多様な環境への適応性に課題がある。
- 本研究は，自己進化によってエージェントの適応能力を高めることを目指す。
- CyberEvolverは，失敗事例からの学習を通じて，エージェントの構造を反復的に改善する。
- CTFチャレンジ，脆弱性攻撃，侵入テストにおいて，平均して13.6％の成功率向上を達成した。
- 人間が設計したエージェントや他の自己改善手法と比較しても優れた性能を示した。
Link: https://arxiv.org/abs/2605.26195
時間的モチーフを考慮したグラフテスト時適応によるOODブロックチェーン異常検知 [cs.CR, cs.AI, cs.LG]目的：ブロックチェーンにおける異常検知の性能向上
- ブロックチェーン技術は金融やサプライチェーン等，多様な分野で利用が拡大しており，セキュリティ確保は重要である。
- ブロックチェーン上の取引パターンは常に変化するため，既存の異常検知手法では新たな異常に対応が困難である。
- 訓練データとテストデータの分布のずれ（OOD問題）を解消し，変化する取引パターンへの適応を可能にすること。
- 提案手法TEMG-TTAは，5つの実データセットにおいて最先端のグラフ異常検知手法を平均54.88%上回る性能を示した。
- TEMG-TTAは，各アクティブアドレスの時間的モチーフ分布を効率的に捉え，グラフ学習に活用することで，異常アドレスの複雑な取引パターンを明確に特徴づける。
- ケーススタディにより，解釈可能なモチーフパターンを通じて，提案手法が技術的な設計の有効性を検証していることが示された。
Link: https://arxiv.org/abs/2605.29526
エージェントの痕跡から信頼へ：LLMエージェントにおける証拠追跡と実行系統の調査 [cs.CR, cs.AI]目的：LLMエージェントにおける証拠追跡と実行系統
- LLMエージェントの自律性が高まる中，その振る舞いの検証・デバッグ・監査の重要性が増している。
- 最終的な回答の正確性だけでは，出力の根拠やツールの利用正当性，記憶の影響が不明確である。
- LLMエージェントのプロセスレベルでの説明責任を確立し，信頼性を高めるための手法を整理・分析する。
- 証拠追跡と実行系統は，検索根拠，主張のサポート，ツールの安全性，記憶の系統，可視化，デバッグ，監査，復旧を統一的に扱うための基盤となる。
- 本調査では，痕跡のソース，証拠と実行の単位，系統関係，追跡の粒度とタイミング，表現形式，信頼性関数を網羅する分類体系を提示する。
- 系統表現，証拠帰属，ツール利用系統，実行時ガードレール，系統を伴う記憶，可視化，障害診断などの主要な方法論的動向をレビューする。
Link: https://arxiv.org/abs/2606.04990
CAPED：コンテキスト認識型プライバシー露出防御システム - モバイルGUIエージェント向け [eess.SY, cs.SY, math.OC, cs.DC, cs.CR, cs.AI]目的：モバイルGUIエージェントにおける偶発的な視覚的プライバシー露出の軽減
- スマートフォン利用が普及し，GUIエージェントによる自動操作が増加する中で，プライバシー保護が重要となっている。
- 既存のプライバシー保護手法では，タスク遂行に必要な情報までマスキングしてしまうか，十分な情報マスキングができていない。
- タスクに必要な情報のみを選択的に公開し，プライバシー漏洩を抑制する仕組みの開発を目指す。
- CAPEDは，タスク要件と画面コンテキストを解析し，必要な情報のみを公開することで，プライバシー露出を抑制する。
- AndroidWorldを用いた評価により，CAPEDはプライバシー漏洩を0.766から0.268に低減し，高いタスク遂行能力を維持することが示された。
- タスク駆動型の選択的露出により，モバイルGUIエージェントへのスクリーンショット送信前の偶発的な視覚的漏洩を削減できることが確認された。
Link: https://arxiv.org/abs/2606.12666
AgentCyberRange：現実的なサイバー射程における最先端AIシステムのベンチマーク [cs.CR, cs.AI, cs.LG]目的：最先端AIシステムの自律的なサイバー攻撃能力の測定
- サイバーセキュリティ分野において，AIの活用は急速に進んでおり，その性能評価が不可欠である。
- 既存の評価手法では，現実的な侵入ワークフローを再現できず，AIの潜在的なリスクを把握することが困難である。
- 現実的なサイバー射程環境下でのAIシステムの攻撃能力を評価し，新たなリスクを早期に発見することを目的とする。
- AgentCyberRangeは，110の脆弱性を持つ15のWebアプリケーションと8つの企業環境を模したサイバー射程で構成された初の公開基盤である。
- GPT-5.5 with Codexは，Webアプリケーションの脆弱性攻撃で16.1%，事後攻撃で31.7%のタスクを解決し，具体的なヒントを与えるとそれぞれ33.0%と46.3%に向上した。
- 評価の結果，既知の脆弱性だけでなく，一般的なプロジェクトの未知の脆弱性やホスト防御を回避するペイロードの変異も観察された。
Link: https://arxiv.org/abs/2606.14295
シールドから標的に：LLMベースのエージェントガードレールのサービス拒否攻撃 [cs.CR, cs.AI]目的：LLMベースのガードレールの脆弱性とそのDoS攻撃の可能性
- LLMエージェントの安全性確保は重要であり，特にプロンプトインジェクション攻撃からの防御が不可欠である。
- 既存のガードレールは推論能力を利用するが，その能力が攻撃の起点となる可能性が認識されていなかった。
- ガードレールの推論能力を悪用したDoS攻撃を明らかにし，可用性の問題を解決する必要がある。
- 本研究では，自然言語で作成された攻撃Payloadを用いてガードレールの推論時間を大幅に増幅させる攻撃を実証した。
- 攻撃は様々なガードレールアーキテクチャ，安全テンプレート，および主要なLLMバックボーンで有効であることが示された。
- 単一の悪意のあるドキュメントで共有ガードレールインフラを飽和させ，他のエージェントを停止させることが可能である。
Link: https://arxiv.org/abs/2606.14517
貪欲座標拡散：拡散ガイダンスによる効果的かつ意味的に一貫した敵対的攻撃 [cs.DC, cs.LG, cs.CR]目的：大規模言語モデルに対する敵対的攻撃の生成
- 言語モデルの安全性評価において，敵対的攻撃は脆弱性を明らかにする重要な手法である。
- 既存の最適化ベースの攻撃は，意味的に不自然な出力を生成しやすく，防御機構に容易に検出される。
- 意味の一貫性を保ちつつ，目的とする応答を引き出す敵対的攻撃手法の開発。
- 提案手法GCDは，勾配への直接アクセスを必要とせず，グレーボックス環境で動作可能である。
- GCDは，高い攻撃成功率(ASR)を達成しつつ，応答品質においても競争力のある結果を示した。
- 生成された敵対的プロンプトは，Perplexityベースやガードモデルによる検出率が低いことが示された。
Link: https://arxiv.org/abs/2606.15531
QoSを考慮したトークンスケジューリングとマルチモーダルエージェントネットワークにおけるプライベートデータ評価 [cs.AI, cs.CR]目的：マルチモーダルエージェントネットワークにおける公平なトークン配分およびプライベートデータ評価
- AIサービスの価値は人間生成データに依存する。分散型システムでのデータ管理が重要視されている。
- クラウド集中型処理は，データ主権を低下させ，QoSを悪化させる可能性がある。
- 分散・制約のある環境で，データの質と貢献度に応じた公平な評価を目指す。
- 提案手法は，マルチモーダルデータを共有セマンティック空間に埋め込み，差分プライバシーを適用したプロトタイプを生成する。
- 公平なトークン配分スキームは，効果的な貢献を報酬化し，データ異質性やAIリソース不足に強い。
- シミュレーションにより，貢献度に基づく公平性とQoSが向上し，画像再構成攻撃への耐性も強化された。
Link: https://arxiv.org/abs/2606.15573
MASCOT-Android：Androidマルウェアのソースコード標本のキュレーション済みデータセットと自動収集パイプライン [cs.CR, cs.AI]目的：Androidマルウェアのソースコード標本データセットおよび自動収集フレームワーク
- マルウェア解析において，攻撃者の意図を直接的に把握できるソースコードは重要である。
- マルウェアのソースコードは入手が困難であり，手動レビューのコストが高いという課題がある。
- GitHubにおけるマルウェアソースコードの効率的な収集を可能にする。
- リポジトリレベルのドキュメントが，マルウェアソースコード収集の強力な指標となることが判明した。
- READMEファイルのみを用いたモデルは，96.28％の精度と1.06％のFPRを達成した。
- モデルが出力する信頼度スコアにより，誤検知率と網羅性のバランスを調整できる。
Link: https://arxiv.org/abs/2606.16072
エージェント型AIにおける動的な悪意のあるスキル [cs.CR]目的：エージェント型AIにおける動的な悪意のあるスキルの攻撃手法とその対策
- AIエージェントの能力向上に不可欠なスキルは，同時に新たな攻撃対象となる。
- スキルに悪意のあるコードを埋め込むことで，エージェントを制御できる可能性が存在する。
- 自然言語によるドキュメントを悪用した動的な悪意のあるスキルの攻撃を抑制する。
- 自然言語ドキュメントに悪意のある命令を埋め込むことで，エージェントに悪意のあるロジックを動的に注入できることを示した。
- OpenHandsやClaude Codeといったエージェントフレームワークにおいて，この攻撃が実行可能であることが確認された。
- OSカーネルによる読み取り専用マウントを利用したシステムレベルの防御策が有効であることが示された。
Link: https://arxiv.org/abs/2606.16287
拒否幾何学から安全幾何学へ：動的敵対的ファインチューニング下における有害性－拒否の結合 [cs.CR]目的：言語モデルにおける有害な要求の拒否と無害な要求への応答能力維持の関係性
- 安全なAIシステムの開発において，有害な要求への拒否機能は不可欠である。人間との調和のとれたAI実現のため重要。
- 既存の評価では，モデルが有害性を認識し，拒否ポリシーを実行しているか，その両者を連携させているか不明である。
- 有害性と拒否の結合を評価する安全幾何学プロトコルを用いて，安全性のダイナミクスを診断すること。
- R2D2モデルは，初期段階で高い結合性を示し，堅牢性と安全なプロンプト拒否を達成する一方，無害な応答能力は低下する。
- SFTモデルも低い結合性に到達するが，R2D2と比較して堅牢性が低く，結合性が低いだけでは安全性が保証されない。
- 有害性－拒否の結合は，R2D2モデルの安全性評価において有用であり，安全幾何学のダイナミクスを診断するための指標となる。
Link: https://arxiv.org/abs/2606.16349
周波数分割多重化CV-QKDシステム [quant-ph, cs.CR]目的：周波数分割多重化連続変量量子鍵配送(CV-QKD)システムの性能向上
- 量子暗号は，理論的に絶対安全であり，情報セキュリティの根幹を担う重要な技術である。
- 既存のCV-QKDシステムは，伝送距離や鍵生成速度に課題が残されている。
- 周波数分割多重化によりスペクトル効率を向上させ，長距離・高効率なCV-QKDを実現する。
- 提案システムは，4チャンネル10MbaudのFDM-CV-QKDシステムとして実験的に実証された。
- 有限サイズシナリオ下において，バック・ツー・バックの秘密鍵生成速度は単一チャンネル構成の26.8km相当の伝送距離において3.6倍に向上した。
- チャネル間干渉が存在する条件下でも，優れた性能を発揮することが確認された。
Link: https://arxiv.org/abs/2603.20718