arXiv雑要約
セキュリティ - 2026/06/17 公開
教育棟オートメーション試験環境におけるBACnet制御DALIインフラのセキュリティと人間中心評価 [cs.CR, cs.HC]目的:BACnet/IPビルオートメーション試験環境とDALI照明インフラのセキュリティ評価
- 建物管理システムの統合が進み,効率的な運用が求められる一方で,セキュリティリスクも増加している。
- 複雑なサイバー物理環境のため,検査・保護が難しく,分析者の理解を妨げる要因となっている。
- 教育環境におけるBACnet/DALIの探索を通じて,セキュリティ教育と人間中心のツール開発に貢献する。
- YabeやBACteriaを用いてBACnetサービスを検出し,オブジェクト階層を再構築,照明制御パスを特定した。
- BACnetオブジェクトとDALIグループレベルのインフラ間の対応関係を明らかにした。
- BACS評価には,技術的なプロトコルだけでなく,使いやすいインターフェースや安全なメンタルモデルが不可欠であると強調した。
マルチエージェントGISシステムのセキュリティ確保:リスク評価とプロンプト強化最適化 [cs.CR, cs.CL]目的:マルチエージェントGISシステムにおけるリスク特定,評価,軽減のためのセキュリティ指向フレームワーク
- GISとエージェントシステムの融合は空間分析の複雑化を可能にするが,セキュリティリスクを伴うため,その確保が重要である。
- 既存システムは,エージェント間の協調による複雑な処理を行う一方で,セキュリティ対策が不十分な場合が多い。
- 本研究は,適応性とセキュリティを両立するフレームワークを開発し,リスク軽減策を提示することでこの課題を解決する。
- リスク評価において,敵対的LLMを用いたレッドチームアタックにより,システムの脆弱性を特定した。
- プロンプト最適化フレームワークにより,構造化されたシグネチャを用いたプロンプトへの攻撃に対する耐性を向上させた。
- タスク性能を損なうことなく,プロンプトのセキュリティ改善を体系的に実現できることを示した。
タイムスタンプを考慮した時空間グラフ対照学習によるネットワーク侵入検知 [cs.CR, cs.AI, cs.LG]目的:ネットワーク侵入検知のための時空間グラフ対照学習手法
- ネットワークセキュリティの重要性が高まる中で,異常な通信パターンを検知する技術は不可欠である。
- 既存手法は時間的な依存関係を無視し,未知の攻撃への対応が困難な場合がある。
- 本研究は,時間情報を活用し,未知の攻撃に対する汎化性能を高めることを目指す。
- 提案手法は,ネットワークトラフィックの時系列グラフを構築し,E-GraphSAGEとLSTMエンコーダを用いて時間情報と空間依存性を抽出する。
- マルチビューグラフ対照学習により,時間的連続性,構造的一貫性を維持し,表現学習の汎化性能とロバスト性を向上させる。
- 実験結果から,提案手法は既存の自己教師あり学習手法を凌駕し,教師あり学習の最先端手法に匹敵する性能を示す。
LLMの損失地形汚染:LLMからの未学習データの標的抽出 [cs.CR, cs.LG]目的:LLMからの未学習データの抽出
- LLMは機密データで学習されることが多く,情報漏洩対策は重要である。
- LLMの学習データからの機密情報の抽出攻撃が懸念されている。
- 学習データへの汚染によって標的データの抽出を可能にすること。
- 学習データの一部を汚染することで,アクセス不能な標的レコードの漏洩を誘発できる。
- 損失地形を操作し,標的データ周辺に鋭い損失最小値を生成することで,モデルは標的を記憶する。
- 差分プライバシーによる防御を回避する損失地形の直接的な探索攻撃も存在する。
分数Verkle木:高性能ブロックチェーン状態蓄積器のためのハイパツリー分解と検証済み証明シリアライゼーションアーキテクチャ [cs.CR, cs.DC, cs.PF]目的:ブロックチェーン状態管理の効率化
- ブロックチェーンのスケーラビリティ向上が不可欠であり,状態管理はその重要なボトルネックとなっている。
- 従来のブロックチェーン状態蓄積器は,膨大なデータ量に対して計算コストが高くなるという課題がある。
- Verkle木を用いた状態管理の効率化と,実用的な実装における課題解決を目指す。
- 分数Verkle木(FVT)は,グローバル状態を複数の独立したサブ蓄積器に分割することで,キャッシュ効率と並列処理性能を向上させた。
- go-verkle実装における非効率性を特定し,存在チェック,SHA256参照,ゼロコピーバッファ,ハッシュマップによる重複排除を通じて改善した。
- Apple M1 Proでのベンチマークにより,ヒープ割り当て量を57%削減し,ネットワーク全体で年間4.85PBのデータ削減効果が確認された。
現実的なシナリオにおけるツール使用LLMエージェントのデータ漏洩リスク評価 [cs.CR, cs.AI]目的:ツール使用型LLMエージェントにおけるデータ漏洩リスク
- 企業や個人利用でLLMエージェントが増加しており,機密情報へのアクセス管理が重要になっている。
- 既存研究は悪意のあるデータ抽出に焦点を当てており,通常の利用におけるデータ漏洩リスクは未解明である。
- 現実的な非悪意的なタスクでのデータ漏洩リスクを評価し,安全な運用方法を確立することを目指す。
- 3つのエージェント全てで,全てのシナリオにおいて完全な正解と安全な実行は確認されなかった。
- タスクの成功とデータ処理の失敗(不必要な情報アクセスや不適切な開示)が同時に発生し,能力と安全性の評価分離の必要性が示唆された。
- 本研究は,敵対的抽出とは異なる,運用上のデータ漏洩が重要な安全上の懸念事項であることを示している。
量子リスクの定量化:暗号アジリティの尺度 [cs.CR]目的:暗号アジリティの尺度であるローテーション時間の算出
- 現代社会における情報セキュリティにおいて,暗号技術は不可欠であり,その保護は極めて重要である。
- 量子コンピュータの出現により,既存の暗号アルゴリズムの脆弱性が顕在化し,対策の遅れが大きなリスクとなる。
- 量子コンピュータに対する耐性を持つシステムの設計に必要なローテーション時間の許容範囲を明確にすることを目的とする。
- ローテーション時間という概念を導入し,セキュリティリスク許容度との関係性を導出した。
- 過去のCVEデータに基づき,ローテーション時間の許容範囲を時間から数日に見積もることができた。
- 暗号アジリティとハイブリッド暗号化を組み合わせることで,量子耐性システムを設計できることが示された。
グラフニューラルネットワークによるサイバーセキュリティとドローンインテリジェンスの統合:イスラエル・イラン紛争における応用 [cs.CR, cs.AI]目的:サイバーセキュリティとドローン管理の支援
- 物理サイバーシステムは新たな脅威をもたらすため,その検知と迅速な対応が重要である。
- サイバー攻撃とUAVの連携は複雑化しており,既存の手法では対応が困難である。
- グラフニューラルネットワークを用いて,状況認識と迅速な対応能力の向上を目指す。
- グラフニューラルネットワークが侵入検知システムの精度向上に貢献することが示された。
- 提案手法は,従来のGCNやGATと比較して高い性能を示すことが実証された。
- 本研究は,動的なサイバー物理システムのセキュリティ強化に貢献する可能性を示す。
TrustErase:パスポート埋め込み表現を用いた検証可能な即時機械アンラーニング [cs.CR, cs.AI, cs.LG]目的:検証可能でデータ不要な機械アンラーニングフレームワーク
- AIのプライバシー保護需要が高まり,機械アンラーニングの必要性が増している。
- 既存手法は検証が難しく,計算コストが高いという課題がある。
- パスポート埋め込み表現により,高速かつ検証可能なアンラーニングを実現する。
- TrustEraseは,モデルのパラメータ効率的な適応層内でパスポートを暗号鍵として扱い,再学習や微調整なしに特定のクラスやデータセットを削除可能である。
- 特異値分解によりパスポートをモデルの重みに隠蔽し,アンラーニング操作の透明性と証明可能性を確保している。
- MNIST,CIFAR10,CIFAR100での評価において,既存の最先端手法と同等またはそれ以上の性能を示し,データ不要な環境下で動作する。
モデル派生チェーンにおける貢献追跡のためのマルチユーザーホワイトボックス透かし [cs.CR, cs.AI]目的:モデル派生チェーンにおける貢献の追跡と検証
- 大規模言語モデルの利用拡大に伴い,モデルの来歴管理と知的財産の保護が重要になっている。
- 既存の透かし技術は単一ユーザー向けであり,モデルの反復的な派生や段階的な更新に耐性がない。
- マルチユーザー環境におけるモデル派生チェーンに対応し,貢献者の透かしを保護することを目的とする。
- LineageMarkは,モデルパラメータに投影ベースのアプローチを用いて透かしを埋め込む。
- マルチ段階のモデル派生においても貢献者の透かしを維持し,複数ユーザーによる透かし挿入をサポートする。
- 再透かし,ファインチューニング,量子化,プルーニングといった摂動に対しても堅牢性を示す。
神経記号AIにおける安全性,セキュリティ,および認知リスク [cs.CR]目的:神経記号AIの攻撃対象領域,記号的完全性侵害,および層間増幅率の定義
- 高信頼性が必要な分野において,説明可能性と構造化された推論が求められるため,神経記号AIの研究が重要である。
- 従来のニューラルシステムに比べ,神経記号AIは攻撃対象領域が拡大し,新たな脆弱性を抱えている。
- 神経記号AI固有の脅威モデルと緩和策を確立し,安全性とセキュリティを確保することを目指す。
- 神経記号AIの攻撃対象領域を5層に分類し,各層における脆弱性を形式的に定義した。
- 知識グラフへの攻撃実験により,少数の攻撃で記号的完全性侵害が発生することを示した。
- DistilBERT+ProbLogパイプラインにおいて,敵対的攻撃による層間増幅率が有意に高いことを確認した。
未来へのキャッシュ:インターネット遮断のための分散型ウェブページアーカイブ [cs.CR, cs.NI]目的:インターネット遮断時のウェブページへのアクセス維持
- 情報へのアクセスは重要であり,遮断は人権侵害にもつながり得る。
- 遮断発生時にウェブコンテンツへのアクセス手段が限られている。
- 分散型キャッシュシステムにより,遮断下でも情報へのアクセスを可能とする。
- Cache to the Future (CttF)は,ウェブ上の静的コンテンツをキャッシュし,遮断時でも提供するシステムである。
- CttFは,コミュニティによる評価と暗号技術を活用し,大規模なキャッシュと悪意のある干渉への対策を実現している。
- シミュレーションの結果,CttFは都市規模で様々な状況下でコンテンツ配信が可能であることが示された。
構文システムは意味的不変量を見ることができない [cs.LO, cs.CR]目的:帰納法の二つの理論,開帰納法と節集合サイクル,の比較可能性
- 計算可能性理論は,計算の限界と可能性を探求する上で不可欠である。
- 既存の理論では,数論的な事実と記号的な操作の区別が曖昧になっている。
- この研究は,構文的な操作が意味論的な不変量にアクセスできないことを示す。
- 開帰納法と節集合サイクルの比較可能性に関する未解決問題を解決した。
- 加算規則の適用条件により,$a{+}b$と$b{+}a$は区別可能であり,これは数論的な事実である。
- この研究から導かれる「構文不変性原理」は,P versus NP問題の障壁にも示唆を与える可能性がある。
オープンソースソフトウェアの再現可能な脆弱性の地図 [cs.CR, cs.AI, cs.LG]目的:オープンソースソフトウェアの脆弱性に関する大規模で再現可能なデータセットの構築
- ソフトウェアのセキュリティ確保は重要であり,脆弱性データの活用が不可欠である。
- 既存の脆弱性データセットは,再現性の低さから有効活用が難しい場合が多い。
- 再現性を重視することで,脆弱性分析の精度向上と新たなセキュリティ研究の促進を目指す。
- 本研究では,オープンソースソフトウェアの脆弱性データセット(OSS-Fuzz)に対して,再現性を確保する手法を適用した。
- その結果,6,100件を超える脆弱性を収録したARVOデータセットを構築し,81%の脆弱性を再現することに成功した。
- また,対応する修正パッチの特定精度は89.4%に達し,脆弱性研究の新たな可能性を示唆した。
OTRO:平方根ORAMを用いた秘匿トークン化パス [cs.CR]目的:LLMサービスにおけるトークナイザーのセキュリティギャップの解消
- LLMの利用拡大に伴い,機密コンピューティング環境下での情報漏洩対策が重要になっている。
- 従来のトークナイザーは,メモリアクセスパターンからプロンプトが漏洩する脆弱性があった。
- トークナイザーの遅延を最小限に抑えつつ,アクセスパターンからの情報漏洩を防ぐことを目指す。
- OTROは,平方根ORAMを活用し,高速な単一アクセスを実現することで,トークナイザーのオーバーヘッドを抑制した。
- HuggingFace Tokenizersとnano-vLLMに実装し,TDX環境下で評価した結果,TTFTへの影響は最大4.5%に留まった。
- メモリオーバーヘッドも0.5GB未満であり,様々なモデルでトークナイザーの漏洩を低減することに成功した。
AI 強化バイナリ逆アセンブルに関する知識の体系化 [cs.CR, cs.AI, cs.SE]目的:AI 強化バイナリ逆アセンブルに関する知識の体系化
- ソフトウェア理解,脆弱性発見,マルウェア解析など,情報セキュリティ分野において基盤技術である。
- コンパイル過程で意味情報が失われ,解析が困難であるという課題が存在する。
- AI 技術を用いて,バイナリ逆アセンブルの効率化と精度向上を目指す。
- 本研究では,2015年以降に発表された144件の論文を分析し,AI強化バイナリ逆アセンブルの分野を体系的に整理した。
- 従来の解析技術,バイナリから得られる成果物,表現戦略,学習パラダイムなどを統合的に捉える分類体系を提示した。
- この研究は,多様なアプローチの共通構造を明らかにし,今後の研究の方向性を示唆する基盤となる。
Bifrost:プライバシー保護のためのTransformerおよびLLMサービングにおけるハイブリッドTEE-FHE推論 [cs.CR]目的:TransformerおよびLLM推論におけるプライバシー保護
- クラウド上のLLM利用拡大に伴い,秘匿性の確保が不可欠となっている。
- FHEは計算コストが高く,TEE単体ではアクセラレータの安全な利用が困難である。
- TEEとFHEを組み合わせ,効率的かつ安全な推論環境を構築すること。
- Bifrostは,FHEとTEEを組み合わせたハイブリッドアーキテクチャを提案する。
- GPT-2(1.5B)において推論遅延を9.25倍,LLaMA 3(8B)において9.91倍削減。
- CKKS/FHE単独での実装と比較して,TTFTを14.6-53.4倍削減することに成功した。
プロフェッショナルドメインLLMエージェントのための由来情報に基づいた検索サニタイゼーション [cs.CR, cs.CL]目的:プロフェッショナルドメインにおけるLLMエージェントに対するプロンプトインジェクション防御
- 企業におけるLLM活用が進む中,その安全性確保は不可欠である。機密情報漏洩等のリスクを抑制する必要がある。
- 合成ベンチマークで有効な防御策が,実際の企業文書には通用しないという課題がある。文書の特性が大きく異なるためである。
- 実際の企業文書に対する,より効果的かつ実用的なプロンプトインジェクション防御手法を開発すること。
- 実文書ベンチマークにおいて,既存の防御策である言い換えは,攻撃成功率の有意な低下をもたらさず,むしろ有用性を低下させた。
- 提案手法PARSEは,攻撃成功率を38%削減し,有用性を維持しつつ,統計的に有意な防御効果を示した。
- 防御策の評価には,合成データではなく,ドメインに適合した実文書を用いるべきである。
サンドボックス化されたワークロードにおけるセキュアなアウトバウンド通信のための多層防御アーキテクチャSNAS [cs.CR]目的:サンドボックス化されたワークロードからのセキュアな外部通信のためのアーキテクチャ
- データエンジニアリングやAI/MLの普及に伴い,クラウド環境におけるセキュリティ対策の重要性が増している。
- サンドボックス環境における外部ネットワークアクセスは,多層テナント間の分離やリソース公平性の確保が課題となる。
- 厳格な隔離性と公平性を保ちつつ,透過的なネットワークアクセスを可能にする仕組みの確立を目指す。
- SNASは,eBPFパケットフィルタリング,GENEVEオーバーレイネットワーク,分散型アウトバウンドプロキシを組み合わせることで,低オーバーヘッドでポリシーに基づいたアウトバウンド制御を実現する。
- Earliest Departure Time (EDT)アルゴリズムを用いたeBPFベースの帯域幅制限や,二重階層のポリシー適用,コネクション制限とポート枯渇に対する保護機能を実装している。
- SNASはSnowflakeの全リージョンに展開され,ペタバイト規模のデータ転送や低遅延の外部連携を含む大規模な本番ワークロードをサポートしている。
銀行向けAIセキュリティエージェント:小口・法人口座を対象とした不正検知とAML [cs.CR, cs.AI, cs.CE, cs.ET]目的:銀行における多岐にわたる不正行為とAML(アンチ・マネーロンダリング)の検知
- 金融機関は,常に高度化する不正手口から資産と顧客を守る必要があり,セキュリティ対策は不可欠である。
- 従来のルールベースのシステムでは,巧妙に隠蔽された不正行為や新しい手口への対応が困難である。
- 本研究は,高度なAI技術を用いて,より効果的かつ包括的な不正検知システムを構築することを目指す。
- 提案モデルは,取引データとセッションデータという二つの異なるストリームを統合し,不正検知精度を向上させた。
- 合成データによる実験の結果,提案モデルはルールベースやLSTM単独モデルと比較して高いF1スコアを示した。
- 顧客対応チャットボットとアナリスト支援機能も搭載し,迅速かつ正確な対応を実現した。
どこでも,どんな妨害でも:変調信号によるLiDAR上のトロイのマルウェアの遠隔起動 [cs.CR, cs.SY, eess.SY]目的:LiDARセンサーに対する,展開後に外部からトリガー可能なマルウェア攻撃手法
- 自動運転システムにおいて,LiDARは3次元認識と安全を確保する上で不可欠な役割を担っている。
- LiDARのサプライチェーンセキュリティは懸念されるが,展開後の攻撃は未だ検討が十分ではない。
- 本研究は,LiDARのハードウェアやネットワークアクセスなしにマルウェアを遠隔操作する手法を提示する。
- マルウェアはLiDARのファームウェアに埋め込まれ,変調信号による光学トリガーで起動できることを示した。
- 実験により,静止および移動するプラットフォーム上で偽オブジェクトの挿入と実オブジェクトの抑制が可能であることを実証した。
- 挿入された人型の偽造物は,最先端の3次元物体検出器によって検出可能であり,安全への影響も確認された。
Cordon:ツール使用LLMエージェントのための意味的トランザクション [cs.OS, cs.CR]目的:ツール使用LLMエージェントにおける意味的トランザクションの実現
- LLMエージェントの能力向上には,複雑なタスクを安全かつ確実に実行できる環境が不可欠である。
- 既存のランタイムはツールを独立したRPCとして扱い,複数ステップのワークフロー全体での整合性確保が困難である。
- エージェントのタスク単位での実行境界を設け,状態管理と外部への影響を安全に制御することを目指す。
- Cordonは,外部への影響をステージングし,検証することで,不可逆的なエージェントの効果を安全に管理するランタイムシステムである。
- 評価実験により,既存の防御策では検出できないワークフロー違反をCordonが検出できることが示された。
- 不可逆的な影響による失敗を削減しつつ,正常なタスク完了を維持できることが確認された。
ネイティブ成功を超えて:CLIPバックドアの展開インターフェース露出の監査 [cs.CR, cs.CL]目的:CLIPバックドアの展開インターフェースにおける露出の監査
- 画像とテキストの事前学習モデルは多様な応用で利用され,その安全性確保が重要である。
- 既存研究では特定のタスクでの攻撃検証に偏り,他のインターフェースでの脆弱性が不明である。
- 様々な展開インターフェースにおけるバックドアの露出状況を定量的に評価し,リスクの所在を特定する。
- DIFEフレームワークにより,バックドア攻撃の露出がインターフェースの構成要素に依存することが明らかになった。
- テキスト側へのポイズニングはテキストエンコーダーの制御にはつながらず,特定の攻撃は仕組みに依存することが示された。
- 再利用可能なテキストエンコーダーが敵対的挙動の担い手となりうるという課題が明らかになり,BadTextTowerが提案された。
子供は敵ではない:禁止と監視に代わる,子どもに合わせたセキュリティ [cs.CR, cs.CY, cs.HC]目的:子どもに合わせたセキュリティ設計
- 現代社会において,デジタル技術は子どもの成長・学習に不可欠である。
- 既存のオンライン安全対策は,制限に偏重し,子どもの主体性を損ねる恐れがある。
- 子どもを正当なユーザーと捉え,安全性を確保する新しいセキュリティモデルの提案。
- 本研究では,「子どもに合わせたセキュリティ」という新たな設計パラダイムを提唱する。
- このパラダイムは,子どもの幸福,発達,プライバシー,権利をセキュリティ要件の中心に据える。
- 従来の封じ込め型アプローチとの対比や,具体的な原則,設計への影響についても議論する。
ShellGames: LLM駆動によるSSH欺瞞 [cs.CR]目的:LLMを用いたSSHシェルシミュレータによる,サイバー欺瞞と移動標的防御の実現
- サイバー攻撃の高度化に対応するため,攻撃者の不確実性を高める欺瞞技術の重要性が増している。
- 長期にわたる,信頼性の高いインタラクティブな欺瞞セッションを維持することが困難である。
- LLMの制約を克服し,持続可能で現実的なSSHシェル環境を構築し,欺瞞の有効性を高める。
- ShellGamesは,自動Chain-of-Thought,メモリ管理,投機的コマンド実行,スマートルーティング,サブバージョン検出を組み合わせる。
- コマンド正答率は0.898(ベースライン比+5.3pp),シーケンスレベルの一貫性は0.918(+36pp)を達成した。
- ユーザースタディの結果,ShellGamesは現実のシェルと同程度のリアリズムを持ち,従来のハニーポットよりもコマンド網羅性が高いことが確認された。
サービス機能チェーンオーケストレーションにおけるセキュリティ誘発型ブレースのパラドックス [cs.NI, cs.CR, cs.GT]目的:サービス機能チェーン(SFC)オーケストレーションにおけるセキュリティ誘発型ブレースのパラドックスの存在とその対策
- ネットワーク機能仮想化/ソフトウェア定義ネットワークは,柔軟なセキュリティ運用を可能にする重要な技術である。
- セキュリティ機能の追加が,必ずしもネットワーク全体の性能向上に繋がるとは限らないという課題がある。
- セキュリティ機能の追加が,逆にネットワークのボトルネックを招き,リスクを集中させる状況を回避する。
- セキュリティオプションの追加が,トラフィック集中と攻撃価値の集中を引き起こし,結果としてサービスコストが増加することが示された。
- 理論的に導出された条件に基づき,事前に有害なオプションを排除,制限,または予約することで,パラドックスを回避できる。
- パラドックスを考慮した制約付き運用は,サービスコストを削減し,攻撃に対する損失を大幅に軽減する効果がある。
音楽ストリーミングにおけるAIスラップの経験的分析 [cs.CL, cs.CR]目的:音楽ストリーミングにおけるAIスラップの現状と,その持続可能性の検証
- 生成AIの普及によりコンテンツ制作が容易になったが,質の低い大量コンテンツ(AIスラップ)の問題が顕在化している。
- AIスラップは,人間の手によるコンテンツを装ったり,不正な消費を促すものであり,音楽業界に悪影響を及ぼす可能性がある。
- AIスラップが音楽業界で自立的な産業構造へと発展するのを防ぐための対策を検討すること。
- SpotifyにおけるAI音楽の分析から,大多数(93%)がほとんど再生されず,推薦されることも稀であることが確認された。
- AI音楽制作者は,ヒット曲を狙って複数のジャンルに大量の楽曲をリリースする「スプレー・アンド・プレイ」戦術を用いている。
- インディーズ音楽配信業者におけるAI音楽の取り扱いポリシーは一貫性がなく,AI楽曲の大量配信が容易に行われていることが判明した。
大規模言語モデルに対するセキュリティとプライバシーに関する質問と回答 [cs.CL, cs.AI, cs.CR, cs.HC]目的:ユーザーが大規模言語モデルにセキュリティとプライバシーに関する質問をし,それに対してモデルがどのように応答するか
- デジタルセキュリティとプライバシーは,オンライン活動の安全性を確保する上で不可欠である。
- 大規模言語モデルに対するユーザーのセキュリティとプライバシーに関する質問は,未だ十分に研究されていない。
- ユーザーの実際の質問に基づいたセキュリティとプライバシーに関する大規模言語モデルの応答品質を評価する。
- 大規模言語モデルは,セキュリティとプライバシーに関する幅広い質問に対応していることが判明した。
- 商用モデル(GPT 5.5)は,オープンウェイトモデル(Llama 4)よりも高品質な回答を提供することが示された。
- 商用モデルは一貫性のない回答を生成する可能性があり,ユーザーを混乱させるリスクがある。
動的暗号化制御のための検証可能計算 [eess.SY, cs.CR, cs.SY]目的:動的暗号化制御における計算検証手法
- データとパラメータのプライバシー保護が重要視され,クラウドへの計算委託が増加している。
- クラウドから得られた値の完全性保証が課題であり,高コストな検証アルゴリズムが必要とされている。
- 動的暗号化制御における効率的かつ安全な検証手法を確立し,計算の正確性を保証すること。
- 提案手法は,コントローラの入出力特性を利用し,追加の計算負荷をほぼゼロに抑える。
- クラウドでの不正計算を高確率で検出し,リプレイ攻撃を防止する。
- 線形動的暗号化制御に特化した新たな検証アルゴリズムとして有効性が示された。
HandlebarsテンプレートにおけるLLMプロンプトの構造的役割注入:トリプルブレース補間,区切り文字ファミリー,HTML自動エスケープの限界 [cs.CR, cs.AI, cs.CL, cs.LG]目的:LLMプロンプトにおける構造的役割注入のメカニズムと影響の分析
- LLMアプリケーションの安全性確保は重要であり,プロンプトの脆弱性が悪用される可能性がある。
- テンプレートエンジン使用時のHTMLエスケープ処理が,セキュリティの万全な保証とならない場合がある。
- Handlebarsテンプレートの特性を明らかにし,構造的役割注入のリスク軽減策を提示すること。
- Handlebarsのトリプルブレース補間は,チャットロール区切り文字をそのまま挿入するため,構造的役割注入の脆弱性を持つことが判明した。
- GPT-3.5 Turboは,エスケープ処理の有無に関わらず,高い確率でタスク乗っ取り命令を実行し,特にコロンやMarkdownベースの区切り文字ファミリーにおいて脆弱性が顕著であった。
- HTMLエスケープ処理は,対応する文字のみを保護し,区切り文字の完全な防御には不十分である。命令とデータの構造的な分離が不可欠である。
CTIレポートにおける多ラベルATT&CK手法分類のためのオープンソースLLMの評価 [cs.CR, cs.LG]目的:複雑なCTIレポートに対するオープンソースLLMの多ラベルATT&CK手法分類の性能評価
- サイバー脅威への積極的な防御には,CTIの分類が不可欠であり,その重要性は増している。
- 従来の自動化では複雑なCTIレポートに対応できず,LLMでも現実的な評価が不足していた。
- 複雑なCTIレポートにおけるオープンソースLLMのベースライン性能を明らかにする。
- 構築したデータセットを用いて7つのオープンソースLLMを評価した結果,最高性能モデルのF1スコアは0.22であった。
- モデルのパラメータサイズとF1スコアには統計的に有意な正の相関関係が認められた。
- プロンプト戦略や温度設定は,モデル構成において統計的に有意な改善をもたらさなかった。現状のLLMでは実用レベルの分類は困難である。
マルチソース・サイバーセキュリティログ:ATT&CKラベル付きデータセットとSLM評価 [cs.DB, cs.PF, cs.RO, cs.CR, cs.LG]目的:マルチソースのサイバーセキュリティログを用いたATT&CKラベル付きデータセットの構築と,小規模言語モデル(SLM)の評価
- サイバー攻撃は巧妙化の一途を辿っており,システム全体を俯瞰した多層的な防御が不可欠となっている。
- 既存のデータセットは,ログソースが限定的であったり,ATT&CKフレームワークに基づいた詳細なラベル付けが不足していたりする。
- 本研究は,システム,ネットワーク,ブラウザのログを統合し,ATT&CKに基づいた詳細なラベル付けを行うことで,この課題を解決する。
- 870セッション(攻撃70,良性800)と約230万件のイベントを含む,マルチソースログデータセットを構築した。
- 構築したデータセットを用いて,Qwen2.5-1.5B,Llama-3.2-3B,Phi-4-Miniの3つのSLMをLoRAを用いてファインチューニングした。
- ファインチューニングにより,チャンク分類の精度はベースモデルの約8%から90〜97%に向上したが,ATT&CKテクニックの特定は依然として課題が残る。
Anthropic Fable 5 & Opus 4.8モデルに対するレッドチーム研究 [cs.CR, cs.AI, cs.CL]目的:大規模言語モデルの敵対的堅牢性評価
- 自然言語処理の発展に伴い,AIの安全性確保が重要課題となっている。
- 大規模言語モデルは有害な応答を生成する可能性があり,対策が急務である。
- 自動化された攻撃に対するモデルの脆弱性を明らかにし,安全性を向上させる。
- Fable 5とOpus 4.8は多くの攻撃に耐性を示すものの,依然として突破可能な余地が存在する。
- Opus 4.8は11.5%,Fable 5は6.1%の割合で意図した有害な応答を生成することが確認された。
- 自動化された攻撃によって,専門家なしで容易に有害な応答が生成されることが示された。
視覚はスクリーニングではない:エージェントスキルスキャナに対するマルチモーダルな隠れた指示攻撃 [cs.CL, cs.CR, cs.CV]目的:エージェントスキルのスキャンにおける,視覚的に伝達される悪意のある意図の不十分な検証
- LLMベースシステムにおいて,エージェントスキルは新たな攻撃対象領域として重要性を増している。
- 既存のセキュリティ分析はテキスト情報に依存しており,画像に隠された悪意を見逃す可能性がある。
- 画像に隠された悪意のある指示を検出し,スキルスキャンの性能を向上させる。
- 画像に隠された悪意のある指示は既存のスキルスキャナにとって課題となることが示された。
- 提案手法ExecScanは,ドキュメント,コード,リソース,視覚コンテンツを共同で分析し,隠れた指示を復元する。
- ExecScanは,実行環境に基づいた分析により,データ漏洩などのリスクを特定し,スキルスキャンの性能を改善する。
Gatling: 並列構成による高速コンセンサス [cs.SI, cs.DB, cs.CL, cs.CR, cs.DC]目的:並列構成による高速コンセンサスプロトコルの実現
- ブロックチェーン等の分散台帳技術の中核であり,データの整合性と信頼性を担保する上で不可欠である。
- 提案間隔がネットワーク遅延に制限され,トランザクション処理のスループット向上が課題となっていた。
- ネットワーク遅延以下の提案間隔を実現し,トランザクション処理の高速化を図ることを目指す。
- Gatlingは,ローテーションリーダー方式を用いて,提案間隔をネットワーク遅延以下に短縮するアトミックブロードキャストプロトコルである。
- 複数のアトミックブロードキャストプロトコルのインスタンスを並列実行し,提案スケジュールをずらすことで,高速な提案生成を実現している。
- 実験により,既存のコンポーネントプロトコルを活用しつつ,最小限の調整で低遅延を達成できることが確認された。
観測からの敵エージェントポリシー学習:神経記号型自律サイバーエージェントのために [cs.CL, cs.DL, cs.CR, cs.AI, cs.LG, cs.SY, eess.SY]目的:部分観測強化学習エージェントにおけるポリシー学習手法
- サイバー攻撃の巧妙化により,自律的なサイバー防御の重要性が増している。
- 攻撃者の行動が観測できないため,防御側の予測や学習が困難である。
- 部分観測環境下で,敵エージェントの行動を予測し,防御能力を高める。
- 模倣学習を用いて敵エージェントのポリシーを学習する手法を提案した。
- 本手法は,ネットワーク観測と防御側の行動から敵エージェントの行動を予測する。
- 多様なシミュレーションシナリオにおいて,高い予測精度と効果が確認された。
ガウス過程事後サンプルの差分プライバシー [stat.ML, cs.CR, cs.LG]目的:ガウス過程の事後サンプルパスの公開におけるプライバシー
- データ利活用とプライバシー保護の両立が重要視されているため。
- 従来の差分プライバシー手法ではノイズ付加が必要であり,精度低下の懸念がある。
- 事後サンプルの内在するランダム性を利用し,プライバシー保護を実現する。
- ガウス過程事後サンプルパスの公開が差分プライバシーを保証することを理論的に示した。
- リッジ正則化の強度がプライバシー保護に大きく影響することを確認した。
- 実用的なタスクにおいて,プライバシー保護と有用性のバランスが取れることを示した。
サービスコンピューティングにおける様式化ロゴを用いた効率的なビデオに対する敵対的攻撃 [cs.CV, cs.CR]目的:ビデオに対する敵対的攻撃手法の開発
- サービスコンピューティングにおいて,ビデオ分類は多くの知能化アプリケーションの基盤である
- 深層ニューラルネットワークは脆弱であり,敵対的サンプルによる攻撃を受けやすい
- 低コストで,より自然な敵対的サンプルを生成し,ビデオ分類システムの安全性を検証する
- 提案手法Stylized Logo Attack (SLA)は,最先端の手法と比較して,より高い攻撃成功率を達成した
- SLAは,様々な防御手法に対しても良好な欺瞞効果を維持できることが実験的に示された
- 本研究は,ビデオ分類システムの信頼性・安全性に対するセキュリティコミュニティの意識向上に貢献する
機械学習における差分プライバシー保証の報告に対するガウスDP [cs.LG, cs.AI, cs.CR, stat.ML]目的:機械学習アルゴリズムの差分プライバシー保証報告における課題とその改善策
- 機械学習の発展に伴い,個人情報保護の重要性が増しており,差分プライバシーはそのための有力な手法である。
- 既存の差分プライバシー保証報告は不完全で誤解を招く可能性があり,攻撃に対する過剰な警戒を生む場合がある。
- 非漸近的なガウス差分プライバシー(GDP)を用いることで,より正確かつ包括的なプライバシー保証報告を目指す。
- GDPは,DP-SGD等のアルゴリズムのプライバシープロファイルをほぼ誤差なく捉えることができる。
- 最新の大規模画像分類や米国国勢調査アルゴリズムのプライバシープロファイルをGDPで分析した結果,良好な適合性が見られた。
- GDPの利点と欠点を議論し,他のプライバシーメカニズムへの応用可能性についても言及する。
AIを用いたDDoS攻撃の検知と緩和:サーベイ [cs.CR, cs.AI, cs.LG, cs.NI]目的:DDoS攻撃の検知と緩和に関するAI技術の現状と課題
- サイバーセキュリティにおいて,DDoS攻撃は依然として深刻な脅威であり,対策が急務である。
- 従来のルールベースの防御では,巧妙化するDDoS攻撃への対応が困難になっている。
- AI技術を活用し,より高度なDDoS攻撃の検知と緩和を実現することを目指す。
- 本サーベイでは,最新のAI検知手法について詳細な議論がなされている。
- 専門家による分類とAI生成による分類木を用いて,DDoS攻撃の分類に関する曖昧さを解消している。
- AI検知手法の学習に用いられるデータセットや,敵対的学習,データ拡張などの重要性についても議論されている。
LLM支援型共同秘匿プリコーディングと軌跡設計:RSMAベース異種UAVネットワーク [cs.NI, cs.AI, cs.CR]目的:秘匿率最大化と推進エネルギー消費最小化を両立するUAVネットワークの最適化
- UAVネットワークは,災害時の通信やインフラ点検など,広範な分野での活用が期待されており,その重要性は増している。
- UAVネットワークにおけるセキュリティは脆弱であり,傍受者による情報漏洩のリスクが存在する。秘匿通信の確保が課題である。
- 秘匿率とエネルギー効率を両立させ,安全で効率的なUAVネットワークの運用を実現することを目指す。
- 提案手法は,既存のベースラインと比較して,秘匿率とエネルギー効率の両方で優れた性能を発揮することがシミュレーションにより示された。
- LLMを活用することで,UAVはエネルギー効率とセキュリティを考慮した軌跡を効率的に学習し,リアルタイムでのLLM推論のオーバーヘッドを削減できる。
- 様々なUAV群サイズやランダムシードに対しても,安定したロバスト性を示すことが確認された。
AIコードエージェントの系統的な脱獄攻撃によるセキュリティ評価 [cs.CR, cs.AI]目的:AIコードエージェントのセキュリティ脆弱性
- ソフトウェア開発にAIが不可欠となり,セキュリティリスクが顕在化している。
- 既存研究ではテキストベースの評価が中心で,コード実行環境における脆弱性は未解明である。
- AIコードエージェントが実行可能な悪意のあるコードを生成・実行するリスクを評価する。
- JAWS-Benchにより,エージェントは段階的に高度化する環境下で脱獄攻撃を受けやすいことが示された。
- プロンプトのみの攻撃でも高いコンプライアンス率(61%)を示し,有害なコードの解析・実行に成功するケースが存在する。
- エージェント化により攻撃成功率が1.6倍に上昇し,計画とツール利用段階での拒否を覆す要因となることが明らかになった。
Psyzkaller:OSカーネルファジングにおけるより賢いシード生成のための,過去およびオンザフライ実行データからの学習 [cs.CR]目的:OSカーネルファジングにおけるシード生成の改善
- OSカーネルはシステムの中核であり,そのセキュリティは極めて重要である。脆弱性の発見と修正はシステム全体の安定性に不可欠。
- 既存のファザーは,システムコールの依存関係を適切に考慮できず,有効なシードを生成するのが難しい。
- 過去の実行履歴とファジング結果からシステムコールの依存関係を学習し,より有効なシードを生成することで,脆弱性の発見率を向上させる。
- Psyzkallerは,大規模なDongTingデータセットと継続的なファジング結果で学習することで,Syzkallerのコードカバレッジを4.6%-7.0%改善した。
- Psyzkallerは,Syzkallerよりも110.4%-187.2%多くのクラッシュを誘発し,8つの未知のカーネル脆弱性を発見した。
- Psyzkallerは,最先端のファザーであるACTORやSyzDescribeよりも,カバレッジとクラッシュの両方で優れた性能を示した。
BadScientist:説得力はあるが不確かな論文を生成する研究エージェントは,LLMレビュー担当者を欺くことができるか [cs.CR, cs.AI, cs.CY]目的:LLMを活用した研究支援とAIベースの査読システムの脆弱性の検証
- 研究の効率化が求められる中,AI技術の導入は不可欠であり,その信頼性が重要である。
- AIによる査読システムの信頼性に対する懸念があり,不正な論文が混入するリスクが存在する。
- AI生成論文がAI査読システムを欺く可能性を検証し,その脆弱性を明らかにすること。
- 偽造された論文が,LLMレビューシステムによって受け入れられることが確認された。
- レビュー担当者は,論文の信頼性に懸念を持ちながらも,受け入れレベルの評価を与えるという矛盾が見られた。
- 現在のAI駆動の査読システムには根本的な限界があり,多層防御策の必要性が示唆された。
暗号化されたビデオ会議トラフィックにおけるパケットレベルの測定からのQoE学習 [cs.CL, cs.CL, cs.CR, cs.CV, cs.LG, cs.MM, eess.IV]目的:暗号化されたビデオ会議における品質評価(QoE)予測モデルの開発
- 現代において,ユーザー体験の質はサービス継続利用に直結するため重要である。
- エンドツーエンド暗号化により,ISPはビデオ会議のQoEを評価しづらい。
- パケットサイズの情報のみでQoEを予測する手法を開発し,ISPの課題解決を目指す。
- 提案手法は,WhatsAppとZoomのデータセットを用いて評価し,既存モデルを上回る予測性能を示した。
- 本フレームワークは,複雑な計算資源を必要とせず,容易に実装できる点が特徴である。
- BRISQUEとMOSという二つのQoE指標に対し,高い予測精度を達成した。
PICASSO:数百万の割り当てに対するCHERI使用済みメモリ解放保護のスケールアップ [cs.CR]目的:CHERIにおける使用済みメモリ解放保護のスケーラビリティ向上
- メモリ安全性の重要性が増しており,特に能力ベースのアーキテクチャが注目されている。
- CHERIは空間的メモリ安全は確保するものの,時間的安全性,特にヒープ領域における問題が残る。
- 大量のメモリ割り当てにおいても,効率的かつ安全な使用済みメモリ解放保護を実現すること。
- PICASSOは,カラー付き能力を導入することで,能力の出所追跡と一括取り消しを可能にした。
- これにより,能力取り消しスキャン頻度を削減しつつ,セキュリティを向上させている。
- NIST Julietテストケースや実際のCVEにおける使用済みメモリ解放・二重解放バグの効果的な軽減が確認された。
SkillJect:スキル対応エージェントに対するスキルベースのプロンプトインジェクションの自動化 [cs.CR, cs.AI]目的:スキル対応エージェントシステムに対する汚染されたスキルを生成する自動化フレームワーク
- LLMエージェントの再利用性を高めるスキルは重要だが,新たな攻撃対象領域を生み出す可能性がある。
- 既存のスキルベースのプロンプトインジェクション攻撃は手動で脆弱であり,ワークフローに沿わない指示は拒否される。
- 再利用可能なスキルエコシステムにおける持続的な脅威である汚染されたスキルによる攻撃を効果的に行う。
- SkillJectは,補助スクリプトにペイロードを隠蔽し,SKILL.mdを書き換えることで攻撃を行う。
- 攻撃エージェント,被害者エージェント,評価エージェントを用いた閉ループ多重エージェントプロセスにより攻撃効果を高める。
- 実験により,SkillJectが単純な直接インジェクションや既存の手動攻撃を大幅に上回ることが示された。
Haarランダムオラクルモデルにおけるクローン不可能な暗号 [cs.CC, cs.FL, math.CO, math.DS, cs.CR, quant-ph]目的:クローン不可能な暗号の構成
- 暗号技術は情報セキュリティの根幹であり,その安全性向上は不可欠である。
- 従来の暗号方式は,計算能力の向上により解読されるリスクがある。
- 計算困難性への依存を減らし,より安全な暗号方式の実現を目指す。
- Haarランダムオラクルモデルにおいて,クローン不可能な暗号方式を構築した。
- 本方式は,標準的なクローン不可能性の無差別安全性と,秘密鍵の再利用をサポートする。
- 任意の長さのメッセージを暗号化可能であり,計算困難性を必要としない「マイクロクリプト」世界でも実現可能である。
LLMトレーニングにおけるデータ洗濯への対策 [cs.CR, cs.AI]目的:LLMのトレーニングデータにおける不正なデータ検出手法
- LLMの性能向上には大量のデータが不可欠であり,そのデータ品質と合法性が重要である。
- LLMが学習データに含まれるべきでないデータを学習している場合,権利侵害やプライバシー侵害のリスクがある。
- データ洗濯によって隠蔽された学習データも検出可能な手法を開発し,LLMの透明性と信頼性を確保すること。
- データ洗濯とは,著作権のあるデータを,意味は保ちつつスタイルや構造を変換してLLMに学習させることで,元のデータとの関連性を隠蔽する手法である。
- 本研究では,データ洗濯を考慮した検出手法として,オリジナルデータと参照データを用いて,LLMへのクエリアクセスを行い,データ洗濯プロセスを推測する。
- Synthesis Data Reversion (SDR)という手法を導入し,高レベルな変換目標と詳細な設定を用いてクエリを生成することで,LLMの検出シグナルを回復させることに成功した。
サイバーセキュリティ運用における大規模言語モデルの利用,認識,導入:Redditの事例 [cs.CG, cs.CR, cs.AI]目的:サイバーセキュリティ運用における大規模言語モデルの利用状況,認識,および導入に関する実態
- サイバー攻撃の高度化に伴い,セキュリティ対策の自動化と効率化が喫緊の課題となっている。
- 大規模言語モデルのサイバーセキュリティにおける実用的な利用状況は,まだ十分に解明されていない。
- サイバーセキュリティの実務家による大規模言語モデルの具体的な利用と課題を明らかにすること。
- Redditのサイバーセキュリティ関連フォーラムの投稿分析から,大規模言語モデルが低リスクなタスクで利用されている実態が明らかになった。
- 実務家は,大規模言語モデルによる効率と有効性の向上を報告する一方で,信頼性,検証コスト,セキュリティリスクといった課題を指摘している。
- 大規模言語モデルの自律性の高さは,これらの課題によって制限されており,組織や実務家のセキュリティ確保のための開発・導入指針が求められる。
- 1
- 2
