arXiv雑要約
AI - 2025/10/14 公開
サイバーフィジカルセキュリティのための因果デジタルツイン:産業制御システムにおける堅牢な異常検知のためのフレームワーク [cs.CR, cs.AI, math.ST, stat.TH]目的:産業制御システムにおける堅牢な異常検知のためのフレームワーク
- 産業制御システムは重要インフラを支えるため,セキュリティの確保は社会全体の安定に不可欠である。
- 従来の異常検知手法は相関関係に依存し,真の因果関係と虚偽の関連性を区別できないという課題がある。
- 因果推論とデジタルツインモデリングを組み合わせることで,より正確な異常検知と根本原因分析を目指す。
- 提案手法は,SWaT,WADI,HAIの3つの産業データセットで高いF1スコア(最大0.944)を示し,既存手法を上回る性能を実証した。
- 誤検知を74%削減し,根本原因分析の精度を48.7%から78.4%に向上させることに成功した。
- カウンターファクチュアル分析により攻撃成功率を73.2%削減可能であり,リアルタイム性能も3.2msと実用レベルである。
リスク調整型ベイズストリーミング侵入検知とSRE連携決定 [cs.CR, cs.LG]目的:ストリーミング侵入検知におけるリスク調整型アプローチ
- サイバー攻撃の高度化により,リアルタイムな侵入検知の重要性が増している。
- 既存手法では,誤検知と見逃しのトレードオフが課題であり,運用コストの最適化が難しい。
- SREのエラーバジェットと連動し,運用コストを最小化する検知閾値の最適化を目指す。
- ベイズオンライン変化点検知(BOCPD)とSREエラーバジェットを組み合わせることで,分布シフトや概念ドリフトに適応する。
- 99.9%の可用性SLOにおいて,見逃しコストが誤検知コストの10倍の場合,約0.91の確率閾値が有効である。
- UNSW-NB15およびCIC-IDS2017ベンチマークにおいて,ベースラインと比較して,精度・再現率が改善し,確率較正も優れていることが示された。
AIエージェントのための統合的セキュリティフレームワーク:信頼,リスク,および法的責任 [cs.CR, cs.AI]目的:AIエージェントにおける信頼,リスク,法的責任の関係性
- AI技術の発展は社会に大きな変革をもたらすが,その利用には信頼性の確保が不可欠である。
- AIエージェントの信頼,リスク,法的責任は個別に対処されており,相互影響が考慮されていない。
- 信頼,リスク,法的責任の相互依存性を考慮した体系的なフレームワークの構築。
- 本研究で提案するTRLフレームワークは,信頼の構築,リスクの軽減,法的責任の所在明確化を体系的に行う。
- TRLフレームワークは,AIエージェントの様々な応用事例に対して適切な対策を提案する。
- 本フレームワークは,社会,経済,倫理に及ぼす影響を考慮し,AIの信頼性向上に貢献すると期待される。
Hound:セキュリティ監査における複雑系推論のための関係優先知識グラフ [cs.CR, cs.AI, cs.LG, cs.PL]目的:複雑なコードベースにおける関連コンポーネント間のシステムレベル推論の改善
- システムセキュリティの重要性が増す中,コードベース全体の構造理解が不可欠である。
- 従来の解析手法では,コードベースの複雑さからシステム全体の脆弱性特定が困難である。
- 関係性を重視した知識グラフを用いて,システム構造の理解と脆弱性仮説の検証を効率化する。
- Houndは,関係優先知識グラフエンジンにより,ベースラインLLM解析器と比較して,リコールとF1スコアを向上させた (リコール31.2% vs 8.3%, F1 14.2% vs 9.8%)。
- 柔軟な関係優先グラフが,モデルの理解範囲をコール/データフローを超えた抽象的な側面まで拡張し,仮説を中心としたループが貢献した。
- アナリスト定義の柔軟な視点と,長期的な脆弱性仮説に基づく確信度更新が,システムレベル推論を可能にしている。
公共部門における責任あるAI導入:AI導入課題のデータ中心分類 [cs.CY, cs.AI]目的:公共部門における責任あるAI導入のためのデータ関連課題の分類
- AIは公共サービスの変革,意思決定,行政効率化に貢献するが,導入は遅れている
- AIの公平性,説明責任,透明性を重視するフレームワークは理想論に過ぎず,現実との乖離がある
- 責任あるAI導入を阻害するデータ関連課題を特定し,導入を支援する
- 本研究では,体系的レビューと専門家評価に基づき,技術,組織,環境の各次元における13の主要な課題を特定した
- 課題には,データの質の低さ,AI対応インフラの不足,ガバナンスの弱さなどが含まれる
- この分類は,リスクの高いAI展開の兆候を明らかにし,責任あるAI導入に必要なデータガバナンス構築を支援する
メリーランド大学工学部における偏りへの配慮型AIチャットボット [cs.CY, cs.AI]目的:工学部の新入生への学業指導を目的としたAIチャットボットの開発
- 大学選びは困難であり,適切な指導は学生の成功に不可欠である。
- 従来の学業指導は待ち時間や環境,個別対応の不足といった課題がある。
- AIの偏見による学生への悪影響を軽減し,公平な指導を可能にすること。
- 適切なプロンプト設計と偏り軽減策により,高品質で偏りのない学業指導が可能であることが示された。
- 正確性,関連性,個別対応において高い評価を得た(平均9.76,9.56,9.60)。
- サンプルデータにはステレオタイプな偏見は見られなかったが,サンプルサイズと期間の制約がある。
直接ルーティング勾配 (DRGrad): マルチタスク学習 (MTL) レコメンデーションのための個別化情報手術 [cs.LG, cs.AI]目的:マルチタスク学習におけるタスク間の競合軽減と性能向上
- レコメンデーションシステムは多様なユーザー興味の把握や行動予測に不可欠であり,その精度向上は重要である。
- マルチタスク学習では,タスク間の複雑な相関により,負の転移やシーソー現象が発生し,性能低下を招く。
- 本研究は,個々のユーザー情報に基づき,タスク間の競合を効果的に管理し,レコメンデーション精度を向上させることを目指す。
- DRGradは,大規模レコメンデーションデータセットにおいて,最先端のマルチタスク学習モデルと比較して,AUC指標で優れた性能を示した。
- DRGradは,モデルの複雑さを増加させることなく,タスク間の競合を効果的に管理し,ノイズ処理の欠点を改善する。
- Census-incomeデータセットと合成データセットを用いた実験により,DRGradが相関性の異なるタスク間の関係を適切に判断し,ルーティングできることが示された。
CCTV映像と多岐にわたるデータを用いた都市交通管理の高度化:現状予測と頻出エピソードのマイニング [cs.LG, cs.AI]目的:都市交通のリアルタイム予測の向上
- 都市化の進行により交通渋滞が深刻化しており,効率的な交通管理が不可欠である。
- 従来の交通システムは静的な信号や手動監視に頼っており,現代の動的な交通状況に対応できない。
- CCTV映像と多岐にわたるデータを統合し,リアルタイムな交通予測を実現することで,この課題を解決する。
- 本研究では,CCTV映像と多岐にわたるデータを用いて都市交通のリアルタイム予測を行い,高い予測精度(98.46%)を達成した。
- 頻出エピソードマイニングにより,交通状態の遷移パターンを特定し,55%を超える信頼度で中度渋滞への移行が確認された。
- システムが生成した46件の継続的な交通渋滞アラートは,積極的な渋滞管理への貢献を示唆している。
AdaptAuth:パスワードセキュリティのための多層的な行動・認証情報分析による安全で適応的な認証フレームワーク [cs.CR, cs.HC, cs.LG]目的:パスワードセキュリティ向上のための多層的行動・認証情報分析フレームワーク
- 計算能力の向上に伴い,パスワードセキュリティは進化が必要であり,現代社会における情報保護の根幹をなす。
- 複雑なセキュリティ対策はユーザーの利便性を損ない,不十分なパスワード管理や脆弱性を招く問題がある。
- 多様な要素を統合し,学習モデルを活用することで,不正アクセスを防止し,使いやすさとセキュリティの両立を目指す。
- 本研究では,パスワード分解機構や動的パスワードポリシー機構,行動パターン等の多層的な分析に基づく新しい認証フレームワークを提案した。
- 提案フレームワークは,詳細なユーザープロファイルを構築し,従来の認証方式よりも高いセキュリティを提供しつつ,ユーザーのポリシー設定への参加を促す。
- これにより,パスワード関連リスクへの包括的な防御を実現し,ユーザビリティとセキュリティのパラダイムを変革することを目指す。
オントロジー駆動複合イベント処理とLLM推論を用いたリアルタイム健康分析:結核のケーススタディ [cs.DB, cs.AI]目的:リアルタイム健康分析フレームワークの構築と評価
- 公衆衛生における迅速な健康状態の検出は重要であり,特にビッグデータ環境下ではその必要性が高まる。
- 臨床データの多様性,量,速度から,タイムリーな異常検知や意味的推論が困難である。
- 異種データストリームからの知能的な健康イベント検出と意味的推論を可能にする。
- 提案フレームワークは,低遅延でのイベント検出,スケーラブルな推論,高いモデル性能を実現した。
- Basic Formal Ontology (BFO) とSemantic Web Rule Language (SWRL) を活用し,診断規則やドメイン知識をモデル化した。
- 結核患者1,000人のデータセットを用いた評価により,汎用的なリアルタイム健康分析への可能性が示された。
深層学習モデル量子化における丸め誘導バックドア注入 [cs.CR, cs.AI, cs.LG]目的:深層学習モデル量子化を利用した悪意のある動作の埋め込み
- モデル量子化は,リソース制約環境での深層学習モデル展開に広く用いられ,重要性が高い。
- 量子化処理は,これまで見過ごされてきたセキュリティリスクを生じさせる可能性がある。
- 量子化操作のみを用いてバックドア攻撃を可能にし,既存の防御策を回避する。
- QuRAは,ほとんどの場合において100%近い攻撃成功率を達成し,精度劣化は無視できる程度である。
- QuRAは,重要な重みを特定し,その丸め方向を最適化することで,バックドア効果を拡大させる。
- 本研究は,広く利用されているモデル量子化プロセスにおける重大な脆弱性を明らかにした。
小規模ViT-Batten: 小児MRIにおけるバテン病早期発見のための説明可能な注意機構付きFew-Shot Vision Transformer [cs.CV, cs.AI]目的:小児MRI画像を用いたバテン病の早期検出
- バテン病は希少な神経変性疾患であり,早期発見が重要である。小児の脳MRIは微妙な変化しか見られず,見逃されやすい。
- バテン病のMRI画像における早期兆候は微細であり,十分な訓練データがない状況で高精度な診断が困難である。
- 限られた訓練データで高精度なバテン病の早期検出を可能にするAIモデルの開発。
- 提案手法TinyViT-Battenは,79例のバテン病患者と90例の健常者を含む多施設データセットにおいて,高い精度(約91%)とROC面積(0.95以上)を達成した。
- TinyViT-Battenは,既存の3D-ResNetやSwin-Tinyといったベースラインモデルを上回り,感度90%以上,特異度約90%という高い性能を示した。
- Grad-CAMを統合することで,病気に関連する脳領域を可視化し,説明可能な予測を実現した。モデルの小規模性と高い性能により,実用的なAIソリューションとなりうる。
Ultralytics YOLO進化:YOLO26,YOLO11,YOLOv8,YOLOv5オブジェクト検出器の概要 [cs.CV, cs.AI]目的:YOLOオブジェクト検出器群のアーキテクチャ進化,ベンチマーク,展開,将来の課題に関する包括的な概要
- 画像認識技術は,ロボティクスや自動運転など,幅広い分野で不可欠な役割を果たしている。
- 既存のオブジェクト検出器は,精度と処理速度のバランス,特に小型オブジェクトの検出に課題がある。
- YOLOモデルの進化を理解し,最新のYOLO26の利点を定量的に評価することで,実用的な応用を促進する。
- YOLO26は,DFLの削除,NMSフリー推論,ProgLoss,STAL,MuSGDといった革新的な技術を導入している。
- MS COCOデータセットにおけるベンチマークの結果,YOLOv5,YOLOv8,YOLO11,YOLO26の精度と効率に詳細な比較が見られた。
- 本研究は,YOLOモデルの展開におけるフォーマット,量子化戦略,そしてロボティクス,農業,監視,製造などの応用例について議論している。
ファインチューニングされた大規模言語モデルのテキスト保持型技術を用いたデータ由来検証 [cs.CR, cs.AI]目的:大規模言語モデルのファインチューニングにおける機密または著作権で保護されたテキストの使用状況の検証
- 大規模言語モデルの利用拡大に伴い,学習データに関する透明性と責任の確保が重要となっている。
- 既存の検証手法は信頼性が低いか,モデルへの影響が大きいため,実用的なデータ由来検証が困難である。
- 目に見えるテキストを変更せずに,モデルの出力から学習データへの依存関係を確実に検出すること。
- 提案手法では,不可視のUnicode文字を埋め込むことで,テキストの変更なしにデータ由来を検証可能とした。
- 検証実験の結果,ファインチューニングデータに50件のマークされた文書が含まれる場合,検出率は非常に高く,誤検出率は0.1%未満であった。
- データセットサイズが大きくなっても,検出率が安定しており,0.33%以下のマークされたコレクションでも文書あたりの検出率は45%以上を維持した。
ヘルムホルツ方程式の解に対する生成モデル:音響材料のデータセット [cs.LG, cs.AI, cs.NA, eess.SP, math.NA]目的:音響材料3万件からなるデータセットHA30K
- 音響設計,騒音制御,材料工学など,複雑な音響材料における波の伝播の正確なシミュレーションは不可欠である。
- 従来の数値ソルバーは計算コストが高く,大規模またはリアルタイムのシナリオでは特に問題となる。
- 深層学習を用いて,ヘルムホルツ方程式の解を効率的に学習し,シミュレーションの高速化を目指す。
- 本研究では,Stable DiffusionとControlNetを用いた深層学習アプローチを提案し,ヘルムホルツ方程式の解を画像として生成する。
- GPU並列化を活用することで,複数のシミュレーションを同時に処理し,計算時間を大幅に削減できる。
- 初期段階の研究において,絶対的な精度よりも迅速な探索が重要である場合に,深層学習ベースの手法が有効であることを示す。
勾配符号マスクによる事前学習済みモデル間のタスクベクトル輸送 [cs.LG, cs.AI, cs.CV]目的:事前学習済みモデル間のタスクベクトル輸送
- 大規模言語モデルの進化は速く,継続的なタスク適応が重要である。
- 異なる事前学習済みモデル間でのタスクベクトルの転移は,パラメータ空間の不整合により困難である。
- 新しいモデルの勾配符号構造を利用し,少ないデータでタスクベクトルを転移させる。
- 提案手法GradFixは,勾配符号構造を近似し,少ないラベルサンプルで知識転移を実現する。
- 追加のファインチューニングは不要で,ターゲットモデルの損失地形に合わせた更新を行う。
- 画像認識と自然言語処理のベンチマークにおいて,既存手法を上回る性能を示す。
多視点粒子検出器のセグメンテーションのための不均一点集合Transformer [cs.LG, hep-ex]目的:多視点粒子検出器におけるセグメンテーション手法
- 素粒子物理学研究において,実験装置からのデータ解析は不可欠であり,高精度な粒子識別が重要である。
- 従来のセグメンテーション手法は,メモリ消費量が大きく,計算コストが高いという課題がある。
- 本研究は,メモリ効率が高く,より高精度なセグメンテーションを実現することを目指す。
- 提案手法は,従来のCNNを用いた手法と比較して,メモリ使用量を10%以下に削減することに成功した。
- AUCスコアは96.8%と高く,単一視点での処理結果(85.4%)を大幅に上回る性能を示した。
- 2次元の疎なデータ表現を効果的に処理する点集合ニューラルネットワークの有効性が確認された。
拡散の舵取り:スペクトル異方性前方ノイズによる学習 [cs.LG, cs.AI, cs.CV]目的:拡散モデルにおける誘導バイアスの構築
- 生成モデルの性能向上には,データ分布に適した誘導バイアスの導入が不可欠である。
- 既存の拡散モデルは,その誘導バイアスが暗黙的であり,明示的な制御が困難である。
- 周波数領域に着目し,ノイズプロセスを異方的に制御することで,誘導バイアスを調整する。
- スペクトル異方性ガウス拡散(SAGD)により,特定の周波数帯域を強調または抑制することが可能となった。
- SAGDは,標準的な拡散モデルと比較して,複数の画像データセットで優れた性能を示した。
- 特定の周波数帯域に限定された既知の破損を無視しながら学習する選択的省略が可能となった。
電気化学インピーダンス分光データへの等価回路モデル適合のための損失関数の評価 [cs.LG, cond-mat.mtrl-sci]目的:電気化学インピーダンス分光データへの等価回路モデル適合における損失関数の性能比較
- 電気化学インピーダンス分光法は,電池や燃料電池などの電気化学システムの解析に不可欠である。
- 等価回路モデルのパラメータ推定は,適切な損失関数選択に依存し,最適化が困難な場合がある。
- 本研究は,より効率的かつ正確なパラメータ推定を可能にする損失関数を特定することを目指す。
- 提案された損失関数log-Bとlog-BWの性能を,R2スコア,カイ二乗値,計算効率,MAPEで評価した。
- X2損失関数は,適合品質の指標において最も高い性能を示し,適合品質を重視する場合に適している。
- log-B損失関数は,X2損失関数に比べてわずかに適合品質は低いものの,計算速度が速く,多くの回路部品においてMAPEが低いことが示された。
敵対的耐性のあるRFフィンガープリンティング:不正送信機検出のためのCNN-GANフレームワーク [cs.CR, cs.AI]目的:不正送信機の検出と正当なデバイスの識別
- 無線通信のセキュリティにおいて,デバイスの認証は重要な課題である。
- 既存のRFフィンガープリンティングは,敵対的な攻撃に対して脆弱である可能性がある。
- 敵対的攻撃に対するロバスト性を向上させたRFフィンガープリンティング手法の開発。
- 提案手法は,10台のADALM-PLUTO SDRを用いて検証された。
- 敵対者がGANを用いて正当なデバイスのRF特性を模倣する攻撃シナリオを想定した。
- softmax確率の閾値を用いることで,不正デバイスを高精度に検出可能であることが示された。
セマンティックな凝集性知識蒸留による深層クロスモーダルハッシュ [cs.LG, cs.CV, cs.IR]目的:深層クロスモーダルハッシュのためのセマンティックな凝集性知識蒸留
- マルチモーダルデータの活用は,画像検索や情報検索の精度向上に不可欠である。
- 既存手法では,セマンティック情報の抽出と生のマルチモーダルデータとの相互作用が不十分である。
- 画像とテキスト間のセマンティックな類似性をより効果的に捉えることで,モーダル間のギャップを埋める。
- 提案手法SODAは,ラベル情報をテキストモーダルとして扱い,教師ネットワークによる知識蒸留を行う。
- これにより,画像とラベル間のセマンティック特徴を効果的に学習し,ハミング空間を構築する。
- 実験結果から,提案手法が既存の最先端手法を上回る性能を示すことが確認された。
LMCache:エンタープライズ規模のLLM推論のための効率的なKVキャッシュ層 [cs.LG]目的:LLM推論におけるKVキャッシュの効率的な共有とオフロード
- 大規模言語モデル(LLM)の普及に伴い,推論時の計算資源の効率的な利用が重要となっている。
- 従来のLLM推論システムでは,エンジンとクエリが独立しているため,リソースの非効率性が課題となっていた。
- KVキャッシュの共有とオフロードを効率化し,LLM推論のスループットを向上させることを目指す。
- LMCacheは,vLLMやSGLangなどのLLMエンジンが生成するKVキャッシュを抽出し,エンジンやクエリ間で共有する。
- LMCacheとvLLMを組み合わせることで,多様なワークロードにおいて最大15倍のスループット向上が確認された。
- LMCacheは,バッチ処理やパイプライン処理などの最適化により,高いパフォーマンスを実現している。
気候変動に強靭な緊急時計画のための山火事予測における空間的不確実性の定量化 [cs.LG]目的:山火事予測における空間的不確実性の定量化
- 気候変動により山火事リスクが増大しており,適応戦略に不可欠な信頼性の高い予測が求められている。
- 既存の機械学習による予測は,リスクを考慮した意思決定に不可欠な不確実性の定量化が不足している。
- 山火事の広がり予測における空間的不確実性を定量化し,緊急時計画への活用を目指す。
- 複数の地球観測データを用いて空間的不確実性の体系的な分析を実施し,予測不確実性が火元の周囲に一貫した空間構造を示すことが明らかになった。
- 新規距離指標により,予測された火線周辺に20-60メートルの高不確実性領域が形成されることが示され,緊急時計画に直接適用可能であることが示唆された。
- 特徴量帰属分析により,植生の状態と火災活動が不確実性の主要な要因であることが特定された。
メタヒューリスティック最適化を用いたハイブリッド計算知能フレームワーク:薬物間相互作用予測 [cs.LG, cs.AI, q-bio.BM]目的:薬物間相互作用の予測
- 医薬品の安全性確保は患者の健康と医療費削減に不可欠である。
- 薬物間相互作用の予測精度は未だ十分ではなく,偽陰性・偽陽性の問題がある。
- 予測精度向上と解釈可能性を両立し,臨床応用可能なモデルを構築すること。
- 提案モデルは,DrugBankデータセットにおいて高い予測精度(ROC-AUC 0.911,PR-AUC 0.867)を示した。
- 分子埋め込みの融合,RBScore,および最適化手法が,それぞれ予測精度とロバスト性に貢献することが示された。
- 本研究は,より安全な薬物療法と臨床意思決定を支援する,信頼性の高いモデル構築への道筋を示す。
地理座標を用いた母集団合成 [cs.LG, cs.CY, cs.SI, physics.soc-ph, stat.ML]目的:地理座標を持つ合成母集団の生成
- 地理情報を活用した社会科学研究の重要性が増しており,詳細な位置情報は不可欠である。
- 既存の方法では,緯度経度のような空間データの不均一性への対処が困難であった。
- 緯度経度を正規化することで,より正確な合成母集団の生成を目指す。
- 提案手法は,Normalizing FlowsとVariational Autoencoderを組み合わせることで,空間データと非空間データの結合分布を学習する。
- 121のデータセットを用いた実験で,提案手法は既存手法よりも空間精度と実用性が高いことが示された。
- 本研究は,詳細な地理情報を必要とする多様な応用分野への貢献が期待される。
衝撃を受けた反応性材料中の崩壊孔の周りのせん断帯形成に対する物理学に基づいた深層学習モデル [cs.LG, cond-mat.mtrl-sci, physics.comp-ph]目的:衝撃を受けた反応性材料中のせん断帯形成の予測
- エネルギー材料の安全性確保には,衝撃から爆轟への過程の理解が不可欠である。
- 弱い衝撃下でのホットスポット形成メカニズムは,強衝撃下と比較して研究が不足している。
- 本研究は,計算コストを抑えつつ,せん断帯形成の正確な予測を目指す。
- 提案するPARCv2は,他の物理学に基づいたモデルと比較して,せん断帯形成の時空間ダイナミクスをより正確に捉えることが示された。
- PARCv2は,弱い衝撃下におけるせん断局所化と塑性加熱を迅速に予測する能力を向上させた。
- 反応性材料向けのAI加速シミュレーションツール開発において,ドメイン固有の考慮事項の重要性が強調された。
大規模資金申請レビューの効率化におけるLLMの活用 [cs.CY, cs.AI]目的:公的資金申請レビューの効率化
- EU等の開発資金は重要だが,申請数増加によりレビュー体制が逼迫している。
- レビュー担当者のリソース不足が,評価プロセスのボトルネックとなっている。
- AIを活用し,大量の申請レビューを効率化し,時間短縮を目指す。
- AI支援評価システムを,企業の海外展開支援と,エネルギー効率改善補助金申請に導入した。
- 補助金申請レビューにおいて,レビュー担当者の生産性を20.1%向上させた。
- 全体として,評価時間を2か月以上短縮し,AIによる自動化の効果を示した。
拡散事後サンプリングのための結合データ・測定空間ダイナミクス [cs.LG, cs.AI, stat.ML]目的:逆問題における拡散事後サンプリングの性能向上
- 医療画像やリモートセンシングなど,未知信号の復元は幅広い分野で重要である。
- 既存手法は,測定整合性確保や尤度近似に課題があり,ノイズ環境下で不安定になりやすい。
- データ空間と測定空間の拡散過程を結合し,高精度な事後分布に基づくサンプリングを目指す。
- 提案手法C-DPSは,制約チューニングや尤度近似を必要とせず,逆問題ベンチマークで既存手法を上回る性能を示す。
- データ空間と測定空間の拡散過程を並行して進行させることで,閉形式の事後分布を導出できる。
- この結合により,明確に定義された事後分布に基づく正確かつ再帰的なサンプリングが可能となる。
高等教育における計算思考教育へのAI活用:体系的文献レビュー [cs.CY, cs.AI]目的:高等教育における計算思考教育へのAI活用の現状と課題
- 技術が急速に進歩する現代において,計算思考は高等教育において不可欠なスキルである。
- 高等教育における計算思考教育の研究は十分ではなく,教員への支援が不足している。
- 本研究は,高等教育における計算思考教育へのAI活用事例を明らかにすることを目的とする。
- AIは,計算思考教育における様々な指導活動を支援する可能性を秘めていることが示された。
- AI活用のメリットと課題,具体的な指導戦略,カバーされる計算思考の要素,利用されるAI技術などが特定された。
- AIの活用は,計算思考教育を再構築する可能性を持ちながら,学習者の創造性を損なう可能性もあることが示唆された。
大規模言語モデルによるコード生成の堅牢化:セキュアコーディング実践に基づくグラフ構造による推論 [cs.CR, cs.AI, cs.SE]目的:セキュアコーディング実践に基づいたグラフ構造による推論
- ソフトウェア開発におけるLLM活用が拡大する中,その安全性確保は喫緊の課題である。
- LLM生成コードの脆弱性は依然多く,既存手法はリソース消費や未知の脆弱性への対応が難しい。
- セキュアコーディング実践をグラフ化し,推論を通じてLLMのコード生成を導くことで,脆弱性を低減する。
- GRASPは,セキュアコーディング実践をDAG(有向非巡回グラフ)として構造化することで,LLMの推論を支援する。
- 複数のLLMにおいて,GRASPは80%を超えるセキュリティ達成率を示し,未知の脆弱性に対して最大88%の改善を達成した。
- 本手法は,解釈可能性が高く,モデルに依存せず,スケーラブルなセキュリティ向上を可能にする。
LLMを活用した条件期待値の直接推定が因果推論の効率を向上させる [cs.LG, stat.ME]目的:因果効果推定における効率向上
- 因果推論は,政策評価や意思決定において重要な役割を果たす学問分野である。
- 高次元の交絡因子が存在する場合,条件期待値関数の推定精度が課題となる。
- LLMの知識と推論能力を活用し,次元の呪いを克服することを目指す。
- LLMによって生成された予測を,特徴量として追加することで,推定効率の向上が確認された。
- 従来の埋め込みベクトルのみを用いる手法と比較して,より精度の高い因果推定が可能となった。
- オンラインジュエリーオークションのデータを用いたケーススタディで有効性が示された。
微分方程式に着想を得た深層ニューラルネットワーク [cs.LG, cs.AI, cs.CV, cs.NA, math.NA]目的:深層ニューラルネットワークのアーキテクチャと動的モデリング手法に関する研究
- 深層学習は,画像認識や科学計算など多様な分野で急速に発展しており,重要な技術となっている。
- 既存のニューラルネットワークは,理論的理解,解釈可能性,汎化性能に課題が残されている。
- 微分方程式の視点を取り入れることで,ニューラルネットワークの統一的な理論的枠組みと体系的な設計法を確立することを目指す。
- 本研究では,常微分方程式(ODE)に基づいた深層ニューラルネットワークモデルや決定論的動的ネットワークについて詳細な検討を行った。
- 確率微分方程式(SDE)にヒントを得た正則化手法や確率的動的ネットワークモデルについても比較検討し,その特性と性能を明らかにした。
- 微分方程式と深層学習の統合が,解釈可能性と汎化性能に優れた知能化された計算手法の開発に繋がる可能性を示唆した。
AI生成サーベイ論文による研究コミュニティへのDDoS攻撃の阻止 [cs.CY, cs.AI, cs.CL, cs.IR]目的:AI生成サーベイ論文による研究コミュニティへのDDoS攻撃の現状と対策
- サーベイ論文は,研究分野の進展に不可欠であり,初心者から専門家までを導く重要な役割を担う。
- 大規模言語モデルの登場により,AI生成サーベイ論文が急増し,質の低下や重複,誤情報の拡散といった問題が生じている。
- AI生成サーベイ論文の大量投稿(DDoS攻撃)を抑制し,研究コミュニティの信頼性を守るための対策を提案する。
- AI生成サーベイ論文の急増は,研究コミュニティに深刻な負担をかけ,質の高い研究の発見を困難にしている。
- 専門家による査読の強化や,AI利用の透明性の確保が,サーベイ論文の質の向上に不可欠である。
- 動的ライブサーベイなどの新しいインフラストラクチャの構築により,自動更新と人間によるキュレーションを融合させることが望ましい。
ニューラルネットワークにおける臨界学習期間の発生について [cs.LG, cs.AI]目的:ニューラルネットワークの可塑性に関する研究
- 深層学習の性能向上には,効率的な学習方法の確立が不可欠である。
- 初期の不十分なデータでの学習が,その後の学習能力を阻害する問題がある。
- 学習ハイパーパラメータ調整による,臨界学習期間とウォームスタート性能損失の回避を目指す。
- 初期のデータ不足による学習が,ネットワークの可塑性を低下させることが確認された。
- ウォームスタートは,データ不足による事前学習の一形態と捉えられる。
- サイクリック学習率スケジュールを用いることで,これらの問題を回避できることが示された。
CREST-Search:ウェブ検索を活用した大規模言語モデルの安全性評価のための包括的な敵対的テスト [cs.MA, stat.AP, stat.ME, cs.CR, cs.AI]目的:大規模言語モデルとウェブ検索の連携における安全性脅威の評価
- 大規模言語モデルは多様なタスクで性能を発揮するが,専門領域や変化する情報への適応に課題がある。
- ウェブ検索との連携は安全性リスクを増大させ,悪意のあるプロンプトと信頼できない情報源が脆弱性を引き起こす。
- ウェブ検索連携モデル特有の脆弱性を効率的に発見し,安全な展開に向けた対策を促す。
- CREST-Searchは,コンテキスト学習と反復的なフィードバックにより,効果的に敵対的なクエリを生成し,ウェブ検索連携モデルのリスクを露呈させる。
- WebSearch-Harmデータセットを用いてLLMを敵対的テストエージェントとして微調整することで,効率的な安全性評価を実現する。
- 実験の結果,CREST-Searchは既存の安全フィルターを回避し,ウェブ検索連携LLMの脆弱性を明らかにした。
連合学習における差分プライバシーメカニズムの評価 [cs.LG, cs.AI]目的:連合学習における差分プライバシーメカニズムの性能評価
- データ活用とプライバシー保護の両立が重要視される現代において,連合学習は不可欠な技術である。
- 固定されたプライバシー予算では,モデル収束時に過剰なノイズが発生し,精度が低下する可能性がある。
- 適応的なプライバシー予算とクリッピング手法により,精度とプライバシー保護の両立を目指す。
- 適応的なプライバシー予算とクリッピング手法は,モデルの精度を維持しながらプライバシーを保護する上で有効である可能性が示唆された。
- ラプラスおよびガウスメカニズムを用いた実験結果から,適応的なアプローチが固定予算よりも優れた性能を示すことが確認された。
- IIDおよび非IIDデータセット,クライアント数の変動といった様々な条件下で,その効果が検証された。
物理制約を用いたニューラル偏微分方程式ソルバー:PINN,DRM,WANの比較研究 [cs.LG, quant-ph]目的:偏微分方程式ソルバーの比較
- 科学技術の様々なモデルの基礎であり,高次元問題でコストがかかる従来法に対し,効率的な解法が求められている。
- 解析解が得られないことが多く,古典的なメッシュベースソルバーは高次元で計算コストが高いという課題がある。
- PINN,DRM,WANの性能を比較し,複雑な偏微分方程式を解くための信頼性の高いツールを確立することを目指す。
- 3つの手法(PINN,DRM,WAN)はいずれも強制境界条件や強制ノード,直交正則化を組み合わせることで低いL2誤差(10^-6~10^-9)を達成した。
- PINNは精度と励起スペクトルの再現性で最も信頼性が高く,DRMは定常問題において精度と実行時間のトレードオフが最適であった。
- WANは感度が高いものの,弱い制約と強制ノード/直交正則化を効果的に使用することで競争力を持つことが示された。
大規模モデルにおける潜在的ダイナミクスに基づくリスク検知によるストリーミング保護:Kelp [cs.LG, cs.AI]目的:大規模言語モデルの生成過程におけるストリーミングリスク検知
- 大規模言語モデルの発展はコンテンツ生成能力を飛躍的に向上させた一方で,有害情報生成のリスクも伴う。
- 既存のリスク検知手法は事後的な検出が多く,遅延の問題や検知精度の限界がある。
- 生成過程におけるリアルタイムなリスク検知を実現し,安全性と性能を両立させる。
- Kelpは,大規模言語モデルの潜在状態を活用し,生成シーケンスにおけるリスクの経時変化をモデル化することで,高精度なストリーミングリスク検知を実現した。
- Kelpは,最先端の事後検知手法や既存のプラグインプローブと比較して,平均F1スコアが15.61%向上し,わずかな遅延で高い性能を発揮した。
- また,StreamGuardBenchという新しいベンチマークを提示し,ストリーミングガードレールの厳密な評価を可能にした。
消失する貢献:ニューラルモデルを圧縮形に滑らかに移行させる統一的アプローチ [cs.CL, cs.LG, cs.AI]目的:ニューラルモデルの圧縮形への滑らかな移行
- 深層学習モデルの規模拡大に伴い,メモリや計算資源の効率化が重要になっている。
- 既存の圧縮技術は,精度低下を引き起こす場合が多い。
- 圧縮に伴う精度低下を緩和し,モデルの安定性を高める。
- VCONは,既存の圧縮技術と組み合わせて精度を向上させる汎用的な手法である。
- 様々なベンチマークにおいて,平均して3%以上の精度向上を確認した。
- 一部の構成では,20%もの精度向上が見られた。
VisualDAN:視覚駆動型DANコマンドによるVLMの脆弱性の露呈 [cs.CY, cs.CR, cs.AI]目的:視覚言語モデルにおけるセキュリティ脆弱性の検証
- 視覚言語モデルはマルチモーダルコンテンツの解釈・生成能力で注目されており,その応用範囲は広い。
- 従来のテキストモデルに加え,画像ハイジャックなど新たな脆弱性が存在し,安全性の確保が課題である。
- 画像を用いたDANコマンドにより,VLMの安全性評価と対策の必要性を示す。
- VisualDANは,MiniGPT-4等のVLMの安全対策を回避し,有害な指示を実行させることに成功した。
- わずかな量の有害コンテンツが,モデルの防御を突破し,有害な出力を大幅に増幅させる要因となることが示された。
- 画像ベースの攻撃に対する堅牢な防御策の重要性と,VLMの安全性研究における今後の展望を示唆する。
電力系統シミュレーションのためのオペレーター学習 [cs.LG]目的:電力系統シミュレーションの代替モデルとしてのオペレーター学習
- 再生可能エネルギーの導入拡大に伴い,電力系統の安定性評価が重要性を増している。
- 再生可能エネルギーの高速な動特性を捉えるためには微小な時間ステップが必要となり,計算コストが課題となっている。
- 異なる時間ステップで学習・推論可能なオペレーター学習の有効性を検証し,シミュレーションの高速化を目指す。
- オペレーター学習は,高コストなシミュレーションの代替モデルとして有望であることが示された。
- 時間ステップ不変性という概念が,粗い時間ステップで学習したモデルを高解像度で推論可能にする鍵となる。
- 単純なテストシステムにおいて,ゼロショット超解像と安定/不安定な動的レジーム間の汎化性能が確認された。
動的正則化とバイアス軽減のための方策勾配による自動特徴選択のための多成分報酬関数 [cs.LG, cs.CY, stat.ML]目的:自動特徴選択における多成分報酬関数
- 機械学習モデルの性能は特徴量に大きく依存する。適切な特徴選択は精度向上に不可欠である。
- 静的な特徴量除外戦略では,隠れた依存関係によるバイアスを完全に防ぐことが難しい。
- 予測性能と公平性の考慮を統合した報酬信号による適応的な特徴選択を目指す。
- 本研究では,バイアス軽減と自動特徴選択を統合した強化学習フレームワークを提案した。
- 提案手法は,予測性能と公平性のバランスを訓練プロセス全体を通して動的に調整可能である。
- アンサンブル学習との統合により,相関のある予測変数や潜在的なバイアスに対処できる柔軟性と汎用性を提供する。
AI/ML統合型O-RANにおける自己適応妨害波検知のデモンストレーション [cs.CR, cs.AI]目的:AI/ML統合型O-RAN環境における自己適応妨害波検知フレームワーク
- O-RANは5Gネットワークの柔軟性と効率性を高める技術であり,そのセキュリティ確保は重要である。
- O-RANはオープンなインターフェースを持つため,妨害波攻撃に対して脆弱であるという課題がある。
- 本研究は,人間の介入なしに動的に変化する妨害波を検知し,ネットワーク性能を維持することを目的とする。
- 提案手法SAJDは,機械学習を用いたxAppによりリアルタイムで妨害波を検知する閉ループシステムを構築する。
- SAJDは,既存のオフライン学習型xAppと比較して,精度と適応性において優位性を示す。
- O-RAN準拠のテストベッドにおいて,様々な動的な干渉シナリオ下での有効性が確認された。
AIの部族の偶像:大規模言語モデルは存在しない秩序を知覚する傾向がある [cs.CL, cs.AI]目的:大規模言語モデルにおける,数値数列の規則性認識における不適切なパターン生成の傾向
- AIの応用範囲拡大に伴い,大規模言語モデルの論理的整合性と自己一貫性の評価が重要となっている。
- 大規模言語モデルは,実際には存在しないパターンを認識してしまう場合があり,応用上の課題となる。
- 大規模言語モデルが,論理的推論を必要とするタスクにおいて陥る可能性のある限界を明らかにすること。
- 大規模言語モデルは,等差数列や等比数列といった規則的な数列は正しく認識できる。
- しかし,ランダムに生成された数列に対しては,一貫性のないパターンを頻繁に過剰に認識する傾向が見られた。
- この傾向は,AIモデルにおける「部族の偶像」に相当し,論理的推論が必要な応用タスクにおける限界を示唆する。
SeCon-RAG: 信頼性の高いRAGのための二段階意味的フィルタリングと競合回避フレームワーク [cs.CL, cs.AI]目的:RAGシステムの信頼性向上
- 大規模言語モデルの知識獲得において,外部知識の活用が重要である。
- RAGシステムは,悪意のあるデータ汚染攻撃に脆弱である。
- データ汚染による矛盾を軽減し,生成の信頼性を高める。
- 提案手法SeCon-RAGは,意味的フィルタリングと競合回避の二段階フレームワークを用いる。
- EIREを用いてクエリとドキュメントからエンティティ,意図,関係を抽出し,関連性の高いドキュメントを選択的に追加する。
- 実験の結果,既存の防御手法と比較して,生成の頑健性と出力の信頼性が大幅に向上した。
ReaLM: 知識グラフ埋め込みと大規模言語モデル間の残差量子化 [cs.CL, cs.AI]目的:知識グラフ埋め込みと大規模言語モデルの連携
- 知識グラフは,知識の構造化表現であり,様々なAIタスクにおいて重要な役割を担う。
- 知識グラフ埋め込みとLLMの表現空間の不整合が,効果的な知識転移を阻害している。
- 知識グラフ埋め込みとLLMを効率的に統合し,知識グラフ補完の性能向上を目指す。
- ReaLMは,残差ベクトル量子化により,知識グラフ埋め込みをLLMのトークン化に適合させる。
- 知識グラフ埋め込みを学習可能なトークンとしてLLM語彙に組み込み,記号的知識と文脈的知識を融合する。
- オントロジーに基づいたクラス制約を組み込むことで,エンティティ予測の整合性を高める。
悪意のあるコメントに対するロバストな偽ニュース検出のためのグループ適応型敵対的学習 [cs.LG, cs.AI, cs.CL]目的:悪意のあるコメントに対する偽ニュース検出モデルのロバスト性の向上
- オンラインでの偽ニュース拡散は,世論を歪曲し,ソーシャルメディアへの信頼を損なうため,対策が急務である。
- 既存の偽ニュース検出モデルは,人間または大規模言語モデルによって作成された巧妙な敵対的コメントに対して脆弱である。
- 敵対的コメントの種類に応じた学習戦略により,偽ニュース検出モデルのロバスト性を高めることを目指す。
- 本研究では,既存の偽ニュース検出器に対するコメント攻撃の包括的な評価を行った。
- 敵対的コメントを,知覚的,認知的,社会的な3つのカテゴリーに分類し,それらに特化した攻撃を生成する手法を提案した。
- Dirichlet分布に基づく適応的サンプリング機構(InfoDirichlet Adjusting Mechanism)を導入し,学習中にコメントカテゴリー間の学習重点を動的に調整した。
暗号化された言語における現在の言語モデルの推論の困難性 [cs.CL, cs.AI, cs.LG]目的:AIの有害な行動検出の重要性
- AIの利用拡大に伴い,その安全性確保は不可欠であるため,AIの行動監視が重要視されている。
- CoT監視は有効だが,暗号化された推論によって回避される可能性があり,そのリスク評価が求められる。
- 暗号化された言語での推論能力を評価し,CoT監視回避の有効性を検証することを目的とする。
- モデルは暗号化されたテキストを理解できても,暗号化された言語で推論する能力が大幅に低下することが示された。
- 暗号化された推論能力は,事前学習データにおける暗号の出現頻度と相関関係があることが明らかになった。
- 現状では,CoT監視を回避するための暗号化された推論は効果的ではない可能性が示唆されている。
証明可能な統計的保証を持つ高パワーな訓練データ特定 [cs.LG, cs.AI]目的:訓練データ特定方法
- 大規模モデルの利用拡大に伴い,著作権侵害やプライバシー侵害のリスクが顕在化しているため。
- 既存手法は,統計的保証が不十分であり,誤検出のリスクが高いという課題がある。
- 厳密なFDR制御と高い検出力を両立する,信頼性の高い訓練データ特定手法を開発すること。
- 提案手法PTDIは,未知データを用いてp値を計算し,データ利用割合を推定することで,訓練データを厳密に特定する。
- PTDIは,FDRを厳密に制御しつつ,既存手法よりも高い検出力を実現することを実験的に示した。
- 大規模言語モデルや画像・言語モデルなど,幅広いモデルで有効性が確認された。
汎化全変動最小化による連合学習k-means [cs.LG]目的:連合クラスタリングの実現
- データが分散した環境下での機械学習の重要性が増している
- 各デバイスのデータはプライベートであり,共有が困難である
- デバイス間データの共有なしに,全体データセットのクラスタリングを可能にすること
- 連合k-meansクラスタリングをGTVMinのインスタンスとして定式化することで,各デバイスが局所的なk-means問題を解くアルゴリズムが導出された。
- このアルゴリズムでは,隣接デバイスのクラスタ重心の不一致を測るペナルティ項を導入することで,プライバシーを保護しながらクラスタリングを実現する。
- 集約された情報のみをデバイス間で共有するため,プライバシーに配慮したクラスタリングが可能となる。