arXiv雑要約
AI - 2026/04/21 公開
RAVEN:ユーザーコードとバイナリプログラムにおけるメモリ破壊脆弱性の解析のための検索拡張脆弱性探索ネットワーク [cs.CR, cs.AI, cs.MA]目的:メモリ破壊脆弱性の解析報告書の自動生成
- サイバーセキュリティ分野において,脆弱性への対応は重要であり,その自動化が求められている。
- 脆弱性報告書の作成は専門知識を必要とし,時間と労力を要する作業である。
- LLMを活用し,脆弱性解析報告書の自動生成による効率化を目指す。
- RAVENは,Google Project ZeroのRoot Cause Analysisテンプレートに従った報告書を生成できる。
- 脆弱性識別,関連知識の検索,影響評価,構造化された報告書生成の各モジュールで構成されている。
- NIST-SARDデータセットの105サンプルで評価した結果,平均品質スコアは54.21%であった。
CADMAS-CTX:文脈に応じたマルチエージェント委任のための能力校正 [cs.AI]目的:マルチエージェント委任における能力の文脈依存性
- 複雑なタスク解決には,複数のエージェントによる協力が不可欠であり,効果的な委任が重要となる。
- 従来,エージェントの能力は固定されたスキルレベルで評価されるため,文脈による能力変動が考慮されていない。
- 文脈に応じた能力評価により,より適切な委任判断を実現し,マルチエージェントシステムの性能向上を目指す。
- CADMAS-CTXは,スキルと文脈を階層的に捉え,ベータ分布を用いて能力の不確実性を定量化する。
- GAIAベンチマークにおいて,GPT-4oエージェントを用いた実験で,静的ベースラインやAutoGenよりも高い精度を達成した。
- SWE-bench Liteでは,問題解決率が22.3%から31.4%に向上し,文脈ノイズに対するロバスト性も確認された。
医療データにおける連合ルールアンサンブル法 [cs.LG, stat.ME]目的:医療データの連合学習における解釈可能な予測モデルの構築
- 医療分野において,機械学習は診断や意思決定を支援する上で不可欠であり,その精度向上は重要である。
- 単一機関では大規模多様なデータ収集が難しく,機関を跨いだデータ統合はプライバシーや所有権の問題を抱える。
- 本研究は,プライバシーを保護しつつ,解釈性と精度の高い連合学習モデルの実現を目指す。
- 提案手法は,中央集権的なRuleFitと同等の性能を示し,既存の連合学習アプローチよりも優れていた。
- 実データ分析において,競合する予測精度を維持しながら,解釈可能な知見を提供できることが示された。
- 本フレームワークは,連合学習環境における実用的かつ効果的な解釈可能モデリングの解決策となる。
TPS-CalcBench:ハイパーソニック熱防護システム工学におけるLLMの解析計算能力のベンチマークと診断評価フレームワーク [cs.AI]目的:ハイパーソニック熱防護システム工学におけるLLMの解析計算能力の評価と改善
- 航空宇宙工学は,安全性が最優先であり,高度な計算能力が不可欠である。
- 既存のベンチマークは,工学的な推論過程を評価できず,物理的に無効な解答を見抜けなかった。
- 安全性に関わる工学分野でのLLM活用に向け,より厳密な評価手法を確立すること。
- TPS-CalcBenchは,ハイパーソニック空力と高温ガス力学における閉形式解析計算の診断ベンチマークである。
- 13モデルの評価により,性能に大きな差(KPI 12.6-87.9)が確認され,隠れた数式選択の欠陥が明らかになった。
- DFA-TPSファインチューニング,RAG-EQ検索,PA-CoTプロンプティング等の介入手法が有効であることが示された。
二値化ニューラルネットワーク推論に対する積分的考察 [cs.AI, cs.LG]目的:二値化ニューラルネットワークと Sugeno 積分との間の精密な関係性
- 深層学習の計算コスト削減は重要であり,モデルの軽量化が求められている。
- 二値化ニューラルネットワークは精度低下を招きやすく,その解釈性が課題である。
- Sugeno 積分を用いて二値化ニューラルネットワークの意思決定過程を解釈可能にする。
- 二値化ニューラルネットワークの活性化閾値判定は,バイナリ入力に対する Sugeno 積分として表現できることが示された。
- 各ニューロンの意思決定は,明示的な集合関数表現,およびルールベース表現として導出された。
- 最終層のスコアについても Sugeno 積分による表現が提供され,より複雑な入力相互作用への拡張可能性が議論された。
フォールバックから最前線へ:LLMは人間の視点を注釈する上でいつ優れたアノテーターになり得るか [cs.AI, cs.CL]目的:人間の視点の注釈におけるLLMの優位性の条件
- 大規模言語モデルの活用が進む中で,人間の判断を代替するアノテーターとしての役割が重要になっている。
- LLMは,多くの場合,コスト削減のための代替手段と見なされ,人間の視点を忠実に推定する能力が疑われている。
- 主観的なタスクにおける集団意見の予測において,LLMが人間の注釈者を上回る条件を特定し,その優位性を実証すること。
- LLMは,低分散性やバイアスの軽減といった構造的特性により,集団意見の予測において人間の注釈者よりも優れた統計的推定器として機能する。
- LLMは,特定の条件下で最前線の推定器として活用でき,同時に人間の判断が不可欠な領域も存在する。
- LLMを,コスト削減の妥協案ではなく,集団的な人間の視点を推定するための原理的なツールとして再定義する。
後悔最小化による敵対的セミバンディットフィードバックを用いたオンライン適合予測 [cs.CG, cs.LG, stat.ML]目的:オンライン適合予測における不確実性量の推定
- 安全性が重要なシステムでは,不確実性下での意思決定が不可欠であり,不確実性の定量化が重要である。
- 既存手法は完全なフィードバックを仮定しており,真のラベルが常に観測できる状況に限定されている。
- 敵対的セミバンディットフィードバック下で,予測集合の誤カバレッジ率を制御することを目的とする。
- 提案手法は,オンライン適合予測を敵対的バンディット問題として定式化し,学習者の後悔との関係を確立することで,長期的なカバレッジ保証を実現する。
- 独立同分布(i.i.d.)および非 i.i.d. 設定の両方において実験的に有効性が示され,予測集合のサイズを維持しながら誤カバレッジ率を効果的に制御できることが確認された。
潜在フーリエ変換 [cs.SD, cs.AI]目的:生成音楽モデルに対する新たな周波数領域制御
- 音楽生成の分野では,より高度な制御と多様な表現が求められている。
- 既存の手法では,音楽構造を直感的に制御することが困難であった。
- 潜在空間における周波数制御を通じて音楽構造の操作を目指す。
- 潜在フーリエ変換(LatentFT)は,拡散オートエンコーダと潜在空間におけるフーリエ変換を組み合わせることで,音楽パターンを時間スケールごとに分離する。
- 学習時に周波数領域の潜在変数をマスクすることで,推論時に整合性のある操作を可能にし,音楽のバリエーションやブレンドを生成する。
- 実験とリスニングテストの結果,LatentFTは条件への適合性と品質がベースラインよりも向上することが示された。
AITアカデミー:孔子の三域カリキュラムによる完全なエージェントの育成 [cs.CL, cs.AI]目的:AIエージェントの完全な教育
- AI技術の発展に伴い,より高度な知能を持つエージェントの育成が求められている。
- 既存のエージェント開発は,特定の能力に特化し,汎用性に欠けるという課題がある。
- AIエージェントの能力開発を体系化し,多領域にわたる知能を育成することを目指す。
- AITアカデミーは,自然科学,人文科学,社会科学の三領域から構成されるカリキュラムフレームワークである。
- セキュリティ能力の評価において,弱点優先カリキュラムにより15.9ポイントの向上が確認された。
- 倫理的推論能力の評価では,属性モデリングにより7パーセントポイントの改善が見られた。
因果制約による多変量時系列異常検知のための確率的予測 [eess.SY, cs.SY, cs.MA, cs.LG]目的:多変量時系列における異常検知のための因果制約確率的予測フレームワーク
- 産業監視において,故障は複雑な時間的動態やセンサー間の相互作用に起因するため,異常検知は重要である。
- 既存の深層学習モデルは相関関係に基づいていることが多く,因果解釈や根本原因の特定が難しいという課題がある。
- 因果構造を組み込むことで,異常検知のロバスト性と解釈性を向上させることを目指す。
- 提案手法は,ASDベンチマークでF1スコア96.19%,SMDベンチマークで95.32%を達成し,最先端の性能を示した。
- 変数レベルでの属性付けの質を向上させ,異常の根本原因の特定に貢献した。
- 因果構造の事前知識が,多変量センサーシステムにおける深い異常検知のロバスト性と解釈性を改善することを示唆した。
ニューラルガベージコレクション:推論と学習を同時に行う学習による忘却 [cs.LG]目的:言語モデルにおける推論と忘却の同時学習によるKVキャッシュ効率化
- 大規模言語モデルの能力向上に伴い,推論ステップの増加がメモリ消費のボトルネックとなっている。
- 既存手法では,KVキャッシュの管理に手動で設計された基準が用いられており,スケーラビリティに課題がある。
- 本研究は,言語モデルが推論と同時に忘却を学習し,メモリ効率を改善することを目的とする。
- 提案手法NGCは,強化学習を用いて推論とメモリ管理を同時に最適化し,タスクの報酬に基づいて忘却を学習する。
- 実験の結果,NGCはKVキャッシュサイズを2〜3倍に圧縮しながら,高い精度を維持し,既存の忘却手法を上回った。
- NGCは,言語モデルの能力と効率を両立させるための,エンドツーエンド最適化の新たな方向性を示す。
SELF-EMO:認識から一貫した表現への感情的自己進化 [cs.AI]目的:対話における感情認識と一貫した感情表現の向上
- 人間中心の対話型AIにおいて,感情理解は不可欠な能力である。
- 高品質な感情アノテーションデータの不足が,感情認識と表現の精度を制限している。
- 自己進化型フレームワークにより,データ生成とモデルの継続的な改善を目指す。
- SELF-EMOは,感情認識の精度向上と,それに基づく一貫性のある感情表現を実現する。
- Qwen3-4Bで+6.33%,Qwen3-8Bで+8.54%の精度向上を達成し,最先端の性能を示す。
- ロールベースの自己対話とデータフライホイール機構により,外部からの監督なしで自己改善が可能である。
マルチエージェントLLMシステムにおける多様性の崩壊:構造的結合と開放型アイデア創出における集団的失敗 [cs.MA, cs.AI, cs.CL]目的:マルチエージェントLLMシステムにおける多様性の崩壊機構の解明
- 複雑な課題解決において,多様なアイデアの創出は重要であり,集団知性の活用が期待されている。
- 既存のマルチエージェントシステムでは,協調が必ずしも多様性の拡大に繋がらない場合がある。
- エージェント間の相互作用構造が多様性に及ぼす影響を明らかにし,集団的失敗の克服に寄与する。
- モデルの性能向上は必ずしも多様性の拡大に繋がらず,むしろ効率の限界を示す「計算効率のパラドックス」が確認された。
- 権威的なエージェントの存在は,セマンティックな多様性を抑制し,若手主導のグループの方が多様性が高い傾向が見られた。
- グループ規模の拡大や密なコミュニケーションは,早期の収束を招き,多様性の低下を加速させる要因となることが示された。
ニューラル形状演算子代理:表現レート境界 [cs.SI, cs.DB, cs.LG, cs.NA, math.NA]目的:偏微分方程式および境界積分方程式の解演算子の代理演算子に対する誤差境界
- 形状変化に対するロバストなシミュレーションが求められているため,形状パラメータの関数としての解を効率的に近似する手法が重要である。
- 従来の数値解法は,形状が変化するたびに再計算が必要であり,計算コストが高いという問題がある。
- 共通の参照ドメインへのプルバックとニューラル演算子の利用により,形状変化に対応できる効率的な解法を開発する。
- 形状の族に対し,参照ドメイン上でのパラメトリックな偏微分方程式の系列を生成し,そのwell-posednessを示すことで,パラメトリック解族の存在,一意性,安定性を保証した。
- パラメトリックなホロモルフィーを定量化することで,有限パラメトリックな離散近似の存在と,パラメータ数Nに関する収束レートを導出した。
- ニューラル演算子およびスペクトル演算子代理の存在と,許容可能な形状の集合に対する誤差境界および収束レート保証を構築的に示した。
多視点クラスタリングにおける潜在的にノイズを含む視点のクラスター可能性に基づく評価 [cs.CE, cs.DC, cs.LG]目的:多視点データのノイズ視点分析と検出
- 多様な視点からのデータ分析が重要視される中,視点データの質が結果に大きく影響する。
- 質の低い視点データはクラスタリング性能を低下させるが,事前評価が十分でない場合がある。
- 多視点データに適したクラスター可能性指標を提案し,ノイズ視点の特定を支援する。
- 提案手法である多視点クラスター可能性スコア(MVCS)は,視点ごとの構造的クラスター可能性,共同空間のクラスター可能性,クロスビュー近傍一致性の3要素で構成される。
- 実データ実験の結果,ノイズ視点はクラスタリング性能を著しく低下させることが示された。
- MVCSは既存の単一視点用クラスター可能性指標と比較して,ノイズ視点分析と検出においてより有効であることが確認された。
RASP-Tuner:非定常環境における文脈を意識したブラックボックス最適化のための検索拡張ソフトプロンプト [cs.LG, cs.AI]目的:非定常環境におけるブラックボックス最適化のための手法
- 実世界のシステム最適化は重要であり,動的な変化への対応が不可欠である。
- 過去の情報を無視すると,同じ文脈が繰り返し現れた際に最適化コストが増大する。
- 文脈に応じた効率的な最適化を可能にし,計算コストを抑えることを目指す。
- RASP-Tunerは,過去の文脈の検索とソフトプロンプトを用いた損失予測により,オンラインチューニングを実現する。
- 合成ベンチマークと実世界のデータセットにおいて,既存手法と比較して累積リグレットを改善または同等に抑えることが示された。
- RASP-Tunerは,sliding-window GP-UCBと比較して,ステップごとの計算時間を大幅に削減することに成功した。
大規模言語モデルにおける分子生成の創造性:その評価 [cs.DC, cs.CL, cs.LG, q-bio.BM]目的:分子生成における大規模言語モデルの創造性の評価
- 創薬において,有望な化合物を効率的に探索することは重要である。
- 既存の分子生成手法は,局所最適解に陥りやすく,多様性に欠ける場合がある。
- 大規模言語モデルの創造性を評価し,分子生成への応用可能性を探る。
- 大規模言語モデルは,物理化学的特性,ADMET,生物活性のタスクにおいて,独特な創造性パターンを示すことが明らかになった。
- 制約が増加すると,制約充足率が向上するという結果が得られた。
- 本研究は,分子生成に必要な能力を「創造性」として捉え直し,大規模言語モデルを用いた分子探索の新たな指針を提供する。
機械学習に基づくSOP監視におけるクロスシステム汎化のための変分オートエンコーダドメイン適応 [cs.LG]目的:機械学習による光ファイバシステムの物理層脅威検出におけるクロスシステム汎化
- 光通信ネットワークのセキュリティ確保は重要であり,物理層での脅威検出が不可欠である。
- システムの違いにより,異なる光ファイバシステムへのモデル適用が困難である。
- システム固有の違いを抑制し,共通の特徴表現を学習することで汎化性能の向上を目指す。
- 提案手法は,システム1からシステム2へのクロスシステム精度で95.3%を達成した。
- システム2からシステム1への精度は73.5%であり,単一システムで学習したDNNの精度を大幅に上回る。
- システム内性能を維持しつつ,クロスシステム汎化性能の向上が確認された。
まず,危害を加えるな(LLMと共に):エージェントワークフローによる人種的偏りの軽減 [cs.CY, cs.AI]目的:LLMにおける人種的偏りの軽減策の評価
- 医療現場でのLLM活用が進む中,倫理的・社会的な影響を考慮した研究が不可欠である。
- 既存の医療用LLMには人種的偏りが存在し,医療格差の拡大が懸念されている。
- LLMを用いた医療における人種的偏りを検出し,軽減するための手法を確立することを目指す。
- 5つのLLMにおいて,合成患者事例の生成時に人種分布の偏りが認められた。GPT-4.1が最も少ない偏りを示した。
- エージェントワークフローに組み込むことで,DeepSeek V3の診断性能が向上し,一部の指標において明示的な偏りが軽減された。
- 多角的指標によるバイアス評価と,検索型エージェントワークフローの活用が,医療AIの信頼性向上に繋がる可能性が示唆された。
データセットのトポロジカル双対:AlphaGeometryスタイルデータの論理-トポロジー符号化 [cs.DC, cs.AI, cs.LO]目的:論理からトポロジーへの符号化によるデータ表現の構造的不変性
- 近年,ニューロシンボリック推論が注目されており,複雑な問題を解決する可能性を秘めている。
- AlphaGeometryのようなシステムでは,推論エンジンのスケーラビリティがボトルネックとなり,効率が制限されている。
- データ表現の構造的理解を深め,ニューラルガイダンスの効率を改善することを目指している。
- 本研究では,論理の観察論理を利用し,データセットのトポロジカル双対という概念を導入した。
- この符号化手法により,モデルの潜在空間における構造的不変性が明らかになり,効率的な推論が可能になる。
- この枠組みは,ニューロシンボリックAIの解釈可能性を高め,モデルの探索経路の理解を深めるための基盤となる。
ExAI5G:5Gネットワークにおける侵入検知のための論理に基づく説明可能なAIフレームワーク [cs.CR, cs.AI, cs.LG]目的:5Gネットワークにおける侵入検知のための説明可能なAIフレームワーク
- 5Gネットワークの高度化に伴い,セキュリティリスクが増大しており,迅速かつ正確な侵入検知が不可欠である。
- 従来の侵入検知システムは,ブラックボックスモデルが多く,その判断根拠が不明瞭であるという課題があった。
- 本研究は,モデルの判断根拠を明確にし,信頼性と運用効率を高めることを目指している。
- ExAI5Gは,Transformerベースの深層学習IDSと論理ベースのXAI技術を統合することで,高い解釈性を実現した。
- 5G IoTの侵入検知データセットにおいて,99.9%の精度と0.854のmacro F1スコアを達成し,高い性能を示した。
- 99.7%の忠実度を持つ16の論理ルールを抽出し,モデルの推論プロセスを透明化した。
臨床データ不足下における慣性運動学のためのハイブリッド世界モデルSonata [cs.LG]目的:臨床データ不足下における6軸体幹IMU表現学習のためのコンパクトな潜在世界モデル
- 神経学的評価において,人間の運動を正確に捉えることは重要である。そのため,運動データを活用したモデル開発が求められている。
- 臨床データは患者数が限られることが多く,大規模な教師なし学習が困難であるという課題がある。
- 本研究は,限られた臨床データでも高い性能を発揮する,新しい世界モデルを提案することで,この課題を解決する。
- Sonataは,9つの公開データセットで事前学習された3.77Mパラメータのハイブリッドモデルである。
- Sonataは,生のセンサーデータを再構成するのではなく,将来の状態を予測する潜在世界モデルの目的関数を用いる。
- 評価実験の結果,Sonataは臨床的識別,転倒リスク予測,コホート間転送において,既存の手法よりも優れた性能を示した。
3次元設計における空気力学予測のための基盤モデルパラダイムへ [cs.LG, physics.flu-dyn]目的:空気力学予測のための基盤モデル構築手法
- 形状最適化の加速に不可欠であり,航空宇宙開発など幅広い分野で重要性が高まっている。
- 複雑な形状に対する高精度なモデル開発には膨大な学習データが必要となる点が課題である。
- 事前学習と微調整により,少ないデータでも高精度な予測モデルを構築することを目的とする。
- 提案手法は,SuperWingデータセットでの事前学習と,Common Research Modelへの微調整により,高い精度を実現した。
- タスク固有のデータ450サンプルのみで,表面流れ予測誤差を0.36%に抑え,ゼロから学習した場合と比較して84.2%の削減を達成した。
- モデル構成や学習戦略に関する研究を通して,限られたデータと計算資源での効果的なモデル学習の指針を得た。
実行可能なモデルによる人間行動の理解 [cs.AI]目的:人間行動の理解
- 人間中心システムにおいて,物理世界における人間行動の理解は不可欠である。
- 既存手法では,行動の構造,特に実行方法を捉えることが難しい。
- 人間行動の内部メカニズムを捉え,行動の質や差異を評価すること。
- 提案手法では,人間運動を未指定の運動プログラムとして表現するドメイン特化言語EXACTを導入した。
- EXACTの構成的性質を活用し,個々のポリシーを組み合わせることで,実行可能なニューロシンボリックモデルを構築した。
- 本研究の結果,実行可能な行動モデルは,データ効率を向上させ,タスク固有のアプローチと比較して,行動間の直感的な関係を捉えることが示された。
プロセスマイニングによる異常検知型侵入検知システムの強化 [cs.CR, cs.LG, cs.NI]目的:異常検知型侵入検知システムの警報の重大度評価と説明の提供
- ネットワークシステムのセキュリティ維持において,悪意ある攻撃からの防御は不可欠である。
- 深層学習を用いたIDSは高性能だが,ブラックボックスであるため信頼性に課題がある。
- パケットレベルのシーケンス分析に基づくプロセスに基づいた説明の欠如を解決する。
- 本手法は,警報の重大度を低〜非常に高いレベルで識別可能である。
- 再現率は最大99.94%,適合率は99.99%を維持し,誤検知を効果的に削減する。
- ネットワークの振る舞いへの可視性を維持しつつ,誤分類された正当なトラフィックによる中断を最小限に抑える。
μNPUにおけるリアルタイム心電図・筋電図モデリングに向けて [cs.LG]目的:心電図および筋電図信号解析のための軽量でμNPU互換なモデルアーキテクチャと学習フレームワーク
- ウェアラブルデバイスの普及により,リアルタイムな生体信号処理の需要が高まっている。
- Transformerモデルは高性能だが,リソース制約のあるμNPUには実装が困難であった。
- μNPU上で動作可能な,軽量かつ高性能な生体信号解析モデルの開発。
- PhysioLiteは,最新のTransformerベースモデルと同等の性能を,10%以下のサイズで実現した。
- 学習可能なウェーブレットフィルタバンク,CPUオフロードによる位置エンコーディング,ハードウェア対応のレイヤー設計が貢献。
- MAX78000およびHX6538 WE2 μNPU上での性能評価により,バッテリー駆動のハードウェア上での実用性が示された。
AIエージェント基盤におけるアーキテクチャ設計決定 [cs.CL, cs.AI]目的:AIエージェントシステムにおけるアーキテクチャ設計決定の分析
- AIエージェントの発展は,ツール仲介や安全制御などの再利用可能な基盤に依存している。
- エージェントシステムの基盤アーキテクチャ設計に関する研究は十分に進んでいない。
- 公開されているエージェントシステムプロジェクトの分析を通じて,設計の規則性を明らかにすること。
- 70の公開プロジェクトを分析した結果,5つの設計次元(サブエージェントアーキテクチャ,コンテキスト管理,ツールシステム,安全機構,オーケストレーション)が繰り返し現れることがわかった。
- ファイル永続化,ハイブリッド,階層的なコンテキスト戦略が好まれており,ツールシステムはレジストリ指向が主流である。
- 協調性が高いシステムほど明示的なコンテキストサービスを必要とし,ツール登録の境界が明確なほどエコシステムの規模が大きくなる傾向が見られた。
クラス特化型拡散モデルによる低データ領域における軍事物体の検出性能向上 [cs.CV, cs.AI]目的:低データ環境下における軍事車両の検出性能向上
- 軍事分野におけるAI技術の応用は重要性が高いが,十分な学習データが不足している場合が多い。
- 限られたデータでの学習は,AIモデルの汎化性能を低下させ,誤検出や未検出を引き起こす可能性がある。
- 拡散モデルを用いて合成データを生成し,少ない実データでAIモデルの性能を向上させることを目指す。
- 拡散モデルFLUX.1をLoRAでファインチューニングし,クラス特化型モデルを生成することで,軍事車両検出性能が向上した。
- 特にデータが少ない場合(8枚の実データ)において,最大8.0%のmAP$_{50}$の改善が確認された。
- ControlNetを用いた構造化ガイダンスにより,さらに性能が向上したが,実データが比較的多い場合は効果が限定的であった。
ベイジアンアタックグラフとプロセスマイニングによる動的リスク評価 [cs.NI, cs.PF, cs.CR, cs.LG, cs.NI]目的:動的リスク評価手法
- サイバーセキュリティは重要であり,システムの脆弱性に対する脅威を特定し,対策を講じる必要がある。
- 従来のアタックグラフは脅威の特定はできるが,脆弱性の悪用可能性やノード侵害の可能性を評価できない。
- 本研究は,脆弱性の悪用状況を動的に評価し,システム侵害の確率を更新することを目的とする。
- 提案手法では,プロセスマイニングで悪意のあるネットワークトラフィックを分析し,脆弱性悪用の証拠を得る。
- 得られた証拠をベイジアンアタックグラフに提供し,条件付き確率テーブルを更新することで,動的なリスク評価を実現する。
- 実験結果から,提案手法が脆弱性の悪用を検出し,システム侵害確率の更新に有効であることが示された。
疎な生態学的観測からの連続的な環境場再構成のための座標に基づくフレームワークとしての暗黙的ニューラル表現 [cs.LG, cs.AI]目的:疎な生態学的観測からの連続的な環境場の再構成
- 環境モデリングや生物多様性情報学において,連続的な環境場を把握することは重要である。
- 空間・時間的に不均一なデータに対応できる汎用的な手法が求められている。
- 不規則なサンプリングデータに対しても,柔軟かつ効率的な環境場再構成を可能にする。
- 暗黙的ニューラル表現は,座標入力から直接連続的な空間場を学習する柔軟なフレームワークとして有効である。
- 種分布の再構成,表現型ダイナミクス,形態学的セグメンテーションなど,多様なモデリングシナリオにおいて安定した結果が得られた。
- 計算コストが予測可能であり,従来の平滑化手法やツリーベース手法を補完する。
LLM圧縮劣化のスペクトル統計からの予測 [cs.LG]目的:LLM圧縮劣化の予測
- 大規模言語モデルの利用拡大に伴い,計算コストの削減が重要課題となっている。
- LLMの圧縮は有効だが,圧縮後の性能評価に膨大な計算資源が必要となる。
- スペクトル統計を用いて,圧縮前の段階で劣化を予測し,効率的な圧縮を可能とする。
- 安定ランクと情報密度が性能劣化を支配することが示された。
- 圧縮率と安定ランクの積である$\gamma \cdot \bar{\rho}_s$が,精度劣化の頑健な予測因子となった。
- この予測因子により,予測と圧縮を組み合わせた効率的なワークフローが実現可能となる。
組み合わせと照合:スケーラブルなトピック制御型教育要約のためのコンテキストペアリング [cs.CL, cs.AI, cs.CY]目的:トピック制御型要約のためのデータ拡張戦略
- 教育分野における個別化された学習ニーズに応えるため,特定の側面に着目した要約が重要である。
- 小規模言語モデルでは,トピックと要約の関係性を効果的に学習することが課題である。
- データ拡張により,少ない学習データでも高性能なトピック制御型要約モデルを構築することを目指す。
- データ拡張の規模を大きくすることで,モデルの性能が向上し,意味的な整合性が高まることが示された。
- 本手法を用いることで,大規模モデルと同等の性能を,より少ないパラメータと学習データで実現できる。
- 異なるドキュメントからのコンテキストを組み合わせることで,モデルはトピックと要約の関係性をより効果的に学習する。
溺水者捜索・救助のための自律型無人航空機システム:画像に基づく位置特定とミッションシミュレーション [cs.CV, cs.AI, stat.AP]目的:溺水者の早期発見と救助を目的とした自律型無人航空機システムの開発
- 水辺での活動において溺水は常にリスクであり,迅速な救助が求められる。
- 広大な水域や正確な溺水者の位置特定,救助隊員の輸送などが課題である。
- 無人航空機システムによる救助活動の効率化と時間短縮を目指す。
- 画像認識アーキテクチャYOLOを用いて溺水者の自動位置特定を行った結果,YOLOv8が最も高い精度を示した。
- 離散事象シミュレーションにより,従来型の救助活動と比較して,無人航空機システムが救助時間を大幅に短縮できることを示した。
- 2機の無人航空機と2つの格納庫を持つ小規模なシステムでも,救助時間を5分の1に短縮できることがわかった。
ベイズ深層アンサンブルのE値に基づく停止ルール [cs.LG, stat.ML]目的:ベイズ深層アンサンブルにおけるサンプリング停止基準
- 深層学習モデルの不確実性評価は,安全性や意思決定において重要である。
- ベイズニューラルネットワークのサンプリングは計算コストが高く,実用上の課題となる。
- 効率的なサンプリング停止基準を確立し,計算コストを削減することを目指す。
- 提案手法では,E値を基にした停止ルールを,逐次的な仮説検定として定式化した。
- 実験結果から,E値に基づく停止ルールが有効であり,十分な性能を維持しつつサンプリングコストを削減できることが示された。
- 多くの場合,完全なサンプリング予算の一部のみで十分な改善が得られることが明らかになった。
グラフ構造推論のためのファインチューニングされた小型言語モデルの汎化境界 [cs.LG]目的:グラフ構造推論における小型言語モデルの汎化能力
- グラフ構造は,様々な分野で重要な役割を果たすため,その解析は不可欠である。
- ファインチューニングされた小型言語モデルの汎化能力は,訓練条件を超えて十分に理解されていない。
- グラフサイズや分布の変化に対する汎化境界を明確にすること。
- ファインチューニングされたモデルは,構造的に異なるグラフファミリー間で良好な順位の一貫性を維持する。
- 訓練範囲よりも大幅に大きなグラフ入力に対しても,構造的特性に基づいてグラフをランク付けし続ける。
- モデルのアーキテクチャによって性能劣化のプロファイルが異なり,信頼性の高い汎化領域が明らかになった。
DSAINet:汎用脳波デコーディングのための効率的な二重スケール注意相互作用ネットワーク [cs.AI]目的:汎用脳波デコーディングのための,効率的な二重スケール注意相互作用ネットワーク
- 非侵襲的な脳波は,脳機能の解明やブレイン・マシン・インターフェース等,幅広い応用が期待されている。
- 既存の脳波デコーダーは,タスクの種類によって性能が変動し,異なるタスクへの汎化性能が課題となっている。
- 本研究は,タスクに依存しない,汎用性の高い脳波デコーディングモデルを開発し,その問題を解決することを目指す。
- DSAINetは,脳波信号から共有の時空間トークン表現を構築し,微細スケールと粗視スケールの並列畳み込みブランチで多様な時間的ダイナミクスをモデル化する。
- ブランチ内注意とブランチ間注意により表現を適応的に洗練させ,タスクに関連する特徴を統合することで,高い予測性能を実現する。
- 10の公開データセットを用いた5つの脳波デコーディングタスクにおいて,DSAINetは13の代表的なベースラインを安定して上回り,高い精度と効率性を両立した。
人間とAIの協働における溝 [cs.HC, cs.AI, cs.IR, cs.LG]目的:人間とAIの協働における不安定性の理由の理解
- AI技術の発展に伴い,人間の仕事におけるAIの役割が重要になっている。
- AIとの協働において,誤解や前提の欠如による修正作業が発生しやすい。
- AIとの協働を円滑にするための相互理解の条件を明らかにすること。
- LLMを活用したシステム開発者へのインタビュー分析から,協働の安定にはモデルの能力だけでなく,対話の基盤が重要であることが示された。
- AIとの協働は,一次的な支援,非対称な修正を伴う弱い協働,そして基盤が確立された協働の3つの構造に分類できる。
- パートナーシップの印象と対話の基盤構築能力の乖離が,協働の失敗に繋がるというフレームワークを提案する。
安定性は冗長性を示す:効率的な長文コンテキストの事前充填のためのデルタ注意選択的停止 [cs.DC, cs.AI]目的:長文コンテキストにおける事前充填の計算コスト削減
- 大規模言語モデルや大規模マルチモーダルモデルにおいて,長文処理の効率化は重要課題である。
- 既存のトークン削減手法は,ハードウェア効率の良いカーネルとの互換性を損なう場合がある。
- セマンティックに安定したトークンの処理を停止することで,事前充填の高速化を目指す。
- DASHは,言語および視覚ベンチマークにおいて汎化可能であり,事前充填速度を大幅に向上させる。
- モデルの精度とハードウェア効率を維持したまま,計算コストの削減に成功した。
- 層ごとの自己注意メカニズムの更新ダイナミクスを監視し,安定化されたトークンを選択的に停止する。
LoRaQ:4ビット量子化のための最適化された低ランク近似 [cs.CL, cs.MM, cs.LG]目的:4ビット量子化における低ランク近似の最適化
- 大規模拡散モデルの展開にはリソース制約が課題であり,量子化技術が重要である。
- 積極的な4ビット量子化は生成性能を著しく低下させるという問題がある。
- 高精度な補助ブランチの必要性を解消し,データフリーな量子化誤差補償を目指す。
- LoRaQは,既存の最先端手法と比較して,同等のメモリオーバーヘッドで優れた性能を示す。
- LoRaQにより,W4メイン層と組み合わせてW8A8,W6A6,W4A8などの混合精度構成が可能となる。
- これにより,完全に量子化されたアーキテクチャを実現し,現代の混合精度ハードウェアへの適合性が向上する。
タスク認識型大規模言語モデルの低ランク適応 (TLoRA) [cs.HC, cs.SI, cs.CL, cs.MA, cs.CL, cs.AI]目的:大規模言語モデルの低ランク適応における初期化とリソース配分最適化
- 大規模言語モデルの活用が広がる中,効率的なファインチューニング手法が求められている。
- LoRAはパラメータ効率の良い手法だが,ランクやスケール因子の設定が重要であり,最適化が難しい。
- タスクに応じた初期化とリソース配分を同時に最適化し,LoRAの性能向上を目指す。
- TLoRAは,事前学習済みの重みと入力活性共分散の特異値分解に基づき,タスクに関連する部分空間にLoRA行列Aを整合させるデータ駆動型初期化戦略を導入する。
- 行列Aを固定し,行列Bのみを訓練することで,学習効率を高めている。
- また,固定されたパラメータ予算内で,層ごとにランクとスケール因子を適応的に配分する感度ベースの重要度指標を用いる。
深度レジスタがSwiGLUにおけるW4A4を解放:読者/生成器分解 [cs.CL, cs.AI, cs.LG]目的:W4A4量子化における誤差支配部位の特定と,その改善
- 大規模言語モデルの効率的な推論は,計算資源の制約下で重要な課題である。
- 量子化によるモデル圧縮は精度劣化を招き,特に低ビット量子化では顕著である。
- 誤差の原因部位を特定し,読者/生成器分解に基づいた改善策を講じる。
- 事前の量子化では検証perplexityが大幅に悪化したが,Depth Registers (DR+sink)を導入することで改善された。
- 読者(qkv, w1, w3)の制御によりW4A4の損傷が抑制され,生成器(o_proj, w2)への影響は限定的であった。
- オンライン回転を用いた追加の量子化手法(QuaRot)では,性能改善は限定的であり,SwiGLUの線形入力の制約が課題であることが示唆された。
市場効率の推定のための「逆」実験的枠組み [cs.LG, cs.CE, stat.AP]目的:市場効率に関するアルゴリズムガバナンス判断を情報化するための測定枠組みの確立
- デジタル市場は社会技術的生態系における重要なインフラであり,その最適化が重要である。
- 従来のオークションデータからは,市場の実際の配分的効率を正確に評価することが困難である。
- オークションデータのみから市場効率を予測するモデルを構築し,市場のパフォーマンス評価に貢献する。
- 本研究では,オークションデータ(買い注文,売り注文,価格実現値)のみを用いて,配分的効率を合理的な精度で予測できることを示した。
- 予測精度は,初期の買い注文と売り注文から既に向上し,価格実現データが加わるにつれてさらに向上する。
- 提案する枠組みは,実際の市場データへの応用可能性を示し,市場効率とパフォーマンスに関する洞察を提供する。
世界知識探索による自発的・報酬不要な自己進化型LLMエージェントの訓練 [cs.AI]目的:LLMエージェントの自己進化能力
- エージェントの自律性は,複雑な環境への適応において不可欠である。
- 従来の自己進化は人間の報酬に依存し,自律的な進化が困難である。
- 人間の介入なしに,未知環境下での自己適応を可能にすること。
- 提案手法により,WebVoyagerとWebWalkerの性能が20%向上した。
- 14B Qwen3モデルが,Gemini-2.5-Flashを上回る性能を示した。
- 自己生成された世界知識が,エージェントの適応能力を大きく向上させる。
マルチエージェントシステム:古典的なパラダイムから大規模基盤モデルによる未来へ [cs.AI]目的:マルチエージェントシステムにおける古典的な手法と大規模基盤モデルに基づく手法の比較分析
- 社会の複雑化に伴い,複数の主体が協調して問題解決を行うシステム構築の重要性が高まっている
- 古典的なマルチエージェントシステムは,環境変化への適応性や汎用性に課題が残されている
- 大規模基盤モデルを活用することで,より柔軟で適応性の高いマルチエージェントシステムの実現を目指す
- 古典的なマルチエージェントシステムは,知覚,通信,意思決定,制御という4つの要素で構成されることが整理された。
- 大規模基盤モデルに基づくマルチエージェントシステムは,低レベルな状態交換からセマンティックレベルの推論へと協調のレベルを引き上げ,適応性を向上させる。
- アーキテクチャ,動作メカニズム,適応性,応用において,古典的な手法と大規模基盤モデルに基づく手法の比較分析が行われた。
大規模データセット蒸留のためのソフトラベルプルーニングと量子化 [cs.CV, cs.AI, cs.LG]目的:大規模データセット蒸留におけるソフトラベルのサイズ削減
- データセットサイズ削減は,効率的なモデル学習と展開に不可欠である。
- 大規模データセット蒸留では,ソフトラベルのサイズがボトルネックとなりやすい。
- ソフトラベルの冗長性を削減し,データ圧縮率を向上させることを目指す。
- 本研究では,ソフトラベルのプルーニングと量子化により,ImageNet-1Kで78倍,ImageNet-21Kで500倍のストレージ削減を実現した。
- 提案手法は,合成画像の多様性と教師シグナルの多様性を高めることで,高い圧縮率下での精度劣化を抑制する。
- 様々なネットワークアーキテクチャと蒸留手法において,LPQLDの優位性が確認された。
AQPIM:LLMにおけるPIM容量の壁を,インメモリ活性化量子化で打破 [cs.AR, cs.AI, cs.LG]目的:LLMにおける活性化メモリフットプリントの削減と,PIMによる計算効率の向上
- データ集約型機械学習において,メモリボトルネックは性能向上を阻害する重要な課題である。
- TransformerベースのモデルにおけるKVキャッシュサイズの増大が,PIMの限られたメモリ容量を超える問題がある。
- PIMに特化した活性化量子化により,メモリ帯域幅と計算効率を改善し,LLMの性能向上を目指す。
- AQPIMは,PIMの内部帯域幅を活用するため,メモリ内での量子化を直接実行し,圧縮データ上で直接計算を行う。
- 従来のPIMアプローチと比較して,GPU-CPU間の通信量を大幅に削減し,デコーディング遅延を短縮する。
- 最先端のPIMアプローチに対し,3.4倍の高速化を実現した。
3D医療画像における領域に基づいたレポート生成:詳細なデータセットとグラフ強化フレームワーク [eess.SY, cs.SY, eess.SY, cs.SY, cs.CV, cs.AI]目的:3D PET/CT画像に対する医療レポートの自動生成
- 医療画像診断支援は,医師の負担軽減と診断精度の向上に不可欠である。
- 3D医療画像の解析は高次元であり,アノテーション付きデータセットが不足している。
- 低リソース言語における領域に基づいたレポート生成の実現を目指す。
- 本研究では,詳細なRoIアノテーション付きのデータセットVietPET-RoIを公開した。
- 提案手法HiRRAは,RoI間の依存関係をグラフで捉え,診断ワークフローを模倣する。
- RoI CoverageとRoI Quality Indexという新たな評価指標を導入し,臨床的信頼性の向上を示した。
モジュール表現圧縮:効率的かつ効果的な推薦のためのLLMの適応 [cs.IR, cs.AI, cs.CL]目的:LLM表現の圧縮
- 推薦システムにおいてLLMの活用が注目されており,その性能向上は重要である。
- LLMの高次元表現は,ストレージや計算コストの増大という課題を抱えている。
- LLMのモジュール性を制御し,より効率的な表現圧縮を実現することを目指す。
- 中間層の表現が最終層よりも推薦タスクで優れた性能を示す「中間層表現優位性」を特定した。
- モジュール調整とモジュールタスク分離という手法を用いて,LLMのモジュール性を明示的に制御するMARCを提案した。
- 大規模なオンラインA/Bテストにおいて,MARCはeCPMを2.82%向上させる結果を得た。
自動胎児頭部セグメンテーションのためのAttention-ResUNet [cs.CV, cs.LG]目的:胎児頭部セグメンテーションの自動化
- 周産期医療において,正確な生体計測は胎児の成長評価に不可欠である。
- 超音波画像は低コントラスト,ノイズ,複雑な解剖学的境界という課題を抱えている。
- 超音波画像における胎児頭部セグメンテーションの精度向上を目指す。
- 提案手法Attention-ResUNetは,HC18データセットにおいて平均Dice係数99.30±0.14%を達成した。
- 既存のResUNet,Attention U-Net等の5つのベースラインと比較して有意に高い性能を示した(p<0.001)。
- サルイエンシーマップ分析により,解剖学的に整合性の高い活性化パターンが確認され,解釈性の向上に貢献する。
状態遷移から見る制御ルーティングにおける再利用 [cs.HC, cs.AI]目的:制御ルーティングにおける状態の再利用の検証
- 大規模言語モデルの振る舞い制御は重要だが,その制御に必要な状態がどこに存在するかは不明である。
- プロンプトによる介入で振る舞いが変わっても,それが本当に状態の再利用によるものか判断が難しい。
- 制御ルーティングタスクを用いて,状態の再利用とプロンプトの位置移動の違いを明確にすること。
- GPT-2 triopでは,初期のインターフェースが正確な転移をサポートすることが確認された。
- GPT-2 add/subでは,固定インターフェースを用いた転移が,ドナーのルーティング精度をほぼ回復した。
- Qwenルーティングでは,同じインターフェースパターンが異なるアーキテクチャでも一貫性があることが示された。
