arXiv雑要約

AI - 2026/03/26 公開

脳基盤モデルとコーシー・シュワルツのダイバージェンス：クロス被験者運動イメージングデコーディングのための新しいフレームワーク [cs.HC, cs.LG]目的：クロス被験者運動イメージング脳波デコーディングにおける課題克服
- 脳波を用いた運動イメージングは，外部システム制御のための非侵襲的な脳コンピュータインタフェースの重要なパラダイムである。
- 被験者間の大きな変動やラベル付きデータの不足により，クロス被験者デコーディングは依然として困難な課題である。
- 脳基盤モデルを活用し，関連性の高いソース被験者のみを選択することで，適応の効率性と精度を向上させる。
- 提案手法は，2つのベンチマークデータセットにおいて，平均精度86.17%と78.41%を達成し，最先端のベースラインを上回った。
- 大規模なソースプールを用いた実験により，脳基盤モデルによる選択の拡張性と効率性が確認された。
- コーシー・シュワルツのダイバージェンスを用いることで，特徴量レベルと決定レベルの両方でドメイン不変性を強化し，クラス識別能力を維持した。
Link: https://arxiv.org/abs/2507.21037
LLMに対するパーソナプロンプトを用いた脱獄攻撃の強化 [cs.CR, cs.AI]目的：LLMの安全性に対する脱獄攻撃の有効性向上
- LLMの普及に伴い，悪意ある利用を防ぐ安全性確保が不可欠である。
- 既存の防御機構は，直接的な攻撃には有効だが，巧妙なプロンプトには脆弱である。
- パーソナプロンプトの活用による防御回避と攻撃成功率の向上を目指す。
- 提案手法により，複数LLMにおける拒否率が50～70%減少した。
- 生成されたパーソナプロンプトは，既存の攻撃手法と組み合わせることで相乗効果を発揮し，成功率が10～20%向上した。
- 自動パーソナプロンプト生成のための遺伝的アルゴリズムの有効性が示された。
Link: https://arxiv.org/abs/2507.22171
NaviMaster：GUIと身体化ナビゲーションタスクのための統一的なポリシー学習 [cs.RO, cs.LG]目的：GUIナビゲーションと身体化ナビゲーションの統合
- GUIと身体化ナビゲーションは，ロボットの自律性向上に不可欠な技術である。
- 両分野は独立して発展してきたため，データセットや学習方法にばらつきがある。
- GUIと身体化ナビゲーションを統一することで，汎化性能の向上を目指す。
- NaviMasterは，GUIナビゲーション，空間的アフォードダンス予測，身体化ナビゲーションのベンチマークにおいて，最先端のエージェントを上回る性能を示した。
- 統一的な学習戦略，データ混合戦略，報酬設計の有効性が，消去実験によって確認された。
- GUIと身体化ナビゲーションの両タスクに対し，単一のフレームワークで統一的なアプローチを実現した。
Link: https://arxiv.org/abs/2508.02046
カオス写像の記号力学に基づく圧縮分類フレームワーク [cs.LG]目的：カオス写像を用いた記号力学とデータ圧縮に基づく新しい分類フレームワーク
- 複雑なデータの特徴抽出とパターン認識において，記号力学は有効なアプローチとして注目されている。
- 従来の分類手法では，高次元データや複雑な関係性の学習が課題となる場合がある。
- 記号力学と圧縮技術を融合することで，複雑なデータを効率的に表現し分類することを目指す。
- 提案手法ChaosCompは，合成データセットおよび実データセットにおいて，従来の機械学習アルゴリズムと同等以上の性能を示した。
- 特に，ウィスコンシン乳がんデータセットでは0.9531，Seedsデータセットでは0.9475，アイリスデータセットでは0.8469といったマクロF1スコアを達成した。
- 本研究は，分類問題を力学系と圧縮の観点から再解釈し，学習理論と情報処理の基礎的な視点を提供することを目指している。
Link: https://arxiv.org/abs/2508.02330
SafeSieve：LLMベースのマルチエージェントコミュニケーションにおける漸進的プルーニングのヒューリスティックから経験への移行 [cs.MA, cs.AI]目的：LLMベースのマルチエージェントコミュニケーションの効率化
- LLMベースのマルチエージェントシステムは協調性に優れるが，通信冗長性が課題
- 既存手法は事前・事後最適化が分離しており，統合的な戦略が不足している
- 動的なコミュニケーション改善により，効率性と堅牢性を両立させる
- SafeSieveは，初期のLLMによる意味評価と性能フィードバックを統合し，ヒューリスティックから経験へのスムーズな移行を実現した。
- ベンチマーク実験の結果，SafeSieveは平均94.01%の精度を達成し，トークン使用量を12.4%-27.8%削減した。
- プロンプトインジェクション攻撃に対する堅牢性も示され，平均精度低下は1.23%に留まった。
Link: https://arxiv.org/abs/2508.11733
サプライチェーン管理における協調のパラドックス：生成AIが戦略的知性と運用上の安定性を必要とする理由 [cs.AI]目的：生成AIエージェントの戦略的行動の出現に関する調査
- サプライチェーンは経済活動の基盤であり，その効率化は経済成長に不可欠である。
- サプライチェーンはブルウィップ効果などの不安定性に弱く，最適化が困難である。
- 生成AIの協調行動が必ずしも最適化に繋がらないという問題の解決を目指す。
- 生成AIエージェントによるVMIは，理論上は優れているにも関わらず，非AIベースラインよりも悪い結果となった。
- このパラドックスは，エージェントが在庫を買い占め，システム全体を枯渇させるという運用上の欠陥が原因である。
- 戦略的な政策設定と，プロアクティブな下流補充プロトコルを組み合わせることで，安定性と回復力を実現できる。
Link: https://arxiv.org/abs/2508.13942
DART：リソース効率に優れたロバストな連合学習のためのサーバーサイドプラグイン [cs.LG]目的：連合学習におけるロバスト性の向上
- データプライバシー保護が重要視される中で，エッジデバイスでの機械学習が求められている。
- クライアント側の計算資源の制約や，ノイズなどの影響に対する脆弱性が課題となっている。
- 既存手法の計算コストが高いため，リソース制約下でのロバスト性向上が急務である。
- 提案手法DARTは，サーバーサイドでロバスト性を強化し，クライアント側の負担をゼロに抑える。
- DARTは既存の連合学習システムに容易に組み込むことができ，データアクセスも不要である。
- 実験により，DARTが最先端の連合学習システムのロバスト性を向上させることが示された。
Link: https://arxiv.org/abs/2508.17381
ガイドラインから保証へ：LLMのドメイン特化型評価のためのグラフベース評価ハーネス [cs.NI, cs.AI, cs.CL]目的：ドメイン特化型LLM評価のためのグラフベース評価ハーネス
- LLMの応用拡大に伴い，特定の専門分野における能力評価の重要性が増している。
- 既存の評価データセットは，網羅性，汚染耐性，保守性に課題があり，信頼性の高い評価が困難である。
- 構造化された専門知識を基に，網羅的かつ汚染に強く，保守可能な評価データ生成を目指す。
- 提案手法は，臨床ガイドラインを知識グラフに変換し，グラフ探索により評価クエリを動的に生成する。
- WHO IMCIガイドラインへの適用により，症状認識，治療，重症度分類，フォローアップケアに関する多肢選択問題が生成された。
- 評価実験の結果，LLMは症状認識には高い性能を示す一方，治療プロトコルや臨床マネジメント判断には課題が残る事が示された。
Link: https://arxiv.org/abs/2508.20810
クラウドフォーマー：未知のワークロードを持つパブリッククラウドの性能予測に関する注意機構ベースの手法 [cs.AR, cs.PF, cs.DC, cs.LG, cs.PF]目的：パブリッククラウドにおけるVM性能劣化の予測
- クラウド利用の拡大に伴い，資源利用効率向上が重要課題となっている。
- VM間の資源競合による性能劣化が問題視されているが，予測が困難である。
- ブラックボックス環境下でのVM性能劣化予測精度向上を目指す。
- 提案手法CloudFormerは，Transformerベースのモデルを用いてVM性能劣化を予測する。
- CloudFormerは，時間的変動とシステムレベルの相互作用を同時にモデリングすることで，高い予測精度を実現した。
- 実験結果から，CloudFormerは既存手法と比較してMAEを28%以上改善し，汎化性能に優れることが示された。
Link: https://arxiv.org/abs/2509.03394
過去と未来の架け橋：分布を考慮した時系列予測のためのアライメント [cs.LG, cs.AI]目的：時系列予測における過去と未来の表現のアライメント
- 時系列予測は，需要予測や異常検知など，多くの分野で重要な役割を担う。
- 従来の時系列予測モデルは，過去と未来のデータの分布のずれに対応できていない場合がある。
- 過去と未来の表現をアライメントすることで，予測精度を向上させることを目指す。
- TimeAlignは，既存の予測モデルに容易に組み込める軽量なフレームワークである。
- 実験の結果，8つのベンチマークにおいて，TimeAlignが優れた性能を示すことが確認された。
- ゲインは主に，過去の入力と未来の出力の周波数ミスマッチの修正に起因すると考えられる。
Link: https://arxiv.org/abs/2509.14181
誰を信頼するか？連合蒸留におけるクライアント予測の集約 [cs.LG]目的：連合蒸留におけるクライアント予測の集約方法
- データプライバシー保護が重要視される中，分散データを用いた機械学習が注目されている。
- データ分布の不均衡により，クライアントの予測信頼性にばらつきが生じる場合がある。
- 予測の信頼性を考慮した集約方法を開発し，連合蒸留の性能向上を目指す。
- 提案手法（UWA, sUWA）は，データ異質性が高い場合に特に有効であることが実験で示された。
- 共有パブリックデータセット上での集約は，集約品質によって最適解近傍に収束することが理論的に証明された。
- データ異質性が低い場合には，標準的な平均化と同等の性能を発揮することも確認された。
Link: https://arxiv.org/abs/2509.15147
GeoSketch：補助線構築とアフィン変換を用いた幾何学的多様式推論に対するニューラル・シンボリックアプローチ [cs.RO, cs.RO, math.DS, cs.CL, cs.AI]目的：幾何学的問題解決における多様式推論の性能向上
- 視覚情報とテキスト情報を統合した推論は，AIにおける重要な課題であり，様々な応用が期待される。
- 既存の多様式大規模言語モデルは，図を静的な画像として処理するため，動的な操作が苦手である。
- 補助線構築やアフィン変換といった動的な操作を組み込み，幾何学的問題解決能力を高める。
- GeoSketchは，幾何学的問題解決を，知覚・推論・行動のインタラクティブなループとして捉えるニューラル・シンボリックフレームワークである。
- 本研究で開発されたGeoSketch Benchmarkを用いた実験により，GeoSketchは既存手法と比較して，段階的な推論精度と問題解決の成功率を大幅に向上させた。
- 階層的な意思決定，実行可能な視覚的アクション，シンボリックな検証を統合することで，静的な解釈から動的かつ検証可能な相互作用へと多様式推論を進展させた。
Link: https://arxiv.org/abs/2509.22460
分類問題における信号分離の視点 [cs.LG, stat.ML]目的：分類における信号分離的アプローチの理論的検討
- 機械学習の基礎課題であり，様々な応用分野で重要性が増している。
- 従来の関数近似に基づく手法では，十分な性能が得られない場合がある。
- 信号分離の技術を応用し，少ないラベル数で高精度な分類を実現すること。
- 提案手法は，コンパクトな距離空間における分類問題を新たな視点から捉えている。
- 信号処理における点源分離の技術を応用し，確率分布のサポートを分離する。
- Salinas，Indian Pines，文書データセットなどでの実験により，有効性が示された。
Link: https://arxiv.org/abs/2509.24140
拡散モデルのアライメントのための潜在的フィードバックによるプラグアンドプレイプロンプト改良：PromptLoop [cs.LG, cs.AI, cs.CV]目的：拡散モデルのアライメント手法
- 拡散モデルは画像生成において高精度だが，意図した出力を得るための制御が課題である。
- 強化学習による拡散モデルのファインチューニングは，汎化性能や報酬ハッキングに弱い。
- 潜在的フィードバックを用いたステップごとのプロンプト改良により，これらの問題を解決する。
- PromptLoopは，拡散モデルの構造的類似性を維持しつつ，プロンプトベースのアライメントの柔軟性を実現した。
- 多様な報酬関数と拡散モデルで実験を行った結果，PromptLoopは効果的な報酬最適化を達成した。
- また，未知のモデルへの汎化，既存のアライメント手法との組み合わせ，過剰最適化の緩和，わずかな推論オーバーヘッドを実現した。
Link: https://arxiv.org/abs/2510.00430
Fiaingen：現実世界のデータ品質に匹敵する金融時系列生成手法 [cs.LG, cs.AI]目的：金融時系列データの生成手法
- 金融分野では，投資や取引判断に不可欠な正確かつ強固なモデルが求められる。
- 現実の金融データは量が多くても，品質と多様性に課題があり，機械学習モデルの性能向上を阻害する。
- 様々な金融資産のデータ不足を解消し，機械学習モデルの性能向上に貢献することを目指す。
- Fiaingenは，現実のデータと合成データの重なり，機械学習タスクの性能，実行時間において，最先端の性能を達成した。
- Fiaingenで生成された合成データは，元の時系列データをより忠実に再現し，データ生成時間を数秒程度に抑え，スケーラビリティを確保した。
- Fiaingenで学習したモデルは，現実世界のデータで学習したモデルに匹敵する性能を示す。
Link: https://arxiv.org/abs/2510.01169
命令型から宣言型へ：LLM対応OSインターフェースによるコンピュータ利用エージェントの性能向上 [cs.CL, cs.OS, cs.AI, cs.LG]目的：LLMを活用したコンピュータ利用エージェントの性能向上
- LLMによるコンピュータタスク自動化の可能性に着目し，その効率化が重要である。
- 従来のGUIはLLMにとって複雑で，タスク分解に多くのステップと誤りが生じやすい。
- GUIを宣言的なプリミティブに抽象化することで，LLMの負担を軽減し，タスク成功率を高める。
- 提案手法DMIを導入することで，Microsoft Office Suiteにおけるタスク成功率が67%向上した。
- DMIは，インタラクションステップ数を平均43.5%削減することに成功した。
- DMIを用いた場合，61%以上のタスクがLLMへの単一の呼び出しで完了した。
Link: https://arxiv.org/abs/2510.04607
RamPINN：埋め込まれた物理学を用いてコヒーレント反ストークススペクトルからラマンスペクトルを回復する [cs.LG]目的：コヒーレント反ストークス散乱（CARS）測定からのラマンスペクトルの回復
- 科学分野への深層学習の応用は進む一方，大規模データセットの不足が課題である。
- CARS測定において真のラマン信号は非共鳴背景によって抑制されるため，ラマンスペクトルの回復は逆問題として困難を極める。
- 物理法則に基づく誘導的バイアスを導入することで，データ不足下でもロバストな学習を可能にする。
- RamPINNは，デュアルデコーダアーキテクチャとKramers-Kronig因果関係を制約する損失関数を用いて，共鳴信号と非共鳴信号を分離する。
- 合成データのみで学習されたRamPINNは，実世界の実験データに対してゼロショット汎化性能を示し，既存手法を大きく上回った。
- 真のラマンスペクトルにアクセスすることなく，物理ベースの損失関数のみで学習しても，競争力のある結果が得られることが示された。
Link: https://arxiv.org/abs/2510.06020
ペア比較からのスコアベース密度推定 [cs.CL, cs.LG]目的：ペア比較による密度推定
- 専門家の知識抽出や人間のフィードバック学習において，密度推定は重要な役割を果たす。
- 限られた比較データから正確な密度推定を行うことは，依然として困難な課題である。
- ペア比較データから信頼性の高い密度推定手法を開発し，専門家の知識を学習すること。
- 好みの選択肢の周辺密度である「勝者密度」のスコアを学習することで，対象密度を推定する。
- 信念密度と勝者密度のスコアベクトルは，位置依存の緩和場によって結ばれていることが証明された。
- シミュレーション実験により，数百から数千のペア比較から複雑な多変量信念密度を学習できることが示された。
Link: https://arxiv.org/abs/2510.09146
LLMにおける相乗的テスト時適応 [cs.CL, cs.AI, cs.LG]目的：大規模言語モデルのテスト時適応手法
- LLMは専門分野での応用が拡大しており，その性能は重要である。
- 専門分野では，学習データとの分布のずれが課題となる。
- ラベルなしでテスト時にモデルを適応させ，分布ずれに対応する。
- SyTTAは，入力側のperplexityと出力側の予測エントロピーという二つの不確実性指標を活用する。
- 農業分野の質問応答タスクにおいて，Qwen-2.5-7BでRouge-LSumが120%以上向上した。
- ラベル付きデータが不足する分野でも，テスト時適応が有効であることを示した。
Link: https://arxiv.org/abs/2510.10223
プロンプトからパケットへ：ChatGPT，Copilot，Geminiにおけるネットワークからの視点 [cs.NI, cs.AI]目的：ChatGPT，Copilot，Geminiのネットワークトラフィック特性の分析
- 生成AIチャットボットはインターネット利用を大きく変えており，ネットワーク管理への影響を予測する必要がある。
- これらのチャットボットのトラフィック特性は未解明であり，ネットワーク需要の変化への対応が困難である。
- チャットボットのトラフィックパターンを明らかにし，ネットワーク管理への示唆を得ることを目指す。
- ChatGPT，Copilot，Geminiのトラフィックは，従来のメッセージングアプリとは異なる特徴を示すことが明らかになった。
- GeminiはQUICを多用し，ChatGPTはTLS 1.3のみを使用するなど，プロトコル利用に違いが見られた。
- SNIのマスキングはトラフィック分類性能を最大20%低下させ，SNIの重要性が示された。また，生成AIワークロードはネットワークに新たな負荷をもたらす。
Link: https://arxiv.org/abs/2510.11269
データ・プロンプト共進化：LLMの振る舞いを洗練するためのテストセットの成長 [cs.RO, cs.HC, cs.LG]目的：LLMの振る舞い改善のためのデータとプロンプトの同時進化
- LLMは様々な応用に組み込まれており，その振る舞いはプロンプト編集で制御可能である。
- 微妙なドメイン固有のポリシーをプロンプトに記述することは困難である。
- テストデータとプロンプトを同時に進化させることで，LLMの振る舞いをより適切に制御すること。
- 本研究では，テストケースとプロンプトを同時に進化させる新しいワークフローを提案した。
- インタラクティブなシステムを通じて，開発者はエッジケースを発見し，プロンプトを改善できる。
- ユーザー調査の結果，本ワークフローはプロンプトの系統的な洗練と，意図したポリシーとの整合性を高めることが示された。
Link: https://arxiv.org/abs/2510.12728
マルチトークン予測を超えて：将来の要約を用いたLLMの事前学習 [cs.LG, cs.AI]目的：将来の要約によるLLM事前学習
- 大規模言語モデルは自然言語処理の基盤であり，その性能向上は様々な応用を可能とする。
- 従来の学習方法では，長期的推論や創造的な文章生成が苦手であり，性能の限界があった。
- 長距離依存性を捉え，長文生成能力を向上させる新たな事前学習手法を開発すること。
- 将来の要約予測（FSP）は，従来の次トークン予測（NTP）やマルチトークン予測（MTP）と比較して，数学，推論，コーディングのベンチマークにおいて性能向上を示した。
- FSPは，手動で作成した要約と，逆言語モデルで学習した要約という2つのバリアントで実験され，どちらも有効であることが示された。
- FSPは，長文生成に必要な情報を保持し，より一貫性のある生成を可能にする。
Link: https://arxiv.org/abs/2510.14751
時間系列予測の一般化性能向上：概念ドリフトの緩和によるアプローチ [cs.LG]目的：時間系列予測における一般化性能の向上
- 実世界における様々な場面で時間系列予測が活用されているため，その重要性は高い。
- 時間系列データは変動的であり，分布の変化に対応できる予測モデルが求められている。
- 時間系列予測における概念ドリフトへの対応という，これまで十分な注意が払われていない課題を解決する。
- 提案手法ShifTSは，時間系列データに存在する時間的シフトと概念ドリフトを統一的に扱うフレームワークである。
- ShifTSは，まず時間的シフトを緩和し，次に概念ドリフトに対処することで，予測精度を向上させる。
- 複数のデータセットを用いた実験により，ShifTSが既存手法と比較して高い予測性能を示すことが確認された。
Link: https://arxiv.org/abs/2510.14814
高次元データの最適な販売方法 [cs.GT, cs.LG, econ.TH]目的：高次元データの販売における収益最大化メニューの設計
- データ取引市場の拡大に伴い，データの適切な価格設定が重要課題となっている。
- 買い手の選好が不明確な場合，売り手は最適なデータ製品を設計することが困難である。
- 買い手の選好が不明確でも，効率的なアルゴリズムを用いて収益を最大化することを目指す。
- 提案アルゴリズムは，状態空間へのサンプリングアクセスのみを用いて，ほぼ最適なメニューを生成できる。
- 高次元ガウスデータの場合，スカラーガウス実験のみを考慮すれば十分であることが示された。
- 買い手の潜在的な選好に関する分離条件が満たされる場合に限り，完全な余剰抽出が可能となる。
Link: https://arxiv.org/abs/2510.15214
SAG-Agent：動的知識グラフによる戦略ゲームにおける長期的推論の実現 [cs.AI]目的：戦略ゲームにおける長期的推論能力の向上
- ゲームAIの発展は，人間レベルの知能を持つエージェントの実現に不可欠である。
- APIがない環境下では，LLMベースのエージェントは効率が悪く，近視眼的な判断に陥りやすい。
- 過去の戦略経験を構造化し，効率的な探索と計画を可能にすることで，この問題を解決する。
- SAG-Agentは，GUI環境でのエージェントの経験を状態行動グラフ（SAG）として構造化する。
- グラフのトポロジーに基づいた報酬メカニズムにより，探索効率と戦略的深さを向上させる。
- Civilization VとSlay the Spireにおいて，最先端手法と比較して有意な改善が確認された。
Link: https://arxiv.org/abs/2510.15259
オフシム：モデルベースオフライン逆強化学習のためのオフラインシミュレータ [cs.LG, cs.AI]目的：モデルベースオフライン逆強化学習のための環境ダイナミクスと報酬構造のエミュレーション
- 強化学習の発展は，ロボット制御や自律システムの実現に不可欠である。
- 従来の強化学習は，シミュレータと報酬関数の設計に手間がかかるという課題があった。
- 本研究は，専門家の行動データから環境を学習し，報酬関数を推定することで，この課題を解決する。
- オフシムは，既存のオフライン逆強化学習手法と比較して，顕著な性能向上を達成した。
- 高エントロピーな遷移モデルと，逆強化学習に基づく報酬関数を同時に最適化することで，探索能力と汎化性能を向上させた。
- オフシム$^+$は，複数のデータセットを用いた設定において，更なる探索能力の向上を示した。
Link: https://arxiv.org/abs/2510.15495
多言語LLMウォーターマークは本当に多言語対応か？バック翻訳による100以上の言語への堅牢性の拡大 [cs.CL, cs.AI]目的：多言語LLM出力の追跡可能性
- LLMの利用拡大に伴い，生成されたテキストの真正性確保が重要になっている。
- 既存の多言語ウォーターマークは，資源が豊富な言語での評価に偏っている。
- 低資源言語における翻訳攻撃への脆弱性を克服し，公平なウォーターマークを実現する。
- 既存手法は，資源が少ない言語での翻訳攻撃に対して脆弱であることが判明した。
- STEAMは，ベイジアン最適化を用いて，ウォーターマーク強度を最適に回復するバック翻訳を探索する。
- STEAMはAUC平均で+0.23，TPR@1%で+37%の改善を示し，スケーラブルな多言語対応を可能にする。
Link: https://arxiv.org/abs/2510.18019
時間認識モデリングのためのマルチモーダルフレームワークMedM2T：電子カルテと心電図データ [cs.RO, eess.SY, cs.SY, cs.LG]目的：電子カルテと心電図データを用いた時間認識モデリング
- 医療データは多様な情報を含み，病状理解や予後予測に不可欠である。
- 医療データの時間構造は不均一であり，既存手法では効率的な処理が困難である。
- 異なる種類の医療データを統合し，時間情報を考慮した予測モデルを構築すること。
- MedM2Tは，不規則な時系列データや複数の密な時系列データを柔軟に処理できる。
- CVD予測において，AUROC 0.932，AUPRC 0.670を達成し，既存手法を上回る性能を示した。
- また，院内死亡率予測とICU滞在期間回帰においても高い予測精度が確認された。
Link: https://arxiv.org/abs/2510.27321
SigmaDock：フラグメントベースのSE(3)拡散による分子ドッキングの解きほぐし [eess.SY, cs.SY, cs.LG, q-bio.QM]目的：分子ドッキングにおけるリガンドの結合ポーズの決定
- 創薬において，リガンドとタンパク質の結合様子の予測は不可欠なプロセスである。
- 生成モデルは高速化に貢献するが，化学的に妥当でない結果や汎化性能の低さが課題となる。
- 本研究は，構造化学の知見に基づき，より信頼性の高い結合ポーズ生成を目指す。
- SigmaDockは，リガンドを剛体フラグメントに分解し，SE(3)リーマン拡散モデルを用いて再構築する。
- PoseBustersデータセットにおいて，RMSD<2ÅかつPB-validなTop-1成功率79.9%を達成し，既存の深層学習手法を上回る性能を示した。
- PB train-test分割において，従来の物理ベースドッキング手法を初めて上回り，深層学習の分子モデリングへの応用可能性を大きく広げた。
Link: https://arxiv.org/abs/2511.04854
ミクロ交通シミュレーションにおける動的ODマトリックス推定のための深層強化学習：クレジット配分を考慮 [cs.LG]目的：動的ODマトリックス推定の精度向上
- 交通シミュレーションの精度は都市計画や交通管理に不可欠であり，ODマトリックスはその中核をなす。
- 従来のODマトリックス推定は，車両挙動の複雑さから正確なクレジット配分が困難である。
- 深層強化学習を用いることで，クレジット配分問題を解決し，より高精度なODマトリックス推定を実現する。
- 提案手法は，従来の最高性能手法と比較して，平均二乗誤差を20%以上削減することを示した。
- DODE問題を逐次的な意思決定問題として再構成することで，学習されたポリシーを通じてクレジット配分問題に対処している。
- 本研究は，ミクロ交通シミュレーションの校正における新たな枠組みを提案する。
Link: https://arxiv.org/abs/2511.06229
QUARK：非線形演算における共通パターンを活用したTransformer加速のための量子化対応回路共有 [cs.LG, cs.AI]目的：Transformerモデルの非線形演算における共通パターンを利用した回路共有による高速化手法
- TransformerはCVやNLPで高性能を示すが，非線形演算が遅延の主要因である。
- 従来のハードウェアアクセラレータでは，非線形演算の効率的な処理が課題となっていた。
- 回路共有によりハードウェア資源を削減し，Transformerの推論速度を向上させる。
- QUARKは，Transformerモデルの全ての非線形演算を対象に，回路共有設計により高性能な近似を実現した。
- QUARKは，主流のTransformerアーキテクチャにおいて，非線形演算の計算オーバーヘッドを大幅に削減し，GPU実装と比較して最大1.96倍の高速化を達成した。
- QUARKは，従来の技術と比較して，非線形モジュールのハードウェアオーバーヘッドを50%以上削減し，高精度を維持しつつ，極低ビット量子化下では大幅な精度向上を実現した。
Link: https://arxiv.org/abs/2511.06767
5G NSA鉄道ネットワークにおける信頼性故障の早期警告：計測に基づく研究 [cs.NI, cs.LG, eess.SP]目的：5G NSA鉄道ネットワークにおける信頼性故障イベントの早期警告可能性の定量化
- 鉄道システムの安全性向上には，通信インフラの信頼性確保が不可欠である。
- 5G NSA鉄道環境における信頼性故障の予測は，そのリアルタイム性から課題が多い。
- 商用デバイスで利用可能な無線特徴量を用いた秒単位の信頼性予測の実現可能性を検証する。
- 計測データを用いたベンチマーク評価の結果，様々な学習モデルが信頼性故障を事前に予測できることが示された。
- 特に軽量な無線特徴量を用いることで，商用デバイスでの実用的な早期警告が可能となることが確認された。
- 本研究は，センシングを活用した通信制御や，将来の移動体制御への分析統合の基盤を提供する。
Link: https://arxiv.org/abs/2511.08851
CastMind：認知に着想を得た時間系列予測のためのインタラクション駆動型エージェント推論フレームワーク [cs.AI]目的：時間系列予測におけるエージェント推論フレームワーク
- 現実世界の多くの意思決定において，時間系列予測は重要な役割を果たす。
- 既存の手法は，予測を静的な回帰問題として扱うことが多く，人間の反復的な推論を模倣していない。
- 大規模言語モデルを活用し，人間のような反復的な推論プロセスを予測に導入することで精度向上を目指す。
- CastMindは，予測を専門家のようなプロセスとして再構築し，コンテキストの準備，推論に基づく生成，反省的な評価を含む多段階ワークフローを構成する。
- 特徴セット，知識ベース，事例ライブラリ，コンテキストプールを含む軽量ツールキットを開発し，LLMベースの推論を支援する。
- 複数のベンチマークにおける実験により，CastMindが代表的なベースラインよりも優れた性能を示すことが明らかになった。
Link: https://arxiv.org/abs/2511.08947
不確実性が安定性をもたらす：好奇心駆動型量子化混合エキスパート [cs.LG, cs.AI]目的：リソース制約のあるデバイスにおける深層ニューラルネットワークの精度維持と予測可能な推論遅延の確保
- 深層学習モデルの組み込みデバイスへの展開は，省電力化と高性能化の両立が重要である。
- 量子化によるモデル圧縮は精度低下を引き起こしやすく，推論時間の変動も課題となる。
- ベイズエピステミック不確実性に基づくルーティングで，精度と安定性を両立させることを目指す。
- 4ビット量子化において，フル精度モデルと同等のF1スコア（0.858 vs 0.859）を99.9%維持し，8ビット量子化と比較して4倍の圧縮と31%の省エネルギーを実現した。
- 好奇心駆動型ルーティングにより，QuinnデータセットでのF1スコアは0.802から0.809へと向上し，交差検証分散は85%減少した（p < 0.001）。
- 高精度な8ビットエキスパートは，最も不確実性の高いサンプルを自動的に受け取り，軽量なエキスパートが容易な入力を処理する自己組織化ルーティングを実現した。
Link: https://arxiv.org/abs/2511.11743
データに基づいた代理モデルによる原子力発電炉心シミュレーションの高度化 [cs.LG]目的：原子力発電炉心シミュレーションの高度化
- 再生可能エネルギーの拡大に対応するため，原子力発電所の柔軟性向上が喫緊の課題である。
- 従来のシミュレーションは計算コストが高く，迅速な運転支援が困難である。
- データ駆動型モデルを用いてシミュレーションの高速化と精度向上を目指す。
- データ駆動型代理モデルと物理情報に基づいたモデルは，複雑な動的特性を迅速に積分できることが示された。
- 提案手法は，最大1000倍の計算時間短縮を実現し，シミュレーション効率を大幅に向上させる。
- モデル予測制御（MPC）の性能改善に貢献し，運転支援システムの高度化を可能にする。
Link: https://arxiv.org/abs/2511.16148
Pharos-ESG：ESG報告書のマルチモーダル解析，文脈ナレーション，階層的ラベリングのためのフレームワーク [cs.AI]目的：ESG報告書の構造化された表現
- ESGは金融ガバナンスの基礎を再構築し，資本配分やリスク管理に影響を与えている。
- ESG報告書は，レイアウトの不規則性や構造の弱さから，大規模な理解が困難である。
- ESG報告書の解析を容易にし，金融研究のニーズに応えることを目指す。
- Pharos-ESGは，レイアウトフローに基づいた読書順序モデリング，目次をガイドとした階層認識セグメンテーション，視覚要素を自然言語に変換する多角的集約パイプラインを統合する。
- 実験の結果，Pharos-ESGは専用ドキュメント解析システムや汎用マルチモーダルモデルを上回る性能を示した。
- 中国本土，香港，米国市場のESG報告書からなる大規模なAurora-ESGデータセットを公開し，ESG統合を支援する。
Link: https://arxiv.org/abs/2511.16417
空間疫学シミュレーションのための報酬設計：個人の行動学習のための強化学習プラットフォーム [cs.LG, cs.AI, q-bio.PE]目的：空間疫学シミュレーションにおける体系的な報酬設計
- 感染症対策は社会の安定と経済活動に不可欠であり，効果的な戦略開発が求められている。
- 従来の行動モデルは固定ルールに依存するため，状況適応的な行動変化を捉えきれないという課題がある。
- 報酬設計を通じて，個人の生存戦略を学習させ，より現実的な疫学モデルを構築することを目指す。
- ContagionRLプラットフォームを開発し，多様な疫学シナリオ下で報酬設計が学習された生存戦略に与える影響を評価した。
- 疎な生存ボーナスからポテンシャルフィールドまで，5種類の報酬設計を比較し，方向性指示と明確な遵守インセンティブが重要であることが分かった。
- ポテンシャルフィールドを用いた報酬設計が，非薬物介入への遵守と空間回避戦略において優れた性能を発揮することが示された。
Link: https://arxiv.org/abs/2511.18000
エンジン間移植性を考慮したエンジン排気NOxモデルのベイズ較正 [cs.LG]目的：エンジン間移植性を持つエンジン排気NOxモデルのベイズ較正手法
- 排ガス規制の厳格化に伴い，エンジン排気NOxの正確な予測は，環境保全とエンジン性能最適化に不可欠である。
- 従来のモデルはエンジン数が限られたデータで訓練されるため，エンジン間のばらつきやセンサーバイアスにより，汎化性能が課題である。
- 本研究は，エンジン間のばらつきとセンサーの差異に対応し，再学習を最小限に抑えつつ，高精度なNOx予測を実現することを目指す。
- 提案手法は，ガウス過程と近似ベイズ計算を組み合わせたベイズ較正フレームワークであり，エンジン固有のセンサーバイアスを推定・補正する。
- 従来の非適応型ガウス過程モデルと比較して，提案手法はエンジン間移植性において有意に高い予測精度を達成した。
- 本手法により，エンジン間ばらつきを効果的に抑制し，モデルの汎化性能を向上させることが示された。
Link: https://arxiv.org/abs/2511.18178
拡散モデルの少数ステップ少数ショット画像生成のための統一的な蒸留と適応 [cs.CV, cs.AI]目的：拡散モデルにおける，新たなドメインへの高速かつ高品質な画像生成
- 拡散モデルは高品質な画像を生成するが，ドメイン適応時の計算コストが高いという課題がある。
- 蒸留された拡散モデルは高速化されるが，教師モデルのドメインに限定されやすい。
- ドメイン適応と蒸留を組み合わせた，単一の効率的なパイプラインの構築。
- Uni-DADは，拡散モデルの蒸留と適応を統合した単一段階パイプラインであり，2つの学習信号を利用する。
- 実験結果から，Uni-DADは最先端の適応手法と同等以上の品質を，4ステップ以下のサンプリングで実現した。
- 既存の二段階パイプラインと比較して，品質と多様性の両面で優れている場合が多い。
Link: https://arxiv.org/abs/2511.18281
微分摂動：モデルフリーな評価のための二重ワイルド再適合 [cs.LG, stat.ML]目的：経験的リスク最小化における過剰リスクの評価
- 機械学習モデルの性能評価は，実用的な応用において不可欠である。
- 複雑なモデル（深層ニューラルネットワーク等）の理論的な評価は困難である。
- モデルの構造に依存せず，過剰リスクの上限を効率的に推定する手法を開発する。
- 微分を確率的に摂動することで人工的な疑似データセットを生成し，それを用いてブラックボックス手順を二度再適合させる。
- これにより，基礎となる関数クラスのグローバルな構造に頼らず，過剰リスクの上限を導出できる。
- 本手法はモデルフリーであり，深層ニューラルネットワークや生成モデルの評価に有望である。
Link: https://arxiv.org/abs/2511.18789
潜在拡散反転には潜在空間の理解が必要である [cs.CL, cs.SI, cs.LG, cs.CV]目的：潜在拡散モデルにおける記憶化メカニズムの解明
- 生成モデルからの学習データ復元は，プライバシー保護の観点から重要である。
- 潜在拡散モデルは従来の反転手法に対して頑健であると考えられていた。
- 潜在空間における記憶化の偏りを特定し，プライバシーリスク軽減に貢献する。
- 拡散モデルは，デコーダpullback距離が高い潜在コード領域で過学習しやすいことが示された。
- 潜在コード内の表現次元によって記憶化への貢献度が異なり，次元ランキングにより特定可能である。
- 記憶化の少ない次元を除去することで，メンバーシップ推論の性能が向上し，プライバシー保護に繋がる。
Link: https://arxiv.org/abs/2511.20592
Tweedie離散拡散によるVLAモデルの汎化性能と詳細な制御の向上 [cs.RO, cs.AI, cs.CV, cs.LG]目的：VLAモデルにおける汎化性能と詳細な制御の向上
- ロボットの知能化において，視覚，言語，行動を統合するVLAモデルは重要な役割を担う。
- 既存のVLAシステムは，多様なタスクや環境，視点への汎化が難しく，粗雑で不安定な行動を示す場合がある。
- 行動生成を離散拡散過程として捉えることで，トークンベースの推論と詳細な行動制御を実現し，汎化性能を高める。
- E0は，行動生成を量子化された行動トークンに対する反復的なノイズ除去として定式化するTweedie離散拡散フレームワークである。
- 視点摂動によるデータ拡張により，追加データなしでカメラの移動に対するロバスト性を向上させる。
- LIBERO，VLABench，ManiSkill，実世界のFrankaアームを用いた実験で，14の多様な環境において最先端の性能を達成した。
Link: https://arxiv.org/abs/2511.21542
目標指向型マルチエージェント意味ネットワーク：意図，意味，知能の統合 [eess.SY, cs.SY, eess.SY, cs.SY, cs.NI, cs.AI]目的：6Gサービスにおける目標指向型，AIネイティブな通信の実現
- 6G通信は社会全体の変革とエネルギー持続可能性に貢献する可能性を秘めている
- 既存のネットワークアーキテクチャは，アプリケーションとネットワークの分離が完全であり，高レベルな目標を活かせない
- アプリケーションとネットワークの協調による，目標達成を重視した新しいアーキテクチャの提案
- GoAgentNetは，データ交換から目標達成へと通信を昇華させ，より効率的かつインテリジェントなサービスを実現する。
- ロボットの故障検知・回復のケーススタディでは，エネルギー効率が最大99％向上し，タスク成功率が最大72％向上した。
- GoAgentNetは，スケーラブルで持続可能な6Gシステムをサポートする可能性を示唆している。
Link: https://arxiv.org/abs/2512.01035
パネルからピクセルへ：生物医学文献からのズームイン型ビジョン言語事前学習 [cs.CV, cs.AI]目的：生物医学分野におけるビジョン言語モデルの事前学習データパイプラインの構築
- 生物医学分野では，画像とテキストを組み合わせた高度なモデルの需要が高まっている。
- 既存の事前学習は，図表の情報を粗く圧縮し，臨床医が重視する局所的な対応関係を失っている。
- 図表の階層構造を活用し，詳細な局所情報を保持した学習データの生成を目指す。
- 提案手法Panel2Patchは，図表，パネル，視覚的マーカーを解析し，階層的なビジョン言語ペアを構築する。
- これにより，論文全体や図表全体だけでなく，局所的な領域に焦点を当てた学習が可能となる。
- 少量のデータでも従来のパイプラインを上回る効果が得られ，高性能なモデルを効率的に学習できる。
Link: https://arxiv.org/abs/2512.02566
量子・古典物理学に基づくニューラルネットワークを用いた貯留層浸透方程式の解法 [cs.LG, cs.NA, math.NA, physics.comp-ph]目的：貯留層浸透方程式の解法
- 石油・ガス開発において，貯留層の流体挙動予測は生産量評価や最適化に不可欠である。
- 従来の数値シミュレーションは計算コストが高く，特に複雑な貯留層モデルでは課題となる。
- 量子計算と機械学習を融合し，高精度かつ効率的な解法を開発する。
- 離散変数回路量子・古典物理学情報ニューラルネットワーク（QCPINN）が，古典的PINNよりも高い予測精度を示すことが確認された。
- 特にAlternateトポロジーは，不均質単相流，Buckley-Leverett方程式，不均質二相流において優れた性能を発揮した。
- 本研究は，量子計算を貯留層工学に応用する可能性を示し，石油・ガス産業における実用化への道を開く。
Link: https://arxiv.org/abs/2512.03923
分割して基盤化：クエリタイプに応じた長編動画理解のためのフレーム選択の適応 [cs.CV, cs.AI, cs.LG]目的：長編動画理解におけるフレーム選択戦略
- 動画理解は，AI技術の重要な応用分野であり，様々なシーンで活用が期待されている。
- 長編動画は処理コストが高く，限られたコンテキスト長がボトルネックとなっている。
- クエリタイプに応じてフレーム選択戦略を適応することで，効率的な動画理解を目指す。
- 本研究では，クエリタイプを「全体クエリ」と「局所クエリ」に分類し，それぞれの特性に合わせたフレーム選択戦略の有効性を示した。
- 提案手法DIGは，全体クエリに対しては効率的な一様サンプリング，局所クエリに対してはクエリ関連フレーム抽出パイプラインを活用する。
- 実験結果から，DIGは既存手法を上回り，フレーム数を増やす場合でもLMMの性能を安定的に向上させることが確認された。
Link: https://arxiv.org/abs/2512.04000
協調的因果的意味形成：人間とAIの意思決定支援における相補性のギャップを埋める [cs.CL, cs.AI, cs.HC, cs.LG]目的：人間とAIの協調的な意思決定支援における相補性のギャップ
- 専門的な意思決定において，AIの活用は重要性が増している。人間の能力を拡張し，より良い結果をもたらす可能性を秘めている。
- 現在のAIエージェントは，回答エンジンとして設計されており，人間との協調的な意味形成を伴う意思決定プロセスに対応できていない。
- AIが人間のパートナーとして，因果構造を共有し，共に推論することで，より効果的な人間とAIのチームを構築することを目指す。
- 大規模言語モデルを用いたAIエージェントは，専門家の意思決定支援に活用されつつあるが，現状では必ずしも人間とAIの協働が人間の単独作業を上回る結果は得られていない。
- この課題を解決するために，協調的因果的意味形成（CCS）という研究アジェンダを提案する。これは，協調的な思考を促進する訓練環境，共有されたメンタルモデルの表現，信頼性と相補性に焦点を当てた評価を含む。
- 本研究は，単なる回答エンジンではなく，人間のパートナーとして共に推論するAIチームメイトの育成を目指し，人間とAIの協調的な意思決定を促進する。
Link: https://arxiv.org/abs/2512.07801
ODMA：LPDDRクラスアクセラレータにおけるLLMサービングのためのオンデマンドメモリ割り当て戦略 [cs.AR, cs.AI]目的：LLMサービングにおけるメモリ割り当て戦略の改善
- LLMの利用拡大に伴い，メモリ帯域幅の制約下での効率的な推論が重要となっている。
- LPDDRのようなランダムアクセス性能の低いメモリでは，従来のメモリ管理手法がボトルネックとなりやすい。
- LPDDR環境下で発生するメモリの断片化と帯域幅の制約を克服し，LLMサービングの効率を向上させる。
- ODMAは，生成長予測の精度向上により，KVキャッシュ利用率を最大19.25%改善した。
- AlpacaとGoogle-NQのベンチマークにおいて，予測精度がそれぞれ99.55%と93.36%に向上した。
- Cambricon MLU370-X4アクセラレータ上での評価で，スループット(TPS)が23-27%向上し，ODMAの有効性が示された。
Link: https://arxiv.org/abs/2512.09427
物理駆動による人間様ワーキングメモリが動的視覚においてデジタルネットワークを凌駕する [cs.ET, cs.AI, cs.CV, cs.NE]目的：動的視覚における人間様ワーキングメモリの性能向上
- AIのエネルギー消費増大に対し，物理駆動コンピューティングの重要性が高まっている。
- 従来のAIはデジタルメモリを使用し，動的環境下でノイズが蓄積しやすい。
- 熱緩和ダイナミクスを活用し，ノイズを内在可塑性として利用することで，高性能なワーキングメモリを実現する。
- 本研究で開発したIPNetは，動的視覚タスクにおいて，従来の空間的・時間的畳み込みモデルと比較してエラーを18倍削減した。
- IPNetは，メモリエネルギーオーバーヘッドを90,000倍以上削減し，効率的な動作を可能にした。
- 自動運転シミュレーションでは，IPNetは再帰型ネットワークと比較して予測エラーを12.4%低減した。
Link: https://arxiv.org/abs/2512.15829
敵対的生成推論器：敵対的強化学習によるLLM推論能力の向上 [cs.AI, cs.CL, cs.LG]目的：LLMの推論能力向上
- LLMは数学的推論に優れる一方，計算ミスや論理の脆弱性といった課題が存在し，実用化には改善が不可欠である。
- LLMは表面的にはもっともらしいが，実際には無効なステップを含む推論過程を犯しやすく，その改善が求められている。
- 敵対的強化学習を用いて，LLM推論器と識別器を共同進化させ，推論過程の質を向上させることを目指す。
- 提案手法は，数学的ベンチマークにおいて，既存の強化学習手法と比較して一貫した性能向上を示した。
- AIME24において，DeepSeek-R1-Distill-Qwen-7Bの正答率を54.0から61.3へ（+7.3），DeepSeek-R1-Distill-Llama-8Bを43.7から53.7へ（+10.0）向上させた。
- モジュール型の識別器により，教師蒸留や好みの整合性，数学的証明に基づく推論など，柔軟な報酬形状が可能となった。
Link: https://arxiv.org/abs/2512.16917