arXiv雑要約

AI - 2026/05/15 公開

幾何学的整合性に関する定量的なビデオ世界モデルの評価 [cs.CL, cs.CV, cs.AI]目的：生成ビデオの幾何学的整合性の評価手法
- ビデオ生成モデルは，物理世界の理解を深める上で重要であり，その評価は不可欠である。
- 既存の評価手法は主観的であり，幾何学的な問題点を明確に特定できない場合がある。
- 生成ビデオの3次元構造と運動における幾何学的な不整合を定量的に評価すること。
- PDI-Bench（Perspective Distortion Index）という定量的なフレームワークを開発し，生成ビデオの幾何学的整合性を評価した。
- PDIは，スケール・奥行きの一致，3次元運動の一貫性，3次元構造の剛性という３つの側面から幾何学的失敗を捉える。
- 最先端のビデオ生成モデルにおいて，PDIは一般的な知覚指標では捉えられない，幾何学的な失敗モードを明らかにした。
Link: https://arxiv.org/abs/2605.15185
VGGT-Edit：残差場予測によるネイティブ3Dシーン編集 [cs.CV, cs.AI]目的：テキスト条件付きのネイティブ3Dシーン編集手法
- 3Dシーン再構成は高度化し，汎用的な前方通過アーキテクチャが確立されつつある。
- 既存モデルは動的な指示への対応が弱く，インタラクティブなアプリケーションへの応用が制限される。
- 3D空間認識に基づいた，より安定した指示解釈と高精度な編集を実現する。
- VGGT-Editは，奥行き同期テキスト注入により，セマンティックガイダンスと空間ポーズを整合させる。
- 残差変換ヘッドは3D幾何学的変位を直接予測し，背景の安定性を保ちながらシーンを変形する。
- DeltaSceneデータセットを構築し，幾何学的精度と多視点一貫性を重視した多項目的関数でフレームワークを学習した。
Link: https://arxiv.org/abs/2605.15186
FutureSim：適応的エージェントの評価のための世界イベントの再現 [cs.LG, cs.AI, cs.CL]目的：適応的エージェントの能力評価
- AIエージェントは，動的な環境で適応能力が求められるため，その評価手法が重要である。
- 現実世界の複雑さを捉えた，エージェントの適応能力を効率的に測定する環境が不足している。
- 現実世界のイベントを再現し，長期的な適応能力を評価するベンチマーク環境を提供する。
- FutureSimは，現実のニュース記事と質問の解決を時系列で再現するシミュレーション環境である。
- 2026年1月から3月の世界イベント予測において，最良のエージェントの正解率は25%であった。
- FutureSimは，長期的適応，検索，記憶，不確実性の推論など，今後の研究方向を調査するための現実的な環境を提供する。
Link: https://arxiv.org/abs/2605.15188
RefDecoder：条件付きビデオデコードによる視覚生成の強化 [cs.CV, cs.LG]目的：視覚生成における詳細と一貫性の向上
- ビデオ生成技術は様々な応用を可能にする重要な研究分野である。
- 潜在拡散モデルではデコーダーが条件付けされていない場合が多く，詳細や一貫性が失われやすい。
- デコーダーにも条件付けを施すことで，構造的整合性を維持し，生成品質を向上させる。
- RefDecoderは，参照画像情報をデコードプロセスに直接注入する参照注意機構を導入したビデオVAEデコーダーである。
- 実験により，Inter4K，WebVid等のベンチマークで最大2.1dBのPSNR改善が確認された。
- 既存のビデオ生成システムに容易に組み込むことができ，VBench I2Vベンチマークでも全体的な品質が向上した。
Link: https://arxiv.org/abs/2605.15196
ATLAS：能動的か潜在的か？視覚的推論には単一の単語で十分 [cs.CV, cs.AI, cs.CL]目的：視覚的推論における能動的アプローチと潜在的アプローチの統合
- 視覚的推論は，AI分野において重要な研究テーマであり，複雑な問題を解決する可能性を秘めている。
- 既存の能動的推論は処理速度が遅く，潜在的推論は汎化性能が低いという課題があった。
- 単一のトークンを用いて，両者の利点を活かしつつ，それぞれの欠点を克服することを目指す。
- ATLASは，単一の機能トークンを用いて，視覚的操作を効率的に表現するフレームワークである。
- 実験の結果，ATLASは既存手法と比較して，難易度の高いベンチマークにおいて優れた性能を示した。
- LA-GRPOにより，強化学習における機能トークンの学習が安定し，解釈可能性も高い。
Link: https://arxiv.org/abs/2605.15198
EntityBench：長距離多ショット動画生成におけるエンティティ一貫性に向けて [cs.CV, cs.AI]目的：長距離多ショット動画生成におけるエンティティ（登場人物，物体，場所）の一貫性評価
- 動画生成技術は，エンターテインメントや教育など多岐にわたる分野で活用が期待されている。
- 既存の動画生成手法では，長編動画における登場人物や場所の一貫性を保つことが困難であった。
- エンティティのスケジュールに基づいた新しい評価ベンチマークと，エンティティ記憶を用いた生成手法を提案する。
- EntityBenchは，最大50ショット，13人の登場人物，8つの場所，22の物体を含む140エピソード，2491ショットから構成される。
- 既存手法では，登場回数が多いほど一貫性が低下する傾向が見られた。
- EntityMemは，エンティティの視覚的参照を記憶することで，既存手法よりも高い登場人物の再現性と存在感を示した。
Link: https://arxiv.org/abs/2605.15199
微分方程式と機械学習のためのスケーラブルなメカニスティックニューラルネットワーク [cs.LG, cs.NA, math.NA]目的：微分方程式と機械学習における長期時系列データへの対応
- 科学技術分野では，複雑な動的システムのモデル化が不可欠である。
- 従来のメカニスティックニューラルネットワークは計算コストが高いという課題がある。
- 長期時系列データに対応可能な効率的なモデルを開発すること。
- 提案手法S-MNNは，計算時間と空間複雑さを大幅に削減することに成功した。
- S-MNNは，元のMNNと同等の精度を維持しつつ，計算資源を大幅に削減する。
- S-MNNは，既存のMNNの代替として，複雑な動的システムのモデル化に貢献する。
Link: https://arxiv.org/abs/2410.06074
LLM量子化の幾何学：GPTQをBabaiの最近平面アルゴリズムとして [cs.LG, cs.DS, cs.IT, math.IT]目的：大規模言語モデルの量子化手法GPTQの数学的性質の解明
- 大規模言語モデルの利用拡大には，計算資源の効率化が不可欠であるため。
- GPTQは広く用いられるが，その動作原理は幾何学的な解釈が乏しく，理論的な保証も不明確である。
- GPTQの数学的等価性を示すことで，理論的な基盤を確立し，量子化アルゴリズムの改良を目指す。
- GPTQは，線形レイヤーにおいて，Babaiの最近平面アルゴリズムと数学的に等価であることが示された。
- この等価性により，GPTQのエラー伝播ステップの幾何学的解釈が可能になり，誤差の上限も導出された。
- 誤差上限を活用した量子化手法を設計し，オリジナルのGPTQを上回る性能を達成。効率的なGPU推論カーネルも提供する。
Link: https://arxiv.org/abs/2507.18553
静電式タッチスクリーンにおけるリスク：スマートフォンからの電磁波を利用した筆跡軌道の復元 [cs.CR, cs.AI]目的：スマートフォンから発せられる電磁波による筆跡軌道の復元
- タッチスクリーンは現代のスマートフォンにおける主要な入力手段であり，そのセキュリティは重要である。
- タッチスクリーンのセキュリティ脆弱性は，個人情報漏洩のリスクにつながる可能性がある。
- 本研究は，タッチスクリーンの電磁波から筆跡情報を盗み出す攻撃手法とその有効性を検証する。
- 提案手法TESLAは，タッチスクリーンから発生する電磁波を非接触で捕捉し，リアルタイムで筆跡軌道を復元する。
- 様々なスマートフォンを用いた評価により，77%の文字認識精度と0.74のジャカード指数を達成した。
- 本研究の結果は，タッチスクリーンのセキュリティ脆弱性とその対策の必要性を示唆している。
Link: https://arxiv.org/abs/2512.11484
Mambaベースの言語モデルに対する隠れ状態ポイズニング攻撃 [cs.CL, cs.AI, cs.LG]目的：Mambaベースの言語モデルにおける隠れ状態ポイズニング攻撃の現象
- 近年，Transformerに代わる効率的なモデルとしてSSMが注目されている。計算効率の高さから，多様な応用が期待される。
- SSMはTransformerと比較して，敵対的攻撃に対する脆弱性が十分に検討されていないという課題がある。
- 特定の入力によってSSMの隠れ状態が上書きされ，情報検索能力が低下する現象（HiSPA）を解明し，対策を検討する。
- 本研究では，SSMがHiSPAに対して脆弱であることを示す評価基盤RoBench-25を開発した。
- 最新のハイブリッドモデルJamba-1.7-Miniにおいても，特定のHiSPAトリガーによってRoBench-25での性能が著しく低下することを確認した。
- HiSPAトリガーは，JambaモデルのOpen-Prompt-Injectionsベンチマークにおける性能を低下させ，その傾向はTransformerには見られない。
Link: https://arxiv.org/abs/2601.01972
GAMBIT：マルチエージェントLLM集団における敵対的頑健性のための三つのモードベンチマーク [cs.CL, cs.AI, cs.LG, cs.MA]目的：マルチエージェントLLM集団における，欺瞞的なエージェントの検出能力評価
- マルチエージェントシステムはAIの協調的活用に不可欠であり，その信頼性確保が重要である。
- 既存の研究では，浅いタスクに限定され，適応的に戦略を進化させる敵対者への対策が不十分である。
- 本研究は，敵対者が戦略を進化させても検出可能な，より現実的なベンチマークを構築し，迅速な再校正手法を開発する。
- GAMBITベンチマークは，分布シフトに対するゼロショット検出，および少数のラベルサンプルでの再校正能力を評価する三つのモードを提供する。
- 進化的フレームワークに基づく適応型欺瞞エージェントは，高度な推論問題において，集団のタスク性能を低下させながら，ほぼ検出不可能な性能を示す。
- ゼロショット評価は，適応型敵対者に対して誤解を招く可能性があり，少数のサンプルでの適応能力には大きな差が見られた。
Link: https://arxiv.org/abs/2605.09027
F2 上での代数的オントロジー射影による LLM の論理的崩壊の制御 [cs.LG, cs.AI, cs.CL, cs.LO]目的：大規模言語モデルにおけるオントロジー関係の形式的な検証可能性
- 大規模言語モデルの推論能力向上には，知識表現の構造化が不可欠である。
- 現在の LLM では，論理的一貫性の維持が課題であり，特に高層で性能が低下する。
- LLM の内部表現における代数的構造を明らかにし，論理的崩壊を抑制する。
- 代数的オントロジー射影（AOP）により，未知の概念ペアに対するゼロショット包含精度が最大 93.33% を達成した。
- AOP はモデルの調整なしに，複数のモデルファミリーで一貫して 86.67% の精度を示した。
- Semantic Crystallisation (SC) は，F2 制約の充足度を定量化し，保留データなしにゼロショット精度を予測できる。
Link: https://arxiv.org/abs/2605.12968
意識としての特異な自己知識：相乗的情報フレームワーク [q-bio.NC, cs.AI]目的：意識の基準としての特異な自己知識
- 意識研究は，主観的な経験の理解を目指す，神経科学や哲学における重要な課題である。
- 既存の意識理論は，反例にさらされたり，明確な実証的予測を欠いたりする問題がある。
- 意識の形式的な特徴付けと，実証可能な予測の提示を通じて，意識の理解を深める。
- 本研究では，システムとそのサブシステム間の相乗的な情報が，意識の重要な要素であると提案する。
- このフレームワークは，意識とメタ認知を明確に区別し，既存の意識理論に対する反論に対処する。
- 麻酔やアルツハイマー病が相乗的情報処理を特異的に減少させるという最近の知見と一致する。
Link: https://arxiv.org/abs/2605.13884
物理に基づいた敵対的染色拡張：キャリブレーションされたカバレッジ保証付き [eess.IV, cs.CV, cs.LG]目的：病理組織モデルの展開における病院間での染色変動への対策
- 組織病理診断の精度向上は，医療の質の向上に不可欠である。
- 病院ごとに染色方法が異なり，モデルの汎化性能が低下する。
- 染色空間における敵対的拡張により，未知の染色状態へのロバスト性を高める。
- CASAは，Camelyon17-WILDSにおいて93.9%±1.6%のスライドレベル精度を達成した。
- 既存手法（HED-strong, RandStainNA, ERM）と比較して高い性能を示し，特に最悪グループの精度が優れていた。
- DKW不等式に基づいた予算設定により，カバレッジ保証を実現している。
Link: https://arxiv.org/abs/2605.13889
熱帯軸方向注意を用いた系統樹推論 [q-bio.PE, cs.LG]目的：系統樹推論のための新しいニューラル推論アーキテクチャ
- 生物の進化系統を理解するためには正確な系統樹が不可欠である。
- 従来の系統樹推論手法は計算コストが高い場合がある。
- 熱帯注意を用いることで，より効率的な系統樹推論を実現する。
- 熱帯軸方向注意は，従来のsoftmaxドット積注意をmax-plus演算子で置き換える。
- 実験結果から，提案モデルはBME誘導樹メトリクスにより近い距離行列を生成することが示された。
- このことは，熱帯注意がニューラル系統樹推論のための有用な幾何学的誘導バイアスであることを示唆する。
Link: https://arxiv.org/abs/2605.13894
注意機構に基づくクロスモーダル双線形融合によるマルチモーダル生存時間予測 [q-bio.QM, cs.LG]目的：患者レベルの生存時間予測
- がん治療において，患者の予後予測は治療方針決定に不可欠である。
- 既存手法では，複数のデータソースを十分に活用できていない場合がある。
- マルチモーダルデータを統合し，より精度の高い予後予測を実現すること。
- 本研究では，組織学的画像，RNA-seqデータ，臨床情報を統合する深層学習モデルを提案した。
- クロスモーダル双線形融合により，モダリティ間の条件付き相互作用を効率的にモデル化した。
- CHIMERAチャレンジデータセットにおいて，既存手法と比較して予測性能が向上した。
Link: https://arxiv.org/abs/2605.13897
特徴可視化がTRIBE v2から既知の皮質選択性を回復 [q-bio.NC, cs.LG]目的：脳エンコーダーモデルにおける特徴可視化による皮質選択性の解明
- 脳機能解明には，脳活動と計算モデルの対応関係を明らかにすることが重要である。
- 従来の予測精度評価では，モデルが脳の機能的組織を内在化しているかは不明確である。
- 特徴可視化を用いて，脳エンコーダーがどのように脳の機能を表現しているかを探る。
- 特徴可視化により，V1からV4にかけて空間スケールと特徴の複雑性が徐々に増大する過程が再現された。
- MT領域では静止画像のみの最適化にも関わらず，放射状の運動感覚パターンが生成された。
- FFAやPPA領域では，それぞれ顔のような特徴や直線的なパターンが再現され，特徴可視化が超刺激を生み出す可能性が示唆された。
Link: https://arxiv.org/abs/2605.13904
量子化された強化学習のための適応的重要性サンプリング [stat.ML, cs.AI, cs.LG]目的：大規模言語モデルの強化学習におけるロールアウト生成コストの課題解決
- 大規模言語モデルの学習には膨大な計算資源が必要であり，効率化が重要課題となっている。
- 低精度ロールアウトは計算コストを削減するが，学習データとの不一致が生じ，学習が不安定になる可能性がある。
- ロールアウトと学習の不一致によるバイアスを抑制しつつ，探索性を維持することを目指す。
- 適応的重要性サンプリング(AIS)は，重みの信頼性，発散の深刻度，分散の増幅を診断し，勾配の修正強度を調整する。
- AISはGRPOに統合され，LLaDA-8B-Instruct，Qwen3-8B，Qwen3.5-9Bを用いて数学的推論と計画のベンチマークで評価された。
- AISはBF16ベースラインと同等の性能を維持しつつ，FP8の1.5倍から2.76倍のロールアウト速度向上を実現した。
Link: https://arxiv.org/abs/2605.13907
拡散モデルのための共分散を考慮したサンプリング [stat.ML, cs.CV, cs.LG]目的：少ステップ領域における拡散モデルのピクセル空間サンプリング品質の向上
- 拡散モデルは画像生成などで高い性能を発揮するが，計算コストが大きい
- 少ステップサンプリングでは，平均値のみに依存するため品質が低下する
- 逆過程の共分散を明示的にモデル化することで，その問題を解決する
- 提案手法は，Tweedieの公式と効率的なフーリエ空間分解を組み合わせる
- DDIMの拡張として実装されており，計算コストの増加は小さい
- 既存の二次のサンプラーやaDDIMと比較して，同等の計算量で高品質なサンプルを生成する
Link: https://arxiv.org/abs/2605.13910
データ依存型最悪の場合の一般化限界に関する調査 [stat.ML, cs.LG]目的：深層ニューラルネットワークの汎化性能に関する理論的保証
- 深層学習の理論的基盤確立は，その実用性にもかかわらず未だ不十分である。
- 古典的な学習理論は，過剰パラメータ化されたモデルの汎化性能を説明できない。
- アルゴリズムが実際に探索するパラメータ空間に焦点を当て，より現実的な汎化限界を導く。
- 本調査論文は，データ依存型仮説集合へのPAC-Bayesian理論の拡張を整理する。
- 最適化軌跡の幾何学的・位相的記述子（フラクタル次元など）を用いた複雑度項の改良をまとめる。
- 情報理論的な項を安定性仮定に置き換えることで，汎化限界の導出を統一する。
Link: https://arxiv.org/abs/2605.13913
マルチスケール量子化：活性化分解による量子化ボトルの除去と効率的なLLM推論 [stat.ML, cs.AI, cs.LG]目的：大規模言語モデルの効率的な推論のための量子化フレームワーク
- 大規模言語モデルの推論速度向上は，AI技術の発展において不可欠である。
- 量子化後の逆量子化処理が，AIアクセラレータ上でボトルネックとなっている。
- 活性化分解により逆量子化処理を回避し，計算効率を改善することを目指す。
- マルチスケール量子化(MSD)は，重み/KVの逆量子化をGEMMのクリティカルパスから除去する。
- INT8重みでは2回のINT8分解により，実質的に16ビットの精度を達成する。
- MSDは，逆量子化によるVector-Cubeパイプラインの停滞を回避し，KVキャッシュのHBMトラフィックを最大2.5倍削減する。
Link: https://arxiv.org/abs/2605.13915
オンライン多重検定における後悔の視点 [stat.ML, cs.AI, cs.LG]目的：オンライン多重検定における加重後悔の導入と評価
- 自動化パイプラインの性能向上のためには，偽陽性と偽陰性のコストを考慮した適切な検定方法が不可欠である。
- 従来のオンライン多重検定は，偽発見率と統計的検出力を個別に評価するため，コストの非対称性を捉えられていない。
- 信号が少ない初期段階における閾値の枯渇による偽陰性を抑制し，全体的な後悔を最小化することを目指す。
- 加重後悔という新たな指標を導入し，厳密な偽発見率制御を行う決定論的検定手続きは，線形的な後悔ペナルティを被ることを証明した。
- 履歴を分離した摂動を加えることで，既存の検定手続きの閾値枯渇を抑制するDecoupled-OMT (DOMT)を提案した。
- DOMTは，定常環境下で安全性を維持し，非定常環境下ではオーダー最適に後悔を削減し，初期段階におけるコストを定量化した。
Link: https://arxiv.org/abs/2605.13916
ニューラルネットワークにおける量子に触発された古典アルゴリズムによる当たり宝くじの選定 [quant-ph, cs.LG, stat.ML]目的：ニューラルネットワークからの疎なサブネットワークの選定
- 機械学習の効率化が求められており，量子計算はその有力な手段となる。
- 大規模ネットワークにおける最適化は計算コストが高く，実用上の課題となっている。
- 最適化された確率分布に基づいた効率的なサンプリング手法を古典的に実現する。
- 提案アルゴリズムは，データ次元Dに対して多項式時間で動作し，指数関数的な計算コストを回避する。
- 数値シミュレーションにより，提案サンプラーが最適化された分布からの正確なサンプリングと同等の性能を示すことが確認された。
- 本研究は，量子ハードウェアなしで従来のコンピュータ上でも疎なサブネットワーク選択が古典的に可能となることを示唆する。
Link: https://arxiv.org/abs/2605.13979
ジャンプHMM駆動ヘストン暗黙ボラティリティによるアメリカンオプション価格決定 [q-fin.CP, cs.LG]目的：アメリカンオプションの合成価格決定手法
- 機械学習やリスク分析において，現実的なオプション価格データの必要性が高まっている。
- 暗黙ボラティリティはオプション価格から算出されるため，合成データ生成における循環依存性が課題となっていた。
- この研究は，構造モデルから暗黙ボラティリティを導き出し，上記循環依存性を解消することを目指す。
- ジャンプHMMと変形ヘストン過程を組み合わせることで，多資産価格パスと暗黙ボラティリティパスを生成するパイプラインを構築した。
- バイノミアル格子を用いたアメリカンオプション価格決定において，外部キャリブレーションなしにボラティリティスマイル，スキュー，タームストラクチャを再現することに成功した。
- 企業イベントがテスト時汎化誤差の主要な要因であり，カレンダー情報とセクター間連動性に基づく特徴量がその信号を回復することを確認した。
Link: https://arxiv.org/abs/2605.13998
後悔は共分散に等しい：確率的最適化のための閉形式特性付け [econ.EM, cs.LG, math.ST, stat.CO, stat.TH]目的：確率的最適化問題における後悔の定量化
- 意思決定における不確実性のコストを評価する上で重要であり，資源配分やリスク管理などに応用される。
- 従来の評価手法は計算コストが高く，大規模問題への適用が困難である。
- 後悔を効率的に定量化し，計算コストを削減するための新たな手法を確立すること。
- 後悔は，不確実なパラメータと最適決定の共分散に分解できることが証明された。
- 線形計画問題や二次計画問題においては，後悔は完全に共分散で表されることが示された。
- 共分散の推定は従来の評価手法に比べて大幅に高速であり，実用的な規模の問題にも適用可能である。
Link: https://arxiv.org/abs/2605.14019
言語モデルは脳と整合性があるか？予測スコアだけでは不十分 [q-bio.NC, cs.AI]目的：言語モデルと脳の整合性評価
- 言語処理の理解は，人間とAIのコミュニケーションを円滑にし，認知科学の発展に不可欠である。
- 言語モデルの脳との整合性評価は，モデルの解釈可能性と信頼性に課題を抱えている。
- 本研究は，厳密な基準を用いて言語モデルと脳の整合性を検証し，その限界を明らかにする。
- L-PACTフレームワークを用いて，言語モデルの予測，関係性，メカニズム除去，信頼性を評価した結果，現行の言語モデルはいずれも整合性基準を満たさなかった。
- 脳の活動パターンとモデルの表現を比較した結果，モデルの正当化された効果は，コントロールによって説明可能であった。
- 予測スコアのみでは，言語モデルが脳の言語処理を反映していると結論付けるには不十分である。
Link: https://arxiv.org/abs/2605.14025
Wahkon：統計的原理に基づいた深層RKHS重ね合わせネットワーク [stat.ME, cs.LG]目的：深層RKHS重ね合わせネットワーク
- 深層学習の予測性能は高いが，有限サンプルでの保証や不確実性の較正が課題である。
- RKHS法は保証を提供するが，高次元空間での適応性に難がある。
- 深層学習とRKHS法の利点を統合し，統計的厳密性を実現する。
- Wahkonは，Kolmogorovの重ね合わせ原理とRKHS正則化を統合した深層ネットワークである。
- Wahkonは，有限次元の表現定理を持ち，層ごとの複雑さを制御可能である。
- シミュレーションやシングルセルCITE-seqデータにおいて，既存手法を上回る性能を示した。
Link: https://arxiv.org/abs/2605.14041
発話を用いた早期パーキンソン病検出のためのベンチマーク [math.OC, cs.DM, eess.AS, cs.AI, cs.CL, cs.SD]目的：発話に基づく早期パーキンソン病検出の評価基準
- 早期パーキンソン病の早期発見は，患者の生活の質を向上させる上で重要である。
- 既存研究は，データセットや評価方法が異なり，結果の比較が困難であった。
- 公平かつ再現性のある評価を可能にするベンチマークを開発し，研究を促進すること。
- 提案するベンチマークは，研究者がアクセス可能なデータセットを用いて，公平な比較を可能にする。
- 3つの一般的な発話タスクと，異なる学習リソース設定で手法を評価する。
- データセット，集約レベル，性別，疾患段階による多次元評価により，詳細な比較と臨床応用を支援する。
Link: https://arxiv.org/abs/2605.14066
思考の連鎖における確信的集約：帰納的集約による推論 [stat.ML, cs.CL, cs.LG]目的：思考の連鎖推論における集約不確実性への対処
- 大規模言語モデルの推論能力向上は，複雑な問題解決に不可欠である。
- 思考の連鎖推論では，複数の推論経路の集約が重要だが，集約方法の不確実性が課題となる。
- 集約不確実性を制御し，確信的なエラー率を保証することで，より信頼性の高い推論を目指す。
- 帰納的集約手続きを導入し，推論経路の重み付け集約と棄権規則の較正を行うことで，確信的なエラー率の有限サンプル保証を実現した。
- スコア分離可能性が棄権による選択的精度の向上の鍵であり，較正データのみから精度向上を予測する閉形式表現を導出した。
- GSM8Kベンチマークで，5%未満の棄権で90.1%の選択的精度を達成し，多数決ベースラインの82%を上回った。
Link: https://arxiv.org/abs/2605.14098
連続的なものを離散化する：ベイズ推論のための平均シフト相互粒子系 [stat.ML, cs.LG, stat.CO]目的：確率分布に対する積分近似
- ベイズ推論は，不確実性下での意思決定において重要な役割を果たす。
- 正規化定数不明の密度関数からの積分計算は困難である。
- 標的分布との最大平均不一致（MMD）最小化による近似を目指す。
- 提案手法は，古典的な平均シフトアルゴリズムを拡張し，連続分布に対応する。
- 未知の正規化定数に依存しないMMD最小化のダイナミクスを確立した。
- 多峰性分布や高次元問題において，高速な収束性と良好な性能を示した。
Link: https://arxiv.org/abs/2605.14142
共形予測における公平性達成の負担 [math.CO, cs.DM, quant-ph, cs.CL, cs.DL, physics.atom-ph, stat.ML, cs.LG]目的：共形予測におけるグループ間でのカバレッジ歪みの定量化と，公平性の定義間のトレードオフ
- 共形予測は信頼性の高い予測を行う手法であり，医療や金融など，リスクが重要な分野での応用が期待されている。
- グループ間でスコア分布が異なると，単一の閾値でキャリブレーションを行うと，グループごとのカバレッジに歪みが生じる可能性がある。
- グループ間の量子分布の不均一性が，公平な予測を阻害する要因を明らかにし，その歪みを最小化する方法を探る。
- 単一の閾値によるキャリブレーションでは，グループ間カバレッジの歪みが避けられないことが理論的に示された。
- 公平性の定義であるEqualized CoverageとEqualized Set Sizeは，本質的にトレードオフの関係にあることが確認された。
- グループごとにポリシーを適用するか，それともグループを統合するかの選択は，カバレッジとセットサイズの歪みに影響することが定量的に示された。
Link: https://arxiv.org/abs/2605.14260
モーメント一致によるスコア平滑化を通じた学習不要生成サンプリング [stat.ML, cs.LG]目的：拡散モデルにおける学習不要サンプリング手法の開発
- 拡散モデルは高品質なサンプル生成が可能だが，学習に膨大な計算資源が必要となる。
- 従来のスコア関数推定はノイズの影響を受けやすく，生成品質の安定性が課題である。
- モーメント一致によるスコア平滑化によって，学習不要で高品質なサンプリングを実現する。
- 提案手法MM-SOLDは，オーバーダンピング Langevinダイナミクスにモーメント一致によるスコア平滑化を導入する。
- 多数の粒子数において，生成される粒子の密度分布がギブス・ボルツマン分布に収束することが理論的に示された。
- 2次元分布や潜在空間画像生成実験により，MM-SOLDがCPU上で高速かつロバストなサンプリングを可能にし，ニューラル拡散モデルに匹敵する性能を示すことが確認された。
Link: https://arxiv.org/abs/2605.14276
拡散強制による統一的かつ堅牢なデータ同化 [eess.IV, cs.LG]目的：データ同化手法の統一とロバスト性の向上
- 科学シミュレーションや気象・気候科学において，データ同化は不可欠な技術である。
- 従来のフィルタリング法は，非マルコフ性のある観測データに対して誤差が蓄積しやすいという課題がある。
- 本研究は，長期的な時間依存性を捉え，誤差の蓄積を軽減するデータ同化手法を提案する。
- 拡散強制を用いたForcingDASは，フレーム間の遷移モデルではなく，共同軌道事前分布を学習する。
- これにより，フィルタリングからスムージングまでの全スペクトルを単一のモデルで網羅し，再学習を不要とする。
- 2次元ナビエ・ストークス渦度，降水予測，地球大気状態推定の実験で，既存手法と同等以上の性能を示した。
Link: https://arxiv.org/abs/2605.14285
アナログRFコンピューティング：MU-MIMOシステムを用いた省エネルギーエッジAIの新たなパラダイム [eess.SP, cs.AI, cs.ET, cs.IT, cs.LG, math.IT]目的：省エネルギーエッジAIを実現するためのアナログRFコンピューティングの物理層設計
- エッジデバイスにおけるAI処理の需要増加に伴い，低消費電力な演算手法が求められている。
- 従来のデジタルコンピューティングでは，エッジ推論に多大なメモリとエネルギーを消費する。
- アナログRFコンピューティングによる，通信と演算を融合した物理層設計により，消費電力の大幅な削減を目指す。
- 本研究で提案する設計は，クライアント及び層ごとに推論精度を制御可能である。
- シミュレーション結果から，アナログRFコンピューティングはデジタルコンピューティングと比較して，クライアント側のエネルギー消費をほぼ2桁削減できることが示された。
- 混合精度推論は，均一精度推論よりもさらに低いエネルギー消費で済むことが確認された。
Link: https://arxiv.org/abs/2605.14331
ニューラル再パラメータ化全波形反転におけるニューラル感度カーネルと波動接線カーネルの解明 [physics.geo-ph, cs.AI, physics.comp-ph]目的：ニューラル再パラメータ化全波形反転の収束性に関する理論的分析
- 地下構造探査において，高精度なモデル推定は不可欠であり，全波形反転はその有力な手法の一つである。
- 従来の全波形反転は，初期モデル依存性が高く，高品質なデータが必要とされるという課題がある。
- ニューラルネットワークを活用することで，初期モデルへの依存性を軽減し，収束性を向上させることを目指す。
- ニューラル感度カーネルと波動接線カーネルを導入し，ニューラル再パラメータ化全波形反転の収束性を理論的に分析した。
- ニューラル接線カーネルが，従来の感度カーネルと波動接線カーネルを適応的に調整し，スペクトルフィルタリング効果や勾配波数変調，波周波数バイアスを引き起こすことを示した。
- これらの知見に基づき，ニューラル感度カーネルと波動接線カーネルの固有構造を調整することで，反転性能と効率を改善する手法を提案し，地震探査と医療画像処理への応用を実証した。
Link: https://arxiv.org/abs/2605.14370
多衛星降水推定のためのプラグアンドプレイ型生成フレームワーク [physics.ao-ph, cs.AI]目的：多衛星降水推定のための拡張可能かつ効率的なフレームワーク
- 災害軽減，水資源管理，農業判断において，信頼性の高い降水モニタリングが不可欠である。
- 既存手法は計算効率が悪く，深層学習モデルは新たなセンサーの組み込みに再学習が必要となる。
- 新たなセンサーを組み込んでも再学習が不要な，効率的で拡張性の高いフレームワークを開発する。
- PRISMAは，IMERG Finalデータから無条件の降水事前分布を学習し，センサー固有の条件分岐で制約する。
- FY-4B AGRI赤外とGPM GMIマイクロ波データへの適用により，Critical Success Indexが最大40.3%向上，RMSEが22.6%削減された。
- 中国全土での雨量計検証と台風事例研究により，マイクロ波による条件付けが降水構造を改善することが確認された。
Link: https://arxiv.org/abs/2605.14426
大規模次元カーネルリッジ回帰：積カーネルへの拡張 [stat.ML, cs.LG]目的：大規模次元カーネルにおける汎化誤差の収束率
- 機械学習において，カーネル法は非線形な関係を捉える強力な手法であり，その理論的理解が重要である。
- 従来のカーネルリッジ回帰の理論は，特定のカーネルや仮定に依存しており，より広範な状況への適用が課題となっていた。
- 本研究は，より一般的なカーネルに対し，大規模次元におけるカーネルリッジ回帰の理論的性質を明らかにすることを目的とする。
- 内積カーネルで確認されたminimax最適性，飽和効果，周期的なプラトー現象，複数下降現象が，より広範なカーネルにおいても確認された。
- 源条件s≤1の場合，minimax最適性が達成されることが示された。
- s>1の場合，飽和効果が確認された。サンプルサイズnに関して，複数下降挙動が認められた。
Link: https://arxiv.org/abs/2605.14524
逐次特徴回復からのスケーリング則：解ける階層モデル [stat.ML, cs.LG, math.PR, math.ST, stat.TH]目的：多層ネットワークにおける特徴学習からのスケーリング則の創発メカニズム
- 深層学習の性能向上のためには，モデルのスケール拡大が重要であり，その理論的理解が不可欠である。
- 従来の解析では，深層学習におけるスケーリング則の明確な説明が難しく，経験則に頼る部分が大きかった。
- 潜在的な構成的特徴を持つ高次元階層的ターゲットにおける特徴学習過程を解析し，スケーリング則の起源を解明する。
- 提案手法は，従来の浅い非適応的な手法と比較して，スケーリング性能が向上し，潜在的な方向を逐次的に回復することが示された。
- 特徴ごとの回復閾値が明確に示され，これらの遷移を集約することで，予測誤差のべき乗則的な減衰が導き出された。
- 数値実験により，予測される逐次回復，閾値の有限サイズ平滑化，非階層的カーネルベースラインからの分離が確認された。
Link: https://arxiv.org/abs/2605.14567
タンパク質溶媒和のための全原子ニューラルポテンシャル [physics.chem-ph, cs.LG]目的：タンパク質溶媒和の計算精度向上
- タンパク質の構造と機能理解には，溶媒和エネルギーの正確な計算が不可欠である。
- 暗黙的溶媒モデルは計算コストが低いが，明示的モデルと比較して精度が劣ることが課題である。
- ニューラルポテンシャルを活用し，データ効率を最大化することで，汎用性の高い溶媒和モデルを開発する。
- PHNNは，従来の解析的手法と比較して計算精度が向上することを示した。
- PHNNは，ドメイン外のタンパク質システムに対しても予測精度を維持することが確認された。
- PHNNは，データに組み込まれた物理的知識を活用することで，データ効率を最大化している。
Link: https://arxiv.org/abs/2605.14584
ニューラルネットワークによる確率的多重経路巡回セールスマン問題のスケーラブルな解法 [math.OC, cs.LG]目的：確率的多重経路巡回セールスマン問題の解法
- スマートシティやシティロジスティクスにおける車両経路最適化の重要性が高まっている。
- 経路間の移動時間には不確実性が伴い，従来の解法では計算負荷が大きい。
- ニューラルネットワークを用いて不確実性を効率的に考慮し，問題をスケーラブルに解く。
- ニューラルネットワークを代理モデルとして統合することで，計算時間を大幅に削減できた。
- 提案手法は，計算時間，解の質，汎化能力の面で良好な結果を示した。
- 複雑な車両経路問題における不確実性下での実用的な適用可能性が示唆された。
Link: https://arxiv.org/abs/2605.14662
材料科学応用のための自己研究による組成記述子の設計 [cond-mat.mtrl-sci, cs.AI]目的：材料特性予測のための入力記述子設計
- 材料開発において，より高精度な特性予測は，効率的な材料探索に不可欠である。
- 既存の記述子は，汎用的であるため，特定のタスクに対する最適化が困難である。
- 自己研究エージェントを用いて，タスクに特化した記述子を自動的に設計し，予測精度を向上させる。
- 自己研究フレームワークAutomatにより，化学式からのみ記述子を生成し，バンドギャップとキュリー温度の予測精度が向上した。
- Automatは，従来の記述子である分数組成，Magpie，およびそれらの組み合わせよりも優れた性能を示した。
- 生成された記述子は化学的に解釈可能であり，手動による特徴量エンジニアリングの必要性を低減する可能性が示された。
Link: https://arxiv.org/abs/2605.14671
AI支援を超えて：宇宙論における自律的な発見へ [quant-ph, cs.DB, astro-ph.IM, astro-ph.CO, cs.AI]目的：宇宙論における自律的な発見
- 宇宙論は，宇宙の起源や構造を解明する上で重要な分野である。
- 従来のデータ解析は，人間の専門知識に依存しており，効率性に限界があった。
- AIを活用し，人間の介入を減らした自律的なデータ解析を実現する。
- AIエージェントシステムCMBEvolveは，弱重力レンズマップの分布外検出において，コード進化を通じてベンチマークスコアを向上させた。
- CosmoEvolveは，ACT DR6データの自律的な解析を行い，非自明なペア依存性およびスケール依存性を示した。
- 宇宙論は，AI科学者システムの開発において，制御されたベンチマークタスクと現実的な研究問題の両方を提供する。
Link: https://arxiv.org/abs/2605.14791
K-モデル：順序クラスタリングのための柔軟かつ解釈可能な手法 - 抗原抗体相互作用プロファイルへの応用 [stat.ML, cs.LG, stat.ME]目的：順序制約を組み込み，機能的プロファイルを生成するランダムプロセスの基盤要素推定
- 機能性データ解析におけるクラスタリングは，データの本質を理解する上で重要な役割を担う。
- 既存手法は精度を優先し，クラスタ間の順序関係に着目した解釈が困難な場合がある。
- 順序構造を考慮したクラスタリングにより，データの本質的なパターンを抽出することを目指す。
- K-モデルは，順序制約を統合することで，解釈可能性と構造識別の両者を向上させる。
- シミュレーションと実データへの適用により，提案手法の有効性が確認された。
- 特に，抗原抗体結合などのバイオモレキュラー相互作用をモニタリングするROI曲線データセットで優れた性能を示した。
Link: https://arxiv.org/abs/2605.14828
ニューラルネットワーク訓練のための非単調事前条件付きトラスト領域法 [eess.SP, cs.SY, eess.SY, math.OC, cs.LG]目的：ニューラルネットワーク訓練における効率化
- 大規模ニューラルネットワークの学習は，計算資源の制約から並列化が重要である。
- 既存手法では，効率的な並列化と精度維持が課題となっていた。
- 粗視点方向のステップを有効活用し，学習時間の短縮を目指す。
- 提案手法（NAPTS）は，既存手法（APTS）と同等の精度を維持する。
- CPU時間を約30％削減し，却下されるステップ数を大幅に減少させる。
- 非単調性許容により，有効な粗視点ステップの棄却を防ぐ。
Link: https://arxiv.org/abs/2605.14860
動的時間ワーピングとRDWT駆動深層ニューラルフレームワークを用いた眼球反応時間評価のためのBCI [eess.SP, cs.HC, cs.LG]目的：軽度外傷性脳損傷における眼球反応時間の推定
- 軽度外傷性脳損傷は診断が困難であり，早期発見が重要である。
- 眼球運動機能不全は軽度外傷性脳損傷の指標となるが，定量的な評価が難しい。
- 脳波と拡張現実に基づく検査を統合し，個人に合わせた眼球反応時間を推定する。
- 脳波信号のRDWT変換によるフィルタリングが，ノイズ除去に有効であることが示された。
- 動的時間ワーピングによって，眼球運動タスク間の個人差が有意に認められた。
- 特に追跡タスクは，タイミングの違いを識別する上で有用であることが示唆された。
Link: https://arxiv.org/abs/2605.14883
ニューラルネットワークエミュレータによるプラズマ形状制御のためのリアルタイム仮想回路 [physics.plasm-ph, cs.LG]目的：プラズマ形状制御のためのリアルタイム仮想回路の構築
- 核融合プラズマの安定制御は，エネルギー生成への応用において不可欠である。
- 従来の仮想回路計算はリアルタイム処理が困難であり，プラズマ状態の変化に対応できない。
- ニューラルネットワークを用いてリアルタイムで仮想回路を生成し，プラズマ制御の精度向上を目指す。
- ニューラルネットワークエミュレータは，プラズマ形状パラメータの微分可能な関数を高速に計算できる。
- エミュレートされた仮想回路は，様々なプラズマ状態において高い精度と直交性を示すことが検証された。
- 本研究は，事前に計算された仮想回路のスケジュールに代わる，スケーラブルで汎用的な手法の物理的妥当性を確立した。
Link: https://arxiv.org/abs/2605.14939
nASR：リアルタイムBCIのためのチャネルレベル脳波アーチファクト部分空間再構成用ニューラル層 [eess.SP, cs.HC, cs.LG]目的：脳波信号からアーチファクトを除去し，下流のデコーディングを最適化すること。
- 脳波信号はノイズに弱く，有用な神経情報を抽出することが課題である。BCIの性能向上には，ノイズ除去が不可欠である。
- 従来のアーチファクト除去手法は，閾値設定が難しく，有用な神経情報を除去してしまう可能性がある。
- 本研究では，チャネルレベルでの再構成により，神経情報の損失を抑制し，リアルタイムBCIへの応用を目指す。
- 提案手法nASRは，従来のASRと比較して，テスト分類指標において一貫して優れた性能を示した。
- nASRは，推論時間を6-8倍削減し，低遅延かつ高精度なリアルタイムBCIへの応用可能性を示した。
- nASRは，アーチファクト検出と下流デコーディングを同時に最適化する，学習可能なニューラル層である。
Link: https://arxiv.org/abs/2605.14941
IRS支援ミリ波MIMOにおける効率的なチャネル推定のためのマルチブロックアテンション [quant-ph, cs.NI, eess.SP, cs.LG]目的：IRS支援ミリ波MIMOシステムにおける効率的なカスケードチャネル推定
- ミリ波MIMOは高速大容量通信を実現する技術として重要である。その性能を最大限に引き出すには，正確なチャネル推定が不可欠である。
- IRSは受動素子であるためチャネル推定が困難であり，大規模展開ではパイロットオーバーヘッドが増大する。
- IRS支援ミリ波MIMOシステムにおけるパイロットオーバーヘッドを削減し，高精度なチャネル推定を実現すること。
- 提案手法であるMBAは，パイロットオーバーヘッドを最大87%削減することを示した。
- 10dBのSNRにおいて，提案手法は既存手法と比較して約51%低いNMSEを達成した。
- MBAは低い計算複雑度を維持し，様々な伝搬環境に適応できる。
Link: https://arxiv.org/abs/2605.15032
カーネル回帰における平均勾配外積が，多重指数モデルにおいて中心部分空間を確実に復元する [stat.ML, cs.LG, math.ST, stat.TH]目的：多重指数多項式における中心部分空間の復元
- データ構造の低次元化は，機械学習において重要な役割を果たす。
- 高次元データにおいて，重要な情報を保持する部分空間の特定が困難である。
- 少ないサンプル数で中心部分空間を復元し，表現学習の効率化を目指す。
- 平均勾配外積（AGOP）のトップr次元固有空間が，中心部分空間を確実に復元することが示された。
- 予測誤差が大きい場合でも，中心部分空間の復元が可能であることが証明された。
- 予測と表現学習の分離を示し，Recursive Feature Machines(RFM)のサンプル効率性の理由を説明する。
Link: https://arxiv.org/abs/2605.15082
データから行動へ：AIによる精製所最適化の加速 [stat.ML, cs.LG, stat.AP, stat.ME]目的：精製所最適化におけるAI活用
- 精製所は，エネルギー供給において重要な役割を担うため，効率的な運用が不可欠である。
- 既存の最適化手法では，モデルの簡略化やデータ誤りにより，結果への信頼性が課題となっていた。
- 過去データと現在の計画を比較することで，最適化結果の信頼性を高め，意思決定を支援すること。
- AI異常検知手法と線形計画法を組み合わせることで，精製所のスケジューリングと計画におけるビジネス機会とデータ誤りを明らかにすることができた。
- 高次元データの扱いに有効な，情報量の多いペアを選択する新しい手法が提案された。
- ECOD手法を応用し，2次元異常検知アルゴリズムと組み合わせることで，より効果的な分析が可能となった。
Link: https://arxiv.org/abs/2605.15085