arXiv雑要約
AI - 2026/05/14 公開
最適制御におけるエントロピー正則化の統合:反復ソフトポリシーと経路積分解による古典的な目的関数との往復 [math.OC, cs.LG, cs.RO, cs.SY, eess.SY]目的:最適制御における様々な定式化のエントロピー正則化に関する統一的な視点
- 最適制御は,ロボット工学や経済学など,様々な分野で重要な役割を果たす
- 従来の最適制御手法では,複雑な問題に対して計算困難となる場合が多い
- エントロピー正則化により,複雑な問題を扱いやすくし,計算効率を向上させる
- 本研究では,ポリシーと遷移に対するKLペナルティを独立した重みで扱うことで,様々な制御問題を統一的に表現できることを示した。
- この定式化は,従来の確率的最適制御やリスク感応的確率的最適制御を含むだけでなく,それらのソフトポリシー版も包含する。
- ソフトポリシー定式化は元の問題を上限で近似し,反復計算により元の目的関数を回復できることが示された。
強化学習によるホログラフィックエントロピーコーンの探索 [hep-th, cs.LG, quant-ph]目的:ホログラフィックエントロピーコーンの研究
- 量子情報理論の基礎であり,ブラックホールの情報パラドックスなどへの示唆を与える重要な分野である。
- ホログラフィックエントロピーコーンの形状が完全には解明されておらず,高次元での構造推定が課題である。
- 強化学習を用いて,ホログラフィックエントロピーコーンの境界や極端な点を探索し,その構造を明らかにする。
- 強化学習アルゴリズムは,$\sf N=3$コーンにおいて,ホログラフィックエントロピーコーン外のターゲットベクトルから,相互情報の一意性が再現できることを確認した。
- $\sf N=6$コーンにおいて,3つの「ミステリー」な極端な線に対してグラフ実現を発見し,それらがコーンの極端な線であることを証明した。
- 残りの3つの線については実現不可能である可能性を示唆しており,$\sf N=6$に対する未知のホログラフィック不等式が存在する可能性がある。
RAG-GNN:精密医療のためのグラフニューラルネットワークと取得知識の統合 [q-bio.MN, cs.AI, cs.LG]目的:精密医療における機能的クラスタリングの改善
- ネットワークトポロジーは構造予測に優れるが,生物医学文献に埋め込まれた機能的意味を捉えられない。
- 既存のグラフニューラルネットワークは,文献由来の知識を活用できていない点が課題である。
- グラフニューラルネットワークと取得知識を統合し,機能的クラスタリングの精度向上を目指す。
- RAG-GNNは,シルエット係数を-0.237から-0.144へと改善し,機能的クラスタリング性能を向上させた。
- 学習された検索の精度@10は0.242であり,ランダムベースラインの0.096と比較して152%の改善を示した。
- トポロジーと検索は圧倒的に共有情報(95.6%)を符号化し,検索はクラスタ内凝集性と合意を改善した。
ニューラルネットワークを用いた拡散過程におけるドリフト関数のプラグイン分類 [stat.ML, cs.LG, math.ST, stat.TH]目的:拡散過程のドリフト関数に基づく多クラス分類
- 拡散過程は物理,生物,金融など広範な分野でモデルとして利用され,その理解は重要である。
- 観測データからドリフト関数を正確に推定することは困難であり,分類精度に影響を与える。
- ニューラルネットワークを用いたドリフト関数の推定と,それに基づく分類精度の向上を目指す。
- 提案手法は,ドリフト関数の推定誤差,時間離散化,次元の寄与を明確にした収束レートを確立した。
- 拡散過程の構造を利用することで,従来の軌道ベースのニューラル分類器よりも優れた分類性能が期待できる。
- 数値実験の結果,提案手法は既存手法と比較して,特に高次元において良好な分類性能を示した。
EHR基盤モデルに対する効率的な生成予測:SCOPEとREACH推定器 [stat.ML, cs.LG]目的:EHR基盤モデルにおける臨床アウトカム予測の効率化
- EHRデータは医療の質の向上に不可欠であり,その有効活用が重要視されている。
- 既存手法は計算コストが高く,希少なイベントの予測精度が課題となっていた。
- モンテカルロ法に代わる,効率的かつ高精度なアウトカム予測手法を開発すること。
- 提案手法(SCOPEとREACH)は,モンテカルロ法と同等の精度を,大幅な計算量削減で実現した。
- REACHは,あらゆるモデルとアウトカムに対し,モンテカルロ法よりも分散を低減することを保証する。
- SCOPEは,複数のアウトカムに対して再利用可能なサンプルプールを用いることで,さらなる効率化を可能にする。
拡散モデルの汎化性能は,データ依存のリッジ多様体への誘導的バイアスによって特徴付けられる [stat.ML, cs.LG, cs.NA, math.NA, math.PR]目的:拡散モデルの汎化性能に関する考察
- 機械学習モデルの汎化性能評価は,未知データへの適応能力を測る上で重要である。
- 拡散モデルにおいて,訓練データ以外の領域における生成サンプルの分布が不明確である。
- データ分布の幾何学的構造と拡散モデルの生成過程の関係を明らかにすること。
- 生成サンプルは,まずリッジ多様体の近傍に入り,その後,訓練誤差の法成分によってリッジからの距離が制御される。
- リッジ上での運動は,誤差の接成分によって制御され,このメカニズムを「reach-align-slide」と呼ぶ。
- 学習された誤差の方向分解を通して,この幾何学的構造と学習ダイナミクスとの関連性が示された。
欠損値補完における分布シフト:リスクに基づく視点とMAR下での重要度重み補正 [stat.ML, cs.LG]目的:欠損値補完モデル学習における平均二乗誤差リスクの最小化
- 機械学習において,欠損値は頻繁に発生し,データ分析の精度に大きく影響する
- 既存の補完手法は,欠損メカニズムがデータに依存する場合の分布シフトを考慮していない
- 分布シフトを明示的に考慮した新たな補完アルゴリズムを開発し,リスクを最小化する
- 提案手法は,観測データから欠損値補完モデルを学習する際に,分布シフトを明示的に考慮する
- シミュレーション研究により,提案手法は既存手法と比較して,RMSEが平均3%減少し,Wasserstein距離が7%減少することが示された
- 本研究は,欠損値補完における分布シフトの影響を定量的に評価し,リスクに基づいた補正手法の有効性を示す
ドメイン横断型乳児泣き声分類のためのLMUベースの逐次学習と事後アンサンブル融合 [eess.AS, cs.LG, cs.SD]目的:乳児泣き声のドメイン横断型分類
- 乳児の健康モニタリングにおいて,泣き声は重要な情報源である。
- 泣き声信号は短く非定常であり,注釈データが限られ,個人差やデータセット間の差異が大きい。
- 異なるデータセット間での汎化性能向上と,リアルタイム処理の実現を目指す。
- 提案手法は,MFCC,STFT,F0特徴量をCNNエンコーダで融合し,LMUを用いて時間的変化をモデル化する。
- LMUはLSTMと比較して,少ないパラメータで安定した系列モデリングを可能にする。
- 事後アンサンブル融合により,ドメイン固有の知識を保持しつつ,データセット間のバイアスを軽減することで,ドメイン横断評価におけるF1スコアを改善した。
浅いチャネル回路で準備された混合状態の学習と生成 [quant-ph, cond-mat.stat-mech, cs.CC, cs.LG]目的:有限次元格子上の混合状態生成の学習
- 量子情報科学において,状態学習は重要な課題であり,計算複雑性にも関わる。
- 混合状態の位相や状態の学習には,効率的なアルゴリズムが不足している。
- 浅いチャネル回路で準備可能な混合状態の効率的な学習方法を確立する。
- 本研究では,測定データのみから混合状態を効率的に学習できることを示した。
- 具体的には,未知の混合状態から浅い局所チャネル回路を生成し,その状態を近似的に再現する。
- この手法は,量子生成モデルの構造的基盤を提供し,古典的な拡散モデルにも応用可能である。
ハダマール多様体上の測地深度とブセマン媒介値 [math.ST, cs.LG, stat.ML, stat.TH]目的:ハダマール多様体上の統計的深度の概念である測地深度の導入と,その最大化点の集合としてのブセマン媒介値の定義
- ハダマール多様体は,負の断面曲率を持つ幾何学構造であり,様々な数学的応用を持つため重要である。
- 既存の統計的深度の概念は,多様体上の幾何学的な構造を十分に活用できていない場合がある。
- ハダマール多様体に適した統計的深度を定義し,その性質を明らかにすることで,幾何学的データ分析に貢献する。
- 測地深度は視覚境界によってパラメータ化され,等距変換不変性を持つことが示された。
- 任意のハダマール多様体上で,深度領域がネスト構造を持ち,測地凸であることが証明された。
- 負の断面曲率条件下では,深度が厳密準凹であり,媒介値は一意に存在することが示された。
AI CFD科学者:物理に精通したAIエージェントによるオープンエンドな数値流体力学発見に向けて [physics.flu-dyn, cs.AI]目的:数値流体力学における自動発見ワークフローの構築
- 数値流体力学は,航空宇宙,自動車,気象など幅広い分野で不可欠なシミュレーション技術である。
- 高精度な物理シミュレーションでは,物理的妥当性の検証が難しく,潜在的なエラーが視覚的な情報に現れる場合がある。
- 物理検証ゲートを導入し,シミュレーション結果の信頼性を高めることで,科学的な主張を裏付ける。
- AI CFD Scientistは,文献調査,シミュレーション実行,画像ベースの物理検証,ソースコード修正,論文執筆を統合したワークフローを実現した。
- Spalart-Allmarasモデルの実行時補正を自律的に発見し,DNSとのRMSEを7.89%削減することに成功した。
- 既存のAI科学者と比較して,ドメイン固有の検証ゲートにより,信頼性の高い科学的結果を得ることができた。
定常状態データに基づく重み付きMaxSMTによる定性的モデルの推論 [q-bio.MN, cs.LG, cs.LO]目的:複雑な生物学的システムのモデリングにおける定性的モデルの推論
- 生物学的システムの理解には,複雑な相互作用を表現するモデルが不可欠である。
- 測定誤差や矛盾する観測データが,モデル推論の安定性を損なうことが多い。
- 不確実性を含むデータから,最も適切な定性的モデルを効率的に推論すること。
- 重み付きMaxSMTを用いることで,矛盾する制約を持つデータに対してもロバストなモデル推論が可能になった。
- Boolean変数や多値変数,離散化されたデータ,発現量差に基づく制約を扱える汎用性を持つ。
- 200-1300遺伝子を含む神経細胞分化モデルの推論において,有効性が確認された。
GAN確率的クラウドサブカラム生成器によるクラウドと関連する放射場の評価 [physics.comp-ph, cs.DC, physics.chem-ph, physics.comp-ph, cs.DC, physics.chem-ph, physics.ao-ph, cs.LG]目的:クラウドと放射場の評価
- 地球システムモデルの精度向上にクラウド表現が不可欠であり,高解像度なクラウド構造のパラメータ化が課題。
- 従来の物理過程ベースのサブカラム生成器は,複雑なクラウドの重なりを正確に捉えられない場合がある。
- GANを用いたサブカラム生成器を導入し,クラウドの表現を改善することで,放射計算の精度向上を目指す。
- 本研究で開発した機械学習ベースのサブカラム生成器は,既存手法と比較して,クラウドの重なり分布をより正確に再現する。
- 生成器は,グリッド平均統計量におけるバイアスを大幅に低減し,クラウドトップ圧力と光学的厚さのヒストグラム誤差を半分に減少させた。
- この改善は,オフライン放射伝達計算の精度向上に繋がり,大気上端の短波放射への影響を3分の1に削減した。
