arXiv雑要約
AI - 2026/03/17 公開
平均を超えて:持続ホモロジー無視可能性下のトポロジカル因果効果 [math.PR, cs.PF, stat.ME, cs.AI]目的:分布形状の変化を捉えたトポロジカル因果効果の推定
- 因果推論は政策評価や医療など,社会科学における重要な課題である。
- 従来の平均因果効果は分布形状の変化を捉えきれない場合がある。
- 持続ホモロジーを用いて,分布形状の変化を捉えた因果効果を推定する。
- 持続ホモロジー無視可能性条件を定義し,トポロジカル因果効果の識別可能性を証明した。
- 周辺持続性図効果は条件付きトポロジカル無視可能性だけでは識別できないことを明確にした。
- 平均を保存するトポロジー変化のシミュレーション実験で,提案手法の有効性を示した。
離散拡散による制御可能なアクセント正規化 [eess.AS, cs.AI, cs.SD]目的:制御可能なアクセント正規化システムの開発
- 言語学習やダビングなど,アクセントの調整が必要な応用例が多い。
- 従来のアクセント正規化手法では,アクセント強度を制御できないという課題がある。
- アクセント強度を調整可能な正規化手法を提案し,その有効性を検証すること。
- 提案手法DLM-ANは,単語誤り率において比較対象システムの中で最低の結果を達成した。
- DLM-ANは,競争力のあるアクセント軽減効果と滑らかで解釈可能なアクセント強度制御を実現する。
- 自己教師あり学習による音声トークンを用いた,マスク付き離散拡散に基づくシステムである。
専門家による助言に基づいた学習による先延ばし [stat.ML, cs.LG]目的:最適な専門家への入力経路決定
- 複雑化する意思決定システムにおいて,専門家を活用した効率的な問題解決が重要となる。
- 従来の学習による先延ばしは,専門家への情報提供が固定されているという制約があった。
- 動的に情報を選択し,専門家への助言を組み合わせることで,意思決定の質を向上させる。
- 提案手法は,ルーティングと助言を同時に学習する分離型代替モデルの一貫性の問題を指摘した。
- 複合的な専門家-助言行動空間上で動作する拡張代替モデルの一貫性保証と過剰リスク転移境界を証明した。
- 実験結果から,提案手法は標準的な学習による先延ばしを上回り,コスト状況に適応した助言獲得行動を示した。
教師あり分類のためのベルヌーイランダムサンプリングによるラベルノイズ除去 [stat.ME, cs.LG, stat.ML]目的:ラベルノイズの除去
- 教師あり学習の性能は,ラベルの正確性に大きく依存する。
- ラベルノイズは,教師あり分類器の性能を著しく低下させる。
- ラベルノイズを効率的に識別し,除去すること。
- ベルヌーイランダムサンプリングによって生成されたサブセットにおける平均ラベルノイズレベルは,クリーンなデータとノイズのあるデータで異なる分布を示す。
- クロスバリデーションによる分類誤差とラベルノイズレベルの間に線形モデルを確立することで,ラベルの分布を近似できる。
- 提案手法は分類器に依存せず,理論的根拠があり,シミュレーションと実データで良好な性能を示す。
AR-Flow VAE:構造化自己回帰フロー事前分布変分オートエンコーダによる教師なし盲源分離 [stat.ML, cs.LG]目的:盲源分離のための変分オートエンコーダの新しいフレームワーク
- 音声や画像など,複数の信号が混ざり合った状態から元の信号を分離する技術であり,多様な応用が期待される。
- 従来の盲源分離手法では,複雑な信号や非ガウス分布を持つ信号の分離が困難であった。
- 自己回帰フロー事前分布を用いることで,複雑な信号構造や時間的相関を捉え,より高精度な分離を実現する。
- 提案手法AR-Flow VAEは,各潜在ソースにパラメータ適応型自己回帰フロー事前分布を付与することで,潜在ソースの柔軟なモデリングを可能にした。
- 異なる潜在次元に異なる事前分布を割り当てることで,潜在成分が異なるソース信号に分離されることを促進する。
- 実験結果は,提案アーキテクチャが盲源分離において有効であることを検証し,識別可能性と解釈可能性に関する今後の研究の基盤を提供する。
表現可能かつ訓練可能なパラメータ化量子回路の探索方法 [quant-ph, cs.LG]目的:表現性と訓練可能性を兼ね備えたパラメータ化量子回路の系統的な構築方法
- 量子計算は,従来の計算機では困難な問題を解決できる可能性があり,その実現には効率的な量子回路が不可欠である。
- 表現力の高い量子回路は「barren plateau」の問題を起こしやすく,訓練可能な回路は古典計算で容易にシミュレーションできてしまう。
- 訓練可能性と表現性を両立する回路を探索し,効率的な量子アルゴリズムの開発に貢献すること。
- パラメータ化量子回路のコスト関数の分散推定に関する有限サンプル次元独立濃縮不等式を導出し,訓練可能性の保証を得た。
- 一般的なansatzにおいて,訓練可能性と表現性には負の相関関係が認められ,理論的知見と一致した。
- 訓練可能性と表現性を兼ね備えた回路を特定するための性質に基づくansatz探索フレームワークを提案し,実機での有効性を実証した。
二時間スケール確率的近似法の収束:マルチンゲールアプローチ [stat.ML, cs.LG, math.PR]目的:二時間スケール確率的近似法(TTSSA)の収束性解析
- 最適化問題や機械学習において,効率的なアルゴリズム設計が重要視されている。
- TTSSAの理論的保証は,線形方程式に限定されることが多く,非線形問題への適用が課題であった。
- より広範な条件下でのTTSSAの収束性を示し,収束速度の改善を目指す。
- マルチンゲールアプローチにより,TTSSAの反復がほぼ確実に有界であるための十分条件を得た。
- 平均二乗誤差の収束速度に関する評価を示し,既存の結果と比較して改善された収束速度を確立した。
- 測定誤差の条件付き平均がゼロでない場合や,条件付き分散が無限に増加する場合でも結果が成立することを示した。
衝突物理学およびその先のEnd-to-Endアーキテクチャ [hep-ph, cs.AI, cs.MA, hep-ex]目的:衝突物理学現象論のEnd-to-Endタスク実行を可能にする言語駆動型エージェントシステム
- 高エネルギー物理学は,宇宙の根本的な構成要素と力を理解する上で不可欠である。
- 現象論的研究は,計算の複雑さと再現性の問題に直面している。
- この研究は,自動化,スケーラビリティ,再現性を向上させることを目指す。
- ColliderAgentは,自然言語と物理記号のみをガイドに,理論的なラグランジアンから現象論的な出力まで,一連のワークフローをパッケージ固有のコードに依存せずに実行できる。
- 本システムは,レプトクォークやアクシオンライク粒子,高次元有効演算子,パルトンレベルおよび検出器レベル解析,大規模なパラメータスキャンなど,代表的な文献の再現に有効であることが確認された。
- これらの結果は,衝突物理学,宇宙論,より広範な物理学における,より自動化された,スケーラブルで再現性のある研究への道を示す。
動的空洞法による一次元アルゴリズムの厳密漸近解析 [physics.soc-ph, cs.SI, math.GN, cond-mat.dis-nn, cs.LG, math.PR]目的:一次元アルゴリズムに対するDMFT方程式の新たな証明
- 無秩序系における巨視的観測量のダイナミクス記述において,DMFTは重要な役割を果たす。
- 動的空洞法は直感的だが,厳密な数学的基礎に欠けていた。
- 動的空洞法を数学的に厳密化し,一次元アルゴリズムのDMFT方程式を導出すること。
- 本研究では,動的空洞法を厳密化することで,勾配降下法や近似メッセージパッシングを含む一般的な一次元アルゴリズムに対するDMFT方程式を新たに証明した。
- 従来の数学的定式化とは異なり,物理学者で広く用いられる動的空洞法を基礎とした証明を提供した。
- この結果は,多様な物理,統計,機械学習モデルにおけるアルゴリズムの漸近的挙動を理解する上で貢献する。
データ依存および無知的な初期化戦略下におけるIQP Bornマシン [quant-ph, cs.LG, stat.ML]目的:IQP Bornマシンの初期化戦略が最適化に与える影響の解明
- 量子機械学習は,古典計算機では困難な問題を解決する可能性を秘めており,学術・産業界で注目されている。
- IQP Bornマシンの学習においては,初期化戦略が最適化の風景に大きな影響を与えるものの,十分な理解が得られていない。
- 本研究は,初期化戦略が生成する損失関数の風景を分析し,より効率的な学習方法を確立することを目的とする。
- ランダムな初期化では,損失関数の風景に荒地(barren plateau)が生じることが示された。
- 恒等初期化やデータに依存しない初期化では,損失関数の分散の下限が確立された。
- データ依存的な初期化は,勾配を安定化させ,学習の収束を速めることが実験的に示された。
ランダム特徴モデルのべき乗則スペクトル [stat.ML, cs.LG, math.PR]目的:ニューラルネットワークにおける損失関数のパラメータ数,データ数,計算量に伴うべき乗則に従うスケーリング則の解析
- ニューラルネットワークの性能向上には,データ共分散のスペクトル構造の理解が不可欠である。
- ニューラルネットワークの基本構成要素であるランダム線形投影と非線形活性化関数が,入力データのスペクトル構造をどのように変化させるかが未解明であった。
- ランダム特徴モデルにおいて,入力データのスペクトル構造がどのように保持または変化するかを明らかにする。
- 入力データ共分散のべき乗則指数αは,ランダム特徴モデルによって正確に継承されることが示された。
- ただし,べき乗則の対数補正項が,単項式の次数pに依存して変化することが明らかになった。
- この結果は,ダイアディックヘッドテイル分解とウィックカオス展開,およびランダム行列集中不等式を組み合わせることで得られた。
D-MEM:報酬予測誤差ルーティングによるドーパミンゲート型エージェントメモリ [q-bio.NC, cs.AI]目的:自律型LLMエージェントのための構造化された長期記憶
- LLMエージェントの性能向上には,効率的な長期記憶が不可欠である。
- 従来の「追加と進化」型システムは,書き込み遅延やトークンコストが大きい。
- 報酬予測誤差に基づき,認知構造の再構築を効率化するメモリシステムの構築。
- D-MEMは,トークン消費量を80%以上削減し,O(N^2)のボトルネックを解消した。
- LoCoMo-Noiseベンチマークにおいて,マルチホップ推論と敵対的耐性で既存手法を上回る性能を示した。
- 選択的な認知構造再構築により,スケーラブルでコスト効率の良い長期記憶基盤を提供する。
学習された距離尺度を用いた$K$-平均法 [math.ST, cs.LG, math.PR, stat.TH]目的:測度と距離が未知である計量測度空間におけるFr\'echet $k$-平均法の研究
- 機械学習におけるクラスタリングは,データ解析の基礎であり,多様な応用分野で重要である。
- 距離の定義がデータに依存する場合,適切な距離尺度の学習が課題となる。
- 未知の測度と距離を推定し,安定した$k$-平均法とVoronoiクラスタを構築すること。
- 測度付きGromov-Hausdorffトポロジーに関して,$k$-平均法の連続性が証明された。
- Voronoiクラスタの安定性も証明され,一意解でない場合でも有効な結果が得られた。
- Isomapや拡散距離など,様々な距離尺度を用いた$k$-平均法の一貫性に関する新たな結果が得られた。
LUMINA:エネルギー調和プロトコルを用いたマルチベンダーマンモグラフィーベンチマーク [math.CO, cs.DM, eess.IV, cs.CV, cs.DB, cs.LG]目的:マルチベンダーマンモグラフィー画像データセットの構築と,エネルギー調和プロトコルの有効性評価
- マンモグラフィーAIの信頼性向上には,多様なデータセットと標準化された評価が不可欠である。
- 既存のデータセットは,規模,臨床ラベル,ベンダーの多様性が不足しており,汎用的なモデル開発の妨げとなっている。
- ベンダーやエネルギーによる画像外観の変化を軽減し,より信頼性の高いAIモデル開発を促進すること。
- LUMINAデータセットは,6種類の装置と高・低エネルギーの画像を含み,ベンダーやエネルギーに起因する外観の差異を明らかにしている。
- 開発されたエネルギー調和プロトコルは,背景を維持しつつ,病変形態を維持しながら画像間のずれを軽減し,診断精度を向上させた。
- 二方向画像を用いたモデルは一方向画像モデルよりも高い性能を示し,EfficientNet-B0は診断でAUC 93.54%を達成した。
格子熱力学のための自己回帰モデルのスケーリング [cond-mat.stat-mech, cs.LG]目的:格子上の原子配置の統計分布の予測
- 合金設計,触媒,相転移研究の中核をなす問題であり,材料の現実的な条件下での挙動予測に不可欠である。
- 従来のマルコフ連鎖モンテカルロ法は収束が遅く,相転移近傍で臨界減速が起こるという課題がある。
- 自己回帰モデルと周辺化モデルを組み合わせ,メモリ要件を削減し,計算コストを抑えつつ,より大規模なシステムへの適用を目指す。
- Transformerベースの周辺化モデルは,2次元イジング模型およびCuAu合金において,多層パーセプトロンベースの自己回帰モデルよりも正確な自由エネルギーを達成した。
- 本手法は相転移や臨界現象を忠実に捉えることができた。
- イジング系では10x10から20x20へ,CuAu合金では2x2x4から4x4x8へ,従来法と比較して計算コストを抑えながらスケールアップに成功した。
自己整合的な静電機械学習原子間ポテンシャルの設計空間 [physics.chem-ph, cs.LG]目的:機械学習原子間ポテンシャルにおける静電効果の取り扱いに関する設計空間の特定
- 原子レベルのシミュレーションにおいて,原子間ポテンシャルは物質の性質予測に不可欠である。
- 従来の機械学習原子間ポテンシャルは,長距離静電気力や電荷移動を十分に考慮できていない。
- 静電効果を適切に組み込んだ,より高精度な機械学習原子間ポテンシャルの開発を目指す。
- 既存モデルを密度汎関数理論の粗視化として捉え,静電効果の近似を明確化した。
- 自己整合的な静電機械学習原子間ポテンシャルの設計空間を特定し,MACEアーキテクチャで実装した。
- 金属-水界面と二酸化ケイ素中の電荷欠陥を評価し,既存手法の限界とより表現力の高いモデルの必要性を示した。
監視切り替え制御のためのオンライン学習 [physics.ed-ph, cs.CL, quant-ph, cs.CC, math.OC, math.ST, stat.TH, math.OC, cs.LG, cs.SY, eess.SY]目的:部分観測線形動的システムに対する最適な制御器の特定と展開
- 制御システムの設計において,システムの安定性と性能向上が重要な課題である。
- 不安定な制御器の可能性を考慮した,制御システムの安全性評価が困難である。
- 不安定制御器の検出と,安定したシステムの同定を両立させる制御手法の開発。
- 提案手法は,マルチアームドバンディットアルゴリズムを適用し,有限時間性能保証を実現した。
- 各アルゴリズム変種は,$\mathcal{O}(N \log N)$ステップで最適な制御器を特定できることが示された。
- システム擾乱に対する有限$L_2$ゲインを同時に達成する。
関数空間におけるベイズ逆問題に対する事前条件付き一段階生成モデリング [stat.ML, cs.LG, cs.NA, math.NA]目的:関数空間におけるベイズ逆問題の近似事後分布サンプリング手法
- 偏微分方程式など,物理現象のモデル化において逆問題は重要であり,その解決は科学技術の発展に不可欠である。
- 従来のMCMC法は計算コストが高く,高次元問題や関数空間における適用が困難であるという課題がある。
- 本研究は,計算コストを削減しつつ,関数空間におけるベイズ逆問題の安定的な事後分布サンプリングを実現する。
- 提案手法は,ニューラル演算子を基盤とした一段階生成モデリングにより,高速な事後分布サンプリングを可能にする。
- ホワイトノイズを基準とする従来の方法では不安定性が発生するのに対し,事前分布に整合した異方性ガウス分布を用いることで安定性を確保する。
- 訓練後,64x64の事後分布サンプルを約10^-3秒で生成でき,MCMC法と同等の精度を達成する。
Fold-CP:生体分子モデリングのためのコンテキスト並列フレームワーク [q-bio.QM, cs.DC, cs.LG, q-bio.BM]目的:大規模生体分子複合体の構造予測における計算資源の制約克服
- 細胞機能理解には原子レベルでの構造解析が不可欠であり,大規模複合体の構造予測が重要である。
- AlphaFold3等のモデルはメモリ制約があり,一度に処理可能な残基数に上限が存在する。
- Fold-CPは,複数GPUへの分散処理により,メモリ制約を克服し,大規模構造予測を可能にする。
- Fold-CPは,入力トークン数NをGPU数Pで分割することで,デバイス毎のメモリ使用量をO(N^2/P)に削減する。
- 64台のNVIDIA B300 GPU上で3万残基を超える複合体の構造予測に成功した。
- CORUMデータベースの90%以上のタンパク質複合体のスコアリングや,PI4KA複合体の構造決定に貢献した。
ニューラルネットワークの局所から大域への計算 [math.AT, cs.LG, math.DS]目的:ニューラルネットワークの計算構造の数学的表現
- 深層学習モデルの理論的理解は,その性能向上と応用範囲拡大に不可欠である。
- ニューラルネットワークの内部動作はブラックボックス的であり,解釈が困難である。
- ニューラルネットワークの計算を数学的に厳密に記述し,その性質を解明すること。
- ReLUニューラルネットワークをセル状層(cellular sheaf)として構築する枠組みを提案した。
- 層間の情報伝播が双方向になる可能性を示し,新たな学習方法や診断手法への応用が期待される。
- 提案手法による学習は,現状では確率的勾配降下法に劣るものの,理論予測と一致するスケーリング則に従うことが確認された。
データ駆動型動力系に対するスコアフィルタ拡張データ同化フレームワーク [math.DS, cs.LG, math.PR]目的:データ駆動型動力系予測における予測不確実性の低減
- 機械学習は動力系の予測において効率的な数値モデルとなりうるため,その重要性は高い。
- 十分なデータを用いてもモデルの不確実性が残り,長期的予測性能の低下を招くという課題がある。
- 観測情報を組み込むことでモデル予測を反復的に改善し,長期的予測性能を向上させることを目指す。
- 提案手法は,機械学習モデルとEnsemble Score Filter (EnSF)を組み合わせたハイブリッドなデータ同化・学習フレームワークを構築する。
- Lorenz-96系およびKorteweg-De Vries (KdV)方程式の予測において,EnSF拡張機械学習が予測不確実性を効果的に低減することを示した。
- 本研究は,データ同化技術を機械学習の訓練プロセスに統合することで,長期的予測性能の改善に貢献する。
音声対話報酬のモダリティと口語性に基づいたモデル化とベンチマーク [math.OC, cs.SY, eess.SY, eess.AS, cs.CL, cs.LG]目的:音声対話報酬のモダリティと口語性を考慮したモデル化
- 対話システムの進化に伴い,テキスト情報だけでなく,非言語的な要素や自然な会話表現の重要性が高まっている。
- 既存手法では,プロソディや感情といったモダリティのギャップ,および脚本と自然な会話の口語性のギャップへの対応が課題である。
- 本研究は,モダリティと口語性を考慮した報酬モデルを構築し,対話システムの評価基準を確立することを目的とする。
- SDiaRewardは,プロソディや感情といったモダリティと口語性を同時に評価できるエンドツーエンドの報酬モデルである。
- ESDR-Benchという,エピソードレベルの評価を可能にする層化されたベンチマークを新たに確立した。
- 実験の結果,SDiaRewardは既存の汎用音声LLMを凌駕するペアワイズ評価精度を達成し,会話表現力の相対的な違いを捉えることが示された。
光子を用いた量子知識蒸留の強化 [quant-ph, cs.ET, cs.LG]目的:光子量子計算による知識蒸留の効率化
- 機械学習の高性能化には,計算資源とモデルサイズの効率的なバランスが重要である。
- 従来の知識蒸留では,モデル圧縮と精度維持のトレードオフが課題となっていた。
- 光量子計算の特性を活用し,より効率的な知識蒸留手法を開発すること。
- 提案手法PQKDは,光回路から得られる情報を活用し,パラメータ効率の良い学習を実現した。
- MNIST,Fashion-MNIST,CIFAR-10のデータセットにおいて,教師モデルに近い性能を維持しつつ高い圧縮率を達成した。
- ショットノイズの影響を抑制する手法により,限られた計算資源でも実用的な性能が得られることを示した。
自転車シェアシステムにおける機械学習予測が戦略的意思決定に与える影響 [math.OC, cs.LG]目的:自転車シェアシステムの各ステーションにおける,自転車の返却数と貸出数の差の予測
- 都市交通における自転車シェアシステムの重要性が増しており,効率的な運営が課題となっている。
- 需要予測の精度が不十分な場合,自転車の再配置が滞り,利用者の利便性を損なう可能性がある。
- 機械学習による高精度な需要予測を通じて,自転車シェアシステムの運用効率向上を目指す。
- 機械学習を用いた予測は,既存の予測手法と比較して高い精度を示した。
- 予測結果をシミュレーションに組み込むことで,自転車の再配置戦略の最適化が可能となった。
- イタリアのブレシア市における実データに基づき,予測の有効性が確認された。
持続可能な地熱エネルギーのための機械学習:不確実性,物理モデル,意思決定に活用可能な推論 [cond-mat.dis-nn, cs.LG]目的:地熱エネルギープロジェクトにおけるリスク管理と最適化のための機械学習手法
- 地熱エネルギーは,脱炭素化に不可欠な再生可能エネルギー源であり,その重要性は増している。
- 地熱エネルギープロジェクトでは,限られたデータと複雑な物理・地質学的制約の下で,リスク評価が困難である。
- 本研究は,機械学習を用いて,不確実性を定量化し,より信頼性の高い意思決定を支援することを目的とする。
- 機械学習と物理モデルを組み合わせることで,データが少ない状況でも高い予測精度を実現できる。
- 確率的不確実性定量化により,リスクを考慮した意思決定が可能となる。
- デジタルツイン,多相流,モニタリング,ポートフォリオ管理など,様々なアプリケーションへの応用が期待される。
音声および音声分析のためのスペクトログラム特徴 [eess.AS, cs.AI, cs.LG, eess.SP]目的:音声分析におけるスペクトログラム特徴の利用状況
- 近年,深層学習を用いた音声分析において,スペクトログラムが重要な役割を果たしている。
- スペクトログラムの解像度やスケーリング設定が,タスクの性能に大きく影響する。
- フロントエンドの特徴表現選択とバックエンドの分類器アーキテクチャの関係を明らかにする。
- スペクトログラムは,音声を時間周波数平面で表現し,解釈しやすい物理的根拠を提供する。
- 画像処理技術で開発された畳み込みニューラルネットワークなど,様々な機械学習手法の応用を可能にする。
- 本研究は,様々なタスクにおいて,どのスペクトログラム設定が最適な分類器アーキテクチャと相性が良いかを調査する。
欠損物理量に対するベイジアン推論 [stat.ML, cs.LG]目的:欠損物理量の推定
- バイオプロセスシステムのモデル化は重要であり,その性能向上に不可欠である。
- 基礎法則の不完全な知識が,モデルベースのアプローチの課題となっている。
- ベイジアン記号回帰により,発見された方程式への信頼度を定量化することを目指す。
- 記号回帰にベイジアン推論を適用することで,モデル構造の不確実性を自然に定量化できる。
- Lotka-Volterra捕食者-被食者システムへの適用により,手法の有効性が確認された。
- 適切な実験計画により,フェドバッチバイオリアクターケーススタディにおいて不確実性を低減できることが示された。
生物学的知見による化学構造の強化を通じたスケーラブルな表現型バーチャルスクリーニング [q-bio.QM, cs.AI, cs.LG]目的:生物活性化合物のスケーラブルな同定
- 現代の創薬において,生物活性化合物の効率的な探索は不可欠である。
- 構造に基づいたスクリーニングはスケーラブルだが,生物学的背景が欠如している。
- ノイズの多いデータからロバストな生物学的シグナルを抽出し,推論時に生物学的データが不要な表現を構築すること。
- DECODEは,化学構造に内在する生物学的意味を付与することで,構造ベースのin silico生物学的プロファイリングを可能にする。
- 限られたトランスクリプトームおよび形態データを利用して訓練することで,化学構造から測定不変の生物学的フィンガープリントを抽出,実験ノイズを明示的にフィルタリングする。
- DECODEは,作用機序(MOA)予測において,化学構造のみに基づくベースラインよりも20%以上の相対的な改善を示す。
過渡性向流炎の代替モデル化のための畳み込みオートエンコーダとニューラル常微分方程式のフレームワーク [physics.flu-dyn, cs.LG, physics.comp-ph]目的:過渡性2次元向流炎の簡約次モデル
- 化学反応流れのシミュレーションは計算コストが高く,リアルタイム制御や設計最適化が困難である。
- 高次元の空間データを効率的に圧縮し,物理的に整合性のある低次元空間を構築することが課題である。
- 多次元反応流れの非定常挙動を正確かつ高速に予測する代替モデルを開発すること。
- 本研究で提案する畳み込みオートエンコーダニューラル常微分方程式(CAE-NODE)フレームワークは,高精度に炎の過渡過程を捕捉することが示された。
- 主要種に対する相対誤差は~2%以下であり,点火,炎の伝播,非予混合状態への移行を正確に予測できる。
- 本研究は,多次元反応流れの非定常ダイナミクスの代替モデル化におけるCAE-NODEの可能性を初めて示した。
MMAF誘導学習を用いた時空間確率予測 [stat.ML, cs.LG, math.ST, stat.TH]目的:時空間ラスターデータの確率予測
- 気象や環境変動予測など,時空間データの予測は社会に不可欠である。
- 従来の予測手法では,複雑な時空間構造の把握が困難であった。
- MMAF誘導学習により,時空間データの構造を捉えた高精度な予測を実現する。
- 本研究では,MMAF誘導学習を用いた確率予測モデルを提案した。
- 提案手法は,合成データおよび実データにおいて,予測精度と信頼性が確認された。
- また,畳み込みニューラルネットワークや拡散モデルと同等以上の性能を達成した。
グローバル特徴効果推定における誤差源の分析 [stat.ML, cs.AI, cs.LG]目的:ブラックボックスモデル解釈のためのグローバル特徴効果推定における誤差源の特定と分析
- 機械学習モデルの解釈性は,その信頼性と説明責任を確保する上で不可欠である。
- グローバル特徴効果推定の信頼性を損なう誤差源は,十分に理解されていない。
- モデルの特性,データ選択,サンプルサイズが誤差に与える影響を解明すること。
- ホールドアウトデータを使用することが理論上は最も望ましいが,訓練データから生じる潜在的なバイアスは実証的には無視できる程度である。
- 推定分散は,相互作用の存在とサンプルサイズに依存し,ALEは特にサンプルサイズの影響を受けやすい。
- クロスバリデーションに基づく推定は,特に過学習モデルに対してモデル分散を低減する有望なアプローチである。
生成意味的HARQ:潜在空間におけるテキスト再送と結合 [eess.SP, cs.LG]目的:テキスト通信のためのセマンティックレベルのハイブリッド自動再要求(HARQ)フレームワーク
- 意味伝達は情報伝達の効率化に不可欠であり,通信信頼性の向上は重要課題である。
- セマンティックレベルでの信頼性確保が未解決の課題として残されている。
- 単一モデルからの漸進的知識伝達によるセマンティックHARQの性能向上を目指す。
- 提案手法は,Transformer-VAEコーデックを軽量なオーバーレイとして利用することで,セマンティックレベルのHARQを実現する。
- 受信側では,ソフト品質推定器が再送をトリガーし,品質を考慮した結合器が潜在ベクトルを統合する。
- 実験結果から,Weighted-AverageまたはMRC-Inspired結合と自己整合性に基づくHARQトリガーが最適な性能を示すことが示唆された。
最小限のリザーバーコンピューターにおける複数のカオスアトラクターの記憶と選択 [nlin.CD, cs.LG]目的:複数のカオスアトラクターの記憶と,文脈に応じた適切なアトラクターの選択
- 現代の予測モデリングでは,多様な状態に対応できる単一の学習済み動的基盤が求められている
- リザーバーコンピューティングでは,多重アトラクター学習には大規模なランダム配線が用いられてきた
- 最小限の決定論的トポロジーで複数のカオスアトラクターを学習できるかを検証する
- 最小限のアーキテクチャは複数のカオスアトラクターを記憶できることが示された
- しかし,外部からの信号に応じてアトラクター間を切り替えるタスクでは苦戦した
- リザーバーのトポロジーと多重アトラクター性能との間には,強い依存関係は認められなかった
因果仲介分析のための逐次輸送 [stat.ME, cs.LG]目的:因果仲介分析のための分布的フレームワーク
- 社会現象のメカニズム解明には,要因間の因果関係の特定が不可欠である。
- 従来の仲介分析は,強い仮定に依存し,現実的なデータへの適用が困難な場合がある。
- DAG構造を考慮し,最小限の輸送コストで仲介変数の反事実を構築し,よりロバストな分析を実現する。
- 逐次輸送(ST)は,最適輸送(OT)とDAGを組み合わせた新しいアプローチである。
- STは,従来の反事実の仮定に頼らず,因果関係を維持しつつ,仲介変数の分布を輸送する。
- 数値・カテゴリカルデータ両方に対応可能であり,COMPASデータセットへの適用例も示されている。
二者対戦バンディットにおけるコンドセ勝者の識別に関するサンプリング複雑性 [stat.ML, cs.LG]目的:コンドセ勝者の識別におけるサンプリング複雑性の解析
- 意思決定における最適な選択肢の特定は,様々な応用分野において重要な課題である。
- 二者対戦バンディット問題におけるコンドセ勝者の効率的な識別は未解決の課題であった。
- ギャップ行列の情報を最大限に活用し,サンプル複雑性を改善することを試みる。
- 本研究では,既存の結果を改善するサンプル複雑性の保証を導出した。
- この改善は,コンドセ勝者との比較だけでなく,他の情報的な比較も活用することで実現される。
- さらに,二者対戦バンディットにおけるコンドセ勝者識別に関する新たな下界を提示し,提案手法の最適性を示した。
生物進化の幾何学的枠組み [q-bio.PE, cs.LG]目的:生物進化の動力学記述
- 生物進化は生命現象の根幹であり,その理解は生物学の重要な課題である。
- 遺伝子型と表現型空間における一貫した進化記述法が確立されていなかった。
- 進化を適応度地形上での学習過程として捉え,その学習アルゴリズムを明確化すること。
- 最大エントロピー原理により,逆メトリックテンソルと共分散行列の関係が明らかになった。
- これにより,Lande方程式が共変勾配上昇方程式として導出され,進化が適応度地形上での学習とみなせる点が示された。
- メトリックは経験的に特徴付けられてきたが,ノイズ共分散とそれに関連する観測量の直接的な測定が課題である。
AI駆動によるステラレータコイル最適化の概念実証:ループ内有限要素計算との連携 [math.CO, cs.DM, physics.plasm-ph, cs.LG, physics.comp-ph]目的:ステラレータコイル最適化の自動化手法
- 核融合エネルギー実現への重要な一歩であり,実用化には効率的な設計が不可欠である。
- ステラレータコイル設計は複雑で時間と労力を要し,設計期間の短縮が課題である。
- AIを活用し,コイル設計プロセスを自動化することで,設計期間の短縮を目指す。
- AI駆動による自動最適化ランナーを開発し,遺伝的アルゴリズムとLLMによる2つの最適化ポリシーを実装した。
- コイルのVon Mises応力に対するループ内最適化を新たに構築し,有限要素計算との連携を可能にした。
- 設計プロセス全体を自動化し,設計結果をオープンソースのリーダーボードで共有することで,迅速なコイル設計を実現する。
テスト時複雑度制御によるスケーラブルなシミュレーションに基づくモデル推論 [stat.ML, cs.AI, cs.LG]目的:シミュレーションに基づくモデル推論におけるスケーラビリティとテスト時複雑度制御
- 科学的発見においてシミュレーションは重要な役割を担うが,モデル選択がボトルネックとなる場合が多い。
- 大規模なモデル群における古典的なベイズ法は非現実的であり,既存のアモル化手法は事前分布を固定する。
- テスト時にモデルの複雑度を制御可能な手法を提供し,モデル選択の効率化を目指す。
- PRISMは,離散モデル構造と連続パラメータの結合事後分布を推論するエンコーダ・デコーダである。
- PRISMは,組み合わせ的に多くのモデルインスタンス(最大数十億)を持つモデル群に対してスケーラブルであることが示された。
- 拡散MRIデータの生物物理的モデリングへの応用において,合成データおよび生体データを用いたモデル選択能力が確認された。
活性セリエーション:統計的保証付き効率的な順序回復 [stat.ML, cs.LG]目的:未知のアイテムの順序回復
- データ分析において,データの順序は重要な情報であり,その回復は多様な応用で不可欠である。
- ペアごとの類似度から順序を回復する既存手法は,ノイズの影響を受けやすく,保証がない場合が多い。
- 統計的保証の下で,効率的に潜在的な順序を回復するためのアルゴリズムを開発すること。
- 提案アルゴリズムは,高確率で潜在的な順序を回復できることが証明された。
- 類似度行列が一定の分離条件を満たす場合,誤り確率と必要な観測回数の最適な性能保証が確立された。
- 部分的な順序情報から開始することも可能であり,柔軟な適用性を持つ。
ミニバッチで学習されたフィードフォワードニューラルネットワークのサンプリングのための制御されたランジュバン力学 [math.OC, cs.SY, eess.SY, math.DS, math.OC, cs.SY, eess.SY, cond-mat.dis-nn, cs.LG]目的:フィードフォワードニューラルネットワークのボルツマン分布に基づくパラメータ空間のサンプリング
- ニューラルネットワークの学習において,損失最小化以外に,パラメータ空間の幾何学的な理解が重要である。
- フルバッチ勾配計算が必要な正確なサンプリング法は,大規模データセットでは計算コストが高くなる。
- ミニバッチを用いた効率的なボルツマンサンプリングを可能にする制御された擬似ランジュバン力学を提案する。
- 提案手法は,ミニバッチ勾配ノイズの統計的特性を利用し,適切な仮想質量と摩擦係数を調整することで,効率的なサンプリングを実現する。
- ネットワーク規模が大きくなっても,提案手法は高い計算拡散を維持し,スケーラビリティに優れることがベンチマークで示された。
- 中間温度でのサンプリングは,検証セットや早期停止なしに,SGDと同等の汎化性能をもたらすことが示された。
持続球面:測度に対する双連続線形表現,部分最適輸送 [stat.ML, cs.LG, math.AT, math.ST, stat.TH]目的:部分最適輸送における測度の表現と,その安定性に関する研究
- トポロジー的機械学習は,データの形状や構造を捉え,多様な応用可能性を持つ重要な分野である。
- 部分最適輸送空間における既存の埋め込みは強力だが,明示的な要約写像として機能しないという課題がある。
- 部分最適輸送のメカニズムをより良く反映した持続球面の定義を確立し,測度の表現を改善することを目指す。
- 持続球面は,積分可能な測度を球面上関数に写像し,部分最適輸送距離に対する安定性を示す。
- 新しい定義は,測度の持続性のみに依存する写像のノルムを確立し,パラメータフリーな表現を実現する。
- クラスタリング,回帰,分類タスクにおいて,持続球面は既存のトポロジー的表現と比較して競争力があり,改善を示す。
ファノ超曲面の深層強化学習 [math.AG, cs.LG]目的:ファノ4次元超曲面の探索
- 代数幾何学において,終端特異点を持つファノ多様体は基本的な構成要素である。
- 組み合わせ的な複雑さから,ファノ多様体の分類は未完のままである。
- 強化学習を用いて,既存の手法では困難なファノ超曲面の探索を可能にする。
- 深層強化学習アルゴリズムにより,高次元整数格子を効率的に探索した。
- 数千個の未知のファノ4次元超曲面を発見し,数百個は既存手法では到達不可能であることを示した。
- ニューラルネットワークを動的な探索ヒューリスティックとして活用することで,報酬の多い領域への探索を誘導した。
選択的析出による複雑な原料からの重要物質回収を可能にするエージェントワークフロー [math.OC, cs.CG, astro-ph.IM, astro-ph.GA, cs.HC, cond-mat.mtrl-sci, cs.AI]目的:重要物質回収のためのマルチエージェントワークフロー
- 資源の持続可能性確保のため,都市鉱山からの重要物質回収が不可欠である。
- 既存の分離プロセスは,時間とコストがかかることが課題である。
- 複雑な原料からの効率的かつ迅速な分離プロセスの開発を目指す。
- AIエージェントと自動化機器を用いたワークフローにより,単純な化学物質で選択的析出が可能となった。
- 従来数ヶ月から数年かかっていた分離プロセスを,数日という期間に短縮することに成功した。
- このアプローチは,効率的,適応可能,かつ拡張性のある分離技術の開発を加速させる。
シンプレックス上での階層的クラスタリングによる段階的イベントツリーモデルの推定 [stat.ML, cs.LG]目的:段階的イベントツリーモデルの推定手法
- ベイズネットワークの拡張として,文脈依存性を考慮した段階的構造が重要である。
- 既存手法では,大規模データへの適用や計算コストが課題となっている。
- シンプレックス上での階層的クラスタリングにより,効率的な推定を可能にすること。
- 総変動距離とWard.D2連結法を組み合わせることで,モデル適合度,構造復元,計算効率が向上した。
- 相対ベイズ情報量規準(BIC)とハミング距離の評価により,その有効性が確認された。
- 後方丘登法(BHC)と同等の性能を持ちながら,計算コストを大幅に削減できることが示された。
コントラストとクラスタリングによる教師なし点群事前学習 [cs.CC, cs.RO, cs.CV, cs.AI, math.OC]目的:点群の識別表現学習
- 点群データは,自動運転やロボティクスなど多様な分野で活用が期待されている。
- 大規模な点群データのアノテーションはコストが高く,現実的な課題となっている。
- ラベルなしデータから効果的な表現を学習し,アノテーションコストを削減する。
- 提案手法ConCluは,コントラスト学習とクラスタリングを統合した汎用的な事前学習フレームワークである。
- 同一点群の異なる拡張ビュー間の特徴表現の類似性を最大化し,データ分割と拡張間の一貫性を実現する。
- 複数の下流タスクにおいて,最先端手法を上回る性能を示し,提案フレームワークの有効性を実証した。
エッジワース会計士:差分プライバシー合成への解析的アプローチ [cs.CR, cs.DS, cs.LG, stat.ML]目的:差分プライバシー合成のプライバシー損失の効率的な計算
- プライバシー保護データ分析は重要であり,個人情報保護とデータ利用のバランスが求められる。
- 複数のプライバシー保護メカニズムの合成におけるプライバシー損失の正確な評価が困難である。
- エッジワース会計士を用いて,合成におけるプライバシー損失をより正確に追跡し,効率的なプライバシー保証を提供する。
- エッジワース会計士は,$f$-差分プライバシーフレームワークを活用し,プライバシー損失ログ尤度比(PLLR)を通じて閉形式のプライバシー保証式を提供する。
- エッジワース展開を適用し,PLLRの和の確率分布を推定することで,複雑な分布を簡略化し,様々なノイズ付加メカニズムへの適用を可能にする。
- 従来の合成手法と比較して,計算コストが増加しにくい,非漸近的な$(\epsilon, \delta)$-差分プライバシー境界を提供する点が特徴である。
ニューラルネットワークの概念的視点:神経記号分析のためのフレームワーク [cs.LG, cs.AI, cs.CV]目的:ニューラルネットワークのグローバルな説明
- 深層学習の応用拡大に伴い,その解釈可能性が重要視されている。
- ニューラルネットワークの内部動作は不透明であり,解釈が困難である。
- ニューラルネットワークの挙動を概念的に理解し,説明可能なルールを抽出する。
- 概念的視点は,ニューラルネットワークを忠実に表現し,アーキテクチャの比較を可能にする。
- Fruits-360およびImageNetモデルの実験により,その有効性が確認された。
- ニューロンから人間が理解可能なルールを推論するアブダクティブ学習を支援する。
ゲーム理論的強化学習における木探索,生成モデル,ナッシュ交渉概念の組み合わせ [cs.AI, cs.GT, cs.LG, cs.MA]目的:対戦相手の戦略に対する信念分布の構築と,それを利用した最適反応の探索
- マルチエージェント環境における意思決定において,対戦相手の行動を予測し,それに対応することが重要である。
- 既存手法は,ドメイン固有のヒューリスティックに依存したり,大規模な不完全情報環境での最適反応計算が困難である。
- 深層ゲーム理論的強化学習を用いた,スケーラブルで汎用的な対戦相手モデリング手法を開発し,その有効性を示す。
- 生成モデルを用いた木探索(GenBR)は,大規模な不完全情報環境でも効率的に最適反応を計算できる。
- ナッシュ交渉概念に基づく対戦相手混合戦略の構築により,パレート最適解に近いプロファイルを特定することができた。
- Deal-or-No-Dealゲームにおいて,人間との交渉実験で,人間同士と同程度の社会的厚生とナッシュ交渉スコアを達成できるエージェントを開発した。
公正な機械学習ソフトウェアの実現:反事実的思考によるモデルバイアスの理解と対処 [cs.SE, cs.AI]目的:機械学習ソフトウェアにおけるバイアスの理解と対処
- 機械学習の利用拡大に伴い,倫理的な問題が顕在化しており,公平性の確保が重要である。
- 既存手法では,公平性を向上させるために性能を犠牲にする必要があった。
- 公平性と性能の両立を図り,機械学習ソフトウェアのバイアスを根本的に解消することを目指す。
- 提案手法は,10のベンチマークタスクにおいて,性能と公平性の両面で優れた結果を示した。
- 5つの性能指標,3つの公平性指標,15の測定シナリオを用いた評価により,その有効性が確認された。
- 最先端手法と比較して,84.6%のケースで公平性が向上し,競争力のある性能を維持した。
多様体構造を持つデータに対するグラフベース回帰法 [cs.DC, cs.SY, eess.SY, cs.LG, stat.ME, stat.ML]目的:低次元多様体上に存在するノイズを含む大規模複雑データの回帰推定
- 高次元データ解析において,データの内在する幾何学的構造の把握が重要である。
- 従来の回帰手法では,複雑な多様体構造を持つデータへの適用が困難な場合がある。
- 多様体構造を捉えたグラフを用いて,よりロバストな回帰推定を実現することを目指す。
- 提案手法では,データの本質的な幾何学的構造を捉える「骨格」と呼ばれるグラフを構築する。
- グラフ上の距離指標と非パラメトリック回帰を組み合わせることで,高精度な回帰が可能となる。
- 複数の多様体の和やノイズに対する耐性も示され,理論的な保証も提供されている。
