arXiv雑要約
AI - 2026/03/04 公開
深層ReLUネットワークの被覆数:関数近似とノンパラメトリック回帰への応用 [stat.ML, cs.AI, cs.IT, cs.LG, math.IT]目的:深層ReLUネットワークの近似理論的性能,ノンパラメトリック回帰における予測誤差の上界,分類能力の定量化
- 深層学習の理論的理解は,その性能向上と限界の把握に不可欠である。
- 深層ネットワークの複雑さの定量的評価が困難であり,汎化性能の解析を阻害している。
- ネットワークの被覆数を評価し,スパース性,量子化などの影響を解明すること。
- 深層ネットワークの被覆数に対し,漸近的にタイトな上限と下限を導出した。
- スパース性,量子化,重みの制限などがネットワーク性能に与える影響を定量的に示した。
- ノンパラメトリック回帰におけるサンプル複雑度の上界を改善し,深層ネットワークの最適性を確立した。
高コントラスト媒体におけるDarcy方程式の多重尺度特徴予測のための深層学習ベースのプレコンディショナーソルバーアーキテクチャ [physics.soc-ph, cs.DL, physics.flu-dyn, cs.LG]目的:高次元地下流体フローの多重尺度基底関数再構成
- 地下流体フローモデリングは,石油・ガス探査等の分野において不可欠であり,その精度向上は重要である。
- 地下媒体の多重尺度性と異質性により,流体フロー挙動の正確な再構成が困難であるという課題が存在する。
- 本研究は,深層学習を用いて多重尺度特徴を効率的に予測し,地下流体フローモデリングの精度と効率を向上させることを目指す。
- 提案手法FP-HMsNetは,テストデータセットにおいてMSE 0.0036,MAE 0.0375,R2 0.9716を達成し,既存モデルを大きく上回る性能を示した。
- FP-HMsNetは,様々なノイズ干渉下においても安定性を維持し,頑健性も確認された。
- プレコンディショナーと多重尺度パスウェイがモデル性能に重要な貢献をすることが,消去実験により示された。
RealOSR:潜在的ガイダンスが拡散ベースの実世界全方向画像超解像を強化する [eess.IV, cs.CV, cs.GR, cs.LG]目的:実世界における全方向画像超解像のための手法
- 全方向画像は没入型体験に不可欠であり,高解像度化の需要が高まっている。
- 既存手法は簡略化された劣化モデルに依存しており,実世界の劣化を捉えきれていない。
- 実世界の劣化を考慮し,効率的な全方向画像超解像を実現することを目的とする。
- 提案手法RealOSRは,従来の拡散ベース手法と比較して,視覚品質の大幅な向上と200倍以上の推論速度の向上を達成した。
- 潜在的勾配配置ルーティング(LaGAR)により,潜在空間とピクセル空間の効率的な相互作用と,潜在空間での直接的な勾配降下法のシミュレーションを実現している。
- LaGARは軽量モジュールであり,ノイズ除去UNetによって捉えられた意味的豊かさとマルチスケール特徴を活用する。
CLEAR:エピステミックおよびアレオリックリスクのためのキャリブレーション学習 [stat.AP, cs.SI, math.OC, cs.SY, eess.SY, q-bio.QM, cs.CL, cs.IR, math.CO, cs.DM, physics.soc-ph, cs.SI, stat.ML, cs.LG, stat.ME]目的:予測モデルにおける不確実性の正確な定量化
- 信頼性の高い予測モデリングには不可欠であり,意思決定の質に直結する。
- アレオリック不確実性とエピステミック不確実性の両方をバランス良く扱う方法が不足している。
- 両不確実性を統合し,予測区間の網羅率を改善することを目的とする。
- 提案手法CLEARは,2つのパラメータを用いてアレオリックとエピステミックの不確実性を組み合わせる。
- 17の多様な実データセットで,ベースラインと比較して予測区間の幅を平均28.3%,17.5%改善した。
- 高いアレオリックまたはエピステミック不確実性の状況下で,その効果が特に顕著である。
履歴付き非パラメトリック反応座標最適化:稀な事象ダイナミクスに関するフレームワーク [physics.chem-ph, cs.LG, math.PR, physics.comp-ph, q-bio.BM]目的:稀な事象のダイナミクスを特徴付けるための最適な反応座標の同定
- 複雑系の挙動理解に不可欠であり,タンパク質フォールディング等,多岐にわたる分野への応用が期待される。
- 従来の機械学習手法では,真値の不在,非平衡ダイナミクスに適した損失関数の欠如等の課題が存在した。
- 不完全なデータや限定的なサンプリングでも,稀な事象のダイナミクスを正確に解析することを可能とする。
- 提案手法は,タンパク質フォールディングの解析において,厳密な検証を通過する精度の高いコミッター推定値を算出。
- 相空間ダイナミクス,海洋循環モデル,臨床データセットへの適用により,手法の汎用性と柔軟性が示された。
- 広範なサンプリングなしに稀な事象ダイナミクスの正確な特徴付けが可能となり,複雑系の解析における新たな道を開く。
スライスされたWasserstein距離上の回帰によるWasserstein距離の高速推定 [stat.ML, cs.LG]目的:複数の分布ペアに対するWasserstein距離の効率的な計算
- 分布間の類似度を測るWasserstein距離は,機械学習や統計分析において重要な役割を担う。
- 高次元データにおけるWasserstein距離の計算は,計算コストが高く,現実的な時間で完了しない場合がある。
- スライスされたWasserstein距離を用いた回帰モデルにより,計算コストを削減し,高速な近似を実現することを目指す。
- スライスされたWasserstein距離(SW距離)と真のWasserstein距離との関係を回帰することで,高速な推定が可能となった。
- 提案手法は,MNIST点群,ShapeNetV2,MERFISH Cell Niches,scRNA-seqなどの多様なデータセットで,最先端のWormholeモデルよりも優れた近似精度を示した。
- 学習済みのモデルを用いることで,Wormholeの学習を加速するRG-Wormholeの開発にも貢献した。
テスト時計算におけるBest-of-$\infty$ – 極限性能 [stat.ML, cs.AI, cs.LG]目的:大規模言語モデルにおける多数決に基づくBest-of-$N$の漸近的性能
- 大規模言語モデルの性能向上は,自然言語処理の発展に不可欠である。
- テスト時の計算コストが無限大になるBest-of-$\infty$は実用的ではない。
- 効率的な計算資源配分による,Best-of-$\infty$の性能維持を目指す。
- 提案手法では,回答の一致度に応じて$N$を動的に選択することで,計算コストを削減する。
- 複数の言語モデルを重み付けアンサンブルすることで,個々のモデルを上回る性能を達成できる。
- 最適なアンサンブル重みは,混合整数線形計画問題として効率的に計算可能である。
ガウス・ザイデル投影を用いた物理的に妥当な生体分子相互作用モデリング [q-bio.BM, cs.LG]目的:生体分子相互作用の物理的妥当性
- 創薬やタンパク質設計において,生体分子間の相互作用予測は不可欠である。
- 既存のモデルでは,立体的な妥当性を欠く構造が生成される場合がある。
- 物理的制約を厳格に適用し,現実的な構造生成を可能にすること。
- 本研究では,ガウス・ザイデル法を用いた微分可能な投影モジュールを開発した。
- このモジュールにより,わずか2ステップで物理的妥当性と構造的正確性を両立した複合体を生成できる。
- 6つのベンチマークテストで,最先端の200ステップ拡散ベースラインと同等の精度を10倍の速度で達成した。
親和性に基づく分散減少を用いた個別化協調学習 [stat.ML, cs.LG, cs.MA, cs.SY, eess.SY]目的:多様なエージェントにおける,分散型協調学習と個別化のバランス
- マルチエージェント学習は,分散型協調と個別化のトレードオフを抱える重要な研究分野である。
- エージェントの多様性が高い場合,協調学習の効果が低下する可能性がある。
- 未知の異質性レベルに適応しつつ,協調学習の加速と性能劣化を防ぐことを目指す。
- 提案手法AffPCLは,環境と目的の異質性に対してロバストに動作することが示された。
- AffPCLは,独立学習と比較してサンプル複雑性を$\max\{n^{-1}, \delta\}$の係数で削減することが証明された。
- エージェント間の類似性が低い場合でも線形的な加速が得られる可能性が示され,個別化と協調学習に関する新たな知見が得られた。
高速コセット選択のためのトポロジー認識周波数領域分布マッチング [quant-ph, cs.ET, stat.ML, cs.AI, cs.LG]目的:大規模データセットのコンパクトな代表的サブセットによる圧縮
- 深層ニューラルネットワークの学習コスト削減は,実用化における重要な課題である。
- 既存手法はモデル依存または理論的保証の欠如があり,分布の等価性制約が不十分である。
- スペクトルグラフ理論に基づく新しいコセット選択フレームワークにより,分布の不一致を解消する。
- 提案手法FASTは,最先端のコセット選択手法と比較して,平均で9.12%の精度向上を達成した。
- 電力消費量を96.57%削減し,平均2.2倍の高速化を実現し,高い性能とエネルギー効率を実証した。
- 位相勾配消失問題を緩和するため,減衰位相分離CFDを導入し,収束性を向上させた。
最適化のための確率的制御手法 [math.OC, cs.LG, cs.NA, math.NA, math.PR]目的:最適化問題における確率的制御の枠組み
- 複雑な最適化問題への応用が期待される分野であり,工学や経済学など広範な分野で重要である。
- 従来の最適化手法では,非凸・非微分可能な関数を持つ問題への対応が困難であった。
- 確率的制御を用いて,そのような複雑な最適化問題を効率的に解くことを目指す。
- ユークリッド空間における最適化問題に対し,確率的制御問題による近似と動的計画法に基づく解析を行った。
- 確率測度の空間上での最適化問題に対し,平均場制御問題とN粒子系による近似を導入した。
- 正則化パラメータをゼロに近づけることで,制御問題の値が元の目的関数の大域的最小値に収束することを証明した。
人工知能時代における持続可能な材料発見 [cond-mat.mtrl-sci, cs.AI]目的:持続可能な材料発見のための機械学習とライフサイクルアセスメント統合フレームワーク
- 材料開発は社会の発展に不可欠であり,高性能化と同時に環境負荷低減が求められる。
- 従来の材料開発では,性能評価後に環境負荷を評価するため,非効率性が存在する。
- 機械学習とライフサイクルアセスメントを統合し,材料設計段階から環境影響を考慮する。
- 機械学習とライフサイクルアセスメントを統合したML-LCAフレームワークを提案した。
- ガラス,セメント,半導体フォトレジスト,ポリマーを対象としたケーススタディで実用性と課題を検証した。
- データ基盤整備,事前評価手法,多目的最適化,法規制の整備が,持続可能な材料設計に重要である。
事実的および反事実的クエリによる線形モデルの抽出 [math.OC, cs.LG]目的:線形モデルのパラメータ抽出
- 機械学習モデルの説明可能性が求められる中,モデルの挙動を理解する手法が重要である。
- ブラックボックスモデルのパラメータ抽出攻撃は,モデルのセキュリティ上の脆弱性となる。
- 距離関数と反事実的クエリの頑健性が,モデルのセキュリティに与える影響を評価する。
- 事実に即したクエリと反事実的なクエリを用いて,未知のモデルの決定領域をパラメータ復元なしに特定できる。
- 微分可能な距離尺度を用いる場合,単一の反事実的クエリでモデル全体を復元可能である。
- 多面体距離を用いる場合,必要なクエリ数はデータ空間の次元に比例し,頑健な反事実的クエリではその数が倍増する。
経験的リスク最小化のための研究者ガイド [stat.ML, cs.LG, math.ST, stat.TH]目的:経験的リスク最小化における高確率後悔境界の参照
- 機械学習の理論的基盤を確立し,汎化性能を保証するためには不可欠である。
- 複雑なモデルやデータに対して,後悔境界の導出が困難である。
- 一般的な導出方法論と,具体的な損失関数への適用例を示す。
- 本研究では,基本的な不等式,一様局所集中不等式,固定点定理に基づく,後悔境界導出の三段階レシピを提示する。
- VC-サブグラフ,ソボレフ/ヘルダ空間,有界変動クラスに対する既知のレートを,局所最大不等式と測度エントロピー積分を用いて復元する。
- 因果推論などの分野における,交絡成分を含む経験的リスク最小化に対しても,後悔伝播境界を導出し,その有用性を示す。
ReDON:再構成可能な自己変調非線形性を持つ回帰型回折光学ニューラルプロセッサ [physics.optics, cs.AI, cs.ET]目的:回帰的かつ自己変調的な非線形性を持つ回折光学ニューラルプロセッサのアーキテクチャ
- 光ドメインでの情報処理により,従来にないエネルギー効率と並列処理が可能となる分野。
- 静的な受動的回折位相マスクによる計算表現力の制約,効率的な非線形応答と再構成可能性の欠如。
- 動的な入力依存光透過による効率的で再構成可能な光計算を実現し,DONNの表現力を拡張。
- ReDONは,軽量なパラメータ関数による位相または強度の変調を通じて効果的な非線形性を提供し,推論オーバーヘッドを最小限に抑える。
- 画像認識およびセグメンテーションベンチマークにおいて,従来のDONNと比較してテスト精度とmIoUが最大20%向上した。
- 本研究は,非ノイマン型アナログプロセッサにおける回帰と自己変調を統合した,再構成可能な非線形光コンピューティングの新たなパラダイムを確立する。
アライメント税とは何か [econ.EM, cs.AI, cs.LG, math.OC]目的:表現空間におけるアライメント税の幾何学的理論
- AI安全性の研究は,強力なAIシステムが人間の意図に沿って動作することを保証する上で不可欠である。
- AIシステムの安全性と能力のトレードオフを定量化する明確な枠組みが存在しない。
- 安全性と能力の間のトレードオフを特徴づける「アライメント税」の概念を形式化し,その性質を解明すること。
- 線形表現の仮定の下で,アライメント税率は,安全性方向と能力部分空間の間の主角度によってパラメータ化される安全性-能力トレードオフのパレートフロンティアを支配する。
- このフロンティアがタイトであり,再帰的な構造を持つことが証明された。能力制約下での安全性-安全性トレードオフも同様の式で記述できる。
- アライメント税は,データの構造によって決定される不可約な成分と,モデル次元に応じて消失するパッキング残差に分解される。
非矩形平均報酬ロバストMDP:最適方策とその過渡的な値 [physics.optics, cs.SY, eess.SY, math.OC, cs.LG, stat.ML]目的:非矩形ロバストマルコフ決定過程における平均報酬基準下での最適方策の存在と,その過渡的な値の評価
- 不確実性の下での意思決定は,現実世界の様々な問題を扱う上で重要である。
- 従来のロバスト最適化手法は,矩形条件を必要とし,適用範囲が限られていた。
- 矩形条件を必要としないロバスト最適化の手法を確立し,過渡的な性能評価を行う。
- 非矩形ロバストMDPにおいても,ある種の履歴依存方策がロバスト最適となることが示された。
- ロバスト値は,古典的な最適ゲインのinfimumとして表現可能であり,動的計画法は不要である。
- 平均報酬最適性は,必ずしも良好な過渡性能を保証せず,新たな下界が導出された。
競合する盆地の間の相転移としてのグロッキング:特異学習理論的アプローチ [stat.ML, cs.LG]目的:グロッキング現象の解明
- 機械学習モデルの汎化性能向上は重要課題である。
- 過学習からの脱却メカニズムが十分に解明されていない。
- グロッキングにおける相転移を理論的に捉える。
- 特異学習理論を用いることで,グロッキングを近ゼロ損失解盆地間の相転移として解釈した。
- 二次ネットワークにおける局所学習係数(LLC)の閉形式解を導出し,実験的に検証した。
- LLCの軌跡が汎化ダイナミクスを追跡し,相転移を解釈する上で有用であることを示した。
DISPLACE-Mチャレンジ Track 1におけるTCG CRESTシステムの説明 [eess.AS, cs.LG]目的:医療現場における話し者区別性能の向上
- 医療対話の自動解析は,診療効率化や患者ケアの質向上に不可欠である。
- 騒音環境下での医療対話における話し者区別は,依然として課題が多い。
- 本研究は,雑音下での医療対話における話し者区別性能の改善を目指す。
- Diarizenシステムは,SpeechBrainベースラインと比較して,DERを約39%相対的に改善した。
- DiarizenとAHCを組み合わせたシステムは,開発データセットで10.37%,評価データセットで9.21%のDERを達成した。
- Phase Iの評価で,11チーム中6位の成績を収めた。
