arXiv雑要約
AI - 2026/03/20 公開
T学習とDR学習の組み合わせ:因果的コントラストのオラクル効率推定のためのフレームワーク [stat.ML, cs.LG, stat.ME]目的:異質因果的コントラストの推定
- 因果推論は,政策評価や医療における治療効果の評価など,様々な分野で重要な役割を果たす。
- 従来の因果推論手法は,非凸損失関数や重み付けの問題,不安定性といった課題を抱えていた。
- これらの課題を克服し,より安定かつ効率的な因果推論手法を開発することを目指す。
- 提案手法であるEP学習は,Neyman-orthogonal学習戦略と同等のオラクル効率を実現する。
- EP学習は,T学習の安定性を維持しつつ,効率性を向上させる。
- シミュレーション実験の結果,EP学習は既存手法(T学習,R学習,DR学習)を上回る性能を示した。
バーチャル染色ヒストロジーにおける幻覚検出:潜在空間のベースライン [eess.IV, cs.CV, cs.LG]目的:バーチャル染色における幻覚検出問題
- 生体医学研究や臨床において,染色のヒストパトロジー解析は不可欠である。
- バーチャル染色はコスト削減やワークフローの効率化に貢献するが,幻覚が臨床的信頼性を損なう可能性がある。
- バーチャル染色における幻覚を事前に検出する手法を開発し,評価基準の改善を目指す。
- 提案手法であるNHPは,様々なバーチャル染色タスクにおいて,幻覚検出の有効性とロバスト性を示した。
- 幻覚の少ないモデルが必ずしも検出されやすいとは限らず,現状のバーチャル染色評価に課題があることが判明した。
- 幻覚検出のためのベンチマークの必要性が示唆された。
埋め込み特徴スコアを用いた合成胸部X線画像の分布忠実性の評価 [math.AT, cs.CG, stat.ML, cs.LG]目的:合成胸部X線画像の分布忠実性評価手法
- 胸部X線画像は臨床診断で広く用いられ,その活用は医療の発展に不可欠である。
- 患者データのプライバシー保護により,公開可能な画像が限られ,合成画像の利用が増加している。
- 合成画像が患者画像の本質的な分布をどれだけ忠実に反映しているかを定量的に評価すること。
- 本研究では,埋め込み特徴スコア(ECS)という新しい評価手法を提案し,合成画像と患者画像を比較した。
- ECSは,特徴量埋め込みの特性関数変換を用いることで,高次モーメントや分布の裾の違いに敏感に反応する。
- ECSと従来のFIDを比較した結果,ECSが臨床的に重要な分布の差異をより適切に検出できることが示された。
計算コストの高いシミュレータに対する多忠実度シミュレーションに基づく推論 [stat.ML, cs.LG]目的:計算コストの高いシミュレータのパラメータ効率的な推論
- 科学の多くの分野で確率モデルは重要であり,観測データ背後のメカニズム理解に不可欠である。
- 高忠実度モデルのパラメータ推論は,シミュレータの計算コストが高い場合に困難を伴う。
- 低忠実度シミュレーションを活用し,高忠実度シミュレータのパラメータ推論を効率化することを目指す。
- 本研究では,転移学習を用いた多忠実度アプローチにより,高忠実度シミュレーションの数を大幅に削減した。
- 提案手法は,アモルタイズドおよびノンアモルタイズドなニューラル事後推定の両方に適用可能である。
- 予測不確実性に基づく適応的な高忠実度パラメータ選択により,シミュレーション効率をさらに向上させた。
一次形式の疎凸最適化:疎な更新によるより良いレート [math.OC, cs.LG]目的:疎な最適解を持つ凸最適化問題における,疎な更新を用いた線形収束レートの達成
- 最適化は機械学習,統計,制御など広範な分野で不可欠であり,効率的な解法が求められている。
- 高次元問題では,計算コストが高く,スパース性を活用した効率的なアルゴリズムが課題である。
- 最適解のスパース性を活用し,各反復の実行時間を削減することで,より実用的なアルゴリズムを開発する。
- 本研究では,最適解のスパース性を利用して,反復あたりの計算コストを削減する手法を提案した。
- 提案手法は,改善された混合ノルム条件数に基づく線形収束レートを維持しつつ,疎な更新のみを用いる。
- この手法は実装が容易であり,高次元問題における実行時間を大幅に改善する可能性がある。
インピンジングジェットアレイにおける熱伝達予測のための代理モデル:動的入口/出口と流量制御を用いた [physics.flu-dyn, cs.AI]目的:インピンジングジェットアレイにおけるヌッセルト数分布の予測
- 熱管理技術の高度化には,リアルタイムでの熱伝達予測が不可欠である。
- 詳細なCFDシミュレーションは計算コストが高く,リアルタイム制御への応用が困難である。
- CFDシミュレーションの代替として,高速な予測が可能な代理モデルを開発する。
- CNNベースの代理モデルがヌッセルト数分布をリアルタイムで高精度に予測可能となった。
- 5x1アレイでは2%未満,3x3アレイでは0.6%以下の正規化平均絶対誤差を達成した。
- 実験的検証により,モデルの予測能力が確認された。高度な熱管理応用の基盤となる。
InsurTechを活用したエンティティ固有のサイバーリスク評価 [q-fin.RM, cs.LG, stat.ML]目的:エンティティ固有のサイバーリスク評価のためのフレームワーク
- サイバー攻撃は増加の一途をたどっており,組織への影響が深刻化しているため,リスク評価が不可欠である。
- 公開されているサイバーインシデントデータの質と量が限られており,精度の高いリスク評価が困難である。
- InsurTechを活用し,エンティティ固有の属性を取り入れることで,リスク評価の精度向上を目指す。
- InsurTechによって強化された特徴量は,従来の要因のみを使用した場合と比較して,予測のロバスト性を向上させる。
- 多ラベル分類モデルおよび多出力回帰モデルを開発し,サイバーインシデントの種類と発生頻度の推定を行った。
- 本フレームワークは,透明性の高いエンティティ固有のサイバーリスクプロファイルを生成し,カスタマイズされたアンダーライティングとプロアクティブなリスク軽減を支援する。
コンピューター断層撮影における逆問題に対する教師なし学習 [physics.med-ph, cs.AI]目的:コンピューター断層撮影の逆問題解決手法
- 医療診断において,迅速かつ正確な画像再構成は不可欠であり,その重要性は高い。
- 教師データなしでの逆問題解決は困難であり,既存手法では精度や効率に限界があった。
- 教師なし学習により,高品質な画像再構成を効率的に実現し,リアルタイム医療画像への応用を目指す。
- 提案手法は,2DeteCTデータセットにおいて,平均二乗誤差(MSE)と構造類似性指標(SSIM)で従来の再構成手法を上回った。
- 教師あり深層学習と同等の性能を示しつつ,再構成時間を大幅に短縮することに成功した。
- 投影幾何学への適応性向上やその他の医療画像への応用が期待される。
ニュートリノ散乱における転移学習:GANsを用いたドメイン適応 [hep-ph, cs.LG, hep-ex, nucl-ex, physics.comp-ph]目的:ニュートリノ散乱における転移学習の有効性
- ニュートリノ物理学は,宇宙の構成要素や進化を理解する上で不可欠な分野である。
- 実験データが不足している場合,正確なニュートリノ相互作用モデルの構築が困難である。
- GANsで学習した知識を応用し,データ不足を補い,モデルの精度向上を目指す。
- 転移学習は,レプトンの運動学的特徴を再現するだけでなく,ゼロから学習した生成モデルを大幅に上回る性能を示す。
- 統計量が限られていても,高い精度を維持できることが,1万件および10万件のデータセットを用いた実験で確認された。
- 転移学習は,(反)ニュートリノ核相互作用のモデリングや次世代ニュートリノ散乱事象生成器の構築に有効な枠組みを提供する。
実データを用いたマッチングモデルに対するユニバーサル逆蒸留 (GANなし) [stat.ML, cs.LG]目的:マッチングモデルの効率的なワンステップ生成器の学習
- 生成モデルの品質向上は重要だが,推論速度が課題となっている。
- 既存の蒸留法は特定のフレームワークに限定され,実データ利用にGANが必要。
- 実データを取り込み,GANなしで汎用的な蒸留を可能にすること。
- 提案手法RealUIDは,Flow MatchingやDiffusionモデルを含む様々なマッチングモデルに適用可能である。
- RealUIDは,既存の蒸留手法の理論的基盤を包含し,拡張性も高い。
- 実データを取り込むことで,GANを必要とせずに高品質な生成が可能になる。
マルチバンドセルラーハンドセットにおけるTransformerベースのレート予測 [eess.SP, cs.IT, cs.LG, math.IT]目的:マルチバンドおよび複数アンテナアレイにおける達成可能なレートの予測
- 周波数帯の増加により,セルラーシステムは複雑化しており,効率的な周波数管理が不可欠である。
- アンテナの視野角の制限やハードウェア制約により,信頼性の高いマルチバンドチャンネル追跡が困難である。
- 疎な過去の測定値からレートを予測し,バンド選択の精度を向上させることを目指す。
- 提案手法は,現実的な移動環境下において,既存の予測モデルよりも優れた性能を示すことが確認された。
- Transformerベースのニューラルアーキテクチャは,非同期のレート履歴を入力として,アレイごとのレート予測を出力する。
- シミュレーション結果から,提案手法が限られたハードウェアリソース下でのバンド選択に貢献する可能性が示された。
細胞間コミュニケーションの推論と解析:生物学的メカニズム,計算論的アプローチ,および将来の機会 [q-bio.QM, cs.AI, q-bio.CB]目的:細胞間コミュニケーションの推論と解析
- 多細胞生物において,発生,組織恒常性,疾患進行に不可欠であり,生命現象理解の基盤となる。
- 既存手法では,複雑なシグナル伝達機構の正確なモデル化が困難であり,網羅的な解析が課題である。
- シングルセル・空間オミクスデータから細胞間コミュニケーションを効率的に推論・解析する手法の確立を目指す。
- シングルセルおよび空間トランスクリプトームデータを用いた細胞間コミュニケーションの解析手法が140以上存在することが示された。
- これらの手法は,方法論的枠組みと生物学的問いにおいて多様性が認められる。
- 細胞間コミュニケーション解析の現状と課題,将来の展望が議論され,効率的な手法選択のためのオンラインリソースが提供されている。
複雑な化学空間における長距離機械学習ポテンシャルの一般化 [physics.chem-ph, cs.LG]目的:機械学習原子間ポテンシャル(MLIP)の一般化
- 化学空間の広大さから,機械学習ポテンシャルの一般化は重要な課題である。
- 既存のMLIPは,分布外のサンプルへの転移性が低いという課題がある。
- 未知の化学空間領域への転移性を高めるためのMLIP設計指針を提供する。
- 長距離補正は,分布内性能の向上だけでなく,転移性の向上にも不可欠であることが示された。
- バイアスをかけた学習・テスト分割戦略により,化学空間の異なる領域におけるモデル性能を厳密に評価できる。
- 本研究は,金属有機構造体以外にも広く適用可能であり,より堅牢で転移性の高いMLIP設計に貢献する。
非線形加速故障時間モデルのための構造化非パラメトリックフレームワーク (KAN-AFT) [stat.ML, cs.LG]目的:非線形加速故障時間モデルの構造化非パラメトリック拡張
- 生存時間解析において,共変量の効果を直接解釈可能な時間スケールで記述することが重要である。
- 従来のモデルは線形予測子に依存し,非線形関係の表現に限界がある。
- 複雑な共変量構造や検閲メカニズム下で,既存のモデルの構造的制約を克服する。
- 提案手法は,Kolmogorov-Arnold表現を用いて生存時間に対する非線形関数を推定する。
- シミュレーション研究により,線形構造の回収と非線形効果の捕捉が可能であることが示された。
- 臨床データへの応用により,競合的な予測性能と透明性の高い共変量効果推定が確認された。
重裾雑音下における非滑らかな凸最適化のためのクリップ勾配法:洗練された分析 [math.OC, cs.LG, stat.ML]目的:重裾雑音下における非滑らかな凸最適化問題に対するクリップ勾配法の収束レートの改善
- 機械学習タスクの多くは,有限の二乗モーメントではなく,より現実的な重裾雑音を持つことが経験的に示されている。
- 従来の解析では,クリップ勾配法の性能が十分に引き出せておらず,より高速な収束レートの実現が課題であった。
- 汎化された有効次元を導入し,フリードマンの不等式をより効果的に利用することで,既存の結果よりも高速な収束レートを示す。
- クリップ勾配法(Clipped SGD)に対する洗練された分析により,非滑らかな凸問題では ${\cal O}(\sigma_{\frak l}d_{\rm eff}^{-1/2{\frak p}}\ln^{1-1/{\frak p}}(1/\delta)T^{1/{\frak p}-1})$,強凸問題では ${\cal O}(\sigma_{\frak l}^2d_{\rm eff}^{-1/{\frak p}}\ln^{2-2/{\frak p}}(1/\delta)T^{2/{\frak p}-2})$ という,これまでで最速の収束レートが得られた。
- 期待値収束についても解析を拡張し,既知の下限を破る新しいレートを導出した。これは,期待値収束における解析の最適性を示唆している。
- 高確率収束と期待値収束の両方について新たな下限を確立し,期待値収束の下限は新しい上限と一致することから,解析の洗練度が確認された。
展開と疎化表現を用いた密度とモード推定の最適レート [quant-ph, cs.SY, eess.SY, math.ST, cs.AI, cs.LG, stat.ML, stat.TH]目的:密度とモード推定における最適レート
- 感覚系の疎な表現現象を捉える理論モデルとして重要である。神経科学や機械学習への応用が期待される。
- 高次元データにおける効率的な密度推定とモード推定が課題となっている。計算コストと精度のバランスが難しい。
- 展開と疎化表現がこれらの問題解決に有効か検証する。理論的なレートを導出する。
- 展開と疎化表現を用いた密度推定は,最適な$\ell_{\infty}$収束レートを持つことが示された。
- 密度推定器を基盤としたモード推定アルゴリズムは,対数因子を除き最適なレートでモードを復元する。
- 本研究は,高次元データ解析における新たなアプローチの可能性を示唆している。
量子極限学習機械の理論と解釈可能性:パウリ転送行列アプローチ [math.OC, cs.MA, cs.SY, eess.SY, quant-ph, cs.LG]目的:量子極限学習機械の性能に影響するエンコーディング,貯蔵庫動力学,測定操作の理論的分析
- 量子機械学習は,古典機械学習の限界を克服する可能性を秘めており,注目を集めている。
- 量子極限学習機械は,その理論的基盤が十分に確立されておらず,性能向上が課題である。
- パウリ転送行列形式を用いて,量子極限学習機械の性能を決定する要素を解明し,最適化を目指す。
- パウリ転送行列形式を用いることで,エンコーディングが量子極限学習機械が利用可能な非線形特徴を決定することが明らかになった。
- 量子チャネルはこれらの特徴を線形変換し,測定演算子によって特徴が抽出される。この変換を制御することが最適化の鍵となる。
- 量子極限学習機械は,非線形動的システムの学習において,基になるフローマップの近似を学習することが示された。
量子拡散モデルにおけるスコア反転は無償ではない [quant-ph, cs.LG, math-ph, math.MP]目的:量子拡散モデルにおけるスコア反転のコスト
- 量子情報処理の発展には,ノイズの影響を克服し,高精度な状態操作を実現することが不可欠である。
- 従来の量子拡散モデルの逆拡散プロセスにおけるノイズの発生メカニズムが十分に解明されていない。
- 本研究は,量子拡散モデルにおけるスコア反転のコストを理論的に決定し,最適化を目指す。
- ガウス純損失動力学において,スコア反転は,臨界スクイージング・熱比以下ではノイズレスに,それ以上では不可避なノイズを伴うことが示された。
- 最適な逆拡散は,幾何学的,測光学的,熱力学的なコストを同時に最小化する共分散アラインメントを持つことが証明された。
- 純粋な非古典的エンドポイントを含む場合,最適スコア反転は動的に達成不可能であり,コストは時間と共に発散する。
発声および無声音の音声生成における感情の解読:表面筋電図からのアプローチ [eess.AS, cs.AI, cs.SD]目的:発声および無声音の音声生成における感情解読の可能性
- 感情はコミュニケーションにおいて不可欠であり,そのメカニズム解明は重要である。
- 音声と感情の関連性は明らかではない点があり,解明が求められている。
- 表面筋電図を用いて,感情と音声生成の関連性を明らかにすることを目指す。
- 表面筋電図を用いることで,フラストレーションを最大0.845のAUCで信頼性高く識別できることが示された。
- この識別性能は,発声と無声音のどちらにおいても良好に一般化することが確認された。
- 表情筋の活動に感情的な特徴が埋め込まれており,発声がなくても持続することが示唆された。
専門家による助言付きの先送り学習 [quant-ph, cs.NI, eess.SP, math.OC, cs.RO, cs.SY, eess.SY, math.PR, cs.PF, stat.ML, cs.LG]目的:最適なコストが期待される専門家への入力経路
- 現代のAIシステムでは,専門家選択と情報獲得を連携させる重要性が高まっている。
- 既存の先送り学習は,専門家が利用できる情報が固定されている前提で,柔軟性に欠ける。
- 助言の獲得戦略を適応的に学習し,先送り学習の性能向上を目指す。
- 提案手法は,専門家選択と助言獲得を統合的に扱うことで,標準的な先送り学習を改善する。
- 分離型代理モデルの一貫性の問題を理論的に証明し,拡張代理モデルによる解決策を示す。
- テーブル形式,言語,マルチモーダルタスクでの実験により,提案手法の有効性を確認した。
学習された距離尺度を用いた$K$-平均法 [math.ST, cs.LG, math.PR, stat.TH]目的:測度と距離が未知の場合における計量測度空間のFréchet $k$-平均法の研究
- 多様なデータ解析において,適切な距離尺度の選択が重要であり,その学習法は性能向上に不可欠である。
- 既存の$k$-平均法では,距離尺度が固定されており,データに最適化された距離尺度を学習する手法が不足している。
- 未知の測度と距離を推定し,統計的推論の整合性を保証する一般的な枠組みを確立し,新しい整合性結果を得る。
- 測定されたグロモフ・ハウスドルフ位相において,$k$-平均法が連続であるという一般的な結果が示された。
- 得られたVoronoiクラスターの安定性に関する結果も示され,一意性が仮定されない場合でもより強い結果が得られる。
- Isomap,拡散距離,Wasserstein距離など,いくつかの重要な推定量に対して新たな整合性結果が得られた。
ニューラルネットワークの局所から大域への計算 [math.AT, cs.LG, math.DS]目的:ニューラルネットワークの計算構造の数学的表現
- 深層学習の理論的理解が不十分であり,その動作原理の解明が求められている。
- 勾配降下法に依存した学習は,局所最適解に陥りやすく,効率的な学習が課題となっている。
- ニューラルネットワークの計算を,層間の情報伝播に着目して解析し,新しい学習手法の理論的基盤を構築する。
- ReLUニューラルネットワークを,層ごとの計算ステップを辺で結んだ頂点を持つセル状の構造(sheaf)として表現した。
- このsheaf構造におけるLaplacianが正定値であることより,順伝播出力が一意に定まることが示された。
- sheaf熱方程式は指数関数的に出力に収束し,双方向の情報伝播により,勾配降下法に依存しない学習や詳細なネットワーク診断が可能となることが示唆された。
収束の最前線:次世代創薬のための機械学習と高性能量子コンピューティングの統合 [quant-ph, cs.LG, physics.chem-ph]目的:機械学習,高性能計算,量子コンピューティングの融合による創薬パイプラインの最適化
- 創薬において,経験則に頼る方法から定量的な精度を追求する方向への転換が求められている
- 高精度な計算には大きなコストがかかり,計算規模と化学的精度を両立させることが課題であった
- 高性能量子コンピューティングを利用し,量子化学データの生成を加速することで,この課題を解決する
- 機械学習の基盤モデルは量子レベルのシミュレーションを可能にするが,古典的なデータ生成の限界がある
- 高性能量子コンピューティングは,ハイブリッドQPU-GPUアーキテクチャを利用し,真の化学的精度を実現する
- 量子相補的サンプリングは,GPUの限界を超え,反応性細胞系や次世代材料のモデル化を可能にする
