arXiv雑要約

AI - 2026/03/02 公開

微分方程式の解析解を求めるニューロシンボリックAI [cs.LG, cs.NA, math.NA, physics.comp-ph]目的：微分方程式の解析解自動探索手法
- 科学技術の発展には，物理現象を正確に記述する微分方程式の解析解が不可欠である。
- 解析解の発見は専門家の直感や膨大な探索に頼るため，困難な課題となっている。
- 本研究は，ニューロシンボリックAIを用いて，効率的かつデータフリーな解析解探索を実現する。
- SIGSは，文法に基づいた表現生成と数値最適化を組み合わせた革新的なフレームワークである。
- SIGSは，非線形偏微分方程式系を解析的に解くことに世界で初めて成功した。
- SIGSは，文法仕様の誤りがあっても解を発見でき，解析解が存在しない方程式に対しても高精度な近似解を生成する。
Link: https://arxiv.org/abs/2502.01476
爪の出現：MoltbookにおけるAIエージェントの初期ソーシャルネットワーク分析 [physics.soc-ph, cs.AI, cs.CY, cs.SI]目的：AIエージェントのソーシャルプラットフォームにおける初期のネットワーク構造
- AIエージェント間の相互作用は，社会システムの理解を深める上で重要である。
- AIエージェントのプラットフォームにおける構造形成の速さやメカニズムは不明である。
- AIエージェントの初期段階におけるソーシャルネットワークの構造を明らかにすること。
- Moltbookの立ち上げ12日間で，プラットフォーム内に著しい注意の集中，階層構造，一方通行の注意の流れが見られた。
- コメントと投稿の関係を分析した結果，相互作用は非対称であり，ハブとオーソリティの役割が明確に分離されていた。
- 富める者がさらに富むという現象が見られ，初期に活動したアカウントが高い評価を得る傾向が示された。
Link: https://arxiv.org/abs/2602.20044
非ユークリッド空間における浅層・深層ニューラルネットワークの普遍性 [math.GN, cs.LG, cs.NE, math.FA]目的：非ユークリッド空間上のニューラルネットワークの近似普遍性
- 機械学習は様々な分野で活用されており，その理論的基盤の確立が重要である。
- 従来の近似定理は主にユークリッド空間に限定されており，より一般的な空間への拡張が課題であった。
- 一般的なトポロジー空間におけるニューラルネットワークの近似能力を明らかにすること。
- 浅層および深層ニューラルネットワークは，連続ベクトルの関数空間において密であることを示した。
- 幅の制約がない場合，古典的な近似定理が非ユークリッド空間に拡張されることが明らかになった。
- コンパクトな測度空間の積に対して，幅の制約下でも普遍的な近似能力を維持する条件を特定した。
Link: https://arxiv.org/abs/2602.23381
複雑ネットワークと薬剤再配置問題 [q-bio.MN, cs.LG]目的：薬剤再配置のためのネットワーク拡散推薦システム
- 創薬は時間とコストがかかるため，既存薬の新たな用途を見出す効率的な手法が求められている。
- 既存の薬剤とタンパク質の相互作用ネットワークの構造が十分に活用されていない現状がある。
- ネットワーク構造を活用し，熱帯性疾患の原因となるタンパク質に対する薬剤候補を特定する。
- 薬剤とタンパク質の多層ネットワークのグラフ的性質を分析し，過去の発見事例を分類した。
- ネットワーク拡散推薦システムを構築し，薬剤の再配置候補を優先順位付けした。
- 熱帯性疾患の原因タンパク質に対する薬剤再配置の可能性を示唆する結果が得られた。
Link: https://arxiv.org/abs/2602.23396
SALIENT：頻度を考慮したペア拡散による制御可能な長尾CT検出 [astro-ph.HE, astro-ph.IM, cs.DC, eess.IV, cs.AI, cs.CV, cs.LG]目的：長尾分布における制御可能なCT画像拡張
- 全身CT検査において，稀な病変の検出は臨床上重要であり，早期発見に繋がる。
- 病変の出現頻度の偏り(長尾分布)が検出精度を低下させる主要な原因となっている。
- 頻度を考慮した拡散モデルを用いて，高精度な病変検出を可能にする。
- SALIENTは，離散ウェーブレット係数上で構造化された拡散を行うことで，計算効率の高い画像生成を実現した。
- 生成された画像の現実感は，MS-SSIMの向上(0.63から0.83)とFIDの低下(118.4から46.5)によって示された。
- SALIENTによる拡張データを用いた訓練は，低頻度病変の検出性能を大幅に向上させ，シードデータ量に応じた最適な合成比率を示した。
Link: https://arxiv.org/abs/2602.23447
ニューラル・アンサンブルカルマンフィルタ：衝撃波を含む圧縮性流体のデータ同化 [physics.flu-dyn, cs.LG]目的：衝撃波を含む圧縮性流体のデータ同化手法の改善
- 気象予報や航空力学など，流体シミュレーションは科学技術の発展に不可欠である。
- 既存のデータ同化手法は，衝撃波近傍で不安定な振動や非物理的な解を生じやすい。
- ニューラルネットワークを利用し，より安定したデータ同化を実現し，予測精度を向上させる。
- 標準的なEnKFの性能低下は，衝撃波位置の不確実性に起因する二峰性の予測分布が原因であることが示された。
- ニューラルEnKFは，深層ニューラルネットワークのパラメータ空間へのマッピングと，その空間内でのデータ同化により，この問題を解決する。
- 物理情報に基づいた転移学習を用いることで，ネットワークパラメータの変動を滑らかにし，安定したデータ同化を可能にした。
Link: https://arxiv.org/abs/2602.23461
SegReg：医療画像セグメンテーションの改善のための潜在空間の正則化 [eess.IV, cs.AI, cs.CV]目的：医療画像セグメンテーションにおける汎化性能の向上
- 医療画像セグメンテーションは，疾患診断や治療計画において不可欠な技術である。
- 既存手法では，出力空間のみが制約され，潜在表現が十分に活用されていない。
- 潜在空間に正則化を導入し，モデルの汎化性能と継続学習能力を向上させる。
- SegRegは，U-Netモデルの潜在空間に正則化を施すことで，構造化された埋め込み表現を促す。
- Prostate，Cardiac，Hippocampusのセグメンテーションにおいて，ドメイン汎化性能の向上を確認した。
- 継続学習において，タスクドリフトの軽減と順方向転移の促進に貢献し，メモリやパラメータ増加を伴わない。
Link: https://arxiv.org/abs/2602.23509
補助変数誘導生成モデルによる暗黒物質ハロー構造の物理的要因の解明 [math.CO, cs.DM, stat.ML, cs.LG]目的：暗黒物質ハローの熱Sunyaev-Zel'dovichマップの表現の分離
- 宇宙論的構造の研究において，暗黒物質ハローは構成要素として重要であり，その構造理解は宇宙の進化を解き明かす鍵となる。
- 深層生成モデルは高次元データを圧縮するが，潜在空間において異なる物理的要因が混同され，解釈が困難となる場合がある。
- 潜在空間に物理的解釈可能な変数を導入し，潜在空間の構造を明確化することで，宇宙論的構造の診断ツールを開発する。
- 提案手法DL-CFMは，確立された質量-集中度のスケーリング関係を再現し，特異なハロー形成史を持つ可能性のある潜在空間の異常値を特定した。
- 補助変数による誘導は，生成の柔軟性を維持しつつ，物理的に意味のある分離された埋め込み表現を実現することが示された。
- 本研究は，複雑な天体データセットにおける独立した要因の解明に向けた汎用的な経路を提供する。
Link: https://arxiv.org/abs/2602.23518
大規模3D脳MRIデータを用いた事前学習済みモデルの知識転移: 少数の学習データによる継続学習 [eess.IV, cs.CV, cs.LG]目的：3D脳MRIにおける少数の学習データによる継続学習手法の開発
- 医療画像解析において，大規模な事前学習済みモデルの活用が重要視されている。
- 継続学習において，限られた学習データでのタスク適応時に知識の忘却が課題となる。
- 事前学習済みモデルを固定し，少量のパラメータでタスク適応を行うことで忘却を防ぐ。
- タスク固有のLoRAモジュールを用いることで，腫瘍セグメンテーションと脳年齢推定の両タスクで高い性能を維持した。
- 従来の継続学習手法と比較して，忘却を抑制しつつ，学習パラメータ数を大幅に削減した。
- 脳年齢推定において系統的な若年化傾向が認められたが，実用的な継続学習手法となりうる可能性を示唆した。
Link: https://arxiv.org/abs/2602.23533
有限f-ダイバージェンス下における分配関数の推定 [stat.ML, cs.LG]目的：分配関数の推定における統計的複雑性
- 統計物理学や機械学習において，分配関数は重要な役割を果たす。その推定は，様々な推論問題に不可欠である。
- 既存手法は，領域やモデルの構造に関する強い仮定に依存しており，汎用性に欠ける場合がある。
- 提案分布と目標分布の関係のみに基づいて，より一般的な情報理論的特徴付けを提供し，推定のサンプル複雑性を解明する。
- 提案手法では，積分被覆プロファイルという関数を導入し，密度比が大きい領域における目標分布の質量を定量化する。
- この積分被覆プロファイルが，乗法的分配関数推定のサンプル複雑性を特徴づけることが示され，整合的な下限も導出された。
- 本研究は，重要度サンプリングや自己正規化重要度サンプリングの有限サンプル保証を改善し，近似サンプリングとカウントの複雑性の分離を示す。
Link: https://arxiv.org/abs/2602.23535
知識誘導型注意機構を用いた階層型マルチスケールグラフ学習による全スライド画像生存率解析 [eess.IV, cs.AI, cs.CV]目的：全スライド画像におけるマルチスケールな相互作用と空間的な階層構造のモデリング
- 癌の予後予測は，個別化医療の実現に不可欠であり，病理画像の解析が重要な役割を果たす。
- 従来のMIL(Multiple Instance Learning)では空間的な組織が無視され，グラフベースのMILでは静的なグラフに依存する。
- 空間的な局所性を考慮した階層構造を導入し，マルチスケールな特徴統合を行うことで，予後予測の精度向上を目指す。
- 提案手法HMKGNは，4つのTCGAコホート(KIRC, LGG, PAAD, STAD)において，既存のMILベースモデルを上回る性能を示した。
- 一致度指標(concordance index)が10.85%改善し，患者の生存リスクを統計的に有意に層別化することができた(log-rank p < 0.05)。
- HMKGNは，ROIレベルでのマルチスケール統合と，空間的な階層構造を持つ動的グラフを効果的に活用している。
Link: https://arxiv.org/abs/2602.23557
VaSST：ソフト記号木を用いた記号回帰の変分推論 [stat.ME, cs.LG, cs.SC, stat.CO, stat.ML]目的：記号回帰による物理法則の抽出
- データから物理法則を発見するAI研究が重要視されているため。
- 既存手法は探索的，または低ノイズ環境に限定され，不確実性評価が困難。
- 多峰性空間での効率的な探索と不確実性評価を可能にする手法を開発。
- VaSSTは，記号木を連続的に緩和したソフト記号木を用いることで，勾配降下法による効率的な最適化を実現。
- ソフト表現から得られる事後分布により，記号構造の不確実性を定量化することが可能。
- シミュレーション実験およびSRBenchのFeynmanデータセットにおいて，最先端手法を上回る性能を示した。
Link: https://arxiv.org/abs/2602.23561
回帰を用いたテンソル超収縮誤差補正 [physics.chem-ph, cs.LG]目的：テンソル超収縮法による近似誤差の補正
- 分子の電子構造予測において，動的電子相関を考慮した高精度な手法は不可欠である。
- 動的電子相関の高精度な計算は計算コストが高く，大規模分子への適用が困難である。
- 機械学習を用いてテンソル超収縮法による近似誤差を補正し，計算コストと精度のバランスを取る。
- 非線形回帰モデルは，全分子エネルギーにおけるテンソル超収縮法と標準MP3の二乗平均平方根誤差を6～9倍削減した。
- 反応エネルギーに関しては，同様のモデルが二乗平均平方根誤差を2～3倍削減した。
- 回帰技術を用いることで，テンソル超収縮MP3法の精度を向上させることが示された。
Link: https://arxiv.org/abs/2602.23567
瞬間が重要である：不均一分散観測データからの平均と分散因果グラフの発見 [stat.ML, cs.LG]目的：不均一分散観測データからの平均因果グラフと分散因果グラフの推定
- データに不均一分散が存在することは一般的であり，その原因を統計的モーメントの観点から解明することは重要である。
- 従来の因果探索は，平均と分散に作用する原因を区別できず，解釈性や介入設計の妨げとなる。
- 平均と分散に作用する原因を分離して推定することで，より詳細な因果構造の解明を目指す。
- 提案手法は，平均と分散の因果グラフをそれぞれ識別するための十分条件を導出した。
- 変分推論を用いて，2つのグラフ構造に対する事後分布を学習し，構造的特徴の不確実性を定量化する。
- シミュレーションデータおよび実データによる実験で，提案手法が平均と分散の構造を正確に復元し，既存手法を上回る性能を示すことが確認された。
Link: https://arxiv.org/abs/2602.23602
グラフ不確実性下での公平性：変数クラスターにおける部分的に既知の因果グラフを用いた介入的公平性の達成 [stat.ML, cs.LG]目的：介入的公平性の達成
- 個人に対するアルゴリズム的決定において，正確性に加え，公平性が重要である。
- 既存手法は詳細な因果グラフの知識を前提とするが，その推定は現実的には困難である。
- 変数クラスター上の因果グラフを用いることで，限られた知識下での公平性を実現する。
- 提案手法は，変数レベルのグラフと比較して推定が容易なクラスター因果グラフを活用する。
- 介入分布間の最悪の乖離を削減することで，予測モデルを訓練する。
- 実験結果から，既存手法と比較して，公平性と精度のバランスに優れることが示された。
Link: https://arxiv.org/abs/2602.23611
ReDON：再構成可能な自己変調非線形性を持つ回帰型回折光学ニューラルプロセッサ [physics.optics, cs.AI, cs.ET]目的：再構成可能な回帰型自己変調非線形性を持つ回折光学ニューラルプロセッサのアーキテクチャ
- 近年，光学計算は，そのエネルギー効率と並列性から注目を集めている。
- 従来のDONNは，静的な回折位相マスクによって計算表現力が制限されている。
- 回帰的な自己変調非線形性を導入することで，DONNの表現力と適応性を向上させる。
- ReDONは，光学的な自己変調を利用して動的な入力依存透過を実現し，効率的な計算を可能にする。
- 画像認識およびセグメンテーションのベンチマークにおいて，従来のDONNと比較して最大20%のテスト精度とmIoUの改善が確認された。
- この研究は，再構成可能な非線形光学計算の新たなパラダイムを確立する。
Link: https://arxiv.org/abs/2602.23616
多変量時空間ニューラルホークス過程 [physics.optics, cs.AR, stat.ML, cs.LG, math.ST, stat.AP, stat.ME, stat.TH]目的：複雑な多変量イベントデータの時空間動態のモデリング
- イベントデータの分析は，感染症の蔓延やテロリズムの予測など，様々な分野で重要である
- 従来のモデルでは，イベント間の複雑な相互作用や空間的な影響を捉えるのが困難であった
- 時空間的な情報を取り入れた新しいモデルを構築し，イベントデータの予測精度を向上させる
- 提案手法は，多変量時空間点パターンの時間的・空間的強度構造を適切に復元できることをシミュレーションにより示した
- 既存の時間的ニューラルホークス過程アプローチでは，この復元は困難である
- パキスタンのテロデータへの応用は，複数のイベントタイプ間の複雑な時空間的相互作用を捉える能力を実証した
Link: https://arxiv.org/abs/2602.23629
惑星居住可能性分類における極端なクラス不均衡下での能動学習 [astro-ph.EP, astro-ph.IM, cs.LG]目的：惑星居住可能性分類の効率向上
- 系外惑星の数は増加の一途を辿っており，居住可能性の評価は重要である。
- 居住可能な惑星は稀であり，ラベル付けも変化するため，分類は困難である。
- 能動学習を用いて，少ないラベル資源で効率的に居住可能性を評価する。
- 能動学習は，教師あり学習の性能に近づくために必要なラベル付きインスタンス数を大幅に削減する。
- 不確実性に基づくマージンサンプリングは，ランダムなクエリよりも優れたラベル効率を示す。
- 能動学習モデルのアンサンブルは，さらなる研究の対象となる候補惑星を特定するのに役立つ。
Link: https://arxiv.org/abs/2602.23666
汎用ベイズ方策学習 [stat.ML, cs.LG, econ.EM, math.ST, stat.ME, stat.TH]目的：方策学習のための汎用ベイズフレームワーク
- 意思決定問題は，医療や金融など，多くの分野で重要である。
- 最適な方策を見つけるためには，統計的推論と最適化を組み合わせる必要がある。
- 期待される福利を最大化する方策を，ベイズ更新を用いて効率的に学習する。
- 本研究では，福利最大化を二乗誤差の最小化に置き換えることで，汎用ベイズ事後分布を導出した。
- この事後分布はガウス型偽尤度として解釈でき，ニューラルネットワークへの実装も容易である。
- PAC-Bayes型の理論的保証も提供し，学習の信頼性を示した。
Link: https://arxiv.org/abs/2602.23672
データ駆動型犯罪予測のためのホットスポットマッピング [eess.SP, cs.HC, math.CO, cs.DM, stat.AP, cs.LG]目的：犯罪予測のためのホットスポットマッピング
- 都市における犯罪管理において，効果的な資源配分が重要であり，予測技術が不可欠である。
- 従来の犯罪予測は，専門家の経験に頼る部分が大きく，客観的なデータ分析が不足している。
- 過去の犯罪データに基づき，データ駆動型で客観的なホットスポットマッピングを実現する。
- 本研究では，時空間カーネル密度推定を用いたノンパラメトリックモデルを開発した。
- 提案手法は，専門家の知見を取り入れることが可能であり，実用性が高い。
- デリー警察との共同実験で有効性が確認され，パトロール車両の効率的な配置に貢献できることが示された。
Link: https://arxiv.org/abs/2602.23750
現実世界のワークフロー制約下における縦断的因果発見の運用化 [stat.ME, cs.AI, cs.LG]目的：縦断的因果発見のためのワークフロー制約クラス
- 大規模な縦断的データ分析は，医療や社会科学において重要な課題である。
- 実世界のデータは，記録プロセスとの整合性が取れない部分的な順序を持つことが多い。
- ワークフローに由来する制約を形式化することで，因果構造の解釈性を高めることを目指す。
- ワークフロー制約を組み込むことで，構造的な曖昧さが軽減され，より一貫性のある結果が得られた。
- 日本の全国的な健康診断コホート研究において，時間的に整合性のある部分構造と解釈可能な遅延効果が確認された。
- 感度分析の結果，主要な定性的なパターンは維持され，結果の頑健性が示された。
Link: https://arxiv.org/abs/2602.23800
分散最適化のための分散半滑らかニュートン法に基づく拡張ラグランジュ法 [math.OC, cs.LG, cs.NA, math.NA, stat.ML]目的：ネットワーク上の最適化問題に対する解法
- 近年，大規模データの分散処理が重要視され，分散最適化の研究が盛んである。
- エージェント間の通信コストがボトルネックとなり，効率的なアルゴリズムが求められている。
- 通信量を削減しつつ，高速な収束を実現する分散最適化アルゴリズムを提案する。
- 拡張ラグランジュ法と分散半滑らかニュートン法を組み合わせた新たなアルゴリズムを提案した。
- 一般化ヘッセ行列の構造を利用した分散加速近接勾配法により，ニュートン方向を効率的に計算する。
- 提案アルゴリズムの収束性を示す理論的結果と，既存アルゴリズムとの比較実験により有効性を確認した。
Link: https://arxiv.org/abs/2602.23854
科学的モデリングによる持続可能なパーソナルケア成分組み合わせの解明 [physics.chem-ph, cs.AI, stat.AP]目的：持続可能なパーソナルケア成分組み合わせの提案
- パーソナルケア市場は成長を続けるが，環境負荷が課題となっている。
- 合成成分の規制強化と消費者の環境意識の高まりが，代替成分開発を迫っている。
- 合成成分の代替となる，性能とコストを両立した天然成分組み合わせを迅速に提案する。
- 予測モデリングとシミュレーションにより，合成成分の代替となる天然成分組み合わせを特定した。
- 提案された組み合わせは，既存の処方への応用を通じて有効性が示された。
- デジタルサービスプラットフォームを通じて，処方開発者が環境に配慮した代替成分を探索できるよう支援する。
Link: https://arxiv.org/abs/2602.23887
実験に基づくタンパク質アンサンブル生成のための推論時最適化 [q-bio.BM, cs.LG]目的：実験データとの整合性を持つタンパク質動的構造アンサンブルの生成
- タンパク質の機能は動的な構造アンサンブルに依存し，その理解は生命科学研究において重要である。
- 既存の生成モデルは実験データと一致するアンサンブルを生成するのに苦労しており，信頼性の高い構造予測が課題である。
- 推論時最適化により，実験データに合致した，物理的に妥当なタンパク質アンサンブルの生成を目指す。
- 提案手法は，既存のガイダンス手法を凌駕し，X線結晶学やNMRデータとの整合性を向上させる。
- 最適化によって生成されたアンサンブルは，既存のPDB構造よりも実験データに適合する傾向がある。
- AlphaFold3の埋め込みを摂動することで，モデルの信頼度を人工的に高める脆弱性が明らかになった。
Link: https://arxiv.org/abs/2602.24007
光学粒子検出器の微分可能なキャリブレーションと再構成 [hep-ex, cs.LG, physics.ins-det]目的：光学粒子検出器におけるキャリブレーションと再構成の同時最適化手法
- 素粒子物理実験では，シミュレーションがデータ解析に不可欠であり，高精度なシミュレーションが要求される。
- 従来のシミュレーション，キャリブレーション，再構成は別個に行われ，最適化が困難であった。
- 微分可能なシミュレーションフレームワークを構築し，一連の処理を統合することで，最適化を容易にすること。
- 提示された手法は，光の生成，伝播，検出の各段階で滑らかかつ物理的に意味のある勾配を実現した。
- 従来の非微分可能な手法と比較して，精度と速度の両方で同等以上の性能を発揮した。
- このフレームワークは，様々な検出器形状や材料への適応が可能であり，実験設計と最適化に貢献する。
Link: https://arxiv.org/abs/2602.24129
BLISSNet：疎なセンサー計測からの高速かつ正確な流れ場の再構成のための深層演算子学習 [math.CO, cs.DM, physics.flu-dyn, cs.LG]目的：疎なセンサー計測からの流れ場再構成
- 科学技術において，流れ場の把握は不可欠であり，気象予測や流体制御など広範な応用を持つ。
- センサー数が限られる場合，高精度な流れ場再構成は困難であり，計算コストとのトレードオフが存在する。
- BLISSNetは，高い精度と計算効率を両立し，大規模なリアルタイム流れ場再構成を可能とする。
- BLISSNetは，DeepONetアーキテクチャに基づき，任意の大きさの領域に対するゼロショット推論を実現する。
- 一度の計算で特定のネットワーク成分を事前計算することで，その後の推論コストを大幅に削減できる。
- 古典的な補間法と比較して，BLISSNetはより高速かつ高精度な流れ場再構成を可能にする。
Link: https://arxiv.org/abs/2602.24228
Lp校正誤差の変分推定器 [stat.ML, cs.LG]目的：Lp校正誤差の変分推定
- 機械学習システムの信頼性確保には，予測確率と観測されたクラス頻度の整合性が重要である。
- 多クラス分類において，校正誤差を正確に評価することは困難である。
- Lpダイバージェンスに基づく広範な校正誤差を推定する手法を開発し，過大評価を回避する。
- 本研究では，最近の変分フレームワークを拡張し，適切な損失によって誘導されたダイバージェンスを超えて，校正誤差を推定可能にした。
- 提案手法は，過信と過小信を分離できる点が特徴である。
- 実装コードは，校正誤差評価のためのオープンソースパッケージprobmetricsに統合されている。
Link: https://arxiv.org/abs/2602.24230
滑らかな事後分布を持つ活性二部ランキング [stat.ML, cs.LG]目的：活性二部ランキングにおける最適なランキング規則の推定
- 二部ランキングは，様々な応用分野で重要であり，統計的学習問題として広く研究されている。
- 既存研究では離散的な状況を想定していたが，現実の問題では連続的な分布を扱う必要があった。
- 連続的な条件分布を扱い，ROC曲線に基づき，効率的なランキング規則推定を目指す。
- 提案手法smooth-rankは，固定された信頼水準と確率に対してPAC学習が可能であることを示した。
- smooth-rankの期待サンプリング回数に対し，問題依存の上界と下界を確立した。
- 数値実験の結果，提案手法が既存手法と比較して良好な性能を示すことが確認された。
Link: https://arxiv.org/abs/2602.24263
TimeMAE：デカップルドマスク自動エンコーダによる時系列の自己教師あり表現学習 [cs.LG]目的：時系列データの自己教師あり表現
- 時系列分析は，金融，医療，環境など，多様な分野で重要であり，その応用範囲は広い。
- ラベル付きデータが不足している場合，時系列分析の性能向上は困難である。
- 少ないラベルでも高い性能を出すための，効果的な事前学習手法の開発が求められている。
- TimeMAEは，時系列を意味的に豊かな単位に分割することで，より効率的なマスク再構成を可能にした。
- 可視領域とマスク領域を分離してエンコードすることで，マスクトークンの人工的な導入を回避した。
- 5つのデータセットにおける実験で，TimeMAEは既存手法を上回り，特にラベルが少ない状況で優れた性能を示した。
Link: https://arxiv.org/abs/2303.00320
勾配だけで十分か？合意に基づく最適化は確率的勾配降下の確率的緩和として解釈できる [cs.LG, cs.NA, math.NA, math.OC, stat.ML]目的：合意に基づく最適化と確率的勾配降下の関係性の解明
- 機械学習の性能向上には，効率的な最適化アルゴリズムが不可欠である。
- 微分を用いない最適化手法は，効率性や汎化性能に課題があると考えられていた。
- 確率的緩和の成功メカニズムを理論的に説明し，微分を用いない手法の有効性を示す。
- 合意に基づく最適化は，微分を用いずに目的関数の評価のみによって確率的勾配降下のような振る舞いを示すことが明らかになった。
- 合意に基づく最適化は，多くの非滑らかかつ非凸な目的関数に対して大域的な収束が証明されている。
- この研究は，問題に特化した確率的摂動がエネルギー障壁を克服し，非凸関数の深いレベルに到達する方法に関する洞察を提供する。
Link: https://arxiv.org/abs/2306.09778
浅いニューラルネットワークの幾何学的構造と構成的な${\mathcal L}^2$コスト最小化 [cs.LG, cs.AI, math-ph, math.MP, math.OC, stat.ML]目的：浅いReLUネットワークにおけるコスト最小化
- 機械学習において，ニューラルネットワークの学習理論的理解は重要である。
- 過小パラメータ化されたネットワークの学習過程の理解が不十分である。
- 勾配降下法を用いず，幾何学的構造からコスト最小化を解析する。
- 訓練データの信号対雑音比$\delta_P$に関して，コスト関数の最小値の上界が$O(\delta_P)$であることが示された。
- 特例として$M=Q$の場合，コスト関数の正確な局所最小値が特定され，上界との相対誤差が$O(\delta_P^2)$であることが示された。
- 上界の証明から構成的に学習されたネットワークは，入力空間における特定の$Q$次元部分空間を計量化することが示された。
Link: https://arxiv.org/abs/2309.10370
DRL-ORA：オンラインリスク適応型分布強化学習 [cs.LG]目的：強化学習におけるオンラインリスク適応のフレームワーク
- 強化学習は，不確実な環境下での意思決定において重要な役割を果たす。
- 環境の完全な知識がない中で，安全性が求められるタスクでは，リスク管理が課題となる。
- 学習過程でリスクを動的に調整し，安全かつ効率的な方策を学習することを目指す。
- 提案手法DRL-ORAは，知識的リスクと潜在的偶然的リスクを統合的に定量化する。
- 総変動最小化問題をオンラインで解くことで，知識的リスクレベルを動的に調整する。
- 既存手法と比較して，様々なタスクにおいて優れた性能を示すことが確認された。
Link: https://arxiv.org/abs/2310.05179
マルチタスク強化学習におけるDispatcher/Executor原理：少ない情報でより良く [cs.LG, cs.AI, cs.RO]目的：マルチタスク強化学習コントローラーの設計におけるDispatcher/Executor原理の導入
- 複雑な環境下での意思決定において，人間は詳細を無視する能力を持つ。これは生物システムの重要な特性である。
- 現在の強化学習は，大量のデータと大規模なニューラルネットワークに依存する傾向がある。
- データが限られた状況下で，構造と設計原理を考慮することで，汎化性能を向上させる。
- Dispatcher/Executor原理は，コントローラーをタスク理解部（Dispatcher）と制御計算部（Executor）に分割し，それらを正則化された通信チャネルで接続する。
- この原理により，不要な詳細を抽象化し，データ効率を高め，汎化性能を向上させることが期待される。
- スケーリングの有効性は認めつつも，構造と設計原理の重要性を示唆する。
Link: https://arxiv.org/abs/2312.09120
ニューラルネットワークにおける最小深度について [cs.LG, cs.DM, math.CO]目的：ニューラルネットワークの深度と表現能力の関係性の理解
- 深層学習理論において，ネットワークの深度はモデルの性能を大きく左右する重要な要素である。
- 深層学習モデルの表現能力と必要な深度の関係は未だ解明されていない部分が多い。
- 凸多面体の幾何学的複雑性を通して，深層ニューラルネットワークの深度限界を明らかにすること。
- ReLUネットワークの表現力を，凸多面体の幾何学的な深度複雑性を用いて解析する枠組みを構築した。
- 多面体の深度に関する上限と下限を確立し，古典的な族に対してはタイトな境界を得た。
- ICNNsは全ての凸CPWL関数を固定された深度で表現できないことを示し，標準的なReLUネットワークとの表現力の差を明確にした。
Link: https://arxiv.org/abs/2402.15315
サプライチェーンのレジリエンス強化のためのブロックチェーン 기반 知能レコメンデーションシステムフレームワーク [cs.CY, cs.CE, cs.AI]目的：サプライチェーンのレジリエンス強化を目指した，ブロックチェーン 기반 の知能レコメンデーションシステムフレームワーク
- グローバルなパンデミックや紛争，そして産業革命4.0/5.0の影響を受け，サプライチェーンのレジリエンス強化が重要視されている。
- 既存研究は概念レベルに留まり，単独のレジリエンス対策としては不十分である。知能レコメンデーションシステムの活用が遅れている。
- 本研究は，サプライチェーンの混乱に対応するための，データ駆動型知能レコメンデーションシステムの基本フレームワークを提案する。
- 提案するブロックチェーン 기반 知能レコメンデーションシステムフレームワークは，安定性，安全性，レジリエンスを備えた意思決定支援システムとして機能する。
- システムダイナミクスシミュレーションの結果から，本フレームワークがサプライチェーンの混乱に対する効果的な対策となりうる。
- 本研究は，複数の技術を統合した実行可能なレジリエンス強化デジタルソリューションを提供し，企業の混乱緩和に貢献する。
Link: https://arxiv.org/abs/2404.00306
DirMixE：階層的ラベル変動を用いたテスト非依存型ロングテール認識の活用 [cs.LG, cs.AI, cs.CV]目的：テスト非依存型ロングテール認識における性能向上
- 画像認識の分野において，不均衡データに対するロバストな認識手法が求められている。
- ロングテールデータにおけるテストデータのラベル分布が未知で偏っている場合，認識精度が低下する。
- ラベル分布の変動を階層的に捉え，より柔軟な専門家混合モデルを構築することで，この課題を解決する。
- 提案手法DirMixEは，ラベル分布のDirichletメタ分布への専門家割当により，局所的な変動に適応する。
- Dirichletメタ分布の多様性により，大域的な変動も捉えられ，安定した学習が可能となる。
- CIFAR-10-LT等のデータセットで有効性が検証され，既存手法を上回る性能が確認された。
Link: https://arxiv.org/abs/2405.07780
R2GenCSR：LLMベースの放射線レポート生成のための文脈と残差情報の活用 [cs.CV, cs.AI, cs.CL]目的：LLMを用いた放射線レポート生成における有効な情報抽出と計算効率の向上
- 医療画像の診断支援において，放射線レポートの自動生成は重要な役割を担う。
- 既存手法では，画像特徴抽出に計算コストの高いTransformerが用いられ，効率が課題となっている。
- 本研究は，効率的な画像特徴抽出と文脈情報の活用により，レポート生成の精度向上を目指す。
- 提案手法では，計算効率の高いMambaを画像特徴抽出器として採用し，Transformerと同等の性能を達成した。
- 学習時に文脈情報を検索・活用することで，特徴表現を強化し，識別学習を促進した。
- IU X-Ray，MIMIC-CXR，CheXpert Plusの３つのデータセットで有効性が確認された。
Link: https://arxiv.org/abs/2408.09743
TIGER：効率的な音声分離のための時間周波数インターリーブドゲイン抽出・再構成 [cs.SD, cs.AI, eess.AS]目的：効率的な音声分離モデルの提案
- 近年の音声分離研究の重要性は，その実用性向上にある。特に，リアルタイム処理における効率性が不可欠である。
- 既存のモデルはパラメータ数が多く，計算コストが高いことが課題となっていた。
- パラメータ削減と計算コストの低減により，低遅延な音声分離システムの実現を目指す。
- TIGERは，パラメータ数を94.3%，MACsを95.3%削減し，既存の最先端モデルTF-GridNetを上回る性能を達成した。
- 新しく作成したEchoSetデータセットで学習したモデルは，現実世界のデータに対する汎化性能が向上した。
- EchoSetは，物体遮蔽や材質特性を考慮した，より現実的な残響を含むデータセットである。
Link: https://arxiv.org/abs/2410.01469
Joint Distribution を考慮した Shapley 値による疎な反事実説明 [cs.LG, cs.AI, stat.ME]目的：反事実説明における最小限の特徴量変更
- 機械学習モデルの意思決定の解釈可能性向上は，信頼性と利用促進に不可欠である。
- 既存の反事実説明は，多くの場合，必要以上に多くの特徴量を変更し，説明の明確性と実行可能性を損なう。
- COLA は，反事実と現実の分布間の距離を最小化し，説明に必要な変更を削減する。
- COLA は，最適な輸送を用いて反事実と現実のセットを結合し，Shapley 値に基づいて最小限の変更を選択する。
- 実験の結果，COLA は既存手法と同等の効果を，特徴量変更の 26～45\% で達成した。
- COLA は，理論的に反事実が現実から遠ざかるのを防ぎ，小規模ベンチマークでほぼ最適性を示す。
Link: https://arxiv.org/abs/2410.05419
線形バンディットにおける行列スケッチの再検討：双的ブロックスケッチによる亜線形後悔の達成 [cs.LG, stat.ML]目的：線形バンディットにおける後悔の低減
- オンライン学習や逐次決定において，探索と利用のバランスが重要であり，線形バンディットはその理論的基盤となる。
- 高次元問題において計算効率を高めるために行列スケッチが用いられるが，スペクトル尾が重い場合，線形後悔が発生する可能性がある。
- 双的ブロックスケッチにより，行列スケッチサイズの調整を動的に行い，亜線形後悔を達成することを目指す。
- 本研究では，不適切なスケッチサイズが大きなスペクトル誤差につながり，後悔の保証を損なうことを明らかにした。
- 提案手法である双的ブロックスケッチは，ストリーミング行列の特性に関する事前知識を必要とせずに亜線形後悔を達成する。
- 実験評価により，提案手法が優れたユーティリティ効率のトレードオフを実現することが示された。
Link: https://arxiv.org/abs/2410.10258
プライバシー保護されたラベルアンラーニング：垂直型連合学習における少数のサンプルでの忘却（情報開示なし） [cs.LG, cs.CR, cs.CV]目的：垂直型連合学習におけるラベルアンラーニングの実現
- データ活用とプライバシー保護の両立が重要視される中，連合学習は有望なアプローチである。
- 垂直型連合学習では，ラベル情報が機密情報となるため，効率的なアンラーニング手法が求められている。
- 本研究は，ラベル情報を効率的に忘却しつつ，モデルの性能を維持する手法を提案する。
- 本手法は，表現レベルのマニホールドミックスアップ機構により，アンラーニングおよび保持されたサンプルの合成埋め込みを生成する。
- これにより，勾配ベースのラベル忘却と回復ステップにおいて，より豊富な信号を提供し，効果的なラベルアンラーニングを実現する。
- MNIST，CIFAR-10など多様なデータセットでの実験により，手法の有効性とスケーラビリティが示された。
Link: https://arxiv.org/abs/2410.10922
オフラインからオンラインへの多エージェント強化学習：オフライン価値関数メモリと逐次探索 [cs.AI]目的：オフラインデータとオンライン微調整を活用した多エージェント強化学習フレームワーク
- 強化学習は，複雑な環境下での自律的な意思決定を可能にする重要な技術である。
- 多エージェント環境では，状態空間と行動空間が指数関数的に増加し，効率的な学習が困難である。
- オフラインデータとオンライン学習を組み合わせることで，学習効率と性能の向上を目指す。
- 本研究では，オフライン学習で獲得した知識を保持し，スムーズな移行と効率的な微調整を可能にするオフライン価値関数メモリ（OVM）機構を提案する。
- また，オフラインポリシーを活用した分散型逐次探索（SE）戦略を提案し，探索空間を大幅に削減する。
- StarCraft Multi-Agent Challenge (SMAC) における実験により，既存手法を大幅に上回り，優れたサンプル効率と全体的な性能を達成することが示された。
Link: https://arxiv.org/abs/2410.19450
M3TR：時間的検索によるマルチモーダルマイクロ動画の人気予測向上 [cs.MM, cs.AI]目的：マイクロ動画の人気予測
- 動画プラットフォームにおけるコンテンツの発見と推薦に不可欠な要素である。
- 既存手法では，複雑な時間的パターンを捉えきれず，長期的な予測精度が低い。
- ユーザーのフィードバックと動画の人気推移を考慮した時間的検索により，予測精度を向上させる。
- 提案手法M3TRは，Mamba-Hawkes Processを用いてユーザーのインタラクションを詳細にモデル化する。
- M3TRは，動画のマルチモーダルコンテンツと人気推移に基づいた時間的検索エンジンを導入する。
- 実世界データセットでの実験により，M3TRは既存手法を最大19.3%上回り，長期予測において優れた性能を示す。
Link: https://arxiv.org/abs/2411.15455
気候変動が再生可能エネルギー発電に与える影響の定量化：超解像再帰拡散モデル [eess.SY, cs.SY, cs.LG, eess.SP]目的：気候変動下における再生可能エネルギー発電量の定量化
- 地球温暖化とエネルギー転換により，電力供給能力と気象要因の連携が重要になっている。
- 気候データは，再生可能エネルギーの短期変動を捉えるための時間分解能が不足している。
- 気候データの時間分解能を高め，短期的な不確実性をモデル化することを目指す。
- 開発された超解像再帰拡散モデル(SRDM)は，既存の生成モデルよりも高解像度の気候データ生成において優れた性能を示した。
- 低解像度の気候データを電力換算に用いることによる推定バイアスが明らかになった。
- SRDMを用いて，将来の長期的な風力および太陽光発電量をシミュレーションすることが可能となった。
Link: https://arxiv.org/abs/2412.11399
LLMにおける不確実性推定の再検討：原理に基づいた単一シーケンスの指標 [cs.LG]目的：LLMの生成するテキストの信頼性を評価するための不確実性推定
- LLMの応用が拡大する中，生成されるテキストの信頼性確保が重要課題となっている。
- 既存の不確実性推定法は複数のシーケンスを必要とし，計算コストが高いという問題がある。
- 計算効率を保ちつつ，理論的に妥当な不確実性推定を実現することを目指す。
- 最尤出力シーケンスの負の対数尤度（NLL）が，理論的に適切な不確実性指標となりうることを示した。
- 単一シーケンスからNLLを近似するG-NLLを提案し，計算効率と理論的厳密性を両立した。
- 様々なシナリオにおいて，G-NLLが最先端の性能を達成することを確認した。
Link: https://arxiv.org/abs/2412.15176
オンライン強化学習のサンプル複雑性：多モデルの視点 [cs.LG, cs.SY, eess.SY, math.OC, stat.ML]目的：オンライン強化学習におけるサンプル複雑性の解析
- 強化学習は，複雑な環境下での最適制御を実現する上で重要である。
- 非定常な環境や連続的な状態・行動空間における学習効率が課題である。
- 多様なダイナミクスモデルを扱うための効率的な学習アルゴリズムを確立する。
- 提案アルゴリズムは，多モデルを考慮した設定で，ポリシーリグレット$\mathcal{O}(N \epsilon^2 + d_\mathrm{u}\mathrm{ln}(m(\epsilon))/\epsilon^2)$を達成する。
- パラメータ化されたダイナミクスモデルの場合には，$\mathcal{O}(\sqrt{d_\mathrm{u}N p})$というポリシーリグレットを証明した。
- 本研究で提案するアルゴリズムは，簡便性，事前知識の組み込みやすさ，過渡的な挙動の安定性から，実用性も期待できる。
Link: https://arxiv.org/abs/2501.15910
CowPilot：自律型および人間・エージェント協調によるウェブナビゲーションのためのフレームワーク [cs.AI, cs.CL, cs.HC]目的：ウェブナビゲーションにおける人間とエージェントの協調
- ウェブ上でのタスク自動化のニーズが高まっている。効率的な情報収集や作業遂行に貢献する。
- 複雑なタスクにおいて，エージェント単独ではユーザーの意図を正確に理解できず，失敗するケースが多い。
- 人間がエージェントの能力を有効活用し，ウェブタスクをより効率的に完了することを目指す。
- CowPilotは，エージェントが次のステップを提案し，人間が介入・修正できる協調ナビゲーションを実現する。
- 5つのウェブサイトでのケーススタディで，人間・エージェント協調モードは95%の成功率を達成した。
- 人間は総ステップ数の15.2%しか実行せず，エージェントはタスク成功の最大半分を担った。
Link: https://arxiv.org/abs/2501.16609
InfoBridge：ブリッジマッチングによる相互情報量の推定 [cs.CY, cs.LG, stat.ML]目的：相互情報量の推定
- 機械学習や情報理論において，変数間の依存性を測る重要な指標である。
- 従来の推定手法では，高次元データや複雑な分布に対して推定精度が低下する。
- 拡散ブリッジモデルを活用し，従来の推定手法が苦手とするデータに対しても高精度な推定を実現する。
- 提案手法は，低次元，画像ベース，高相互情報量という3つの標準的な相互情報量推定ベンチマークで性能を実証した。
- タンパク質言語モデルの埋め込みデータという実世界のデータに対しても良好な結果が得られた。
- 相互情報量の推定をドメイン変換問題として捉え，バイアスを持たない推定器を構築した。
Link: https://arxiv.org/abs/2502.01383
生成コンテンツの堅牢なウォーターマーク：ばらばらにするアプローチ [cs.CV, cs.AI]目的：生成コンテンツの検出と生成者の特定
- 生成モデルの急速な発展に伴い，生成物と実物の区別が困難になっている。
- 生成モデルの利用における著作権侵害や権利主張の問題が生じている。
- 生成コンテンツにウォーターマークを埋め込み，不正利用を防ぐことを目指す。
- 提案手法は，モデルの再学習を必要とせず，推論時にウォーターマークを埋め込む。
- 埋め込まれたウォーターマークは，特定の範囲内の摂動に対して堅牢であることが証明された。
- 拡散モデルへの適用実験で，既存のウォーターマーク方式と同等の堅牢性が確認された。
Link: https://arxiv.org/abs/2502.07845
FinBloom：リアルタイム金融データを用いた知識に基づく大規模言語モデル [cs.IR, cs.AI, cs.CL, cs.LG, q-fin.ST]目的：リアルタイム金融データを用いた大規模言語モデルの知識獲得
- 金融分野では，迅速かつ正確な情報が意思決定に不可欠であり，最新データへのアクセスが重要である。
- 大規模言語モデルは，リアルタイム情報へのアクセスに課題があり，特に金融分野での活用が制限されている。
- 金融分野におけるリアルタイムデータの活用を促進し，言語モデルの意思決定能力を向上させることを目指す。
- 本研究では，5万件以上の金融クエリと必要な文脈を含むFinancial Context Datasetを構築した。
- ReutersとDPAの1400万件の金融ニュース記事とSEC filingsからFinBloom 7Bを開発し，金融エージェントとして機能するように調整した。
- 提案手法は，リアルタイムデータ取得を効率化し，金融関連のタスクを効率化することで，大規模言語モデルの能力を大幅に向上させる。
Link: https://arxiv.org/abs/2502.18471