arXiv雑要約
AI - 2026/03/24 公開
3DレイアウトR1:言語指示による空間編集のための構造化推論 [cs.CV, cs.AI]目的:言語指示に基づく空間レイアウト編集
- 視覚情報の理解は,ロボット工学やコンピュータビジョンの発展に不可欠である。
- 既存モデルは,微細な視覚編集において空間的理解とレイアウトの一貫性に課題がある。
- 空間関係の構造化表現を通じて,空間編集の解釈性と制御性を向上させる。
- 本研究で提案する構造化推論フレームワークは,シーングラフによる推論を通してテキスト条件を満たす空間レイアウト編集を実現する。
- 新しいテキスト指示型レイアウト編集ベンチマークにおいて,CoT-SFTやGRPOと比較して,平均15%のIoU向上,25%のセンター距離誤差の削減を達成した。
- 最先端のLLMと比較して,最高モデルはmIoUを最大20%向上させ,空間精度が大幅に向上した。
ThinkJEPA:大規模視覚言語推論モデルによる潜在的世界モデルの強化 [cs.CV, cs.AI, cs.CL, cs.LG, cs.RO]目的:潜在的世界モデルの予測性能向上
- 動画データから未来の状態を予測する技術は,ロボティクスや自動運転などの分野で重要性を増している。
- 短い観察期間では時間的文脈が限定され,局所的な低レベルな外挿に偏りがちで,長期的意味の把握が困難である。
- 視覚言語モデルの知識を活用し,潜在的世界モデルの長期予測能力とロバスト性を向上させる。
- 提案手法は,視覚言語モデルと潜在的世界モデルを組み合わせることで,予測精度を向上させた。
- 特に,長期間の予測において,従来手法と比較してロバストな振る舞いを示した。
- 視覚言語モデルの推論信号を効果的に伝達する階層ピラミッド表現抽出モジュールが有効であることが示された。
UniMotion:モーション・テキスト・ビジョンの統一的理解と生成フレームワーク [cs.CV, cs.AI]目的:人間モーション,自然言語,RGB画像の同時理解と生成
- 人間行動理解は,ロボット工学や人間-コンピュータインタラクションにおいて不可欠である。
- 既存モデルは扱うモーダリティが限定的で,離散的なトークン化による誤差が生じやすい。
- モーションを主要な連続モーダリティとして扱い,多岐にわたるタスクでの性能向上を目指す。
- UniMotionは,モーション,テキスト,ビジョンの理解と生成を同時に行う初の統一的フレームワークを実現した。
- CMA-VAEとDPA,LRAといった新規手法により,各モーダリティ間の連続的な経路を構築し,相互理解を深めている。
- 七つのタスクにおいて最先端の性能を示し,特にクロスモーダル合成タスクにおいて顕著な優位性が見られた。
統一トークン化と潜在的ノイズ除去のためのエンドツーエンド学習 [cs.CV, cs.AI, cs.GR, cs.LG]目的:画像および分子モダリティにおけるトークン化と生成の同時最適化
- 潜在拡散モデルは高品質な合成を可能にするが,その学習は複雑な段階を経る必要がある。
- 既存の潜在拡散モデルの学習には,事前にトークナイザーを学習させる必要があり,ボトルネックとなっている。
- トークナイザーと潜在拡散モデルを同時に学習し,効率的な学習プロセスを実現すること。
- UNITEは,画像トークナイザーと潜在生成器として機能する生成エンコーダーを特徴とする自己符号化器アーキテクチャである。
- ImageNet 256x256において,FIDスコアはそれぞれ2.12と1.73を達成し,最先端の性能に匹敵する結果が得られた。
- トークン化と生成を同時に学習することで,潜在空間の表現アライメントと圧縮が向上することが示された。
WorldCache:動画ワールドモデルの高速化のためのコンテンツ認識キャッシュ [cs.CV, cs.AI, cs.CL, cs.LG]目的:拡散モデルによる動画ワールドモデルの推論高速化
- 動画ワールドモデルは現実世界の動画を生成可能であり,ロボット工学や自動運転等の応用が期待される分野である。
- 拡散モデルは計算コストが高く,特に空間Temporalアテンション処理に時間がかかるという課題がある。
- 既存のキャッシュ手法の課題を克服し,動的なシーンにおけるゴーストやモーションの不整合を抑制する。
- WorldCacheは,モーション適応的な閾値,顕著性に基づいたドリフト推定,ブレンドとワープによる最適近似,および位相を考慮した閾値スケジュールを導入する。
- PAI-Bench上のCosmos-Predict2.5-2Bの評価において,WorldCacheは推論速度を2.3倍に向上させながら,ベースラインの品質の99.4%を維持する。
- 既存の学習不要なキャッシュ手法と比較して,大幅な性能向上が確認された。
REMI:内部駆動型経路計画中のエピソード記憶の再構成 [q-bio.NC, cs.AI]目的:空間表現と経路計画における内側後頭皮質(MEC)と海馬(HC)の連携機構の解明
- 空間認知機能は,生物の生存と行動に不可欠であり,その神経基盤の解明が重要である。
- MECとHCの相互作用が経路計画にどのように寄与しているかの詳細なメカニズムは未解明である。
- 手がかりから想起された目標地点への経路計画と,経路上の感覚体験の再構成を説明する理論を構築すること。
- MECとHCの配線に関するシステムレベルの理論を提案し,手がかりによる目標地点の想起,経路計画,感覚体験の再構成のメカニズムを説明した。
- グリッドセルに基づいた計画は,未訪問地点を通るショートカットを可能にし,局所的な遷移を長距離経路に一般化することが示された。
- 経路計画中に,中間グリッド状態が場所細胞のパターン補完を引き起こし,経路上の感覚体験を再構成することが実証された。
生存性を維持する受動トルク制御 [eess.SY, cs.LG, cs.RO, cs.SY]目的:ロボットの安全性を確保するための受動トルク制御手法
- 産業用ロボットの安全な動作は,人との協調作業において不可欠である。
- 従来の受動トルク制御では,外部からの擾乱により安全性が損なわれる可能性がある。
- ロボットの状態空間における安全な領域を事前に計算し,制約条件としてトルク制御に適用する。
- 本研究では,生存性理論を用いて,自己衝突や外部物体との衝突を回避する安全な領域をデータ駆動および解析的に算出する。
- この安全な領域を制約条件として受動制御に組み込むことで,無限時間 Horizon においてロボットの状態が安全な領域内に留まることを保証する。
- シミュレーションと7自由度Franka Emikaマニピュレータによる実験により,提案手法の有効性が検証された。
低ランク最適化のためのコンパクトなリフトされた緩和 [math.OC, cs.LG]目的:低ランク制約のある二次最適化問題に対する実行可能な凸緩和
- 低ランク最適化は,機械学習や信号処理など,多くの応用分野で重要である。
- 従来の緩和手法は,スペクトル構造を必要とし,適用範囲が限られていた。
- スペクトル構造を必要としない,より汎用的な緩和手法を開発すること。
- 提案手法では,冗長なモーメント行列ブロックを除去し,よりコンパクトな緩和を導出した。
- この緩和は,次元 $nm + 1$ と $n+m$ の2つの半正定値制約のみを含む。
- 行列補完,基底追跡,低ランク回帰問題に対しては,さらにコンパクトな定式化が可能である。
機械学習に基づくウォッチから警告への重候候警報ガイダンスの開発:Warn-on-Forecastシステムからのアプローチ [q-fin.CP, cs.MA, physics.ao-ph, cs.AI, cs.LG, physics.data-an]目的:重候候警報の確率予測
- 気象予測の精度向上は,人命や財産の保護に不可欠である。
- 短時間予報においては,予測精度の改善が依然として課題である。
- 2-6時間先の重候候警報予測の精度向上を目指す。
- 機械学習モデル(HGBT,U-Net)は,従来の統計的手法よりも高い予測性能を示した。
- 特に,高い確率閾値において,機械学習モデルの優位性が顕著であった。
- U-Netは空間的に滑らかなガイダンスを提供するが,HGBTの方が全体的な性能が高い。
イベント関連電位検出のためのDeep-Matchフレームワーク [physics.comp-ph, cs.DC, eess.SP, cs.AI, cs.LG]目的:イベント関連電位の検出性能向上
- 脳機能解明やブレイン・コンピュータ・インターフェース開発において,イベント関連電位の正確な検出が不可欠である。
- 脳波の信号対雑音比が低く,単一試行レベルでのイベント関連電位の検出は困難である。
- 深層学習モデルにイベント関連電位のテンプレート情報を組み込み,検出精度とロバスト性を高める。
- 提案するDeep-MFモデルは,標準的なカーネル初期化モデルと比較して,ほとんどの被験者でわずかに高い性能を示した。
- Deep-MFモデルは,平均F1スコア0.37を達成し,標準モデルの0.34を上回る,被験者間差へのより高いロバスト性を示した。
- Deep-MFモデルは最高F1スコア0.71を達成し,標準モデルの最大スコア0.59を超え,イベント関連電位情報を活用したカーネル初期化の有効性を示した。
分子最適化のための結果データからの科学的推論ステップの解読 [q-bio.BM, cs.AI, cs.LG]目的:分子最適化における科学的推論ステップの解読
- 科学的発見の自動化は,研究開発の効率化に不可欠であり,その鍵は推論モデルの性能向上にある。
- 実験データは豊富だが,推論過程の記録が乏しく,推論モデルの学習における大きな課題となっている。
- 結果データから科学的推論ステップを解読し,推論モデルの学習を促進することを目指す。
- DESROフレームワークにより,分子構造のバリエーションと物性変化の相関を分析することで,最適化の根拠を推論することが可能となった。
- 18のタスク中15で最高の成功率を達成し,単一および複数物性の最適化において優れた性能を示した。
- 導出された推論過程は,未知の組み合わせやターゲットへの汎化能力を高め,専門家レベルの最適化経路を再構築できる。
MiSiSUn:最小シンプレックス半教師あり分解 [eess.IV, cs.CV, cs.LG]目的:半教師あり幾何学的分解手法
- リモートセンシングや画像処理において,混合データから個々の成分を分離する技術は重要である。
- 従来の分解手法では,ノイズや混合比の変動に対するロバスト性に課題があった。
- 本研究では,幾何学的情報を活用し,より高精度な分解を目指す。
- 提案手法MiSiSUnは,既存の半教師あり分解手法と比較して,1dBから3dB以上の性能向上を示した。
- シミュレーションデータセットと実データセットの両方で,優れた結果が得られた。
- 特に実データセットでは,地質図との視覚的な一致性が確認された。
GIP-RAG:解釈可能な遺伝子相互作用および経路影響解析のためのエビデンスに基づく検索拡張フレームワーク [q-fin.PM, cs.CE, q-bio.MN, cs.AI, cs.CL]目的:遺伝子相互作用と生物学的経路への影響に関する解析
- 疾患メカニズムの解明や精密医療の発展には,遺伝子間のメカニズム的関係性の理解が不可欠である。
- 様々な分子相互作用や経路データが存在するものの,異種知識源の統合と解釈可能な多段階推論が課題となっている。
- 本研究は,遺伝子間の相互作用を予測し,そのメカニズムを解釈するための手法を確立することを目的とする。
- GIP-RAGは,生物医学知識グラフと大規模言語モデルを組み合わせ,遺伝子相互作用を推論・解釈する。
- 多様な生物学的シナリオにおいて,GIP-RAGは一貫性があり,解釈可能で,エビデンスに基づいた知見を提供する。
- 本フレームワークは,知識グラフと検索拡張LLMを統合し,複雑な分子システムにおけるメカニズム的推論を支援する汎用的なアプローチである。
相関排除,多様性,創発的知能:社会性昆虫コロニーとアンサンブル機械学習の同型性 [stat.ML, cs.LG]目的:社会性昆虫コロニーとアンサンブル機械学習の共通の形式的体系における同型性の解明
- 分散情報処理は,自然界と計算の両方において成功例が多い。そのメカニズムの理解は重要である。
- 既存の研究では,生物学的知性と人工知性の根底にある共通原理が明確でなかった。
- 両システムにおける分散的知性の創発メカニズムを数学的に明らかにし,共通原理を特定すること。
- アリのコロニーにおける意思決定とランダムフォレスト学習が,確率的アンサンブル知能という共通の形式体系において同型であることが示された。
- 遺伝的に同一のアリが機能分化を達成するメカニズムと,決定木を装飾するブートストラップ集計やランダム特徴サブサンプリングが対応すること。
- 両システムが,同一ユニットの装飾を通じて同一の分散低減戦略を実行することが,ベイズ推論を用いて証明された。
ベイジス・ヒルベルト空間における測度流れの正問題と逆問題 [stat.ML, cs.LG, math.PR]目的:ベイジス・ヒルベルト空間における時間依存確率測度の正問題および逆問題に関する研究
- 確率過程のモデリングにおいて,測度流れの理解は不可欠である。確率的システムの時間発展を記述する上で重要となる。
- 高次元空間における測度流れの解析は,コンパクト性の欠如などの数学的困難を伴う。理論的閉包が難しい。
- 観測データから時間依存確率測度の進化を復元する理論的枠組みを構築することを目指す。
- 正問題において,十分滑らかなベイジス・ヒルベルト空間の経路は,カノニカルな動力学的実現を持つことが示された。これは,対数密度変化を最小運動エネルギー勾配速度場へ変換する加重ノイマン問題に対応する。
- 逆問題においては,時間依存間接観測からベイジス・ヒルベルト空間の経路空間における再構成が定式化された。データ不適合項と正問題の輸送作用が組み合わされている。
- 適切なソボレフ正則性と可観測性条件の下で,最小化解の存在,一階変分公式,観測写像の局所的安定性が証明され,進化する法則,スコア関数,カノニカル速度場の復元が導かれた。
G2DR:遺伝情報優先型フレームワークによる遺伝子標的の優先順位付けと薬剤再利用 [q-bio.GN, cs.LG]目的:遺伝情報に基づく標的候補と薬剤候補の優先順位付け
- 疾患の原因遺伝子特定は,創薬の有力な手段となり得る。
- 遺伝子型情報から標的や薬剤候補を導出する実用的なフレームワークが不足している。
- 遺伝情報に基づき,信頼性の高い標的候補と薬剤候補を効率的に特定すること。
- G2DRフレームワークは,遺伝子発現予測,遺伝子レベル検査,パスウェイエンリッチメント等を通じて遺伝的変異を伝播する。
- 偏向を考慮した評価により,遺伝子レベルでROC-AUC 0.775,PR-AUC 0.475を達成し,偏りなく結果が得られた。
- 優先順位付けされた遺伝子は,既存の片頭痛関連化合物で濃縮され,薬剤候補の絞り込みに役立つ可能性が示唆された。
平滑化と予測のためのオペレーター学習 [stat.ML, cs.LG, cs.NA, math.DS, math.NA]目的:平滑化および予測問題に対するデータ駆動型手法の理論的基盤
- 力学系のデータ同化と予測において,機械学習の応用が期待されている。
- データ駆動型手法の理論的解明が遅れており,モデル駆動型手法に劣る。
- データ駆動型アルゴリズムの普遍近似定理を確立し,理論的保証を与える。
- 連続時間設定でニューラルオペレーターアーキテクチャを用い,理論的枠組みを構築した。
- Lorenz 63,Lorenz 96,Kuramoto-Sivashinsky系に対する実験で理論の有効性を示した。
- データ同化と予測におけるデータ駆動型手法の理論的基盤を確立した。
測定における不確実性の表現と伝播のための包括的な記述:スケーラブルな精度による [stat.ML, cs.AI, cs.LG]目的:測定システムにおける定量的属性の表現と伝播のためのフレームワーク
- 科学技術分野において,不確実性の定量化は不可欠であり,計測・制御システムの性能向上に寄与する。
- 制御理論や製造分野ではガウス分布の仮定が一般的だが,複雑な現象の表現や不確実性の伝播に不十分な場合がある。
- ガウス混合モデルを用いて,計算効率を維持しつつ,より高精度な不確実性の表現と伝播を実現すること。
- ガウス混合モデルは,ガウス分布の拡張として,確率密度関数の近似精度と計算資源のトレードオフを可能にする。
- 提案手法は,製造や計測の現場,特に循環型工場において,測定不確実性の正確な表現と伝播を支援する。
- ガウス分布に基づく従来手法と比較して,提案手法はより高い精度を実現しつつ,計算量を現実的な範囲に抑える。
交差検証からSUREへ:調整された正則化推定量の漸近的リスク [math.ST, cs.LG, econ.EM, stat.ML, stat.TH]目的:調整された正則化推定量の漸近的リスク
- 機械学習において,予測精度向上は重要な課題である。過学習抑制のため,正則化推定量のチューニングが不可欠である。
- 交差検証は広く用いられているが,理論的な保証が十分でない場合がある。特に,SUREとの収束性に関する詳細な解析が求められている。
- 交差検証によるチューニングパラメータが,SUREによるものへ収束することを理論的に示す。
- 交差検証によるパラメータチューニングは,漸近的にSUREに収束することが示された。
- SUREは通常複数の局所的最小値を持つが,その大域的最小値は分離されていることが証明された。
- これにより,交差検証とSUREに基づくチューニングパラメータの収束が保証される。
網目状材料設計のための化学言語モデル [cond-mat.mtrl-sci, cs.LG, physics.chem-ph]目的:網目状材料の有機リンカー生成を通じた逆設計
- 網目状化学は数多くのMOF合成を可能にしたが,体系的な材料探索が課題である。
- 既存の手法では,化学空間のほんの一部しか探索できず,目的とする特性を持つ材料発見が困難である。
- 本研究は,計算設計から合成可能なフレームワークへの直接的な翻訳を可能にする逆設計パラダイムを確立する。
- Nexerra-R1という化学言語モデルを開発し,有機リンカーの生成を通じて網目状材料の逆設計を可能にした。
- 既知のMOFの再発見と,完全に計算上で生成された新規フレームワークCU-525の実験合成提案により,有効性が検証された。
- このモデルは,分子構築ブロックレベルで操作し,網目状合成のモジュール性に対応している。
CERN:隠れマルコフモデルを用いた生ナノポア信号のエラー訂正 [q-bio.GN, cs.LG, q-bio.QM]目的:生ナノポア信号におけるエラー検出および訂正のメカニズム
- ゲノム解析の進歩に貢献する長鎖塩基配列の読み取り技術として,ナノポアシーケンシングが注目されている。
- ナノポアシーケンシングの生信号にはノイズや処理ミスによるエラーが含まれ,解析精度を制限する要因となっている。
- 生信号のエラーを訂正することで,より高精度な生信号解析を実現し,データ解析の効率化を目指す。
- 提案手法CERNは,隠れマルコフモデルを用いて生信号のエラーを効果的に訂正し,既存の生信号解析ツールのマッピング精度を向上させる。
- 新しいナノポアケミストリーにおいて,セグメンテーションアルゴリズムの最適化負担を軽減する効果が認められた。
- CERNは,計算コストを大幅に増加させることなくエラーの特定と訂正を実現し,実用的なエラー訂正メカニズムを提供する。
無線心電図におけるシフト不変特徴量帰属 [astro-ph.IM, cs.DL, physics.soc-ph, eess.SP, cs.AI, cs.LG]目的:機械学習モデルの入力特徴量への重要度スコアの割り当て
- 医療診断支援において,機械学習モデルの判断根拠解明が重要となるため。
- 特徴量重要度の適切な算出には,適切なベースライン設定が課題となる。
- 生理学的に意味のあるベースラインと,心相に対応づけられるスコア算出を目指す。
- 提案手法により,心電図サンプルにおける重要度スコアが算出可能となった。
- 特に,P波とT波に関連するサンプルが,運動強度認識において高い重要度を示した。
- シフト不変ベースラインが,心電図解析における物理的意義を持つことが示された。
確率的動力系における経路空間の観測量に対する誤差限界を用いた目標指向型学習 [stat.ME, cs.LG, math.DS]目的:確率的動力系の目標指向型学習手法
- 大規模な確率的動力系の数値シミュレーションは計算コストが高く,効率的な予測手法が求められている。
- 従来のサロゲートモデルの学習損失関数は,経路依存の観測量に対する誤差保証を提供しないという課題がある。
- 経路空間の観測量に対する誤差限界を導入し,目標指向型学習によるサロゲートモデルの精度向上を目指す。
- 経路空間の観測量に対する誤差限界が,広範なクラスの観測量に対して成立することが示された。
- 目標指向型損失関数の解析的な勾配を導出し,確率的勾配降下法への実装可能性を確認した。
- 過減衰ランジュバン系に対するサロゲートモデルにおいて,目標指向型学習が統計量の予測精度と分布シフトへのロバスト性を向上させることが示された。
CogFormer:一度モデルを学習すれば全てに対応可能 [stat.ML, cs.LG]目的:認知モデルにおけるメタ学習フレームワークのパイロット研究
- 認知モデルは人間の認知プロセスを理解する上で不可欠であり,その精度向上は学術的・応用的な価値が高い。
- 従来の認知モデルの学習は,モデル構造の変更ごとに再学習が必要で,効率が悪いという課題があった。
- 異なるモデル構造やデータ条件下でも,学習済みのモデルを再利用し,効率的な推論を可能にすること。
- CogFormerは,Transformerベースのアーキテクチャにより,構造的に類似した多数のモデルに対して有効なメタ学習フレームワークを構築した。
- 二者択一,多肢選択,連続応答の意思決定モデルファミリーにおいて,パラメータの正確な推定が可能であることを示した。
- モデルファミリー間でのパラメータ推定において,わずかな償却オフセットで高い精度を達成し,認知モデルのワークフローを加速する可能性を示唆した。
逆問題に対する適応スペクトルフィルタリングによる解釈可能な演算子学習:収束性と離散化不変性 [stat.ML, cs.AI, cs.LG]目的:逆問題に対する解釈可能な演算子学習フレームワーク
- 逆問題は,計測ノイズの影響を受けやすく,安定した解を得ることが難しい。適切な正則化が重要。
- 従来の正則化手法はパラメータ調整が難しい。深層学習は解釈性が低く,解像度による汎化性能が課題。
- 信号対雑音比に基づきスペクトル係数を再重み付けすることで,解釈可能かつロバストな解を得る。
- SC-Netは連続逆演算子を近似し,離散化不変性を保証する理論的根拠を持つ。
- 1次元積分方程式の実験で,理論的最適レート($O(\delta^{0.5})$)を達成し,オラクルTikhonov正則化を上回る性能を示した。
- 粗いグリッドで学習し,より細かいグリッドでテストする際,安定した再構成誤差(約0.23)を維持するゼロショット超解像を実現した。
LassoFlexNet:表形式データのための柔軟なニューラルアーキテクチャ [stat.ML, cs.LG]目的:表形式データにおける深層学習モデルの性能向上
- 表形式データは,多くの実世界の問題で広く利用されており,精度の高い予測が求められる。
- 深層学習モデルは,画像や自然言語処理では優れているが,表形式データでは決定木ベースのモデルに劣ることが多い。
- 決定木モデルに匹敵する性能を深層学習モデルで実現し,解釈可能性を維持すること。
- LassoFlexNetは,3つのベンチマークにおける52のデータセットで,主要な決定木ベースのモデルと同等またはそれ以上の性能を示した。
- Per-Feature EmbeddingsとTied Group Lasso機構により,入力変数の線形および非線形の寄与を評価し,関連する変数を疎に選択する。
- Sequential Hierarchical Proximal Adaptive Gradient optimizer (EMA)を用いることで,安定した収束を実現し,回転不変性の構造的破壊を理論的に証明した。
球面ヘリンゲル・カントロビッチ力学に基づくシンコーン連想記憶検索 [quant-ph, cs.ET, cs.SY, eess.SY, stat.ML, cs.AI, cs.LG, math.OC, math.ST, stat.TH]目的:経験的測度の連想記憶検索手法
- 連想記憶は,脳の記憶メカニズムのモデルとして重要であり,パターン認識や機械学習に応用可能である。
- 従来の連想記憶では,ノイズや摂動に対する頑健性が課題であり,記憶容量に限界がある。
- シンコーンダイナミクスを用いることで,頑健性と記憶容量を向上させることを目指す。
- 提案手法は,球面ヘリンゲル・カントロビッチ(SHK)勾配フローとして導出され,点位置と重みを同時に更新する。
- 離散化されたフローは,シンコーンポテンシャルを用いた重心輸送ステップと乗法的単純体再重み付けを行う決定的なアルゴリズムとなる。
- 局所分離とPL型条件の下で,盆地の不変性,幾何学的収束,および最小化解が記憶パターンに留まることが証明された。
脳コネクトーム統合のための階層的マルチスケール構造機能結合 [q-bio.NC, cs.LG]目的:脳コネクトームの統合
- 脳機能解明に不可欠であり,精神疾患の理解や治療法開発に貢献する。
- 構造的・機能的コネクトーム間の非線形な関係性や階層構造が複雑で,統合が困難である。
- 構造的・機能的コネクトームの階層的結合を学習し,脳の組織化を解明することを目的とする。
- 本研究で提案する枠組みは,脳年齢,認知スコア,疾患分類の予測において既存手法を上回る性能を示した。
- プロトタイプに基づくモジュールプーリングやアテンションに基づく階層的結合モジュールが,性能向上に貢献することが確認された。
- 学習された結合の可視化から,生物学的に意味のある構造機能関係を捉えている可能性が示唆された。
高次元オンライン学習における非同期分解:発散しない結果,動的正則化,そしてそれ以降 [eess.SP, cs.MA, stat.ML, cs.LG]目的:高次元オンライン学習のための非同期分解フレームワーク
- 機械学習の応用範囲拡大に伴い,大規模データへの対応が重要となっている。
- 既存の高次元オンライン学習法では,誤差境界やバッチサイズが発散する問題がある。
- 本研究は,誤差発散を抑制し,効率的なスパースオンライン最適化を実現することを目指す。
- 提案手法は,過去の統計情報を活用し,現在のバッチ学習のための代替スコア関数を構築する。
- 理論解析により,誤差境界が発散せず,全履歴データを利用した場合と同等の精度が得られることが示された。
- 動的正則化と反復ハード閾値化アルゴリズムにより,計算効率とメモリ効率に優れた解法を提供する。
mmWave-Diffusion:観測に固定された条件付き拡散モデルを用いた呼吸センシングの新しいフレームワーク [eess.IV, cs.LG]目的:呼吸センシングにおける微小運動ノイズ除去
- 非接触呼吸モニタリングは医療や福祉分野で重要であり,その精度向上が求められている。
- 微小運動による干渉が,高精度な呼吸モニタリングの妨げとなっている。
- mmWave-Diffusionは,観測に基づいた拡散モデルで干渉を除去し,高精度な呼吸センシングを実現する。
- 提案手法mmWave-Diffusionは,レーダーの位相観測と呼吸の真値の残差を直接モデル化することで,微小運動ノイズの除去を実現した。
- Radar Diffusion Transformer(RDT)により,位相観測に条件付け,時間的な厳密な整合性を保証し,局所的な物理的事前知識を注入することで,効率的なノイズ除去を実現した。
- 13.25時間のデータを用いた評価により,最先端の波形再構成と呼吸数推定の性能を示し,高い汎化性能を確認した。
豊な群タイルのムーアホモロジーの普遍係数とマイヤー・フィエトリス [math.AT, cs.LG, math.KT, math.OA]目的:豊な群タイルのムーアホモロジーの構造的性質
- 群タイルは,代数トポロジーや幾何学的群論において重要な役割を果たす。
- ムーアホモロジーの計算は一般に困難であり,効果的なツールが求められる。
- 普遍係数定理とマイヤー・フィエトリス列を確立し,計算を容易にすること。
- 任意の豊かな群タイルと離散的なアーベル係数群に対し,普遍係数定理が成り立つことが示された。
- 単位空間の開閉飽和部分集合による分解に対し,ムーアホモロジーにおけるマイヤー・フィエトリス長完全列が証明された。
- これらの結果は,ムーアホモロジーの計算のための有効なツールを提供する。
自動微分可能なデータ同化:状態,動力学,フィルタリングアルゴリズムの共同学習 [stat.ML, cs.LG, eess.SP, math.DS]目的:データ同化における状態,動力学,フィルタリングアルゴリズムの共同学習
- データ同化は,不完全な観測データから動的システムの状態を推定する上で重要であり,多くの科学分野に応用される。
- 既存のデータ同化アルゴリズムは,パラメータ調整のコストが高い上に,動力学モデルの精度が性能に大きく影響する。
- 本研究は,自動微分を用いてパラメータ調整を効率化し,より高精度なデータ同化を実現することを目的とする。
- 本研究で提案する自動微分可能なフィルタリングは,観測データからの学習を勾配法で最適化することを可能にする。
- 航空宇宙工学,大気科学,システム生物学など,様々な動的システムにおいて有効性が確認された。
- 提案手法は,観測モデル,精度要件,計算資源に応じてカスタマイズ可能であり,実用的なガイドラインが提示された。
物理AIエージェントのための能動推論:エンジニアリングの視点 [stat.ML, cs.LG]目的:物理AIエージェントの能力向上に関する理論的・アーキテクチャ的根拠
- 実世界環境でのAIの応用は重要性が増している。特に制約のある環境下での性能向上が求められている。
- ロボットなどの物理AIエージェントは,生物に比べて実世界での汎用性に劣るという課題がある。
- 能動推論の枠組みを用いて,物理AIエージェントの知能を向上させるための方法を提示する。
- 能動推論は,知覚,学習,計画,制御を統合した単一の計算目標を提供する。
- リアクティブメッセージパッシングにより,制約のある環境下でも効率的な推論が実現可能となる。
- 複数の能動推論エージェントは,階層的な構造を持つシステムとして表現できる。
逐次座標上昇法と並列座標上昇法による変分推論の安定性 [stat.ML, cs.LG, math.ST, stat.CO, stat.TH]目的:逐次座標上昇法と並列座標上昇法の挙動の違い
- 変分推論は,複雑なモデルにおける近似推論の重要な手法である。
- 並列化による効率化が試みられているが,安定性に関する検討は不足している。
- 線形回帰問題を通して,各アルゴリズムの収束条件の違いを明確にする。
- 逐次座標上昇法は,並列法よりも緩やかな条件で収束が保証される。
- 並列座標上昇法は計算効率が高いが,収束条件が厳しくなる場合がある。
- この違いは,ブロックごとの更新を伴う複雑なモデルにおいて重要となる。
ゼロショットLLMエージェントの集約学習による企業開示分類 [math.CO, cs.DM, q-fin.TR, cs.AI, cs.MA, q-fin.CP, q-fin.ST]目的:企業開示分類のための,ゼロショット大規模言語モデルの判断を統合する軽量な集約器の学習
- 企業の開示情報は投資判断に不可欠であり,その分類の精度向上は金融市場の効率化に貢献する。
- ゼロショットLLMは多様なプロンプトやモデルで予測が異なり,安定した判断が課題となっていた。
- 複数のLLMエージェントの判断を統合し,より精度の高い企業開示分類を実現することを目的とする。
- 学習済みの集約器は,単一のエージェント,多数決,信頼度加重投票,FinBERTのベースラインを上回る性能を示した。
- 集約器による正解率は,最良の単一エージェントの0.561から0.612へと向上し,特に業績とガイダンスの乖離が大きい開示において効果が大きかった。
- ゼロショットLLMエージェントが補完的な金融シグナルを捉え,集約学習がエージェント間の意見の相違を有益な分類ターゲットに変える可能性が示唆された。
スパースなターゲットからサンプリングされたハードラベルが,回転不変アルゴリズムを誤解させる [stat.ML, cs.LG, math.ST, stat.TH]目的:スパースターゲットからのハードラベルサンプリングが,回転不変アルゴリズムの性能低下を引き起こすこと
- 機械学習においてロジスティック回帰は基本的な手法であり,分類モデルの最終予測に広く利用されている。
- 回転不変アルゴリズムは,特定の条件下で最適解に到達できない場合があり,その原因が不明であった。
- スパースなターゲットに対するハードラベルサンプリングが,回転不変アルゴリズムの性能低下の要因となることを解明する。
- 過剰制約条件下では,ソフトターゲットからの学習は最適な解に収束するが,ハードラベルからの学習では回転不変アルゴリズムは劣る。
- 回転不変アルゴリズムは,過剰リスク $\Omega\!\left(\frac{d-1}{n}\right)$ を抱える一方,非回転不変アルゴリズムは $O(\frac{s\log d}{n})$ の過剰リスクで済む。
- 重みを $u_iv_i$ で再パラメータ化する非回転不変アルゴリズムは,より高い性能を発揮する。
潜在埋め込みアラインメントのための統計的学習:脳エンコーディングとデコーディングへの応用 [stat.ME, cs.LG]目的:脳エンコーディングとデコーディングにおける潜在埋め込みアラインメント
- 脳活動と刺激の関係解明は神経科学の根幹であり,認知メカニズム理解に不可欠である。
- fMRIデータと刺激のペアが限られ,被験者間でのばらつきが大きいことが課題である。
- 限られたデータと被験者間差に対応できる効率的なアラインメント手法を確立すること。
- 提案手法は,未ペアの刺激埋め込みを活用する逆半教師あり学習と,メタ転移学習を組み合わせる。
- エンコーダーとデコーダーは固定された状態でアラインメントを行うため,計算効率が高い。
- 理論的な一般化誤差限界と安全性も確立され,大規模fMRIデータセットでの有効性が示された。
勾配降下法と射影を用いた過パラメータ化ニューラルネットワークによる低次数多項式学習のほぼ最小最大最適レート [stat.ML, cs.LG, math.ST, stat.TH]目的:低次数球面多項式を学習するための過パラメータ化二層ニューラルネットワークのサンプル複雑性
- 機械学習において,過パラメータ化モデルの性能理解は重要である。特にニューラルネットワークの汎化誤差の評価が不可欠である。
- 従来の学習アルゴリズムでは,高次元データにおけるサンプル複雑性が課題であった。サンプル効率の改善が求められている。
- 本研究では,新しい勾配降下法と射影を用いることで,サンプル複雑性を大幅に改善し,ほぼ最小最大最適レートを達成する。
- 提案手法(GDP)により,サンプル複雑性がΘ(log(4/δ)・d^k0/ε)と示された。これは従来の代表的なサンプル複雑性よりも改善されている。
- 学習されたネットワークは,非パラメトリック回帰リスクにおいてほぼ最適レート,すなわちlog(4/δ)・Θ(d^k0/n)を達成する。
- 真の次数が不明な場合でも,適応的な次数選択アルゴリズムを用いることで同様のレートを維持できることが示された。
非マルコフ環境における確率的近似法の再検討 [stat.ML, cs.LG, math.PR]目的:非マルコフ環境下における確率的近似法の理論的枠組み
- 機械学習の性能向上には,環境変化への適応が不可欠である。
- 従来のマルコフ過程に基づく手法では,非マルコフ環境への対応が困難である。
- 過去の全履歴に依存する学習メカニズムの理解を目指す。
- 非マルコフかつ非エルゴード的な環境下における確率的近似法の解析的枠組みを提案した。
- この枠組みを用いて,TransformerモデルのAttentionメカニズムの理論的解釈を試みた。
- 継続学習のような,過去の情報を活用する学習方法への応用可能性を示唆した。
時間適応型関数型ガウス過程回帰 [stat.ML, cs.LG]目的:関数型ガウス過程回帰における新しい定式化
- 時空間ランダム場のモデリングは,様々な自然現象や社会現象の解析に不可欠である。
- 多様体上での関数型データの回帰分析は,計算コストが高く,次元削減が課題である。
- 本研究は,時間変動する角度スペクトルを用いた次元削減による効率的な回帰手法を提案する。
- 提案手法は,多様体上のガウス測度の理論とラプラス・ベルトラミ演算子の固有関数を利用する。
- シミュレーション実験と合成データへの適用により,提案手法の有限サンプル特性と漸近特性が示された。
- 時間変動する角度スペクトルは,関数型サンプルのサイズに応じた適切な切断スキームを通じて,次元削減を実現する。
TRACE:地震学における自律的な物理的推論のためのマルチエージェントシステム [physics.geo-ph, cs.AI]目的:地震シーケンスを支配する物理メカニズムの推論
- 地震発生メカニズムの解明は,防災・減災に不可欠であり,社会的なニーズが高い。
- 地震シーケンスの解釈は専門家の経験に依存し,再現性や普遍性に課題があった。
- 多様な地震現象の解釈を自動化し,客観的で再現可能な知見を得ることを目指す。
- TRACEは,大規模言語モデルと地震学的な制約を組み合わせることで,物理に基づいたメカニズムの推論を可能にした。
- 2019年のRidgecrest地震では,遅延トリガーを自律的に特定し,Mw 6.4とMw 7.1のメインショック間のカスケード的な相互作用を解明した。
- Santorini-Kolumbo地震では,構造によって誘導されたマグマ貫入モデルを特定し,均質な地殻破壊とは異なる断層を通じたエピソード的な移動を識別した。
ドメイン弾性変換:高次元科学データのためのベイズ関数登録 [math.OC, cs.MS, stat.ML, cs.AI, cs.CV]目的:高次元科学データの関数登録手法
- 空間トランスクリプトミクス等の新たな科学データ解析において,高次元データの位置合わせが重要である。
- 従来の幾何学的・画像解析手法では,高次元かつ不規則なデータへの対応が困難であった。
- 本研究は,幾何学的・関数的アラインメントを統合し,高次元データを直接登録する手法を提案する。
- 提案手法DETは,MERFISHデータにおいて92%のトポロジー保存率を達成し,既存手法を凌駕した。
- DETは,発生段階間の全胚Stereo-seqアトラスの登録にも成功し,大規模かつ複雑な変形に対応可能であることを示した。
- DETは,ドメインを関数として扱うことで,ボクセル化や特徴量の無視といった問題を解決する。
ランドマークによるベクトル拡散写像の高速化 [stat.ML, cs.LG, math.DG, physics.data-an]目的:ベクトル拡散写像の高速化アルゴリズム
- 複雑なデータセット内のペアワイズな接続関係を捉え,多様なデータ解析に応用される。
- データの不均一なサンプリング密度が,計算効率と精度を低下させる。
- ランドマーク制約による拡散を通じて,接続ラプラシアンの近似計算を高速化する。
- ランドマーク制約アルゴリズムLA-VDMを提案し,ベクトル拡散写像の計算を高速化した。
- LA-VDMは,データとランドマークセット両方の不均一なサンプリング密度を効果的に処理する。
- シミュレーションデータと非局所画像ノイズ除去への応用で,LA-VDMの性能と精度が確認された。
データ同化のための閉形式条件付き拡散モデル [stat.ML, cs.LG, physics.comp-ph]目的:データ同化のための閉形式条件付き拡散モデルの開発
- 気象や環境モデリングなどにおいて,観測データとモデルを統合するデータ同化は不可欠である。
- 既存のフィルタリング手法は,複雑な非ガウス分布の近似や,ブラックボックスシステムの取り扱いに課題がある。
- 複雑なシステムや測定プロセスに対する,より高性能なデータ同化手法の確立を目指す。
- 提案手法は,ロレンツ63系およびロレンツ96系を用いた非線形データ同化問題において,アンサンブルカルマンフィルタやパーティクルフィルタよりも優れた性能を示した。
- スコア関数の解析的な扱いやすさを利用することで,システムの内部構造を知らなくてもデータ同化が可能となる。
- 拡散モデルの特性により,複雑で非ガウス的な確率分布を高精度に近似し,より正確な状態推定を実現する。
平均相対エントロピーとトランスパイル深さが変分量子分類器のノイズ頑健性を決定する [quant-ph, cs.LG]目的:変分量子分類器におけるノイズに対する頑健性の評価指標の確立
- 量子機械学習は,既存の機械学習の限界を打破する可能性を秘めており,様々な分野への応用が期待されている。
- ノイズを含む量子デバイス上での変分量子アルゴリズムの再現性が課題となっており,シミュレーション結果と実機結果の乖離が懸念されている。
- ノイズ環境下での変分量子分類器の性能を予測し,最適な回路構造を設計するための指標を提示する。
- 平均相対エントロピーの差とトランスパイル深さの間に,ノイズ環境下での性能差との強い相関関係が確認された。
- 回路深度だけでは,変分量子分類器のノイズ耐性を特徴付けることは不十分であることが示された。
- 様々な変分量子分類器の実装,データセット,および複数のノイズ量子デバイスにおいて,これらの結果が一貫して確認された。
ハイブリッドエッジ畳み込みとTransformerアーキテクチャを用いたBジェットタグ付け [hep-ph, cs.AI, eess.SP]目的:Bジェットタグ付けのための深層学習アーキテクチャの開発
- 精密な標準模型の測定やクォーク・グルーオンプラズマの相互作用研究に不可欠である。
- 重いクォークを含む高エネルギー衝突生成粒子の性質を推測することが困難である。
- Bジェット識別性能を向上させ,特にチャームジェットとの識別を改善すること。
- 提案するECTモデルは,b-ジェットと他のジェットの識別において,AUC 0.9333を達成し,ParticleNetやTransformerよりも高い性能を示した。
- ECTモデルは,0.060ms以下の推論遅延時間を維持しており,LHCでのリアルタイムイベント選択の厳しい要件を満たしている。
- 局所的特徴とグローバル特徴を組み合わせたハイブリッドアーキテクチャが,困難なジェット分類タスクにおいて優れた性能を発揮することが示された。
FinRL-X:定量的取引のためのAIネイティブなモジュール型基盤 [q-fin.TR, cs.LG, q-fin.CP]目的:定量的取引研究とデプロイメントのための再現可能な基盤
- 金融市場における効率的な取引戦略の重要性が高まっている
- 既存のオープンソースプラットフォームは,研究評価と実運用の一貫性に課題がある
- 研究と実運用をシームレスに繋ぐシステムレベルの一貫性を提供すること
- FinRL-Xは,データ処理,戦略構築,バックテスト,ブローカー実行を統合したモジュール型アーキテクチャである。
- このフレームワークは,ルールベースとAI駆動の両方のコンポーネントをサポートし,実行セマンティクスを変更することなく,強化学習アロケーターやLLMベースのセンチメントシグナルを組み込むことができる。
- FinRL-Xは,エンドツーエンドの定量的取引研究とデプロイメントのための拡張可能な基盤を提供する。
スナップショットからの汎化離散拡散 [stat.ML, cs.AI, cs.CL, cs.LG]目的:スナップショットからの汎化離散拡散モデルの枠組み
- 大規模な離散状態空間における生成モデリングは重要であり,多様な表現を学習する必要がある。
- 従来の離散拡散モデルは,ノイズ処理のプロセスに制約があり,柔軟性に欠ける場合がある。
- 任意のノイズ処理プロセスに対応可能な,効率的で高品質な離散拡散モデルを開発すること。
- 提案手法GDDSは,既存の離散拡散アプローチを包含し,ノイズ処理の動的選択において高い柔軟性を提供する。
- スナップショット潜在変数に基づくELBOを用いることで,効率的な学習と明確な確率的解釈が可能となる。
- 大規模な語彙を持つ離散生成タスクにおいて,GDDSは既存手法を上回り,自己回帰モデルを超える性能を達成した。
波長多重化空間非コヒーレント回折光学プロセッサによる圧縮型単一ピクセルイメージング [physics.optics, cs.NE]目的:圧縮型単一ピクセルイメージングの実現
- 単一ピクセルイメージングは高感度,高S/N比,広いスペクトル範囲を持つが,測定効率が低くデータ収集に時間がかかる。
- 従来の単一ピクセルイメージングは,測定効率の低さとデータ収集時間の長さが課題である。
- 波長多重化回折光学プロセッサとニューラルネットワークを組み合わせ,測定効率と速度を向上させる。
- 波長多重化回折光学プロセッサと浅いデジタルニューラルネットワークを組み合わせることで,圧縮型単一ピクセルイメージングの実現性を実証した。
- 回折光学プロセッサをデータフリー最適化により固定化し,高速な画像再構成を可能にした。
- 本研究は,バイオメディカルイメージング,自律デバイス,リモートセンシング等の分野への応用が期待される計算イメージングフレームワークを示す。
PRISM:長文脈LLM推論におけるO(n)メモリ壁の打破 - O(1)光ブロック選択による [math.CO, cs.DM, physics.optics, cs.AI, cs.AR, cs.CL, cs.LG]目的:長文脈LLM推論におけるKVキャッシュのスキャンによるメモリ帯域幅コスト削減
- LLMの高性能化には,計算能力だけでなく,効率的なメモリアクセスが不可欠である。
- 従来のLLM推論では,文脈長が長くなるほどメモリ帯域幅がボトルネックとなり,性能が制限される。
- 光ブロック選択により,メモリアクセスを効率化し,長文脈LLM推論の性能向上を目指す。
- PRISMは,光を用いた高速な類似性検索エンジンであり,KVブロック選択をO(1)で行う。
- Qwen2.5-7Bを用いた評価では,4Kから64Kトークンにおいて100%の精度を達成し,64K文脈では16倍のトラフィック削減を実現。
- PRISMは,従来のGPUベースラインと比較して,実用的な文脈長において4桁以上のエネルギー効率向上を達成。
