arXiv雑要約
AI - 2026/03/02 公開
FedVG:勾配誘導集約による連合学習の性能向上 [cs.LG, cs.AI, cs.CV]目的:連合学習における性能向上
- プライバシー保護と機械学習の活用が求められる中で,連合学習の重要性が増している。
- クライアント間のデータ異質性が高く,モデルの汎化性能が低下しやすいという課題がある。
- データ異質性に起因するクライアントドリフトを抑制し,汎化性能を改善することを目指す。
- 提案手法FedVGは,グローバル検証セットを用いて勾配を誘導する集約フレームワークである。
- クライアントモデルの汎化能力を層ごとの勾配ノルムで評価し,適応的な集約を実現する。
- 自然画像および医療画像データセットで,FedVGは高い性能向上を示し,既存手法とも容易に組み合わせられる。
制約バリア関数を用いた安全な生成サンプリング [cs.LG, cs.AI, cs.SY, eess.SY, math.OC]目的:生成サンプリングにおける安全性確保
- 複雑なデータ分布の学習において,生成モデルの性能は著しい向上を遂げている。
- 安全性が必要な分野では,生成されたサンプルが制約を満たす保証が不足している。
- 生成モデルに制約を課すことで,安全性を保証しつつ,分布の変化を最小限に抑える。
- 提案手法は,事前学習済みの生成モデルに対し,オンラインで制約を適用する安全フィルタリングフレームワークである。
- 制約バリア関数を用いることで,ノイズ分布からデータ分布へ徐々に絞り込まれる安全チューブを定義し,安全なサンプリングを保証する。
- 画像生成,軌跡サンプリング,ロボット操作において,100%の制約充足率と意味的忠実性を両立した。
戦略的リスク回避による汎化可能な協調エージェントの訓練 [cs.LG, cs.AI, cs.MA]目的:汎化可能な協調エージェントの訓練
- エージェント間での協調は,多くの先進的な技術において不可欠であり,その重要性は増している。
- 既存の手法では,新しい相手との組み合わせで性能が低下する,脆い協調エージェントが課題となっている。
- 戦略的リスク回避という概念に基づき,未知の相手との協調を可能にする汎化性の高いエージェントを開発する。
- 戦略的リスク回避は,相手の行動の変化に対して頑健であり,協調ゲームにおいてより良い結果をもたらす。
- 本研究で開発した多エージェント強化学習アルゴリズムは,標準的な手法に戦略的リスク回避を組み込むことで,様々な協調タスクで高い協調性を実現した。
- 実験結果は,本手法が未知の相手との協調において,安定した性能を発揮することを示している。
fEDM+: 原理レベルの説明可能性と多元的な検証を備えたリスクベースのファジー倫理的意思決定フレームワーク [cs.RO, cs.AI]目的:倫理的リスク評価と意思決定ルールを組み合わせたフレームワークの拡張
- AIシステムの倫理的責任が重要視される中,透明性と説明可能性が不可欠となっている。
- 既存の倫理的意思決定フレームワークは,意思決定の根拠の明確化と多様な価値観への対応が課題であった。
- 倫理原則との関連性を示し,複数の利害関係者の視点を考慮した意思決定を可能にすることを目指す。
- fEDM+は,倫理的リスク評価に加え,説明可能性・追跡可能性モジュール(ETM)を導入し,意思決定の根拠を明確化する。
- 各意思決定ルールと倫理原則の関連性を可視化し,推奨される行動に対する各原則の貢献度を算出することで透明性を高める。
- 単一の基準による検証から,複数の利害関係者基準による多元的な検証へと移行し,倫理的多様性を考慮したロバスト性を実現する。
SemVideo:階層的な意味的ガイダンスによる脳活動からの視聴内容の再構成 [cs.CV, cs.AI]目的:脳活動からの動的視覚体験の再構成
- 脳の視覚認知メカニズム解明に貢献し,ブレイン・マシン・インターフェースなど応用範囲が広い。
- 動画の再構成は画像に比べ難易度が高く,物体の一貫性や時間的な整合性の欠如が課題である。
- 意味的情報を活用し,より正確で自然な動画再構成を目指す。
- SemVideoは,階層的な意味情報に基づいてfMRI信号と動画を整合させる新しいフレームワークである。
- 提案手法は,CC2017およびHCPデータセットで既存手法を上回り,意味的整合性と時間的整合性において優れた性能を示した。
- SemMinerが構築する意味的ガイダンスが,動画再構成の精度向上に貢献している。
欺瞞は教えるか?敵対的強化学習による知覚的頑健性の強化 [cs.DC, cs.RO, cs.DC, cs.RO, cs.LG, cs.AI]目的:マルチモーダル大規模言語モデルの知覚的頑健性の向上
- 視覚的に複雑なシーンに対する脆弱性は,実用上の大きな課題である。
- 有限の訓練データへの依存が,モデルの頑健性に上限を設けている。
- 自己対戦を通じて,モデルが訓練データを生成し,頑健性を高める。
- 敵対的訓練フレームワークAOTは,攻撃者と防御者の共進化を実現する。
- AOTは,多様な画像操作を生成し,防御モデルの適応と改善を促す。
- 実験の結果,AOTは知覚的頑健性を向上させ,幻覚を減少させることを示した。
多層因果埋め込み [cs.AI, cs.LG]目的:因果モデルの埋め込み
- 因果推論は,科学的発見や意思決定において不可欠な役割を果たす。
- 異なる粒度のモデルを統合的に扱うための枠組みが不足している。
- 複数の詳細モデルを粗い因果モデルにマッピングする方法を確立する。
- 因果埋め込みは,抽象化の一般化として定義され,一貫性の概念も拡張された。
- 多解像度周辺問題を通じて,統計的周辺問題と因果的周辺問題への関連性が示された。
- 異なる表現を持つモデルからのデータセットのマージにおける実用性が示唆された。
失敗の多様体:言語モデルにおける行動引力盆地 [cs.LG, cs.AI, cs.CR]目的:大規模言語モデルの失敗領域の体系的なマッピング
- AIの安全性確保は重要であり,その理解を深めるには,安全な領域だけでなく,危険な領域の特性把握が不可欠である。
- 既存研究は主に敵対的サンプルを安全な領域に戻すことに注力しており,危険な領域自体の構造的な理解が不足している。
- 言語モデルの失敗領域の連続的なトポロジーを明らかにし,潜在的な脆弱性を網羅的に特定することを目指す。
- MAP-Elitesを用いて,最大63%の行動カバレッジを達成し,最大370の異なる脆弱性ニッチを発見した。
- Llama-3-8Bはほぼ普遍的な脆弱性プラトーを示し,GPT-OSS-20Bは空間的に集中した盆地を持つ断片化された地形を示した。
- GPT-5-Miniは高い堅牢性を示し,Alignment Deviationの上限は0.50であった。本手法は既存手法では得られない,モデルの安全性ランドスケープのグローバルマップを提供した。
モデルが考えを変えるべき時:心電図信号における概念ドリフトのためのエネルギーベースの理論と正則化項 [cs.LG]目的:動的な生理信号における概念ドリフトの安定性
- 生理信号は常に変動するため,変化を捉え,誤った判断を防ぐことが重要である。
- 従来の概念ドリフトの枠組みでは,生理学的に妥当なエネルギー変動に対する適切な対応が難しい。
- 無害な変動と真の概念変化を区別し,モデルの予測安定性を向上させる。
- 提案手法(PECTとECRL)は,信号のエネルギー変化に比例した潜在空間の移動を促すことで,概念ドリフトを抑制する。
- マルチモーダル心電図データを用いた実験で,予測精度を維持しつつ,摂動に対する精度が大幅に向上した。
- 実験結果は,PECTが連続的な生理信号における概念安定性を規定するエネルギー・ドリフト則として機能することを示唆する。
狼の到来としてのバイブ・リサーチ:AIエージェントは社会科学者を代替または拡張できるか [cs.SI, cs.AI, cs.HC]目的:AIエージェントの社会科学における役割と可能性
- 社会科学研究は,社会現象の理解と解決に不可欠である。高度化する社会に対応するためには,研究の効率化が求められる。
- 従来の自動化技術では,複雑な研究プロセス全体をカバーすることが困難であった。研究者の専門知識や判断力が不可欠な部分が存在する。
- AIエージェントによる研究活動の自動化の限界と,社会科学研究におけるAIの適切な活用方法を明らかにすること。
- AIエージェントは,研究の速度,網羅性,方法論的枠組みの構築において優れている。
- しかし,理論的な独創性や暗黙知に基づく現場知識の活用には課題が残る。
- AIの活用には,研究者の能力拡張という条件の脆さ,格差拡大のリスク,教育における危機といった課題が存在する。
veScale-FSDP:大規模における柔軟かつ高性能なFSDP [cs.DC, cs.AI, cs.LG]目的:大規模モデル学習のための,柔軟性と高性能を両立するFSDPシステム
- 大規模モデルの学習は,AI技術の発展に不可欠であり,その効率化が求められている。
- 既存のFSDPシステムは,構造を意識した学習法や最新の最適化手法への対応が課題であった。
- ブロック構造の計算や非要素ごとの最適化に対応し,スケーラビリティを向上させる。
- veScale-FSDPは,柔軟なシャーディング形式と構造を意識した計画アルゴリズムを組み合わせることで,柔軟性と性能を両立した。
- 既存のFSDPシステムと比較して,スループットが5~66%向上し,メモリ使用量は16~30%削減された。
- 数万GPUへの効率的なスケーリングが可能となり,大規模学習のボトルネックを解消する。
ConstraintBench:直接最適化によるLLM制約推論のベンチマーク [cs.CL, cs.AI]目的:LLMにおける制約付き最適化の直接的な推論能力の評価
- LLMを実務上の意思決定に利用する場面が増加しており,その性能評価が重要である。
- 既存のベンチマークは最適化問題のコード生成に焦点を当てており,直接的な解の生成能力は未評価であった。
- LLMがソルバーを使用せずに,制約付き最適化問題を直接解けるかを評価し,その限界を明らかにする。
- LLMの主要な課題は最適性よりも実行可能性であり,最良モデルでも実行可能性は65.0%に留まる。
- 実行可能な解は,Gurobiによる最適解の89~96%程度の目的関数値を示す。
- 最適解の0.1%以内かつ実行可能な解を出力できるモデルは存在せず,ドメインによって難易度に大きな差が見られた。
効果はあるが不可解:生体触発探索による古典中国語を用いた脱獄プロンプト最適化 [cs.RO, cs.AI, cs.CR]目的:大規模言語モデルに対する脱獄プロンプトの自動生成
- 大規模言語モデルの利用拡大に伴い,その安全性確保が重要課題となっている。
- 既存の安全対策は,言語的文脈によって効果に差が生じ,脱獄攻撃に脆弱である。
- 古典中国語の特性を利用し,より効率的な脱獄攻撃手法を開発する。
- 提案手法CC-BOSは,古典中国語のプロンプトを多次元果実蠅最適化により自動生成する。
- プロンプトは8つのポリシー次元で表現され,効率的な探索により脱獄攻撃の効果を高める。
- 実験により,CC-BOSが既存の脱獄攻撃手法を上回る有効性を持つことが示された。
MoDora:木構造に基づく半構造化ドキュメント解析システム [cs.IR, cs.AI, cs.CL, cs.DB, cs.LG]目的:半構造化ドキュメントに対する解析手法
- 現実世界のデータは半構造化ドキュメントの形で存在し,その重要性は高い。
- 従来の技術では,断片化された情報や構造の欠如により,解析が困難である。
- MoDoraは,半構造化ドキュメントの解析における課題解決を目指す。
- MoDoraは,OCRで解析された要素をレイアウトを意識したコンポーネントに変換する。
- コンポーネント間の関係とレイアウトの違いを明示的にモデル化するComponent-Correlation Tree(CCTree)を設計した。
- MoDoraは,既存手法と比較して,精度が5.97%-61.07%向上した。
一般化された双線形選好を用いた正則化オンラインRLHF [cs.LG, stat.ML]目的:文脈化されたオンラインRLHFにおける一般化された選好のNash均衡の特定
- 人間からのフィードバックを活用し,AIの行動をより人間らしく,望ましいものとする研究分野である。
- 既存手法は,選好の表現方法や正則化の選択肢が限られており,複雑な選好に対応できない場合がある。
- 双線形選好モデルと強凸正則化を用いることで,より一般的な選好学習を可能とし,高次元空間での効率的な学習を目指す。
- 提案手法は,双線形選好モデルの偏対称性に着目し,貪欲な方策の双対ギャップが推定誤差の二乗で抑えられることを示した。
- 貪欲サンプリングアルゴリズムは,$\eta$に依存しないpolylogarithmicな後悔を実現した($\tilde{\mathcal{O}}(\eta d^4 (\log T)^2)$)。
- Explore-Then-Commitアルゴリズムは,低ランク構造を活用し,$d$に依存しない後悔を実現し,高次元オンラインRLHFにおける統計的効率性を保証した($\tilde{\mathcal{O}}(\sqrt{\eta r T})$)。
拡散言語モデルが真に並列(非自己回帰的)デコーディングに苦戦する理由 [cs.CL, cs.AI]目的:拡散言語モデルにおける非自己回帰的並列デコーディングの課題と改善策
- 近年,拡散言語モデルは並列トークン生成を可能にするものとして注目されている。効率的な処理が求められている。
- 実用的な拡散言語モデルは,自己回帰的なデコーディングに陥りやすく,並列処理の利点が十分に活かされていない。
- 本研究は,学習データと目的のミスマッチを解消し,真に並列なデコーディングを促進することを目指す。
- 提案手法NAPは,複数の独立した推論軌跡を用いたデータキュレーションと,並列強制デコーディング戦略により,標準的なCoTデータで学習した拡散言語モデルよりも優れた性能を示す。
- NAPは,並列度が上がるにつれて性能向上が顕著であり,自己回帰的な傾向を軽減し,真に非自己回帰的な並列生成への道を開く。
- データと教師データの見直しが,拡散言語モデルにおける並列生成能力を向上させるための重要な方向性であることが示唆された。
ODEBrain:動的脳ネットワークモデリングのための連続時間脳波グラフ [cs.AI]目的:脳波動態の予測
- 神経科学研究や臨床応用において,神経集団の動態モデリングは不可欠である。
- 従来のモデルは離散時間で脳波を扱うため,予測誤差の累積や非線形特性の捉えにくさが課題である。
- ODEBrainは連続時間モデリングにより,これらの課題を克服し,脳波動態の予測精度向上を目指す。
- ODEBrainは,スペクトルグラフノードに空間周波数特徴を統合し,Neural ODEを用いて連続的な潜在的動態をモデリングする。
- 潜在表現は,複雑な脳状態の確率的変動を任意の時点において捉えることが可能となる。
- 実験の結果,ODEBrainは既存手法と比較して,脳波動態予測において有意な改善と高いロバスト性を示すことが確認された。
二重の異質性下における連合不確実性定量のための適合型ニューラルネットワーク [cs.LG, cs.AI]目的:連合学習における不確実性定量
- 連合学習は,プライバシー保護と分散データ利用を可能にする重要な技術である。
- 連合学習では,データやモデルの異質性が不確実性定量に課題をもたらす。
- 二重の異質性を考慮した,効率的で信頼性の高い不確実性定量手法を提案する。
- 提案手法FedWQ-CPは,エージェントレベルとグローバルレベルの両方で,カバー率を維持しつつ,予測集合/区間を最小化する。
- FedWQ-CPは,単一の通信ラウンドでエージェント-サーバー間のキャリブレーションを実現する効率性を有する。
- 分類と回帰の両タスクにおいて,7つの公開データセットで有効性が確認された。
ParamMem: パラメトリックな反省的記憶による言語エージェントの拡張 [cs.LG, cs.MA]目的:言語エージェントの性能向上
- 言語エージェントは反復的な解決策の洗練に役立つが,その性能には限界がある。
- 反省の多様性が低いと,思考の深堀りが妨げられ,性能が制限される。
- 多様な反省シグナルを生成し,言語エージェントの思考能力を向上させる。
- ParamMemは,サンプル間の反省パターンをモデルパラメータにエンコードすることで,多様な反省生成を可能にする。
- ParamAgentは,ParamMemとエピソード記憶,サンプル間記憶を統合した反省に基づくエージェントフレームワークである。
- コード生成,数学的推論,複数ホップ質問応答において,最先端のベースラインよりも一貫した改善が見られた。
リー群と等質空間上の定常カーネルとガウス過程 I:コンパクトな場合 [stat.ME, cs.LG, math.ST, stat.ML, stat.TH]目的:リー群と等質空間上の定常ガウス過程の構築手法
- 機械学習における時空間モデリングにおいて,ガウス過程は極めて重要な役割を担う。
- ガウス過程の共分散関数が持つべき対称性に対する不変性が,十分に考慮されていない。
- 非ユークリッド空間における定常ガウス過程モデルを構築し,実用的な計算を可能にすること。
- 本研究では,リー群と等質空間のような対称性を持つ空間上で,定常ガウス過程を構築するための具体的な手法を開発した。
- 開発された手法により,共分散カーネルの計算や,事前・事後ガウス過程のサンプリングを効率的に行うことが可能になった。
- これにより,標準的なガウス過程ソフトウェアで非ユークリッド空間上のモデルを扱えるようになり,実用性が向上した。
欠損および不均一データが存在する場合における空間的・時間的予測因子の評価 [stat.ML, cs.LG]目的:空間的・時間的予測モデルの最適性評価手法
- 大規模データ分析の重要性が増す中,予測精度の向上が不可欠である。
- 空間的・時間的データは非線形性や時間変動を伴い,欠損も多く,評価が困難である。
- 欠損や不均一データに対してもロバストな評価手法を確立することを目指す。
- 残差相関分析に基づき,モデルが捉えきれていない情報を特定し,予測性能改善の余地を示す領域を空間・時間的に特定する。
- 疎な空間・時間的依存関係を符号化するグラフ構造と,漸近的に分布自由な統計量を活用し,モデルの性能不足箇所を検出する。
- 合成データと実データを用いた実験により,提案手法の有効性が示された。
高次元ノイズデータに対するデュオ・ランドマーク積分演算子を用いたカーネルスペクトル同時埋め込み [math.CO, cs.CC, stat.ML, cs.LG]目的:高次元ノイズデータの同時埋め込み手法
- シングルセルゲノミクスや医療情報学など,多様なデータ統合解析の重要性が増している。
- 既存手法は非線形構造の捉えにくさ,ノイズや高次元性への対応不足が課題である。
- 共有する低次元構造を利用し,埋め込みの質を向上させることを目指す。
- 提案手法は,2つの高次元ノイズデータセット間の共有する低次元構造を自動的に捉え,活用する。
- 理論的な解析により,提案手法の低次元信号復元の一貫性,および信号対雑音比の影響が示された。
- シングルセルオミクスデータを用いた実験により,既存手法と比較して埋め込みと下流タスクの性能が向上することが示された。
自己教師あり刺激符号化のためのスペクトル-刺激情報 [q-bio.NC, cs.IT, cs.LG, cs.NE, math.IT]目的:空間における効率的な場所細胞の符号化原理の解明
- 哺乳類の空間ナビゲーションは,場所細胞やグリッド細胞など特殊なニューロンに依存する。
- 既存の空間情報レート指標は単一ニューロンの符号化しか評価できず,集団レベルでの表現に関する知見が限られている。
- ニューロン集団の符号化効率を評価し,人工ナビゲーションシステムの最適化を目指す。
- スペクトル-刺激情報は,局所的で重ならない発火場を持つニューロンで最大化され,場所細胞や頭方向細胞の活動を反映する。
- マウスとサルからの神経データへの適用により,ニューロンペアと集団間の符号化効率の違いが明らかになった。
- これらの指標を用いてRNNを自己教師あり学習させると,場所細胞や頭方向細胞が出現することが示された。
多項式スケーリングは,構造化されたBSDE族のニューラルオペレーター近似において可能である [math.OC, cs.LG, cs.NA, math.NA, math.PR, q-fin.CP]目的:構造化された非マルコフBSDE族に対するニューラルオペレーター近似のスケーリング特性
- ニューラルオペレーターは高次元関数空間の非線形写像学習に利用され,シミュレーションの高速化やデータ駆動型モデリングを可能とする。
- 一般的な演算子クラスでは,最小二乗近似レートが精度$1/\varepsilon$に対して指数関数的にスケールするため,複雑さの問題がある。
- 問題固有の構造を利用することで,ニューラルオペレーターの表現力を高め,$1/\varepsilon$に対する多項式スケーリングを実現すること。
- 構造化された非マルコフBSDE族の解演算子は,学習可能なパラメータ数が$1/\varepsilon$に対して多項式的に成長するニューラルオペレーターによって近似可能である。
- この多項式スケーリングは,関連する半線形楕円偏微分方程式のグリーン関数の特異部分をファクタリングアウトし,BSDEの共通非マルコフ因子のドレアン=ダード指数をニューラルオペレーターのデコーディング層に組み込むことで実現される。
- その結果として,規則領域上の線形楕円偏微分方程式族に対する多項式スケーリング保証が,半線形設定に拡張された。
Transformerを用いた電離層パラメータの予測 [math.OC, cs.CC, physics.space-ph, cs.LG]目的:電離層パラメータの予測手法
- 宇宙天気予報の精度向上は,通信や測位システムへの影響軽減に不可欠である。
- 従来の電離層モデルは,予測精度に限界があり,リアルタイムな変動に対応できない場合がある。
- Transformerモデルを用いて,より高精度で信頼性の高い電離層パラメータの予測を実現すること。
- Transformerモデルは,foF2,hmF2,TECの予測において高い精度を示した。
- 外部変数(F10.7cmフラックス,Dst指数)と,過去の気候モデルを組み合わせることで,24時間予測が可能となった。
- 訓練データに含まれない場所や期間に対しても,高い汎化性能が確認された。
離散最適輸送と声質変換 [math.OC, cs.SY, eess.SY, eess.AS, cs.LG, cs.SD]目的:声質変換におけるベクトルベースインターフェースの最適化
- 多様な話者間の音声特徴を変換する技術であり,対話システムや音声合成への応用が期待される。
- 話者間の音声特徴の対応付けが難しく,自然な音声を生成することが困難である。
- 離散最適輸送を用いることで,より高品質で効果的な声質変換を実現すること。
- 提案手法は,高品質かつ効果的な声質変換を可能にすることが評価実験で示された。
- 埋め込みベクトルの数に関する消去研究を行い,kNNとOTの単純平均の結果を拡張した。
- 離散OTを音声生成のポスト処理に適用すると,合成音声が実音声と誤認されるという,新たな強力な敵対的攻撃を明らかにした。
原子レベル基礎モデルによる局所タンパク質環境の表現 [q-bio.BM, cs.AI]目的:局所タンパク質環境の表現
- タンパク質の機能や分子間相互作用は,局所構造に強く依存するため,その表現は重要である。
- 局所環境の構造・化学的多様性が大きく,効果的な表現方法が確立されていない。
- 原子レベル基礎モデルから得られる特徴量を用いて,局所環境を表現し,その有用性を検証する。
- 原子レベル基礎モデルの中間特徴量から抽出した表現が,局所構造や化学的特徴を効果的に捉えることが示された。
- 得られた表現空間は意味のある構造を有しており,バイオ分子環境の分布に関するデータ駆動型事前分布の構築を可能にする。
- バイオ分子NMRスペクトルにおいて,物理情報に基づいた化学シフト予測モデルが,最先端の精度を達成することが示された。
配電ネットワークとエネルギーコミュニティ間の協調運転のための量子学習と推定 [math.OC, cs.LG]目的:配電ネットワークとエネルギーコミュニティ間の協調運転の強化
- 電力系統の安定運用には,配電ネットワークとエネルギーコミュニティの連携が不可欠である。
- エネルギーコミュニティの内部情報が限られているため,配電ネットワークとの効果的な協調運転が困難である。
- 不確実性を考慮した多数のシナリオに対する計算負荷を軽減し,協調運転を最適化すること。
- 提案手法である量子TCN-LSTMモデルは,古典的ニューラルネットワークと比較して,マッピング精度を69.2%向上させ,モデルサイズを99.75%削減した。
- 量子振幅推定(QAE)は,古典的なモンテカルロシミュレーションと同等の精度を,大幅な計算資源削減で実現した。
- 理想的な量子デバイス上での量子学習と推定の計算時間は,従来の方式に比べて90%以上短縮される見込みである。
長尾分布分類に対する帰納的予測 [stat.ML, cs.CV, cs.LG, stat.ME]目的:長尾分布分類問題における予測集合の性能向上
- 現実の分類問題では,クラス分布が長尾であることが多く,その対応が重要である。
- 既存の帰納的予測法は,クラス条件付きカバレッジと予測集合のサイズのトレードオフに課題がある。
- クラス条件付きカバレッジと予測集合のサイズを両立させる手法を提案し,問題を解決する。
- 提案手法では,マクロカバレッジを最適化する新しい帰納的スコア関数である prevalence-adjusted softmax を導入した。
- 周辺カバレッジとクラス条件付きカバレッジの間を線形補間する新しい手続きを提案し,両者のトレードオフを制御する。
- Pl@ntNet-300KとiNaturalist-2018のデータセットを用いて,提案手法の有効性を検証した。
独立成分分析による因果効果の推定 [stat.ML, cs.AI, cs.LG]目的:因果効果の推定
- 社会科学や医学において,政策や介入の効果を正確に評価することは重要である。
- 交絡因子の存在により,因果効果の正確な推定が困難となる場合が多い。
- 独立成分分析を用いて,交絡因子が存在する場合でも因果効果を推定する。
- 独立成分分析と高次直交機械学習は,一貫性のある推定のための同じモーメント条件を利用していることが示された。
- 線形独立成分分析は,ガウス分布の交絡因子が存在する場合でも,複数の因果効果を一貫して推定できることが証明された。
- 合成需要推定実験により,線形独立成分分析が因果効果を正確に推定できることが確認された。
より少なく,より良く:AMBER-AFNO - 軽量3D医療画像セグメンテーションの新たなベンチマーク [eess.IV, cs.AI, cs.CV, cs.LG]目的:軽量な3D医療画像セグメンテーション手法の開発
- 医療画像解析は,疾患の診断や治療計画において不可欠であり,高精度なセグメンテーションが求められる。
- 従来の3D画像セグメンテーションは,計算コストが高く,メモリ消費量が大きいという課題があった。
- 本研究では,計算効率の良い新しいアーキテクチャを提案し,その有効性を検証する。
- 提案手法AMBER-AFNOは,ADCD,Synapse,BraTSの3つの公開データセットにおいて,最先端またはそれに匹敵する性能をDSCおよびHD95で達成した。
- 周波数領域でのトークン混合により,自己注意メカニズムと比較して計算コストとメモリ使用量を大幅に削減できることを示した。
- AMBER-AFNOは,コンパクトなモデルサイズでありながら,既存のCNNやTransformerアーキテクチャと比較して高いDiceスコアを達成した。
音声条件付き拡散LLMを用いたASRと熟考処理 [eess.AS, cs.AI, cs.SD]目的:自動音声認識(ASR)における拡散LLMの有効性評価
- 音声認識は,人間と機械間の自然なコミュニケーションを可能にする基盤技術である。
- 従来の音声認識モデルは,計算コストが高い,または低リソース環境での性能が低いという課題がある。
- 拡散LLMを用いることで,これらの課題を克服し,より効率的で高精度な音声認識を実現することを目指す。
- 拡散LLMであるLLaDAをWhisper-LLaMAのトランスクリプトに対する熟考処理モジュールとして利用した結果,WERが大幅に低減された。
- LibriSpeechのテストデータにおいて,最良のシステムはテストクリーンで2.25%,テストその他で4.94%のWERを達成し,Whisper-LLaMAのベースラインと比較して12.3%の相対的な改善を示した。
- 音声特徴を条件付けたLLaDAは認識精度を向上させた一方,音声特徴を用いないLLaDAでは改善は見られなかった。
ベイジアン反転のための幾何学的オートエンコーダ事前分布:まず学習し,後で観測する [stat.ML, cs.LG, physics.comp-ph, physics.data-an]目的:物理システムの応答の幾何学を考慮した生成モデルの学習
- 工学における推論において,不確実性評価は不可欠である。複雑なシステムの挙動を予測するために重要。
- 物理システムの完全な場情報を少数観測から復元する問題は,逆問題として高度に不確定である。
- 幾何学形状が異なる複数のシステムからの情報を活用し,より正確な推論を可能にすること。
- GABIは,様々な形状のシステムデータセットから情報を蒸留し,幾何学条件付きの潜在的な事前分布を学習する。
- この事前分布は,特定の観測プロセスの尤度と組み合わせることで,形状に適合した事後分布を生成する。
- 提案手法は,複雑な形状を持つ問題においても,高い予測精度と適切な不確実性評価を実現した。
離散探索の受容:因果構造学習への合理的なアプローチ [stat.ML, cs.AI, cs.LG, stat.ME]目的:因果構造学習における離散探索の有効性
- 因果推論は,データから原因と結果の関係を明らかにし,様々な科学分野で重要である。
- 大規模データへの適用において,既存の因果探索アルゴリズムの計算コストが課題となっていた。
- 高速な探索アルゴリズムによって因果グラフの学習を効率化し,最適解への到達を目指す。
- FLOPアルゴリズムは,Cholesky分解に基づくスコア更新により高速な親選択を実現した。
- その結果,離散探索の実行可能性を高め,ベンチマークテストで高い精度を示した。
- 本研究は,因果探索における離散探索のアプローチを再評価する根拠を提供する。
構造テンソルと等変ニューラルネットワークを用いた乱流モデル [physics.flu-dyn, cs.LG]目的:構造テンソルに基づく,圧力歪み項に対するテンソルベースの閉包モデル
- 乱流は,工学における様々な現象に影響を与えるため,その予測精度向上が重要である。
- 既存のRANSモデルは汎用性に乏しく,予測精度が信頼できないという課題がある。
- 構造テンソルによる乱流統計状態の記述能力向上により,RANSモデルの精度向上を目指す。
- 等変ニューラルネットワーク(ENN)を用いて,高速圧力歪み項に対する高精度な閉包モデルを構築した。
- 提案モデルは,既存モデルと比較して,数桁高い精度を示すことで,Kassinosらの仮説を検証した。
- ENNは,物理的に整合性の取れた代替手段となり,RANSにおける未閉項の学習を可能にする。
NuBench:深層学習に基づくニュートリノ望遠鏡イベント再構成のオープンベンチマーク [hep-ex, cs.AI, cs.LG, physics.data-an, physics.ins-det]目的:深層学習を用いたニュートリノ望遠鏡におけるイベント再構成手法の比較評価
- ニュートリノ望遠鏡は,宇宙線ニュートリノ起源解明やニュートリノ物理学の根源的な問題に挑む重要な研究ツールである。
- 既存手法の性能向上と深層学習の応用が進む一方で,実験間のデータ共有不足がボトルネックとなっていた。
- 多様なオープンソースデータセットを提供し,ニュートリノ望遠鏡における再構成手法の比較・発展を促進することを目指す。
- NuBenchは,水および氷環境に対応した1億3千万件以上のシミュレーションデータセットで構成されている。
- ParticleNeT,DynEdge,GRIT,DeepIceの4つの再構成アルゴリズムを,エネルギー・方向再構成,トポロジー分類などの主要なタスクで評価した。
- 実験間の手法比較の標準化と,今後の深層学習を用いた再構成アルゴリズム開発の加速に貢献する。
Wasserstein-Fisher-Rao勾配フローのオペレーター分割解析 [stat.ML, cs.LG, stat.ME]目的:Wasserstein-Fisher-Rao勾配フローの数値近似におけるオペレーター分割の最適化
- 確率モデルのサンプリングは,統計的推論や機械学習において不可欠なプロセスである。
- 既存の数値解法は計算コストが高く,大規模データへの適用が困難な場合がある。
- オペレーター分割の順序を最適化し,計算効率と収束速度の向上を目指す。
- 適切なステップサイズとオペレーターの順序を選択することで,分割スキームが厳密なWFRフローよりも高速に目標分布に収束することが示された。
- W-FR分割とFR-W分割のどちらが好ましいかの判断基準を,変分公式を用いて明確化した。
- WFR勾配フローが対数凹性を保存し,その減衰率の上限を初めて導出した。
MEDIC:衝突型実験におけるデータ品質監視のためのネットワーク [hep-ex, cs.AI, cs.LG]目的:衝突型実験におけるデータ品質監視のためのネットワーク
- 素粒子実験は,未解明の物理現象の解明を目指す上で不可欠であり,高精度なデータが求められる。
- 実験装置の規模と複雑さ,そして極限環境下での膨大なデータ量により,データ品質監視は高度な課題となっている。
- シミュレーションを活用することで,実験環境を再現し,データ品質監視手法の開発・検証を効率的に行う。
- MEDICは,ニューラルネットワークを用いて検出器の異常を検出し,故障箇所を特定するフレームワークである。
- シミュレーションベースでの検証の結果,故障を模倣した設定において,異常検出の可能性が示された。
- この研究は,将来の素粒子検出器向けに,より高度な機械学習ベースのデータ品質監視システムの開発に向けた基盤となる。
質量-バネ-ダンパー等価モデルを用いた海況と船舶パラメータの同時推定 [eess.SP, cs.AI, cs.SY, eess.SY]目的:海況と船舶パラメータの同時推定手法
- 造船や海上安全といった分野において,リアルタイムな海況把握が不可欠である。
- 従来の推定手法は,正確な波-船舶伝達関数に依存しており,事前情報がない場合や変動する場合に課題がある。
- 本研究は,伝達関数を必要とせず,海況と船舶パラメータを同時に推定することで,この課題を解決することを目指す。
- 擬似的な質量-バネ-ダンパーを用いて波-船舶システムをモデル化し,時間変動入力に対応可能な動的モデルを開発した。
- 統計的に一貫性のあるプロセスノイズ共分散を導出し,センサーデータの融合にカルマンフィルタを実装した。
- モンテカルロシミュレーションと高精度シミュレーターによる検証の結果,推定された波スペクトルは従来の伝達関数を用いる手法と同等の精度を示した。
VCWorld:バーチャル細胞シミュレーションのための生物学的世界モデル [q-bio.CB, cs.AI, cs.LG]目的:バーチャル細胞シミュレーションにおける細胞応答の予測
- 細胞の振る舞いを理解するためには,精密なモデルが不可欠である。
- 既存のモデルはデータ品質や偏りに左右され,汎用性に課題がある。
- 生物学的知識と推論能力を統合し,解釈可能なモデルを構築すること。
- VCWorldは,大規模言語モデルを活用し,細胞レベルのメカニズムを再現する。
- データ効率に優れ,摂動によるシグナル伝達経路をステップごとに予測する。
- 薬物摂動ベンチマークにおいて最先端の予測性能を示し,推論された経路は既存の知見と一致する。
QKAN-LSTM:量子に着想を得たコルモゴロフ・アーノルド長短期記憶 [quant-ph, cs.AI, cs.LG]目的:都市通信予測などの時系列モデリングにおける予測精度向上とパラメータ削減
- 時系列データ解析は,都市インフラや金融市場など様々な分野で不可欠な技術である。
- 従来のLSTMは,パラメータ過多や非線形表現力の限界が課題となっていた。
- 量子に着想を得た新しいLSTM構造により,これらの課題を克服し,より効率的なモデリングを実現する。
- 提案手法であるQKAN-LSTMは,古典的なLSTMと比較して,予測精度が向上し,学習可能なパラメータを79%削減することに成功した。
- QKAN-LSTMは,DARUANモジュールをゲート構造に組み込むことで,周波数適応性とスペクトル表現力を高めている。
- さらに,HQKAN-LSTMを開発し,階層的な表現学習を可能にし,実世界のデータ環境での応用可能性を示唆している。
GenAI-Net:自動生体分子ネットワーク設計のための生成AIフレームワーク [q-bio.QM, cs.AI, cs.LG, cs.SY, eess.SY, q-bio.MN]目的:生体分子ネットワークの自動設計
- 合成生物学等の発展に不可欠であり,複雑なシステム理解の基盤となる。
- 所望の動的機能を実装する化学反応ネットワークの設計は困難を伴う。
- 生成AIを用いて,仕様から回路候補を効率的に生成し,設計を加速する。
- GenAI-Netは,反応を提案するエージェントとシミュレーションによる評価を組み合わせる。
- 多様な設計タスクに対し,新規で多様なトポロジーの解を効率的に生成する。
- 仕様から回路候補や再利用可能なモチーフを生成し,プログラム可能な回路設計を可能にする。
信頼できる流体:非圧縮性流れのための特性を保持するオペレーター学習 [physics.flu-dyn, cs.LG]目的:非圧縮性流れに対する特性保持オペレーター学習手法
- 流体シミュレーションは科学技術計算の根幹であり,多くの分野で利用されている。
- 従来の数値計算では,非圧縮性の制約を厳密に守るために計算コストが高いという課題がある。
- 本研究は,物理特性を厳密に保持する効率的な代替モデルを構築することを目指す。
- 提案手法は,カーネル基底を用いることで,速度場の非圧縮性,周期性,乱流特性を解析的に保証する。
- 従来のニューラルオペレーターと比較して,一般化性能において最大で6桁低い相対的な$\ell_2$誤差を達成した。
- 学習速度も最大で5桁高速であり,非圧縮性の制約を厳密に守る点でも優れている。
Resp-Agent:多imodal呼吸音生成と疾患診断のためのエージェントベースシステム [eess.AS, cs.AI, cs.DB, cs.HC, cs.MA, cs.SD]目的:多imodal呼吸音の生成と疾患診断システムの開発
- 呼吸音解析は,非侵襲的で簡便な検査手法であり,呼吸器疾患の早期発見に貢献しうる。
- 既存手法では,信号変換による情報損失や,データ不足,特にクラス不均衡が課題となっていた。
- 本研究では,情報損失の軽減とデータ不足への対処を目指し,新たなシステムを提案する。
- Resp-Agentは,診断の弱点を特定し,ターゲットを絞った合成を繰り返すことで,診断精度を向上させる。
- 臨床テキストと音声情報を効果的に統合するDiagnoserにより,詳細な臨床的背景と瞬間的な音響イベントを捉える。
- LLMを活用したGeneratorは,テキスト情報から病理学的特徴と音響スタイルを分離し,診断困難な症例のサンプルを合成する。
EEGチャネル間相互作用の疎なベイズモデリングがP300脳波インターフェースの性能を向上させる [stat.ME, cs.LG]目的:P300脳波インターフェースにおける性能向上
- 身体運動が困難な人々へのコミュニケーション手段提供が期待されるため。
- 脳波の多次元性,時間的依存性,チャネル間の複雑な相互作用が課題である。
- 脳波チャネル間相互作用を明示的にモデル化し,解釈性と個別化を可能にすること。
- 提案手法は,公開されているP300スペラーデータセットで,全ての刺激シーケンスを用いて100%の中央値の文字レベル精度を達成した。
- チャネル間相互作用を取り入れることで,特にアルコールを摂取していない参加者において,文字レベル精度が最大7%向上した。
- 最適な動作点において,BCI-Utilityの中央値が約10%向上し,7回の刺激シーケンス後にはピークのスループットを達成した。
暗黙的バイアスと行列確率的ミラー降下法の収束 [stat.ML, cs.LG, math.OC]目的:行列パラメータとベクトル予測を持つ確率的ミラー降下法における収束性
- 機械学習の高性能化には,大規模データと高次元パラメータの効率的な処理が不可欠である。
- 過剰パラメータ化された設定において,最適化アルゴリズムの挙動や解の特性は未だ不明な点が多い。
- 行列ミラー関数を用いた確率的ミラー降下法の収束性と暗黙的バイアスを解明し,高次元問題への応用を目指す。
- 行列確率的ミラー降下法は,過剰パラメータ化された状況下で,グローバルな補間解へ指数関数的に収束する。
- このアルゴリズムは,初期値とデータ補間条件の下で,$\psi(\cdot)$によって誘導されるブレグマンダイバージェンスを最小化する一意解へ収束する。
- 行列ミラーマップが,高次元かつ多出力問題における帰納的バイアスを決定することが明らかになった。
将来の言語の予測:言及市場のための文脈設計 [q-fin.GN, cs.CL, cs.LG]目的:言及市場におけるキーワード言及予測の精度向上
- 将来の出来事に関する予測市場は,情報収集や意思決定に役立つため重要である。
- 大規模言語モデル(LLM)による予測の精度は,入力文脈の設計に大きく依存する。
- LLMによる予測において,市場確率を事前情報として活用する手法を開発する。
- 豊富な文脈情報を提供することで,予測精度が向上することが確認された。
- 市場確率を事前情報として扱うMarket-Conditioned Prompting (MCP)により,予測の信頼性が向上した。
- 市場確率とMCPを組み合わせたMixMCPが,市場ベースラインよりも優れた性能を示した。
