arXiv雑要約

AI - 2026/03/12 公開

  • 因子分解されたニューラル暗黙的DMDによるパラメトリックダイナミクス [cs.LG]目的:パラメトリックなダイナミカルシステムの学習
    • 物理システムの時間発展モデリングは,支配方程式の明示的な知識を必要としない。
    • 高次元状態空間や非線形ダイナミクスが,従来の数値解法の計算コストを増大させる。
    • 長期予測,未知パラメータへの一般化,スペクトル解析を可能とする学習手法の開発。
    • 提案手法は,クープマン作用素のスペクトル分解を物理情報に基づいてコード化されたニューラル場によってパラメータ化する。
    • 空間モードと時間発展を分離することで,基礎的な固有値,モード,安定性を明らかにする。
    • 複雑な時空間現象を高精度に予測し,システムの動的挙動に関する洞察を提供する。

    Link: https://arxiv.org/abs/2603.10995

  • 皮質GABA作動性ニューロンにおける電気生理学的データとトランスクリプトミクスデータのマッピングのためのクロス種間転移学習 [cs.LG, q-bio.NC]目的:皮質GABA作動性ニューロンにおける電気生理学的特性とトランスクリプトミクスデータの関係性の解明
    • 神経機能の多様性を理解し,生理学的特性と遺伝子発現の関係を明らかにすることは,脳科学研究の根幹をなす。
    • 種間の電気生理学的データの違いから,ヒトの脳に関する知見を得ることが困難である。
    • マウス由来のデータを活用し,ヒトの脳におけるニューロンの分類精度向上を目指す。
    • マウス皮質のデータを用いて構築したモデルは,元のマウス研究で報告された主要なクラスレベルの分離を再現できた。
    • 注意機構に基づいたBiLSTMモデルは,特徴量エンジニアリングによるベースラインと同等の性能を示し,特徴量ファミリーレベルでの解釈可能性を提供した。
    • マウスデータで事前学習したモデルをヒトデータで微調整することで,ヒトの4クラス分類におけるマクロF1スコアが向上した。

    Link: https://arxiv.org/abs/2603.11000

  • RCTと人間能力向上研究:最先端AI評価における方法論的課題と実践的解決策 [cs.CY, cs.AI]目的:最先端AIシステムの評価に関する人間能力向上研究の方法論
    • AI技術の急速な発展に伴い,その影響評価の重要性が増している。
    • 最先端AI特有の性質が,従来の評価手法の前提を揺るがす可能性がある。
    • 人間能力向上研究における課題を特定し,実践的な解決策を提示する。
    • 専門家へのインタビューから,標準的な因果推論の仮定と研究対象との間の緊張が明らかになった。
    • AIシステムの急速な進化,基準の変動,ユーザーのスキル変化などが,評価の妥当性を脅かす要因となる。
    • 人間能力向上研究の各段階における課題と解決策を整理し,高リスクな意思決定における証拠の限界と適切な利用法を明確にした。

    Link: https://arxiv.org/abs/2603.11001

  • 効率的なLLM圧縮のためのリーチ格子ベクトル量子化 [cs.HC, cs.LG]目的:大規模言語モデルの効率的な圧縮
    • 近年のLLMの急速な発展に伴い,モデルサイズの縮小が重要な課題となっている。
    • スカラー量子化は情報理論的な限界があり,ベクトル量子化も実装上の課題を抱えている。
    • リーチ格子を利用することで,高次元空間での効率的なベクトル量子化を実現し,モデル圧縮を可能とする。
    • リーチ格子ベクトル量子化(LLVQ)は,Quip#,QTIP,PVQなどの既存手法を上回る性能を示す。
    • LLVQは,Golayコードに基づく探索アルゴリズムを拡張し,インデックス化や並列化デ量子化を実現した。
    • 高次元格子がスケーラブルかつ理論的に妥当なモデル圧縮に不可欠であることを示唆している。

    Link: https://arxiv.org/abs/2603.11021

  • AIは美術史家のように見るか? ビジョン言語モデルによる芸術様式の認識の解釈 [cs.NI, cs.CV, cs.AI]目的:芸術様式の予測における基盤概念の特定と,美術史家の判断との整合性評価
    • 近年,画像認識技術は高度化しており,芸術分野への応用が期待されている。
    • 既存モデルが芸術様式をどのように認識しているかは,必ずしも美術史家の視点と一致していない可能性がある。
    • ビジョン言語モデルが芸術様式を予測する際に用いる概念を解明し,美術史家の判断との一致度を検証する。
    • 抽出された概念の73%は,美術史家によって意味のある視覚的特徴と判断された。
    • 特定の作品の様式を予測するために使用された概念の90%は,関連性があると判断された。
    • 関連性の低い概念が成功した場合,モデルがより形式的な意味で概念を理解している可能性が示唆された。

    Link: https://arxiv.org/abs/2603.11024

  • グラフ表現のための命令セット [cs.HC, cs.IR, cs.MM, cs.SI, cs.CL, cs.AI, cs.DS]目的:有限の単純グラフの構造を9文字の命令アルファベットによるコンパクトな文字列として表現する方法
    • グラフ構造は,様々な分野でデータ表現の基本であり,その効率的な表現が重要である。
    • 従来のグラフ表現は,計算コストが高い場合や,グラフの類似性評価が困難な場合がある。
    • IsalGraphを用いて,グラフ構造をコンパクトかつ効率的に表現し,類似性評価を容易にすること。
    • IsalGraphは,任意のグラフを9文字の命令アルファベットによる文字列に変換可能である。
    • 文字列の編集距離とグラフ編集距離の間に強い相関が認められた。
    • IsalGraphは,グラフの類似性検索,グラフ生成,グラフ条件付き言語モデリングへの応用が期待される。

    Link: https://arxiv.org/abs/2603.11039

  • V2M-Zero:ペアなし時系列アラインメント動画から音楽生成 [cs.CV, cs.AI, cs.LG, cs.MM, cs.SD]目的:動画イベントと時間的に同期する音楽の生成
    • 動画と音楽の融合は,エンターテインメントやコンテンツ制作において重要な役割を果たす。
    • 既存のテキストから音楽生成モデルは,細粒度の時間制御が難しく,動画イベントとの同期が課題である。
    • モダリティ内での変化の捉え方に基づき,ペアなしデータで時系列アラインメントを実現し,動画と音楽の同期を改善する。
    • V2M-Zeroは,既存のペアデータを用いた手法と比較して,音質,意味的整合性,時間的同期,ビートアラインメントにおいて大幅な改善が見られた。
    • 大規模なリスニングテストにおいても同様の結果が得られ,モダリティ内特徴による時間的アラインメントの有効性が確認された。
    • クロスモダルのペアデータに依存せず,モダリティ内での変化を捉えることで,動画から音楽への生成において時間的同期が可能になった。

    Link: https://arxiv.org/abs/2603.11042

  • ニューラル場熱トモグラフィー:非破壊検査のための微分可能な物理フレームワーク [cs.LG, cond-mat.mtrl-sci, cs.AI, cs.CV, physics.ins-det]目的:材料特性の定量的な3次元再構成
    • 非破壊検査は,製品の品質管理や安全性確保において不可欠な技術である。
    • 従来の熱画像法は,熱拡散の側面を無視した近似に頼ることが多い。
    • 高解像度な3次元トモグラフィーを実現し,熱伝導の逆問題を解決する。
    • NeFTYは,微分可能な物理ソルバーを用いることで熱力学法則を厳密に制約し,高精度な3次元再構成を可能にする。
    • NeFTYは,従来の熱画像法やPINNの課題である,熱拡散の側面無視や勾配の硬直性を克服する。
    • 合成データを用いた実験により,NeFTYが表面下欠陥の局在化において高い精度を示すことが実証された。

    Link: https://arxiv.org/abs/2603.11045

  • LiTo:表面光場トークン化 [cs.CV, cs.AI, cs.GR]目的:物体形状と視点依存表現の同時モデリング
    • 3次元コンピュータビジョンの発展には,リアルな視覚体験の再現が不可欠である。
    • 従来の技術では,3次元形状の再構成と視点非依存拡散反射率の予測に分かれており,視点依存効果の表現が困難であった。
    • 表面光場を効率的にエンコードし,統一された3次元潜在空間で形状と外観を表現することで,この課題を解決する。
    • RGB-D画像から得られる表面光場を潜在ベクトルにエンコードすることで,形状と外観を同時に表現できる表現を確立した。
    • 潜在フローマッチングモデルを用いて,入力画像に基づいた3次元物体の生成が可能となり,照明や材質の変化を再現する。
    • 既存手法と比較して,より高品質かつ入力忠実度の高い3次元オブジェクト生成を達成した。

    Link: https://arxiv.org/abs/2603.11047

  • COMIC:自律的なスケッチコメディ生成 [cs.CV, cs.AI, cs.CL, cs.MA, cs.NE]目的:スケッチコメディ動画の自動生成
    • エンターテイメント分野において,AIによるコンテンツ生成の需要が高まっている。
    • 高品質かつ多様なコメディコンテンツを自動生成することは困難である。
    • AIを用いて,プロの制作レベルに匹敵するスケッチコメディを生成する。
    • 提案システムは,キャラクター設定からユーモアのある短編動画を自動生成する。
    • LLMによる批評家を導入し,YouTubeのコメディ動画データを用いてユーモアの評価を自動化している。
    • 生成された動画は,プロの制作物と同等の品質を示し,動画生成において最先端の性能を達成した。

    Link: https://arxiv.org/abs/2603.11048

  • デイリーオムニ:マルチモーダル間の時間的整列によるオーディオビジュアル推論へ [cs.AI, cs.CL, cs.CV]目的:オーディオビジュアル質問応答ベンチマーク
    • マルチモーダル大規模言語モデルの重要性が増している。
    • 異なるモダリティ間の時間的情報を同期して処理する能力が不十分である。
    • クロスモーダルな時間的推論を必要とする質問応答ベンチマークを構築すること。
    • 新しいベンチマークDaily-Omniは,現実世界の動画と質問から構成される。
    • 多くの最先端のマルチモーダル大規模言語モデルは,時間的整列が重要な質問で苦戦している。
    • 時間的整列シグナルが性能に与える影響を,モジュール診断ベースラインを用いて示した。

    Link: https://arxiv.org/abs/2505.17862

  • 確率的障壁の打破:変分不等式のための適応的分散削減法 [math.OC, cs.LG]目的:確率的変分不等式に対する効率的な解法
    • 機械学習の発展に伴い,確率的最適化問題の重要性が増している。
    • 確率的勾配推定のノイズにより,従来の適応的ステップサイズ法が不安定になる。
    • 確率的勾配のノイズの影響を軽減し,安定した収束を可能にする手法を開発する。
    • VR-SDA-Aアルゴリズムは,リカレントモーメンタムとSame-Batch Curvature Verificationを組み合わせる。
    • 演算子ノルムを追跡するLyapunovポテンシャルに基づき,VR-SDA-AはO(epsilon -3)のオラクル複雑度を達成する。
    • 回転ベンチマークやロバスト回帰タスクにおいて,VR-SDA-Aは振動を抑制し,収束を加速することが示された。

    Link: https://arxiv.org/abs/2601.23034

  • ConFu:より良い推測サンプリングのために未来を熟考する [cs.CL, cs.LG]目的:大規模言語モデルの推論加速のための推測デコーディング手法
    • 大規模言語モデルの活用拡大には,推論速度の向上が不可欠である。
    • 既存の推測デコーディングは,ドラフトモデルの誤差蓄積が課題となっていた。
    • 未来の生成方向を予測するドラフトモデルによる誤差蓄積の抑制を目指す。
    • ConFuは,未来志向のシグナルを活用する「熟考トークン」と「ソフトプロンプト」を導入した。
    • MoEを用いた動的な熟考トークン機構により,文脈に応じた未来予測を可能にした。
    • Llama-3 3B/8Bモデルを用いた実験で,EAGLE-3と比較してトークン受理率と生成速度が8-11%向上した。

    Link: https://arxiv.org/abs/2603.08899

  • 推論と確信度の分離:検証可能な報酬を用いた強化学習におけるキャリブレーションの再構築 [cs.LG, cs.AI, cs.CL]目的:推論と確信度の分離
    • 大規模言語モデルの推論能力向上は重要だが,過信の問題が課題となっている。
    • 検証可能な報酬を用いた強化学習では,キャリブレーションの劣化が深刻である。
    • 推論とキャリブレーションの最適化における勾配の対立を解決し,信頼性の高いLLM展開を目指す。
    • 提案手法DCPOは,既存手法GRPOと同等の精度を維持しつつ,キャリブレーション性能を大幅に向上させた。
    • DCPOは,過信の問題を効果的に軽減し,より信頼性の高いLLMの運用を可能にする。
    • 本研究は,LLMのキャリブレーションに関する貴重な知見と実用的な解決策を提供する。

    Link: https://arxiv.org/abs/2603.09117

  • 物理学共同研究における知識検索のためのAIアシスタントMITRA [cs.IR, cs.AI, cs.CL, cs.LG, hep-ex]目的:物理学共同研究における知識検索の効率化
    • 大規模科学共同研究では,膨大な内部資料が存在し,研究者の知識共有を阻害する要因となっている。
    • 複雑な情報環境下での効率的な知識検索が困難であり,研究の進捗を遅らせる可能性がある。
    • 物理学分析に関する特定の質問に対し,文脈を考慮した回答を迅速に提供することを目指す。
    • MITRAは,Seleniumを用いた自動的なドキュメント検索と,OCRによる高精度なテキスト抽出パイプラインを備えている。
    • ベクトルの二階層データベース構造を採用し,まず概要から関連分析を特定し,その後詳細なドキュメントに焦点を当てることで曖昧さを解消している。
    • キーワードベースの従来手法と比較して,現実的なクエリに対する検索性能が優れていることが示された。

    Link: https://arxiv.org/abs/2603.09800

  • 多段階残差学習による量子モデルの周波数学習バイアス軽減 [quant-ph, cs.LG]目的:量子モデルにおける周波数学習バイアスの軽減
    • 量子機械学習は,古典計算の限界を超える可能性を秘めている。
    • 量子モデルは,複数の周波数成分を持つ関数学習が苦手である。
    • 多段階残差学習により,量子モデルの周波数表現能力を向上させる。
    • 提案手法は,周波数成分が多様な合成ベンチマークにおいて有効性を示した。
    • 量子ビット数,エンコーディング方式,残差学習が,多重周波数の学習に重要であることがわかった。
    • 残差学習のみで,単一の段階学習よりもテストMSEが大幅に改善された。

    Link: https://arxiv.org/abs/2603.10083

  • 正則化による安定性と頑健性:正則化確率ミラー降下によるバンディット推論 [eess.AS, cs.CL, stat.ML, cs.LG]目的:バンディットデータの統計的推論における安定性と頑健性の理論
    • バンディット学習は,探索と利用のバランスが重要であり,オンライン機械学習の基礎をなす。
    • 適応的サンプリングにより,古典的な漸近理論の独立性の仮定が満たされず,信頼性の高い推論が困難である。
    • 確率ミラー降下法に基づく安定性の理論を構築し,効率的な推論と学習を両立させる。
    • 確率ミラー降下法の平均反復が非ランダムな確率ベクトルに収束する場合,誘導されるバンディットアルゴリズムが安定化することが示された。
    • ログバリア正則化を用いた正則化EXP3アルゴリムは安定性基準を満たし,平均パラメータの線形汎関数のWald型信頼区間が公称被覆率を達成する。
    • 正則化EXP3アルゴリムは,対数項までの範囲でミニマックス最適後悔保証を達成し,推論と学習効率の両立が可能である。

    Link: https://arxiv.org/abs/2603.10184

  • ARCHE:ハイパープライヤーと励起を用いた自己回帰残差圧縮 [eess.IV, cs.CV, cs.LG]目的:画像圧縮におけるレート歪効率と計算効率のバランス
    • 画像圧縮は,データ伝送や保存において重要な役割を担う技術であり,高効率化が求められている。
    • 既存の学習ベースの手法は,高い圧縮率を達成する一方で,計算コストが増大し,並列処理が困難な場合がある。
    • 効率的な畳み込み設計により,実用的な展開に適した正確なエントロピーモデルの実現を目指す。
    • 提案手法ARCHEは,ハイパープライヤーと励起を用いて,レート歪効率と計算効率を両立する画像圧縮フレームワークである。
    • Kodakベンチマークデータセットにおいて,既存手法と比較して,BDレートを最大48%削減することに成功した。
    • 低ビットレート環境下において,より鮮明なテクスチャと優れた色再現性を示すことが確認された。

    Link: https://arxiv.org/abs/2603.10188

  • 株式超過成長率の動的モデリングにおけるハイブリッド隠れマルコフモデル:離散状態とジャンプ拡散によるアプローチ [q-fin.ST, cs.LG, q-fin.RM]目的:株式超過成長率の動的モデリング
    • 金融市場の安定性評価やリスク管理において,現実的な金融時系列データの生成は不可欠である。
    • 既存手法では,歪んだ分布,自己相関の少なさ,ボラティリティのクラスター化を同時に再現することが困難である。
    • 現実的なテール状態の持続時間を考慮し,分布,時間構造,テールカバレッジを同時に向上させる。
    • 提案手法は,金融時系列データの分布適合度および時間構造の再現において高い性能を示した。
    • 特に,サンプル内およびサンプル外データにおいて,Kolmogorov-Smirnov検定とAnderson-Darling検定の合格率がそれぞれ97%と91%を超えた。
    • また,Single-Index Modelを拡張することで,424銘柄の相関構造を維持したスケーラブルな合成パス生成が可能となった。

    Link: https://arxiv.org/abs/2603.10202

  • 柔軟なカットオフ学習:学習後の機械学習原子間ポテンシャルの最適化 [cond-mat.mtrl-sci, cs.LG]目的:機械学習原子間ポテンシャル(MLIP)のカットオフ半径調整
    • 物質科学において,原子レベルでのシミュレーションは不可欠であり,MLIPはその計算コストを削減する。
    • 従来のMLIPはカットオフ半径が固定されており,適用範囲や精度に限界がある。
    • 学習後にカットオフ半径を最適化することで,精度と計算コストのトレードオフを改善する。
    • 柔軟なカットオフ学習(FCL)により,原子ごとに異なるカットオフ半径を適用可能となった。
    • 分子結晶のデータセットにおいて,計算コストを60%以上削減しつつ,力の誤差を1%未満に抑えた。
    • FCLは汎用的なMLIPを学習し,学習し直すことなく様々な応用分野に適応させることができる。

    Link: https://arxiv.org/abs/2603.10205

  • SDSR:種樹再構築のためのスペクトル分割統治アプローチ [q-bio.PE, cs.LG, stat.ML]目的:種樹再構築
    • 系統樹作成は生物の進化関係を解明する上で不可欠であり,生物多様性の理解に貢献する。
    • 遺伝子間の系統の不一致や,大規模データセットに対する計算負荷が課題となっている。
    • スペクトルグラフ理論に基づく分割統治法で,計算効率と精度を両立することを目指す。
    • SDSRは,種を再帰的に分割することで計算量を削減し,大規模なデータセットでも高速な種樹再構築を可能にする。
    • 理論的な解析により,MSCモデル下での復元保証が示され,その有効性が裏付けられている。
    • シミュレーション実験では,既存手法と組み合わせることで,最大10倍の高速化が確認された。

    Link: https://arxiv.org/abs/2603.10215

  • 確率的バンディットにおける方策勾配の拡散解析 [stat.ML, cs.AI, cs.LG, math.ST, stat.TH]目的:確率的バンディットにおける方策勾配の拡散近似
    • 強化学習の基礎であり,最適な行動選択を効率的に学習する必要があるため。
    • バンディット問題は探索と活用のバランスが難しく,最適な学習率の決定が課題である。
    • 最適な学習率を設定することで,後悔値を最小化し,効率的な学習を実現すること。
    • 拡散近似を用いることで,学習率を$\eta = O(\Delta^2/\log(n))$と設定した場合の後悔値が$O(k \log(k) \log(n) / \eta)$となることが示された。
    • 特に,アーム数が対数的に少ないインスタンスにおいて,$\eta = O(\Delta^2)$でないと後悔値が線形になることが示された。

    Link: https://arxiv.org/abs/2603.10219

  • 信頼領域内点確率的逐次二次計画法 [physics.soc-ph, cond-mat.stat-mech, cs.SI, nlin.AO, math.OC, cs.LG, cs.NA, math.NA, stat.ML]目的:確率的目的関数と決定論的非線形制約を持つ最適化問題の解法
    • 最適化は,工学,経済,機械学習など広範な分野で不可欠なツールである。
    • 現実の問題では,目的関数の正確な評価が困難な場合が多く,確率的近似に頼る必要がある。
    • 確率的近似を用いた効率的かつ信頼性の高い最適化手法の開発が求められている。
    • 提案手法は,確率的オラクルを用いて目的関数と勾配を推定し,適切な精度を保証する。
    • 内点法を採用し,バリアパラメータを適切に減衰させることで,制約条件を効率的に扱う。
    • 標準的な仮定の下で,提案手法は一次の定常点への大域的ほぼ確実な収束が証明された。

    Link: https://arxiv.org/abs/2603.10230

  • 変分量子RFセンシングを用いた無線電波からの学習 [quant-ph, cs.AI, cs.IT, eess.SP, math.IT]目的:量子回路で最適化された量子センシングプローブを用いた環境学習
    • 無線通信は情報伝達に加え,環境構造の知識源となり得る。
    • 従来の環境学習は,チャネル測定や多くの情報が必要とされる。
    • 量子センシングによる電波からの学習で,効率的な環境理解を目指す。
    • 量子センサーを用いた学習は,展開時にチャネル測定を必要としない。
    • 微弱・遮蔽されたRF信号に対しても感度を維持し,古典的な手法を超える学習が可能となる。
    • シミュレーションによる実験で,現実的な条件下での局所化タスクでの有効性が示された。

    Link: https://arxiv.org/abs/2603.10239

  • ベイズ階層モデルと最大エントロピー原理 [stat.ML, cs.LG, physics.data-an, stat.ME]目的:ベイズ階層モデルにおける事前分布の制約
    • 実用的なデータ解析において,ベイズ階層モデルが広く利用されている。
    • 階層モデルにおける事前分布の構造が,解析結果に影響を及ぼす可能性がある。
    • 最大エントロピー原理を用いて,階層モデルにおける事前分布の情報を明確化すること。
    • 事前分布がカノニカル分布(最大エントロピー分布)である場合,周辺事前分布もまた最大エントロピー性を持つことが示された。
    • 周辺事前分布の制約は,未知量の関数の周辺分布に存在する。
    • 階層モデルを適用する際に,どのような情報が仮定されているのかを理解するための手がかりとなる。

    Link: https://arxiv.org/abs/2603.10252

  • MultiwayPAM:LLM-as-a-Judgeスコア分析のための多方向Medoid分割 [math.OC, cs.SY, eess.SY, stat.ML, cs.LG]目的:LLM-as-a-Judgeスコアテンソルのクラスタリングによる,LLM評価者のバイアス構造の解明
    • テキスト評価において,多様な視点からのスコア取得を可能にするLLM-as-a-Judgeの重要性が高まっている。
    • LLM推論の計算コストや,LLM評価者の内在的なバイアスが課題となっていた。
    • LLM評価者によるスコアバイアスの構造を明らかにし,効率的な評価手法を確立することを目指す。
    • 提案手法MultiwayPAMは,質問,回答者,評価者の各モードにおけるクラスタメンバーシップとMedoidを同時に推定可能である。
    • 実験結果から,MultiwayPAMが実用的なデータセットに対して有効であることが示された。
    • 得られたMedoidを観察することで,各質問/回答者/評価者クラスタの特性を理解することができる。

    Link: https://arxiv.org/abs/2603.10287

  • 量子エンタングルメントが敵対的ゲームにおいて競争上の優位性をもたらす [quant-ph, cs.AI, cs.LG]目的:敵対的ゲームにおける量子エンタングルメントの利点
    • ゲーム理論と機械学習の融合は,人工知能の発展に不可欠である。
    • 強化学習では,相手の行動を予測し,それに対応することが困難である。
    • 量子エンタングルメントが,強化学習における表現学習能力を向上させる可能性を探る。
    • 量子エンタングルメントを含む回路は,分離可能な回路と比較して一貫して高い性能を示した。
    • 低容量の環境下では,量子回路は古典的な多層パーセプトロンと同等かそれ以上の性能を発揮した。
    • 量子エンタングルメントは,競争的な強化学習における表現学習のための機能リソースであると示唆された。

    Link: https://arxiv.org/abs/2603.10289

  • 非定常線形バンディットにおける最良腕識別問題の複雑性について [stat.ML, cs.LG]目的:非定常線形バンディット環境下での固定予算最良腕識別
    • バンディット問題は,探索と活用のトレードオフを扱うため,意思決定や最適化の基礎として重要である。
    • 従来の複雑性指標は,腕集合の構造を考慮しておらず,過度に悲観的な評価となる場合がある。
    • 本研究では,腕集合に依存するより精密な下界を確立し,その下界に一致するアルゴリズムを提案する。
    • 非定常線形バンディット問題において,腕集合に依存する下界を新たに導出した。
    • 提案するAdjacent-BAIアルゴリズムは,導出した下界と定数倍で一致する性能を示すことが証明された。
    • 本研究は,この設定における腕集合依存の複雑性を明らかにした。

    Link: https://arxiv.org/abs/2603.10346

  • 強化学習による回帰のための適応型アクティブラーニング [eess.SP, cs.NI, stat.ML, cs.LG]目的:回帰における情報量の多いサンプル選択
    • データラベリングコスト削減が重要であり,アクティブラーニングはその有効な手法である。
    • 既存手法は,特徴空間の多様性と出力空間の不確実性を静的なルールでバランスさせている。
    • データ密度が不均一な場合,既存手法では高エラーサンプルが無視される問題を解決する。
    • 提案手法WiGSは,iGSを含む既存手法を18のベンチマークデータセットと合成環境で上回る性能を示した。
    • WiGSは,精度とラベリング効率の両面で優れており,特に不規則なデータ密度分布においてその効果が顕著である。
    • 強化学習により,探索と調査のバランスを動的に適応させることが可能となった。

    Link: https://arxiv.org/abs/2603.10435

  • ブレニエ等方回帰 [stat.ML, cs.LG]目的:巡回単調な多出力回帰問題の解決
    • 単変量データへの非減少制約を課す等方回帰は,単一指数モデルや確率較正などに応用可能。
    • 多出力回帰において,古典的な等方回帰の単調性は拡張が容易ではないという課題がある。
    • Kantorovich の最適輸送を利用し,巡回単調性を効率的に制約する手法を提案する。
    • 提案手法は,回帰関数と凸ポテンシャルを一般化線形モデルにおけるリンク関数およびブレニエポテンシャルとして解釈する。
    • 確率較正の実験において,提案手法は多くの既存手法よりも頑健に高い性能を示した。
    • 本研究は,巡回単調制約を伴う多出力回帰問題への新たなアプローチを提供する。

    Link: https://arxiv.org/abs/2603.10452

  • 高強度荷電粒子ビームにおけるビーム-プラズマ集団振動:誘電応答理論,ラングミュール波分散,およびPrometheusによる教師なし検出 [physics.plasm-ph, cond-mat.stat-mech, cs.LG, physics.acc-ph]目的:高エネルギー(10-100 MeV)におけるビーム-プラズマ集団振動の理論的・計算的枠組み
    • 高強度ビームのプラズマ中での挙動は,加速器物理や核物理研究において重要である。
    • ビーム中の集団振動は,ビームの品質低下や不安定化を引き起こす可能性がある。
    • ビーム-プラズマ集団振動の特性を明らかにし,その制御方法を確立すること。
    • Lindhard誘電関数とRPA分極テンソルを導出し,臨界密度以上のビームにおいて減衰しないラングミュール波モードの存在を証明した。
    • プラズマ周波数Ω_p^2はf-sum ruleによって分布形状に依存せず決定され,より高次の分散係数は速度モーメントに依存することが示された。
    • Prometheusを用いてPICシミュレーションデータから集団振動の開始を検出し,理論予測の検証に成功した。

    Link: https://arxiv.org/abs/2603.10457

  • G-STAR:エンドツーエンドのグローバル話者追跡属性認識 [eess.AS, cs.AI, cs.HC, cs.MM, cs.SD]目的:長時間の多者会話におけるタイムスタンプ付き話者属性自動音声認識
    • 会議などの長尺音声データ活用には,話者と発話時間を正確に把握することが不可欠である。
    • 従来のシステムでは,局所的な話者分離とグローバルな話者ラベル付けのバランスが課題であった。
    • 時間的な境界を捉えつつ,話者の一貫性を保つ高精度な話者追跡システムの構築を試みる。
    • G-STARは,時間情報を考慮した話者追跡モジュールとSpeech-LLMを組み合わせたシステムである。
    • 話者追跡モジュールが構造化された話者情報をLLMに提供し,条件付きで属性付きテキストを生成する。
    • コンポーネントごとの最適化とエンドツーエンドの共同学習が可能であり,柔軟な学習を実現する。

    Link: https://arxiv.org/abs/2603.10468

  • 過剰パラメータ化された状況における勾配降下法の二重空間事前条件付け [stat.ML, cs.LG]目的:過剰パラメータ化された線形モデルにおける勾配降下法の収束特性
    • 深層学習等の分野において,モデルのパラメータ数は増加傾向にあり,最適化の効率性が重要課題となっている。
    • 勾配降下法は計算コストが高い場合があり,また,過剰パラメータ化されたモデルでは局所解に陥る可能性がある。
    • 二重空間事前条件付けにより,勾配降下法の収束を加速し,安定性を向上させることを目指す。
    • 二重空間事前条件付けされた勾配降下法は,常に解 ${W}_{\infty}$ に収束し,${X}{W}_{\infty} = {Y}$ を満たす。
    • 等方的な事前条件付けの場合,${W}_{\infty}$ は初期値 ${W}_0$ とのフロベニウスノルムの二乗距離を最小化する解となる。
    • 一般的な事前条件付けにおいても,収束点 ${W}_{\infty}$ は,通常の勾配降下法の収束点 ${W}_{\text{GD}, \infty}$ に比例することが示された。

    Link: https://arxiv.org/abs/2603.10485

  • JEDI:ニューラルダイナミクスの同時埋め込み推論 [q-bio.NC, cs.AI, cs.LG]目的:ニューラルダイナミクスにおけるタスク間共有埋め込み空間の学習
    • 脳の柔軟性と効率性は行動遂行において重要であり,そのメカニズム解明が神経科学の目標。
    • 実験データは脳の状態とダイナミクスへのアクセスが限定的で,タスク特有のルールを特定するのが困難。
    • 複数のタスクと文脈におけるニューラルダイナミクスを捉え,汎化性能の高いモデルを構築すること。
    • JEDIは,シミュレーションデータセットにおいて,ロバストで汎化可能な条件特異的埋め込みを正確に学習した。
    • JEDIは,学習された重みを解析することで,真の固定点構造を復元し,基盤となるニューラルダイナミクスの特徴を明らかにした。
    • JEDIをサル運動皮質記録に適用した結果,運動制御のニューラルダイナミクスに関するメカニズム的知見が得られた。

    Link: https://arxiv.org/abs/2603.10489

  • 単調作用素平衡ネットワークの量子化ロバスト性 [eess.SP, cs.SY, eess.SY, math.OC, cs.LG, cs.SY, eess.SY]目的:単調作用素平衡ネットワークにおける量子化の影響
    • 深層学習の低精度化は,計算コスト削減や省電力化に不可欠である。
    • 量子化により,モデルの収束性や精度が損なわれる可能性がある。
    • 量子化しても保証される収束条件と,精度低下の限界を明らかにすること。
    • 量子化は単調包含のスペクトル摂動として捉えられ,摂動の大きさと単調性マージンによって収束性が保証される。
    • 量子化された解とフル精度解のずれは,摂動の大きさおよびマージンによって制約される。
    • MNIST実験では,予測される閾値で相転移が確認され,4ビット以下の量子化では発散,5ビット以上で収束した。

    Link: https://arxiv.org/abs/2603.10562

  • Geo-ATBench:地理的意味的文脈を用いたジオ空間オーディオタグ付けのベンチマーク [math.CO, cs.DM, eess.AS, cs.LG, cs.SD]目的:ジオ空間オーディオタグ付けにおけるベンチマークデータセットおよび融合フレームワークの開発
    • 環境音認識は,都市の音響環境分析など様々な応用において重要である。
    • 従来のオーディオのみの環境音認識では,音響的な類似性によりイベントの分離が困難となる場合がある。
    • 地理情報に基づいた意味的文脈を導入することで,音響的な曖昧さを解消し,認識精度を向上させることを目指す。
    • 地理的意味的文脈(GSC)を組み込むことで,特に音響的に混同しやすいラベルにおいてオーディオタグ付けの性能が向上した。
    • Geo-ATBenchは,人間のラベル付けとの一致性を示す結果が得られ,人間と整合性の高いベンチマークデータセットであることが確認された。
    • 提案するGeoFusion-ATフレームワークは,様々な特徴量,表現,決定レベルの融合手法を評価するための基盤を提供する。

    Link: https://arxiv.org/abs/2603.10623

  • 金融サービスにおけるLLMに対する自動レッドチーム化のためのリスク調整ハームスコアリング [q-fin.CP, cs.AI, cs.CY]目的:金融サービスにおけるLLMのセキュリティ侵害評価フレームワーク
    • 金融サービスへのLLM導入は加速しており,セキュリティリスクへの対応が急務である。
    • 既存のレッドチームベンチマークは,金融業界特有の危険性を捉えきれていない。
    • 金融業界特有のハームを定量化し,リスクに基づいた評価を行うことを目指す。
    • 提示されたリスク調整ハームスコア(RAHS)は,単なる成功率を超えて,金融情報の開示の重大性を定量化する。
    • デコードの確率的要素の高さと継続的な対話が,セキュリティ侵害の成功率を高め,より深刻な情報開示を引き起こすことが示された。
    • 単一ターン評価の限界が露呈し,現実の金融サービスへの展開にはリスクに配慮した長期的な評価が不可欠であることが示唆された。

    Link: https://arxiv.org/abs/2603.10807

  • 強化学習による現実的な表形式データ合成:ReTabSyn [math.OC, cs.SY, eess.SY, stat.ML, cs.LG]目的:表形式データの現実的な合成
    • データ不足やプライバシー保護の観点から,合成データ生成の重要性が高まっている。
    • 少ないデータや不均衡データの場合,複雑なデータ分布の学習が困難である。
    • 限られたデータでも予測精度の高い合成データを生成することで,下流モデルの性能向上を目指す。
    • ReTabSynは,特徴量相関の維持に重点を置いた強化学習パイプラインである。
    • 小規模サンプル,クラス不均衡,分布シフトのベンチマークにおいて,最先端のベースラインを上回る性能を示した。
    • 生成される表形式データの様々な側面を制御するための拡張性も有している。

    Link: https://arxiv.org/abs/2603.10823

  • Wi-Fi範囲フィルタドップラースペクトルによる人間存在検知 [eess.SP, cs.AI, cs.CV]目的:人間存在検知の実現
    • 日常生活における機器のインテリジェントな電力管理やセキュリティ機能の実現に不可欠である。
    • 既存手法は,追加のセンサーやカメラを用いるため,コストやプライバシーの問題がある。
    • 内蔵Wi-Fiのみで,低コストかつプライバシーに配慮した人間存在検知を可能にすること。
    • 提案手法は,Wi-Fi信号の範囲フィルタドップラースペクトル(RF-DS)を利用し,追加の機器やセンサーを必要としない。
    • チャネルインパルス応答(CIR)ドメインでの範囲フィルタリングにより,計算量を削減し,安定性を向上させている。
    • 動的なCSIサンプリングレート調整により,電力効率と検知精度の両立を実現している。

    Link: https://arxiv.org/abs/2603.10845

  • 分布間の同値性のカーネル検定 [stat.ML, cs.LG, stat.ME]目的:分布間の同値性評価のためのカーネルに基づく検定
    • 分布間の差異を評価することは,統計的モデリングや機械学習において重要な課題である。
    • 従来の適合度検定では分布間の差がないと結論づけることが難しく,検出力の低さが問題となる。
    • 分布全体の差を考慮した,より強力な同値性検定手法を確立することを目的とする。
    • 提案手法は,カーネル・スタイン差異と最大平均差異という2つの統計的差異尺度を用いる。
    • 帰無仮説は,候補分布が名義分布と少なくとも定義されたマージンだけ異なるというものである。
    • 漸近正規近似とブートストラップに基づく2つの臨界値計算アプローチを提案する。

    Link: https://arxiv.org/abs/2603.10886

  • ForwardFlow: 深層学習を用いたシミュレーションのみによる統計的推論 [math.ST, cs.LG, cs.NE, stat.CO, stat.TH]目的:パラメータ推定のための深層学習モデルの構造
    • 統計的モデリングは,科学的発見や意思決定において不可欠な役割を担う。
    • 従来の統計的推論は,モデルの複雑化に伴い計算コストが高くなる課題がある。
    • シミュレーションのみによるアプローチで,複雑なモデルのパラメータ推定を効率化する。
    • 提案手法は,有限サンプルでの正確性,データ汚染へのロバスト性,アルゴリズム近似を実現した。
    • シミュレーションを通じて,遺伝データに対するEMアルゴリズムが自動的に近似されることを示した。
    • 複雑なモデリングにおいて,データシミュレーションを研究者に,パラメータ推定をニューラルネットワークに委ねる利点がある。

    Link: https://arxiv.org/abs/2603.10991

  • ガウス過程を用いたベイズ最適化による定常点探索の高速化 [stat.ML, cs.LG, physics.chem-ph, physics.comp-ph]目的:定常点探索の高速化
    • 分子動力学や材料設計など,ポテンシャルエネルギー面上の定常点探索は重要な課題である。
    • 高次元問題における計算コストが課題であり,効率的な探索手法が求められている。
    • ガウス過程を用いたベイズ最適化により,定常点探索の精度と効率を向上させる。
    • ベイズ最適化の枠組みを統一的に記述し,最小化,単一点サドル点探索,両端サドル点探索を同じループで扱えることを示した。
    • ガウス過程回帰,派生距離カーネル,能動学習,最適輸送GP拡張などの手法を組み合わせることで,精度と効率を改善した。
    • ランダムフーリエ特徴を用いることで,ハイパーパラメータの学習と予測を分離し,高次元システムへの適用を可能にした。

    Link: https://arxiv.org/abs/2603.10992

  • 深層アクティブ学習におけるラプラス近似を用いた効率的なベイズ更新 [cs.LG]目的:深層アクティブ学習における効率的なベイズ更新手法
    • 深層学習モデルの性能向上には大量のラベル付きデータが必要であり,効率的なデータ選択が重要である。
    • 既存のアクティブ学習戦略は,モデルの再学習コストが高い,または選択されたデータに冗長性があるという課題がある。
    • ラプラス近似によるベイズ更新を用いて,再学習コストを削減し,データ選択の効率化を目指す。
    • 提案手法は,ラプラス近似に基づいた2次最適化ステップによって,効率的なベイズ更新を実現している。
    • 典型的なアクティブ学習設定において,本手法は再学習を近似しつつ,大幅な高速化を達成している。
    • 本手法を組み込んだ新たなバッチ選択フレームワークが,最適なバッチ選択への可能性を示唆している。

    Link: https://arxiv.org/abs/2210.06112

  • テキスト処理と情報検索手法の説明可能性:サーベイ [eess.SY, cs.SY, math.ST, stat.TH, cs.IR, cs.AI, cs.CL]目的:テキスト処理と情報検索における説明可能性の研究動向
    • 自然言語処理の発展は,情報へのアクセスを容易にしたが,その複雑さゆえに理解が困難である。
    • 深層学習モデルはブラックボックス化しやすく,その判断根拠が不透明であるという課題がある。
    • モデルの判断根拠を明らかにし,信頼性と透明性を高めることが求められている。
    • 本サーベイでは,単語埋め込み,シーケンスモデリング,アテンション機構,Transformer,BERT,ドキュメントランキングなど,様々な手法における説明可能性の研究を概観した。
    • 既存研究を整理することで,各手法における説明可能性向上のアプローチと課題を明らかにした。
    • 今後の研究の方向性として,説明可能性評価指標の確立や,実用的な応用への展開などが挙げられる。

    Link: https://arxiv.org/abs/2212.07126

  • アンサンブル組み合わせによる公平性の向上:マージン依存型境界 [cs.LG, cs.AI, cs.CY]目的:機械学習モデルにおける公平性向上の手法
    • 機械学習の社会実装が進む中,潜在的な差別問題への関心が高まっている。
    • 既存の公平性指標はグループまたは個人の公平性に偏りがちで,両立が困難な場合がある。
    • 理論的な保証に基づき,アンサンブル組み合わせによる公平性向上の可能性を示す。
    • 提案手法「識別リスク」は,保護属性のみを摂動させることで個人とグループの公平性を同時に評価する。
    • アンサンブル組み合わせにおけるマージン依存型境界を確立し,公平性の向上が理論的に示された。
    • 実験により,提案手法とアンサンブル剪定法の有効性が確認された。

    Link: https://arxiv.org/abs/2301.10813

  • マクロ配置のための強化学習の再評価 [cs.LG, cs.AI]目的:マクロ配置における強化学習アプローチの評価
    • 半導体設計の微細化が進むにつれ,最適なマクロ配置が性能と効率に不可欠である。
    • 既存のマクロ配置手法は,複雑な設計ルールや制約条件への対応に課題がある。
    • 強化学習を用いたマクロ配置の有効性を検証し,改善点を明らかにする。
    • Google Brainの強化学習アプローチとCircuit Trainingの性能を評価した結果,シミュレーテッドアニーリングとの比較で優位性が見られた。
    • 7nm TSMC Ariane protobufおよびASAP7 7nmを用いた新しいベンチマークを公開し,再現性を高めた。
    • Circuit Trainingの拡張性や事前学習手法に関するさらなる検証の必要性を示唆した。

    Link: https://arxiv.org/abs/2302.11014

  • 証明可能な最適低ランク行列補完のための分離分枝限定法 [cs.LG, math.OC, stat.ML]目的:低ランク行列補完における最適性の証明
    • 機械学習やデータ分析において,不完全なデータからの情報復元が重要である。
    • 既存の行列補完手法は近似解に留まり,最適性の保証がないという課題がある。
    • 最適性の証明可能な解法を提供し,より信頼性の高い行列補完を実現すること。
    • 提案手法は,行列をランク1行列の和として分解することで,既存手法より2桁程度最適性ギャップを縮小。
    • 分離分枝限定法により,最大辺長2500,ランク5以下の行列補完問題を数時間で最適またはほぼ最適解に帰着。
    • 学習誤差の低減が,テストセット誤差の平均2%~50%の減少に繋がった。

    Link: https://arxiv.org/abs/2305.12292

  • 自然言語に基づく心の社会 [cs.AI, cs.CL, cs.CV, cs.LG, cs.MA]目的:大規模マルチモーダルニューラルネットワークによる問題解決
    • AI分野において,複雑な問題解決には,単一モデルの限界を超えた新たなアプローチが求められている。
    • 大規模言語モデル(LLM)は強力だが,マルチモーダルな推論や高度なタスク処理に課題がある。
    • 自然言語を介したエージェント間の対話を通して,LLMの能力を拡張し,より高度なAIタスクを実現する。
    • 自然言語を基盤とする心の社会(NLSOM)は,モジュール性により容易に拡張可能であり,多様なAIタスクに適用できる。
    • 視覚的質問応答,画像キャプション生成,テキストから画像合成など,様々なタスクにおいて実用的な性能が確認された。
    • 今後の研究課題として,NLSOMの社会構造,報酬最大化のための経済原理の応用などが挙げられる。

    Link: https://arxiv.org/abs/2305.17066

  • 旅行行動予測のための大規模言語モデル [cs.LG, cs.AI, cs.CL]目的:旅行行動予測
    • 交通需要管理において不可欠であり,都市計画や交通政策に重要な影響を与える。
    • 従来の数値モデルはデータ依存度が高く,新しい状況への適応が困難である。
    • LLMを活用し,データ効率が高く柔軟な予測手法を確立すること。
    • ゼロショットプロンプティングとLLMによる埋め込み表現の活用という2つの枠組みで検証した。
    • 両アプローチとも,多項ロジットモデル等の既存モデルと同等以上の性能を示した。
    • LLMが,従来のモデルに代わる,柔軟かつデータ効率の良い代替手段となる可能性を示唆する。

    Link: https://arxiv.org/abs/2312.00819

  • 分散型 Mixture-of-Experts モデルの最適輸送集約 [cs.LG, cs.AI, cs.DC, stat.ML]目的:分散型 Mixture-of-Experts モデルの集約手法
    • データ量増加に伴い,モデルの複雑化と分散処理の重要性が高まっている。
    • 分散環境下では,単純な平均化ではMoE構造が失われ,性能が低下する。
    • 最適輸送に基づき,MoE構造を維持した効率的な集約手法を提案する。
    • 提案手法は,最適輸送を用いて分散MoEモデルを集約し,グローバルな推定器を構築する。
    • 単一の通信ステップで集約が可能であり,大規模データセットに適した効率的な分散学習を実現する。
    • 合成データと実データでの実験により,集中型学習と同等の性能が確認された。

    Link: https://arxiv.org/abs/2312.09877