arXiv雑要約

AI - 2026/03/18 公開

  • 文脈と時間的特徴の緩和的効率的獲得 [cs.LG]目的:文脈と時間的特徴の獲得における効率性と予測性能の最適化
    • 医療分野では,検査コストや患者負担を考慮した効率的なデータ取得が重要である。
    • 既存手法では,初期の文脈情報選択と時間的適応的な特徴獲得が同時に最適化されていない。
    • 初期文脈と時間的特徴獲得を統合的に最適化し,コストを抑えつつ予測精度を向上させる。
    • 提案手法REACTは,既存手法と比較して,低い取得コストでより高い予測性能を達成した。
    • REACTは,初期文脈の選択と時間的特徴獲得を同時に最適化する,エンドツーエンドの微分可能なフレームワークである。
    • Gumbel-Sigmoid緩和とStraight-Through Estimationを用いることで,離散的な獲得マスクに対する勾配ベースの最適化を実現している。

    Link: https://arxiv.org/abs/2603.11370

  • ソフトマックスTransformerにおいてアテンションシンクが必然的に必要である:トリガー条件付きタスクからの証拠 [cs.DB, cs.LG]目的:ソフトマックスTransformerにおけるアテンションシンクの必要性
    • Transformerは自然言語処理の基盤であり,その性能向上は重要である。
    • Transformerにはアテンションシンクという問題が存在し,モデルの挙動を不安定にする可能性がある。
    • 本研究は,アテンションシンクが必然的に生じる状況を理論的に明らかにし,その解決策を提示する。
    • 特定のトリガー条件付きタスクにおいて,ソフトマックス自己注意モデルにアテンションシンクが必然的に誘発されることを証明した。
    • 確率シンプレックス上での正規化が,デフォルト状態を実現するために注意を安定したアンカーに集中させることを形式的に示した。
    • ReLU注意機構は,正規化制約がないため,シンクを生じさせずに同じタスクを解決できることを証明し,実験で検証した。

    Link: https://arxiv.org/abs/2603.11487

  • 大規模なオープンソースエージェントリポジトリのマイニングによるスキル獲得の自動化:マルチエージェント手続き的知識抽出のためのフレームワーク [cs.AI]目的:オープンソースエージェントリポジトリからの手続き的知識抽出
    • AIの応用展開において,汎用的なLLMから,より専門的なスキルを持つエージェントへの移行が重要になっている。
    • LLMは宣言的な知識は豊富だが,自律的なワークフローに必要な専門的な手続き的知識が不足している場合が多い。
    • オープンソースリポジトリのマイニングにより,LLMの能力を向上させるための手続き的知識を効率的に獲得することを目指す。
    • エージェントリポジトリからの体系的な知識抽出により,LLMの再学習を伴わずに手続き的知識を獲得できることが示された。
    • エージェントが生成した教育コンテンツは,人間の作成したチュートリアルと同等の教育的品質を維持しつつ,知識伝達効率を40%向上させることがわかった。
    • リポジトリ構造解析,意味的スキル識別,SKILL.md形式への翻訳を含むフレームワークが有効であることが示された。

    Link: https://arxiv.org/abs/2603.11808

  • 交互勾配流ユーティリティ:深層ネットワークにおける構造的プルーニングと動的ルーティングのための統一的指標 [cs.CE, cs.CV, cs.LG, cs.NE]目的:深層ネットワークにおける構造的プルーニングと動的ルーティングを最適化するための統一的指標の提案
    • 深層学習の効率化は重要であり,計算コストとモデルサイズの削減が求められている。
    • 従来のプルーニング指標は,機能的な経路を維持できず,精度低下を引き起こす可能性がある。
    • 本研究は,ネットワークの構造的「運動エネルギー的有用性」を正確に捉え,プルーニングとルーティングを改善することを目指す。
    • 本研究で提案するAGFは,極端な疎性下でもベースライン機能を維持し,構造的崩壊を防ぐことが示された。
    • ViTにおけるスパースネスボトルネックが明らかになり,動的信号の圧縮が原因であることが示唆された。
    • AGFと物理的プリアーを用いたハイブリッドルーティングフレームワークは,ImageNet-100において,50%の計算コスト削減と精度の維持を達成した。

    Link: https://arxiv.org/abs/2603.12354

  • 文脈支援型予測におけるモダリティギャップの克服 [cs.LG]目的:文脈支援型予測の性能向上
    • AIシステムの高度化に不可欠であり,従来の統計的手法を超える可能性を秘めている。
    • マルチモーダルモデルが,単一モーダルモデルよりも優れた性能を示せないという課題が存在する。
    • データセットの品質改善を通じて,文脈支援型予測の潜在能力を引き出すことを目指す。
    • 既存のデータセットに含まれる文脈の質が低いことが,マルチモーダルモデルの性能低下の原因であるという仮説を検証した。
    • 時間的動態を記述し,数値データと検証可能な補完性を持つ文脈を生成する半合成データ拡張手法を開発した。
    • 大規模データセットCAF-7Mを構築し,実世界の評価において半合成事前学習が有効であることを示した。

    Link: https://arxiv.org/abs/2603.12451

  • 現実世界AI評価:FRAMEが意思決定者の Dilemma を解決するための体系的証拠の創出 [cs.DC, cs.CY, cs.AI]目的:AIシステムの現実環境における挙動に関する体系的証拠の創出
    • AI技術の導入拡大に伴い,組織はAIのガバナンスが不可欠となっている。
    • 既存の評価手法は,汎用的な指標に偏り,現実世界の多様性を捉えきれていない。
    • AIの利用状況と結果を追跡し,その多様性を測定可能な信号に変換すること。
    • FRAMEは,大規模なAIシステム試験と,コンテキストにおける利用状況の構造化された観察を組み合わせる。
    • Testing SandboxとMetrics Hubという2つの主要な資産を構築し,AIの利用状況を大規模に捕捉し,実用的な指標に変換する。
    • AIシステムの出力から実際の利用と下流への影響までを追跡することで,AIの多様性を規模とのトレードオフとしない。

    Link: https://arxiv.org/abs/2603.13294

  • ESUS患者におけるハイパーグラフに基づく事前学習による心房細動予測の向上 [cs.LG, cs.AI]目的:ESUS患者における心房細動予測の精度向上
    • 脳卒中後の心房細動は再発や死亡リスクを高めるため,早期発見が重要である。
    • 既存の診断ツールは精度,拡張性,費用面で課題があり,十分ではない。
    • 少ないESUS症例と高次元の医療データという問題を解決し,効率的な予測を目指す。
    • 大規模な脳卒中コホートでハイパーグラフに基づく患者埋め込みモデルを事前学習することで,重要な特徴と高次相互作用を捉えた。
    • 事前学習済みの埋め込みをESUSコホートに転移することで,特徴量の次元削減と臨床的に意味のある情報の保持を実現した。
    • 実験の結果,従来のモデルと比較して,予測精度とロバスト性が向上することが示された。

    Link: https://arxiv.org/abs/2603.13297

  • 浮動小数点数実行下におけるLipschitzに基づくロバスト性保証 [cs.LG, cs.CV, cs.PL]目的:ニューラルネットワークのロバスト性保証手法の健全性
    • ニューラルネットワークの安全性確保は重要であり,検証可能な保証が求められている。
    • 既存のロバスト性保証は実数演算を前提としており,浮動小数点演算との乖離が生じる。
    • 浮動小数点演算下でのロバスト性低下を評価し,保証条件を導出すること。
    • 実数演算によるロバスト性保証が,浮動小数点数実行下では成立しない具体例が示された。
    • ReLU活性化関数を持つフィードフォワードネットワークに対し,実数と浮動小数点数の感度を関連付ける理論が開発された。
    • 浮動小数点数実行下でのロバスト性に関する健全な条件と,オーバーフロー回避のための条件が得られた。

    Link: https://arxiv.org/abs/2603.13334

  • AgriPath: 作物病害分類のためのアーキテクチャのトレードオフの体系的探求 [cs.CV, cs.LG]目的:作物病害分類に関するアーキテクチャのトレードオフの体系的探求
    • 食糧生産において,病害の早期発見と正確な分類は,収穫量増加と食料安全保障に不可欠である。
    • 既存の研究では,特定のアーキテクチャに偏っていたり,実験室環境下でのデータに限定されていたりする。
    • 本研究は,多様な環境下での性能を考慮した上で,適切なアーキテクチャ選択の指針を示すことを目指す。
    • CNNは実験室環境下では高い精度を示すが,実際の圃場環境下では性能が低下する傾向が見られた。
    • コントラスト学習を用いたVLMは,パラメータ効率が良く,ドメインを跨いでも安定した性能を発揮する。
    • 生成VLMは,分布の変化に対して最も強い耐性を示す一方,自由記述生成に起因する新たな課題も存在する。

    Link: https://arxiv.org/abs/2603.13354

  • SHAMISA:自己教師あり無参照画像品質評価のための暗黙的構造的関連性の形状モデリング [cs.CV, cs.AI, cs.LG]目的:無参照画像品質評価モデルの学習における課題解決
    • 画像処理技術の発展に伴い,画像品質の自動評価の重要性が増している。
    • 高品質な画像品質評価モデルの学習には,高コストな人間による品質評価データが必要である。
    • 人間による評価データを用いずに,自己教師あり学習によって高品質な評価モデルを構築すること。
    • 提案手法SHAMISAは,明示的な構造的関係的監督を用いて,ラベルなしの歪み画像から学習する非対照的な自己教師ありフレームワークである。
    • 歪みパターンを共有する画像を埋め込み空間上で近づけ,強度変化によって構造的なシフトを生じさせることで表現学習を制御する。
    • 合成データ,実データ,クロスデータセットのベンチマークで優れた性能と汎化性能,堅牢性を実証した。

    Link: https://arxiv.org/abs/2603.13669

  • 見ることは信じることか?合成動画に対する人間の感度評価 [cs.HC, cs.AI]目的:合成動画に対する人間の知覚に関する研究
    • 機械学習の進歩により,リアルな合成動画が容易に作成可能となり,社会への影響が大きくなっている。
    • 誤情報の拡散や世論操作への懸念が高まる一方で,人間の知覚に関する理解が不足している。
    • 動画や音声の歪みが認知処理に及ぼす影響を調査し,合成動画の信頼性評価を改善すること。
    • 動画の歪みやディープフェイクのアーティファクトは,動画の信頼性を低下させる。
    • 主観的な信頼性評価と客観的な学習成果の両方において,歪みの影響が確認された。
    • 本研究は,合成動画の評価と知覚に関する認知プロセスを探求し,ディープフェイクへのさらなる理論的発展の必要性を示唆する。

    Link: https://arxiv.org/abs/2603.13846

  • APEX-Searcher:エージェント的計画と実行によるLLMの検索能力の強化 [cs.CL, cs.AI]目的:複雑な質問への対応能力向上
    • 知識検索の重要性が増しており,LLMの活用が不可欠である。
    • 複雑な質問に対して,単一の検索では十分な精度が得られない。
    • 曖昧な検索実行経路と,強化学習における報酬の希薄さを解決する。
    • APEX-Searcherは,計画と実行を分離したエージェント的フレームワークである。
    • 分解に特化した報酬を用いた強化学習で戦略的計画を最適化する。
    • 高品質な複数段階の軌跡で教師ありファインチューニングを行い,反復的なサブタスク実行能力を高める。

    Link: https://arxiv.org/abs/2603.13853

  • OrigamiBench:折り畳み可能な折り紙を合成するためのインタラクティブな環境 [cs.LG, cs.CV]目的:折り紙の自動合成のための環境
    • 物理世界で計画・行動・創造するAIの実現には,パターン認識を超えた理解が不可欠である。
    • 既存のベンチマークは,視覚とプログラミング的推論を分離しており,体系的な評価が困難である。
    • 視覚,幾何学的制約,順次計画を統合した評価を通して,AIの物理的推論能力の向上を目指す。
    • OrigamiBenchは,モデルが折りを提案し,物理的な妥当性や目標形状との類似性に関するフィードバックを得る,反復的なベンチマークである。
    • 実験の結果,モデルサイズの拡大だけでは,物理的変換に関する因果的推論が必ずしも向上しないことが示された。
    • モデルは一貫した多段階折り戦略を生成できず,視覚と言語表現の統合が不十分であることが示唆された。

    Link: https://arxiv.org/abs/2603.13856

  • LLM誘導強化学習によるオーディオビジュアル音声強調 [cs.SD, cs.AI, eess.AS]目的:オーディオビジュアル音声強調の新たな手法
    • 音声強調は,通信や補聴など,多様な分野で重要な技術である。
    • 既存の評価指標は,知覚的な品質と必ずしも一致しない場合がある。
    • 知覚的な品質をより反映した評価指標による音声強調を目指す。
    • 大規模言語モデル(LLM)に基づいた報酬モデルを用いることで,音声品質の改善をより詳細に記述可能となった。
    • 提案手法は,COG-MHEAR AVSEチャレンジ(AVSEC-4)データセットにおいて,既存手法よりも優れた性能を示した。
    • 客観評価指標(PESQ,STOI等)と主観評価の両方で,提案手法の有効性が確認された。

    Link: https://arxiv.org/abs/2603.13952

  • 人工知能を活用した単一誘導心電図による高カリウム血症の非侵襲的検出:開発,多施設共同検証,および概念実証 [cs.LG, cs.AI]目的:高カリウム血症の非侵襲的スクリーニング
    • 慢性腎臓病や心不全患者に高カリウム血症は多いが,病院外でのモニタリングが困難である。
    • 既存のモニタリング方法は,頻繁な検査や医療機関への受診が必要であり,負担が大きい。
    • AI-ECGシステムによる,簡便かつ高精度な高カリウム血症のスクリーニングを実現すること。
    • 開発されたPocket-Kは,内部テストでAUROC 0.936,時間的検証で0.858,外部検証で0.808という高い精度を示した。
    • 特に重度の高カリウム血症(血清カリウム≧6.0 mmol/L)に対するAUROCは,時間的検証で0.940,外部検証で0.861とさらに向上した。
    • 外部検証における陰性予測値は99.3%を超え,臨床現場での有用性が期待される。

    Link: https://arxiv.org/abs/2603.14177

  • マルチモーダルLLMにおける関係性を考慮した安全性アンラーニング [cs.AI]目的:マルチモーダルLLMの安全性に関する問題解決
    • 生成AIの安全性確保は,社会実装において不可欠である。
    • 既存手法では,特定の関係性に起因する安全性の問題を解決できない。
    • 関係性を考慮し,安全でないパターンのみを効果的に削除することを目指す。
    • 本研究では,O-R-O(オブジェクト-関係-オブジェクト)タプルを明示的に表現するフレームワークを提案した。
    • LoRAを用いて,安全でないタプルを抑制しつつ,オブジェクトや安全な関係性を保持する。
    • CLIPを用いた実験で,言い換えや画像攻撃に対するロバスト性も評価した。

    Link: https://arxiv.org/abs/2603.14185

  • グループ条件付き保証を持つ効率的な連合 conformal 予測 [cs.LG, cs.AI, stat.ML]目的:信頼性の高いAIシステムにおける不確実性定量化
    • AIの信頼性確保には,不確実性の定量化が不可欠であり,その重要性は増している。
    • 連合学習環境において,分散データの特性を考慮した不確実性評価が困難である。
    • グループ構造に着目し,効率的かつ正確な不確実性評価を実現する手法を開発する。
    • 提案手法GC-FCPは,グループごとのカバレッジ保証を提供する新しいプロトコルである。
    • GC-FCPは,ローカルなキャリブレーションスコアからグループ層化コアセットを構築し,効率的な集約を可能にする。
    • 合成データと実データを用いた実験により,GC-FCPの性能が確認された。

    Link: https://arxiv.org/abs/2603.14198

  • DiFlowDubber:クロスモーダルアラインメントと同期による自動ビデオダビングのための離散フローマッチング [cs.CV, cs.AI, cs.MM, cs.SD]目的:ビデオダビングの自動化
    • 映画制作,マルチメディア,支援技術など幅広い応用分野を持つ重要な技術である。
    • 既存手法はデータ不足か,TTSモデルの表現力や同期精度に課題がある。
    • 表情からスタイルを学習し,テキストとビデオの同期精度を高めることで,自然なダビングを実現する。
    • DiFlowDubberは,事前学習済みのTTSモデルの知識をビデオ駆動型ダビングへ効果的に転移させる。
    • FaProモジュールが表情からグローバルなプロソディとスタイルを抽出し,Synchronizerモジュールがテキスト,ビデオ,音声間のギャップを埋める。
    • 2つのベンチマークデータセットにおいて,複数の評価指標で既存手法を上回る性能を示した。

    Link: https://arxiv.org/abs/2603.14267

  • SIREN自動デコーダによる地震速度モデルの高忠実度圧縮 [cs.LG, cs.AI]目的:地震速度モデルの効率的な圧縮手法
    • 地震探査において,高精度な速度モデルは波形反転等の処理の精度を左右する重要な要素である。
    • 従来の速度モデルはグリッド解像度に依存するため,高解像度モデルの保存・処理に大きな計算コストがかかる。
    • 本研究は,暗黙的ニューラル表現を用いて,高解像度の速度モデルを低次元の潜在ベクトルで表現し,効率的な保存と処理を実現する。
    • 提案手法は,70x70の速度マップ(4,900点)を256次元の潜在ベクトルに圧縮し,19:1の圧縮率を達成した。
    • 実験結果から,平均PSNRが32.47dB,SSIMが0.956であり,高品質な再構成が可能であることが示された。
    • 潜在空間の滑らかさにより,中間的な速度構造の生成や,追加学習なしでの超解像が可能となった。

    Link: https://arxiv.org/abs/2603.14284

  • 勾配アトム:学習勾配の疎分解によるモデル行動の教師なし発見,帰属,および制御 [cs.AI]目的:モデル行動の解明と制御
    • AIモデルの挙動理解は,その信頼性と安全性を高める上で不可欠である。
    • 既存手法は,特定の行動を事前に定義する必要があり,網羅性に欠ける。
    • 学習データの勾配分解により,未知の行動を自動的に発見し,制御する。
    • 学習データの勾配を疎な成分(アトム)に分解することで,モデルの共有更新方向を捉えることができた。
    • 発見されたアトムは,教師データなしで,タスクの種類(拒否,算術,質疑応答など)を解釈可能な形で再現した。
    • アトムを重み空間の摂動として適用することで,モデルの行動を大幅かつ制御可能に変化させることができた(例:箇条書き生成率33%→94%)。

    Link: https://arxiv.org/abs/2603.14665

  • GNNVerifier: LLMタスクプランニングのためのグラフベース検証器 [cs.LG]目的:LLMタスクプランニングにおける計画の妥当性検証
    • LLMを活用した自律エージェント開発において,タスクプランニングは重要な役割を担う。
    • LLMが生成する計画は,幻覚や長文プロンプトの影響を受けやすく,誤りを含む可能性がある。
    • 構造的な関係に着目し,LLMの弱点を補完するグラフベースの検証手法を開発する。
    • 提案手法では,計画を属性を付加した有向グラフとして表現し,GNNを用いて構造評価と診断を行う。
    • GNNは計画全体の妥当性スコアと,エラー箇所を特定するためのノード/エッジレベルのリスクスコアを出力する。
    • 実験の結果,GNNVerifierは計画の品質を大幅に向上させることが示された。

    Link: https://arxiv.org/abs/2603.14730

  • リング型ポリゴン注釈に対するトポロジー保存型データ拡張 [cs.CV, cs.AI, cs.LG]目的:リング型ポリゴン注釈のトポロジーを維持したデータ拡張手法
    • セグメンテーションにおいて,データ拡張は重要な役割を担う。
    • 従来のデータ拡張は,単純連結な領域を前提としている。
    • リング型ポリゴンの構造的関係を維持するデータ拡張を実現する。
    • 本手法は,マスク空間での変換と,インデックス空間への頂点投影により接続関係を復元する。
    • 元のポリゴンのトラバーサル順序を維持し,低い計算コストでトポロジーの一貫性を保つ。
    • 実験により,単一および複合拡張において,高い接続性保持率(CAP)が確認された。

    Link: https://arxiv.org/abs/2603.14764

  • OpenHospital:LLMベースの集合知を進化・ベンチマークするための自立環境 [cs.AI]目的:LLMベースの集合知の進化とベンチマークのための環境
    • LLMの能力向上には大量のデータが必要だが,データ不足が課題となっている。
    • LLMベースの集合知を評価・比較するための専用環境が存在しない。
    • LLMベースの集合知を促進し,その効果を定量的に評価すること。
    • OpenHospitalは,医師エージェントと患者エージェントの相互作用を通じて集合知を進化させる環境を提供する。
    • エージェント内データ活用により,迅速な能力向上と,医療知識とシステム効率の評価指標を提供する。
    • 実験により,OpenHospitalが集合知を育成し,定量化する有効性が示された。

    Link: https://arxiv.org/abs/2603.14771

  • VorTEX:ターゲット音声抽出のための様々なオーバーラップ比 [cs.SD, cs.AI, cs.CL]目的:ターゲット音声抽出の性能向上
    • 音響環境における音声分離は,コミュニケーションや音声認識の精度向上に不可欠である。
    • 既存手法は,完全なオーバーラップを前提とするため,現実的な環境下での性能が不明確である。
    • 様々なオーバーラップ比におけるターゲット音声抽出のロバスト性を向上させる。
    • VorTEXは,Decoupled Adaptive Multi-branch Fusionブロックにより,主抽出と補助正則化を分離し,優れた分離性能を実現した。
    • 新規データセットPORTEを用いて,0%から100%までのオーバーラップ比において,既存モデルの課題を克服した。
    • 提案指標SuREにより,抑制行動を検出し,VorTEXが20%~100%のオーバーラップで高い分離忠実度とゼロSuREを両立することを示した。

    Link: https://arxiv.org/abs/2603.14803

  • 気象基礎モデルと衛星データの統合による高精度な太陽放射量予測 [cs.LG, cs.AI]目的:高精度な太陽放射量予測手法の開発
    • 再生可能エネルギーの普及には,電力系統への安定的な統合が不可欠であり,太陽光発電の予測精度が重要となる。
    • 既存手法は,空間解像度の低さや長時間の予測における精度劣化といった課題を抱えている。
    • 気象基礎モデルと衛星データの長所を組み合わせ,高解像度かつ精度の高い予測を実現することを目指す。
    • 提案手法Baguan-solarは,気象基礎モデルBaguanと高解像度衛星画像を融合することで,1kmスケールでの24時間予測を可能にした。
    • 東アジアでの評価実験では,既存手法と比較してRMSEを16.08%削減し,雲による変動をより正確に捉えることができた。
    • Baguan-solarは2025年7月から中国の地方で運用されており,太陽光発電の予測を支援している。

    Link: https://arxiv.org/abs/2603.14845

  • 不確実性に対応した事後説明のための情報的摂動選択 [cs.LG, cs.AI, stat.ML]目的:ブラックボックス機械学習モデルの説明の信頼性向上
    • 機械学習の普及に伴い,モデルの透明性や倫理的な問題が重要視されている。
    • 事後説明手法では,局所的な摂動を生成する必要があり,その選択が課題である。
    • 情報利得を最大化する摂動選択により,説明の再現性と安定性を高める。
    • 提案手法EAGLEは,情報理論に基づく能動学習により効率的に説明モデルを学習する。
    • 理論的に,累積情報利得が特徴量次元とサンプル数に応じてスケーリングすることが示された。
    • 実験結果から,EAGLEは既存手法と比較して説明の再現性,安定性,摂動サンプル品質を向上させることが確認された。

    Link: https://arxiv.org/abs/2603.14894

  • 階層型グラフTransformerによるマスクBRepオートエンコーダ [cs.SI, cs.GR, cs.LG]目的:CADモデルからの表現自動学習
    • 製造業において,CADモデルの効率的な処理は重要であり,機械学習の応用が期待される。
    • 十分なラベル付きデータを得ることが困難であり,汎化性能の高い表現学習が課題である。
    • 少ないラベル付きデータでも高い性能を発揮できる表現学習手法の開発を試みる。
    • 本研究では,マスクされたBRepモデルを再構成するオートエンコーダを提案し,自己教師あり学習による表現学習を実現した。
    • 階層型グラフTransformerを用いて,長距離幾何学的依存性と局所的なトポロジー情報を効果的に統合することに成功した。
    • 少ないラベル付きデータでの実験により,提案手法が既存手法よりも優れた性能を示すことが確認された。

    Link: https://arxiv.org/abs/2603.14927

  • 重い裾を持つノイズ下でのミューオン収束:非凸ヘルダースムース経験リスク最小化 [cs.DC, cs.OS, cs.LG, math.OC]目的:重い裾を持つ確率的ノイズ下における非凸ヘルダースムース経験リスクの最小化
    • 深層学習の規模拡大に伴い,安定かつ効率的な最適化手法の重要性が増している。
    • 実用的な機械学習では,確率的ノイズが重い裾を持つ場合があり,既存手法の理論的保証が適用できない。
    • 本研究では,重い裾を持つ確率的ノイズを考慮したミューオンの収束性を解析し,その有効性を示す。
    • ミューオンは,重い裾を持つ確率的ノイズを考慮した制約条件の下で,経験リスクの停留点に収束することが示された。
    • ミニバッチSGDと比較して,ミューオンの方が収束が速いことが理論的に示された。
    • パラメータ更新における直交性の強制が,安定した学習に寄与することが示唆された。

    Link: https://arxiv.org/abs/2603.15059

  • 大規模バイオメディカル知識グラフの構築,連合,およびSamyamaグラフデータベースによるAIエージェントアクセス [cs.DB, cs.AI, q-bio.QM]目的:大規模バイオメディカル知識グラフの構築と活用
    • バイオメディカル研究の進展には,分散した知識の統合が不可欠である。
    • 既存のバイオメディカルデータは,サイロ化されており,統合が困難である。
    • 異種データソースからの知識グラフ構築と,その連合による高度な解析を目指す。
    • Samyamaを用いて,経路,臨床試験,薬剤相互作用の3つの大規模バイオメディカル知識グラフを構築した。
    • 複数の知識グラフを連合することで,データセット間のプロパティベースの結合が可能となった。
    • LLMエージェント向けにスキーマ駆動型のMCPサーバーを生成し,BiomedQAベンチマークにおいて高い精度を示した。

    Link: https://arxiv.org/abs/2603.15080

  • 見ることと習得することは異なる:プライベートライブラリを利用したコード生成をLLMに教える [cs.CE, cs.SE, cs.AI, cs.CL]目的:プライベートライブラリを利用したコード生成
    • LLMはコード生成に強い潜在力を持つが,プライベートライブラリ特化の生成は課題である
    • 既存手法はAPIドキュメントの検索に頼るが,正確な知識があってもAPIの呼び出しは困難である
    • 自動合成されたデータを用いてLLMにプライベートAPIの呼び出しを学習させる
    • PriCoderは,プライベートライブラリのデータ合成をグラフ構造でモデル化し,多様性と品質を向上させる。
    • 新たに構築したベンチマークにおいて,PriCoderは主要なLLMで20%以上のpass@1向上を示した。
    • 一般的なコード生成能力への影響は軽微である。

    Link: https://arxiv.org/abs/2603.15159

  • HindSight: 将来的なインパクトによるLLM生成の研究アイデアの評価 [cs.CL, cs.AI, cs.LG]目的:LLM生成の研究アイデアの質的評価
    • AI研究の進展において,有望なアイデアを効率的に評価することは不可欠である。
    • 既存の評価手法は主観的であり,実際の研究成果との関連性が薄いという課題がある。
    • 将来の論文との関連性に基づき,研究アイデアの質を客観的に評価すること。
    • HindSightは,生成されたアイデアと将来の論文を照合し,被引用数や掲載会場のレベルによってアイデアの質を評価する。
    • Retrieval-augmentedなアイデア生成は,LLMによる評価では有意差が認められなかったが,HindSightでは2.5倍高いスコアを獲得した。
    • HindSightのスコアとLLMによる新規性は負の相関があり,LLMは実現可能性の低いアイデアを過大評価する傾向があることが示唆された。

    Link: https://arxiv.org/abs/2603.15164

  • LLMの価値ある能力は,まさに説明不可能なものにある [cs.AI]目的:LLMの真に価値ある能力は,人間が理解できる離散的なルールで完全に捉えられない部分にあるというテーゼ
    • LLMは,自然言語処理の分野において目覚ましい進歩を遂げており,その応用範囲は広大である。
    • LLMの動作原理が複雑であり,その判断根拠が不透明であるため,解釈可能性が課題となっている。
    • LLMの超越的な能力を説明できないこと自体が,その価値の源泉であることを論証する。
    • 本研究では,LLMの能力が完全にルール化できるならば,エキスパートシステムと同等になるという反証法を用いている。
    • しかし,エキスパートシステムはLLMよりも能力が劣るため,矛盾が生じる。LLMが持つエキスパートシステムを超える能力こそが,ルール化できない能力である。
    • 中国哲学の「無」の概念や,エキスパートシステムの歴史的失敗も,このテーゼを支持する根拠となる。

    Link: https://arxiv.org/abs/2603.15238

  • SAGE:LLM推論のためのマルチエージェント自己進化 [cs.AI, cs.MA]目的:LLMの推論能力向上
    • 大規模言語モデルの推論能力は,様々なタスクにおいて重要であり,その向上は応用範囲を広げる。
    • 既存手法は,大量の人間がラベル付けしたデータに依存する傾向があり,データ収集のコストが高い。
    • 自己対戦による学習では安定性が課題となるため,本研究では自己進化フレームワークを提案し,安定した学習を目指す。
    • SAGEは,挑戦者,プランナー,ソルバー,批評家の4つのエージェントが,共有LLM基盤から協調進化する閉ループフレームワークである。
    • 数学とコード生成のベンチマークにおいて,モデル規模に関わらず一貫した性能向上が確認された。
    • Qwen-2.5-7Bモデルにおいて,LiveCodeBenchで8.9%,OlympiadBenchで10.7%の改善が認められた。

    Link: https://arxiv.org/abs/2603.15255

  • テスト時計算量の増加は逆効果となりうる:LLMビームサーチにおける過大評価バイアス [cs.LG, cs.AI]目的:LLMビームサーチにおける過大評価バイアスの分析
    • LLMの推論能力向上は重要であり,ビームサーチはその手法の一つである。
    • ビーム幅の拡大が必ずしも性能向上に繋がらない可能性が未検討であった。
    • スコアラーの信号対雑音比に基づいて最適なビーム幅を決定すること。
    • ビーム幅が大きくなるほど,スコアラーのノイズにより過大評価バイアスが増大することが示された。
    • スコアラーの信号対雑音比に依存する最適なビーム幅が存在し,それを超えると性能が低下する。
    • Perplexityスコアリングでは最適なビーム幅は1,PRMスコアリングでは4以上であることが確認された。

    Link: https://arxiv.org/abs/2603.15377

  • RSGen:多様なエッジガイダンスによるレイアウト駆動型リモートセンシング画像生成の強化 [cs.CV, cs.AI]目的:リモートセンシング画像のレイアウト駆動型生成能力の向上
    • リモートセンシング技術は,地球観測や環境監視において不可欠であり,その応用範囲は広い。
    • 既存手法では,生成される画像の微細な制御が難しく,バウンディングボックスの制約を厳密に守れないという課題があった。
    • 多様なエッジガイダンスを活用し,レイアウトに厳密に従った高精度な画像生成を実現することを目指す。
    • 提案手法RSGenは,既存のLayout-to-Imageモデルにプラグアンドプレイで組み込むことが可能である。
    • RSGenは,多様なエッジマップを生成し,これを条件としてL2Iモデルを制御することで,バウンディングボックス内のピクセルレベルでの制御を強化する。
    • DOTAデータセットを用いた実験の結果,RSGenは既存のL2Iモデルの性能を大幅に向上させ,特にCC-Diffを用いた場合,YOLOScore mAP50/mAP50-95で+9.8/+12.0,mAPで+1.6の改善が見られた。

    Link: https://arxiv.org/abs/2603.15484

  • PokeAgentチャレンジ:大規模競争的長文脈学習 [cs.LG, cs.AI]目的:ポケモン対戦とRPG環境における意思決定研究のための大規模ベンチマーク
    • AI研究は,複雑な環境での高度な意思決定能力を必要とするため,実用的なベンチマークが不可欠である。
    • 現在のAIベンチマークは,部分観測性,ゲーム理論的推論,長期計画といった要素を同時に評価できない場合が多い。
    • この研究は,これらの要素を同時に評価可能なベンチマークを提供し,AI研究を促進することを目的とする。
    • PokeAgentチャレンジは,競争的な対戦トラックと長期計画を必要とするスピードランニングトラックの二つのトラックで構成される。
    • 対戦トラックは2000万件以上の対戦データセットと,高度なプレイが可能なベースラインを提供し,LLMや強化学習の研究を支援する。
    • スピードランニングトラックは,RPGスピードランニングの標準的な評価フレームワークを初めて提供し,LLMアプローチの比較を可能にする。

    Link: https://arxiv.org/abs/2603.15563

  • リソグラフィーマスクからのEUV電磁波回折シミュレーションのための物理情報ニューラルシステム [cs.LG, cs.AI, physics.app-ph, physics.comp-ph, physics.optics]目的:EUV電磁波回折問題の解析
    • 次世代リソグラフィー技術の発展には,高精度かつ高速なマスクシミュレーションが不可欠である。
    • 従来の数値シミュレーションは計算コストが高く,設計・最適化のボトルネックとなっている。
    • ニューラルシステムを用いて,シミュレーションの高速化と精度維持を両立することを目指す。
    • 物理情報ニューラルネットワーク(PINN)とニューラルオペレーター(NO)が従来の数値解法と同等の精度を達成した。
    • 提案するWaveguide Neural Operator(WGNO)は,特に高い性能を示し,最先端のシミュレーションを実現した。
    • ニューラルオペレーターは未知のパラメータに対しても高い汎化性能を示し,効率的なマスク設計・最適化に貢献する。

    Link: https://arxiv.org/abs/2603.15584

  • グラフニューラルネットワークの確率的モデル選択によるバイオメディカル相互作用の予測 [q-bio.PE, cond-mat.soft, cs.CL, physics.bio-ph, q-bio.QM, cs.LG]目的:バイオメディカル相互作用予測のためのグラフニューラルネットワークの最適化手法
    • 生物学的なシステム理解には,分子実体と相互作用をネットワークとして捉えることが不可欠である。
    • 適切なグラフ畳み込み層数を決定するには,試行錯誤が必要であり,計算コストが高いという課題がある。
    • データに基づいた層数決定と正則化により,信頼性の高い予測を可能にすることを目指す。
    • 提案手法は,4つのバイオメディカル相互作用データセットで,既存手法よりも優れた性能を発揮した。
    • ベイズモデル選択により,データに適合する適切なグラフ畳み込み層数を推論し,精度の高い予測を実現した。
    • モデルは層数を適応的に調整することで,様々なバイオメディカルネットワークからの情報を活用できる。

    Link: https://arxiv.org/abs/2211.13231

  • 構造マイニングから原子八面体ネットワークの教師なし探索へ [math.CO, cs.DM, cond-mat.mtrl-sci, cs.CE, cs.LG, math.CO]目的:原子中心の配位八面体の空間配置の理解
    • 材料の構造と特性の関係を解明する上で,配位八面体の配置理解は不可欠である。
    • 大規模データセットにおいて,構造の傾向や類似性を手作業で調査するには限界がある。
    • 教師なし機械学習を用いて配位八面体ネットワークの解析・分類を自動化し,構造設計の指針を得る。
    • ペロブスカイト構造の計算データ分析から,軸依存の傾き傾向が酸化状態の変化検出に役立つことが示された。
    • ハイブリッドヨウ化鉛構造の分析により,配位環境に関するPauling類似の結合規則と構造多様性の設計原則が明らかになった。
    • 材料化学における原子八面体ネットワークの膨大な設計空間を垣間見せ,効率的な構造探索への貢献が期待される。

    Link: https://arxiv.org/abs/2306.12272

  • 多峰性分布における逐次モンテカルロ法の収束性に関する限界 [math.ST, cs.LG, math.PR, stat.ML, stat.TH]目的:多峰性分布に対する逐次モンテカルロ法の経験測度の分散の上限
    • 複雑な確率モデルの推論において,マルコフ連鎖モンテカルロ法は必須のツールである。
    • 従来の逐次モンテカルロ法の理論的保証は,単峰性分布を仮定しており,多峰性分布への適用が制限される。
    • 局所的なマルコフ連鎖の混合時間に基づいて収束性を保証し,多峰性分布における効率的な逐次モンテカルロ法を実現する。
    • 本研究では,多峰性分布において,局所的なマルコフ連鎖の混合時間のみに依存する分散の上限を導出した。
    • これにより,従来の理論的保証よりも緩和された条件下で,逐次モンテカルロ法の性能を評価することが可能となった。
    • 本結果は,多峰性分布への逐次モンテカルロ法の適用可能性を広げ,より現実的な問題への応用を促進する。

    Link: https://arxiv.org/abs/2405.19553

  • 大規模細胞数に対応可能な多軸ガウスGraphicalモデルの構築 [stat.ML, cs.LG, q-bio.GN]目的:大規模細胞データセットにおける多軸Graphicalモデルの適用可能性
    • 生物学的データの解析において,遺伝子ネットワークや細胞ネットワークは重要な役割を果たす。
    • 既存の多軸モデルは,大規模な細胞数や遺伝子数に対応できず,適用範囲が限定されていた。
    • 本研究は,より大規模なデータセットでの多軸モデルの適用を可能にすることを目的とする。
    • 本研究により,数百万細胞規模のデータセットを短時間で処理可能な多軸モデルを開発した。
    • この手法は,既存のhdWGCNAと比較して良好な結果を示し,新たな生物学的知見を提供する。
    • 特に,神経発生に関わる可能性のある長鎖非コードRNA遺伝子を特定した。

    Link: https://arxiv.org/abs/2407.19892

  • A-UTE:アドベクション情報を活用した不確実性認識型気温エミュレータ [physics.ao-ph, cs.AI, cs.LG]目的:気候変動の帰属解析と将来予測に必要な地球システムモデルの効率的な長期シミュレーション
    • 地球温暖化対策には,気候変動の正確な予測が不可欠であり,地球システムモデルが重要な役割を担う。
    • 既存の地球システムモデルは計算コストが高く,長期間の実験が困難であるという課題がある。
    • 深層学習を活用し,物理構造と不確実性を考慮した,安定かつ高精度な長期気温エミュレーションを実現する。
    • A-UTEは,多様な気候モデルとグリッド解像度で学習され,10年間の気温変化を予測する。
    • A-UTEは,アドベクションに一致するODEと,月間分解能で変動とモデル間の差異をモデル化するニューラルSDEを組み合わせる。
    • 20の気候モデルを用いた実験で,A-UTEは既存手法と比較して,長期的な安定性と精度が向上することが示された。

    Link: https://arxiv.org/abs/2410.21657

  • オイラーからAIへ:数学定数に対する統一的な公式 [math.HO, cs.AI, cs.CL, math.NT]目的:数学定数に関する公式の統合
    • 数学および科学における知識体系の発展には,既存の知見間の関連性の発見が不可欠である。
    • 数学的公式は孤立して発見されることが多く,それらの間の深層な繋がりが不明なままになっている。
    • AIを活用し,数学的公式を自動的に統合することで,知識の体系化を目指す。
    • 本研究では,AIを活用した公式統合フレームワークを開発し,円周率πの公式385個を検証した。
    • 検証されたπの公式のうち94%に相当する360個において関係性が証明され,そのうち43%は単一の数学的対象から導出可能であった。
    • この手法は,e,ζ(3),カタラン定数など,他の数学定数にも適用可能であり,AIによる数学の可能性を示す。

    Link: https://arxiv.org/abs/2502.17533

  • 一般化された非パラメトリックモデルにおける深層ニューラルネットワーク推定量の推論 [stat.ML, cs.LG, math.ST, stat.TH]目的:深層ニューラルネットワーク推定量を用いた個別固有平均の推論
    • 深層学習は予測に有用だが,個別の結果に対する信頼区間の構築は重要である。
    • 従来の推論手法は,推定誤差と入力の独立性を仮定しており,非パラメトリックモデルでは不適切である。
    • 依存性のあるデータに対しても,深層ニューラルネットワークの推定量の信頼区間を構築することを可能とする。
    • 提案手法では,アンサンブルサンプリング法を用いて,モデルフリーな分散推定を実現している。
    • シミュレーション実験により,ロジスティック,ポアソン,二項回帰モデルにおいて,提案手法の有効性と効率性が確認された。
    • eICUデータセットへの適用により,ICU再入院リスク予測と患者中心の臨床意思決定への貢献が示された。

    Link: https://arxiv.org/abs/2504.09347

  • カーネル密度推定との関連を通じたフローマッチングのミニマックス最適性 [stat.ML, cs.LG, math.ST, stat.TH]目的:フローマッチングのミニマックス最適性
    • 生成モデルは,画像生成など様々な分野で重要な役割を担っている。
    • 拡散モデルの理論的保証は存在するが,フローマッチングに対するものは未整備である。
    • カーネル密度推定との関連性を示すことで,フローマッチングの理論的基盤を確立する。
    • カーネル密度推定器がWasserstein距離において最適な収束レートを達成することが確認された。
    • 十分な大きさのネットワークにおいて,フローマッチングも同様に最適な収束レートを達成する。
    • ターゲット分布が低次元多様体上に存在する場合,フローマッチングはより高速な収束を示す。

    Link: https://arxiv.org/abs/2504.13336

  • 量子アニーリングにおけるマイナー埋め込み問題への対処と最新アルゴリズム性能の評価 [quant-ph, cs.AI, cs.ET]目的:量子アニーリングプロセッサにおけるIsingモデル変数の埋め込み
    • 量子アニーリングは組合せ最適化問題解決に有用だが,性能はハードウェアに依存する。
    • プロセッサの構造に適合しない問題では,量子アニーリングの性能が低下する。
    • 埋め込み品質が量子アニーリングの性能に与える影響を明らかにする。
    • 埋め込みの平均チェーン長と解の相対誤差の間に明確な相関関係が認められた。
    • 標準的な埋め込み手法であるMinorminerには改善の余地があることが示された。
    • より効果的な埋め込み戦略により,量子アニーリングの性能向上が期待される。

    Link: https://arxiv.org/abs/2504.13376

  • ロバストな多モーダル生理学的基盤モデルの構築:任意のモーダリティ欠損への対応 [eess.SP, cs.LG]目的:多モーダル生理学的信号分析のための基盤モデル
    • 医療やブレイン・コンピュータ・インターフェースにおいて,生理学的信号は不可欠である。
    • 既存手法は,特定のアーキテクチャやデータセットに依存し,汎化性能や欠損モーダリティへの対応が課題である。
    • データセットや欠損モーダリティに依存しない,汎用的な表現学習を目指す。
    • PhysioOmniは,同種・異種の特徴量をモデル化し,モーダリティ間の独立性を確保することで,汎用的な表現を獲得する。
    • マスキング信号事前学習と,プロトタイプアライメントを用いたレジリエントなファインチューニングにより,多様な組み合わせへの適応性を実現する。
    • 感情認識,睡眠段階分類,運動予測,精神的ワークロード検出の4つのタスクにおいて,最先端の性能と欠損モーダリティに対する高いロバスト性を示す。

    Link: https://arxiv.org/abs/2504.19596

  • ALPCAH:サンプルごとの不均一分散データに対する部分空間学習 [stat.ML, cs.LG, eess.SP]目的:サンプルごとの不均一分散データに対する部分空間の推定
    • データ解析において,高次元データの次元削減は重要な課題である。効率的な解析のためには必須。
    • 従来のPCAでは,サンプルごとのデータ品質のばらつき(不均一分散)への対応が困難であった。
    • 本研究は,サンプルごとのノイズ分散を考慮し,より正確な部分空間の推定を可能にする。
    • 提案手法ALPCAHは,サンプルごとのノイズ分散を推定し,低ランク構造を持つデータから有効な部分空間を学習する。
    • ALPCAHは,低ランク成分の分布に関する仮定やノイズ分散の事前知識を必要としない点が特徴である。
    • さらに,高速化版のLR-ALPCAHを開発し,実データ実験を通して,既存手法よりも高い有効性を示す。

    Link: https://arxiv.org/abs/2505.07272

  • マルコフ連鎖の混合におけるほぼ最適なクラスタリング [stat.ML, cs.IT, cs.LG, math.IT, math.PR]目的:有限状態空間上のマルコフ連鎖から生成された軌跡のクラスタリング
    • 時系列データ分析において,隠れた構造を明らかにすることは重要である。
    • マルコフ連鎖の混合モデルにおけるクラスタリングは,計算困難な問題である。
    • 本研究は,高次元データにおけるクラスタリング精度の向上を目指す。
    • 提案アルゴリズムは,軌跡のクラスタリングにおいて,ほぼ最適なエラー率を達成する。
    • 新たなユークリッド埋め込みにより,マルコフ連鎖の濃度結果を鋭くすることが可能になった。
    • 実験結果は,提案手法の有効性を示唆しており,その限界と拡張についても議論する。

    Link: https://arxiv.org/abs/2506.01324

  • 大規模言語モデルは選択モデリングを支援できるか? プロンプト戦略と現在のモデルの能力に関する考察 [econ.EM, cs.AI]目的:選択モデリングにおける大規模言語モデルの支援可能性
    • 経済学や交通計画など,合理的選択を分析する上で不可欠な手法である。
    • モデル構築には専門知識が必要であり,時間と労力がかかる。
    • 大規模言語モデルを活用し,モデル構築の効率化と精度向上を目指す。
    • 商用LLMは,構造化されたプロンプト(CoT)により,妥当かつ行動原理に基づいた効用仕様を生成できることが示された。
    • LlamaやGemmaなどのオープンウェイトモデルは,意味のある仕様の生成に苦戦した。
    • GPT-o3は,自己生成したコードを実行することで,自身の仕様を正しく推定できるという特筆すべき能力を示した。

    Link: https://arxiv.org/abs/2507.21790