arXiv雑要約

AI - 2026/05/14 公開

  • ツリーアンサンブルの感度定量化:記号的・構成的なアプローチ [cs.AI, cs.LG]目的:ツリーアンサンブルにおける感度定量化
    • AI分類タスクで広く利用され,安全性確保が重要な分野での検証ニーズが高い。
    • 入力特徴量の微小な変化が誤分類を引き起こす可能性を効率的に評価する手法が課題。
    • モデルの入力空間を離散化し,感度を受けやすい領域を特定・定量化することを目指す。
    • 提案手法は,代数的決定図(ADD)を用いて問題をエンコードし,計算を効率化・分割する。
    • 実験結果から,提案ツールXCountが既存手法よりも高速であり,大規模アンサンブルにも対応可能。
    • 誤差と信頼区間を保証しながら,感度を定量的に評価できることが示された。

    Link: https://arxiv.org/abs/2605.13830

  • QLAM:量子長距離注意メモリによる長系列トークンモデリング [cs.LG, cs.CV]目的:長系列データのトークンモデリング手法
    • 系列データ処理は機械学習の重要な課題であり,長距離依存性のモデル化が不可欠である。
    • Transformerは計算量の問題から長系列への適用が難しく,SSMは表現力に限界がある。
    • 量子重ね合わせの特性を利用し,SSMのメモリ表現を豊かにすることで,この課題を解決する。
    • QLAMは,量子状態を用いて過去情報を重ね合わせで表現し,量子回路によって状態を更新する。
    • 従来の注意機構とは異なり,QLAMは量子状態の進化を通じて暗黙的にグローバルな依存関係を捉える。
    • sMNIST,sFashion-MNIST,sCIFAR-10の評価実験で,QLAMは既存手法を上回る性能を示した。

    Link: https://arxiv.org/abs/2605.13833

  • ホッジ分解によるトポロジー保存ニューラル演算子学習 [cs.LG, cs.AI, cs.CG]目的:幾何学的メッシュ上の物理場方程式の解演算子の学習
    • 物理シミュレーションの精度向上は,科学技術の発展に不可欠である。
    • 従来の機械学習手法では,複雑な形状におけるトポロジー的制約を捉えきれない。
    • ホッジ分解を用いて,トポロジーと幾何学的ダイナミクスを分離し,学習効率と精度を向上させる。
    • ホッジ直交性により,学習不可能なトポロジー的自由度と学習可能な幾何学的ダイナミクスを分離することを示した。
    • 離散微分形式と補助空間を用いて,トポロジー主導成分と局所的ダイナミクスを効率的に表現するハイブリッドEulerian-Lagrangianアーキテクチャを開発した。
    • 提案手法は,幾何学的グラフにおいて,物理的保存則への忠実性を高め,高い精度と効率を達成した。

    Link: https://arxiv.org/abs/2605.13834

  • R-DMesh:ビデオ誘導による3Dアニメーション - 修正された動的メッシュフロー [eess.SY, cs.SY, cs.CV, cs.GR, cs.LG]目的:ビデオ誘導3Dアニメーションにおけるポーズのずれを解決し,高品質な4Dメッシュ生成
    • コンテンツ作成において,直感的かつ高精度な動的アセット制御の需要が高まっている
    • ユーザ提供の静的メッシュ初期ポーズと参照ビデオ開始フレームのずれが,深刻な問題となっている
    • 初期ポーズのずれを自動修正し,高品質な3Dアニメーションを実現することを目指す
    • R-DMeshは,入力メッシュをビデオの初期状態に自動的に変換する「rectification jump offset」を導入
    • Triflow Attentionメカニズムにより,幾何学的特徴を活用し,物理的整合性と局所的な剛性を確保
    • 大規模データセットVideo-RDMeshを構築し,ポーズずれのシミュレーションと高品質な4D生成を可能にした

    Link: https://arxiv.org/abs/2605.13838

  • EVA-Bench:音声エージェント評価のための新しいエンドツーエンドフレームワーク [cs.CL, cs.SD, cs.AI, cs.CL, cs.LG]目的:音声エージェントの評価
    • 企業における音声エージェントの利用が拡大しており,その性能評価が重要になっている。
    • 既存の評価手法では,現実的な会話の生成と,音声特有の失敗モードの網羅的な測定が課題であった。
    • 現実的な会話を生成し,音声エージェントの様々な性能を包括的に評価できるフレームワークを開発する。
    • EVA-Benchは,ボット同士の音声会話をシミュレーションし,自動的に会話の品質を検証する。
    • タスク遂行率,忠実性,音声品質を評価するEVA-Aと,会話の円滑さ,簡潔さ,応答速度を評価するEVA-Xという2つの指標を導入した。
    • 12のシステムを評価した結果,EVA-AとEVA-Xの両方で高い性能を示すシステムは存在せず,また,最高性能と安定性能には差が見られた。

    Link: https://arxiv.org/abs/2605.13841

  • WARDEN: 6時間の学習データによる絶滅危惧言語の書き起こしと翻訳 [cs.CL, cs.AI]目的:絶滅危惧言語であるワルダマン語の書き起こしと英訳
    • 言語の多様性維持は文化遺産保護の観点から重要である。特に絶滅危惧言語の記録・保存は喫緊の課題。
    • 絶滅危惧言語はデータが極端に不足しており,既存の機械翻訳手法を適用することが困難である。
    • 限られたデータでも効果的な書き起こし・翻訳を可能にするモデルの開発。
    • WARDENは,ワルダマン語の音声入力を音素書き起こしに変換し,その後英訳するという二段階構成を採用。
    • 書き起こしモデルの初期化に,音韻が類似するスンダ語のトークンを利用することで,学習を加速。
    • 専門家による注釈に基づいたワルダマン語-英語辞書をLLMに提供し,翻訳性能を向上。

    Link: https://arxiv.org/abs/2605.13846

  • エントロピー誘導型段階的スケーリングによる信頼性の高いソフトウェアエンジニアリング [cs.SE, cs.AI, cs.LG]目的:ソフトウェアエンジニアリングにおける信頼性向上
    • ソフトウェア開発の複雑化に伴い,高品質なコード生成・バグ修正の自動化が重要である。
    • 既存のテスト時スケーリング手法は計算コストが高く,実用性に課題がある。
    • 効率性と有効性を両立する新たなテスト時スケーリングフレームワークを提案し,改善を図る。
    • 提案手法EGSSは,SWE-Bench-Verifiedにおける複数のモデルで性能を5-10%向上させた。
    • Kimi-K2-Intructの解決率を63.2%から72.2%に,GLM-4.6の解決率を65.8%から74.6%にそれぞれ向上させた。
    • GLM-4.6と組み合わせることで,オープンソース大規模言語モデルの中で新たな最高性能を達成し,トークン使用量も28%以上削減した。

    Link: https://arxiv.org/abs/2602.05242

  • 電力系統向けTokaMind:核融合プラズマからのドメイン間転移 [physics.plasm-ph, cs.AI]目的:核融合プラズマ診断データで事前学習された多Modal Transformer (MMT) の汎化性能の検証
    • 電力系統の安定運用には,異常検知と早期警告が不可欠である。その精度向上は重要課題である。
    • 電力系統データの多様性と複雑さから,汎用的な異常検知モデルの開発が遅れている。
    • 核融合プラズマ解析モデルの転移学習により,電力系統における異常検知の精度向上を目指す。
    • TokaMindは,電力系統のPMUデータにおいて,CNNベースラインよりも優れた性能を示した。
    • 分類の難易度は,モデルの能力ではなく,電力系統の提供者レベルのトポロジーによって決定されることが示された。
    • Critical Slowing Down指標を信頼性ゲートとして利用することで,F1スコアが向上し,CNNベースラインを上回った。

    Link: https://arxiv.org/abs/2605.11033

  • AgenticAITA:自律型トレーディングシステムのための熟慮的なマルチエージェント推論の概念実証 [q-fin.TR, cs.AI, stat.ME]目的:自律型トレーディングシステムにおける熟慮的なマルチエージェント推論の実現可能性
    • 金融市場は常に変化するため,適応可能なトレーディングシステムの開発が不可欠である。
    • 従来のトレーディングシステムは,市場の複雑な変化に対応できないという課題がある。
    • 本研究は,オフライン学習や人間の介入なしに自律的に機能するシステムを構築することを目指す。
    • AGENTICAITAは,統計的に異常な市場状況下でのみLLM推論をゲートする適応型Zスコアトリガーエンジンを提案する。
    • アナリスト,リスクマネージャー,エクゼキューターのエージェントからなる熟慮的なパイプラインが,JSONコントラクトと安全レイヤーによって制御される。
    • 5日間のドライランにより,157回のゼロ介入実行が確認され,マルチエージェントの交渉可能性が示唆された。

    Link: https://arxiv.org/abs/2605.12532

  • 情報としての最大カルーバー逸脱:統合情報理論と自由エネルギー原理の架け橋 [q-bio.NC, cs.AI, cs.IT, math.IT]目的:統合情報理論と自由エネルギー原理の数学的対応付け
    • 自己組織化や学習の数理モデルとして重要性が増しているため。
    • 厳密な数学的対応付けが存在せず,検証の精度に限界があるため。
    • 最大カルーバー原理に基づき,両理論を結びつける理論的枠組みを構築する。
    • 情報が,有限時間における制約付き最大カルーバー経路アンサンブルからの逸脱として定義できる。
    • この定義のもと,IIT 3.0の中核となる因果関係のレパートリーが最大カルーバーの変分原理から直接導出される。
    • マルコフ連鎖やイジングモデルへの適用により,情報は予測誤差と同等であることが示された。

    Link: https://arxiv.org/abs/2605.12536

  • 生理学的指針に基づく潜在的整流フロー:電気生理学的PPGからECG生成 [eess.SP, cs.AI, cs.LG]目的:電気生理学的PPG信号からのECG生成
    • 心臓評価にはECGが標準だが,日常的なモニタリングには不向きである。
    • PPGは広く普及しているが,ECG特有の診断形態がなく,ノイズの影響を受けやすい。
    • 生理学的要素に基づいた潜在空間の構造化と,生理動態の制約を導入すること。
    • PG-LRFは,ECGとPPGを共有する心臓位相ダイナミクスを通じて共同モデル化する電気生理学的シミュレーターを導入した。
    • 生理学的認識型オートエンコーダーを用いて,構造化された電気生理学的潜在空間を学習した。
    • 大規模MC-MEDデータセットを用いた実験で,PG-LRFがPPGからECGへの生成と心血管疾患分類を大幅に改善した。

    Link: https://arxiv.org/abs/2605.12541

  • 地球科学基盤モデル:知覚から推論,発見へ [astro-ph.IM, astro-ph.EP, cs.LG]目的:地球科学における基盤モデルの現状と展望
    • 地球規模課題解決に,多様なデータ統合と高度な解析が不可欠である。
    • 異種データ間の整合性,科学的信頼性,継続的更新が課題となっている。
    • 地球科学の進展を加速する,信頼性と実用性に優れたAIの実現を目指す。
    • 多様な地球科学データを統合し,知覚から高度な推論,科学的発見を支援する基盤モデルの進化を体系的に整理した。
    • 大気,水圏,地圏など広範な地球システムにおける基盤モデルの応用事例と,200を超えるデータセット,ベンチマークを紹介した。
    • 異種データ処理,信頼性確保,持続可能性などの課題を提示し,AI地球科学者への発展に向けた方向性を示した。

    Link: https://arxiv.org/abs/2605.12542

  • 未完が戻ってくる理由:キャンシアン化と意識的優先度のダイナミクス [q-bio.NC, cs.AI]目的:意識的優先度の発生メカニズム
    • 意識の研究は,人間の主観的経験を理解する上で不可欠である。意識の動態解明は,認知科学の根幹をなす。
    • 意識に上った内容が,なぜ忘れられるのか,あるいはなぜ繰り返し現れるのか,そのメカニズムは未だ不明である。
    • 未完の経験が意識に繰り返し現れる現象を説明し,健全な反復と病的な反復を区別することを目指す。
    • 意識内容が「キャンシアン化」することで,自己関連の未完性となり,繰り返し意識に優先的に現れると考えられる。
    • 自己と世界の境界,価値判断,因果的閉鎖の阻害,メタ認知的な自己モデルとの結合が,キャンシアン化に寄与する。
    • 構造的な不完全性による反復(コールドキャンシアン化)が,感情的な覚醒とは異なる重要な要素として特定された。

    Link: https://arxiv.org/abs/2605.12543

  • 支払い異質性指数:高ボリューム調達の監視と意思決定支援のための統合された教師なしフレームワーク [econ.EM, cs.LG, q-fin.ST, stat.AP]目的:高ボリューム調達における不正や誤りを監視し,意思決定を支援するための新たなフレームワーク
    • 公共調達は不正リスクを抱え,高額な取引量から十分な監視が困難である。
    • 入札段階の異常に焦点が当たりがちで,落札後の支払に関する研究は不足している。
    • 教師なし学習を用いて,落札後の支払いを分析し,監視を強化し,問題のある取引を特定する。
    • 支払い異質性指数(PHI)は,支払データの構造的特徴を捉え,異常なパターンを検出する。
    • PHIは,英国の地方自治体の調達データに適用され,構造的特徴が異なるサプライヤー群を特定した。
    • 専門家による検証により,PHIが優先順位付けした事例の不正可能性が裏付けられた。

    Link: https://arxiv.org/abs/2605.12547

  • ChannelKAN:ハイブリッドCNN-KANアーキテクチャによる多スケール二重ドメインチャネル予測 [eess.SP, cs.AI]目的:高移動度環境下における大規模MIMO-OFDMシステムにおいて,信頼性とスペクトル効率を向上させるための,正確なチャネル状態情報(CSI)予測
    • 大規模MIMO-OFDMシステムでは,CSIの正確な把握が,通信品質と容量に大きく影響するため,重要である。
    • 既存の深層学習手法は,CSI系列の短期的な局所変動と長距離の非線形依存性を同時に捉えることが困難である。
    • 本研究は,CNNとKANの長所を活かし,CSI予測の精度向上と,様々な環境下でのロバスト性を実現することを目指す。
    • 提案手法ChannelKANは,RNN,LSTM,GRU,CNN,Transformerなどの既存手法と比較して,NMSE,SE,BERの全ての評価指標において優れた性能を示した。
    • 周波数ドメインと遅延ドメインの情報を活用することで,ノイズの影響を抑制し,主要なスペクトル成分を強化することが確認された。
    • CNNとKANを組み合わせることで,局所的な相関と長距離の依存性を効果的に捉え,より正確なCSI予測が可能となった。

    Link: https://arxiv.org/abs/2605.12553

  • MRI画像における脳腫瘍の分類:計算効率の高い畳み込みニューラルネットワーク [eess.IV, cs.CV, cs.LG]目的:脳腫瘍の多クラス分類
    • 脳腫瘍の早期正確な診断は患者の予後改善に不可欠であるため,画像診断技術の発展が重要である。
    • 従来のMRI画像解析は時間がかかり,信頼性に課題がある。深層学習モデルは計算負荷が高く,脳腫瘍の多様性に十分に対応できていない。
    • 計算負荷を抑えつつ,高い分類精度を実現する脳腫瘍診断支援モデルを開発し,臨床現場での実用化を目指す。
    • 提案する畳み込みニューラルネットワークは,2つの公開データセットにおいてそれぞれ99.03%と99.28%の分類精度を達成した。
    • 既存の高性能モデルと比較して,パラメータ数を大幅に削減し,計算コストを低減しながら,より優れた性能を示した。
    • 本研究は,臨床現場における実用的かつ信頼性の高い診断支援ツールの開発可能性を示唆する。

    Link: https://arxiv.org/abs/2605.12560

  • 肺CTにおける交差ウィンドウ知識蒸留による潜在的な病理学的特徴の解明 [eess.IV, cs.AI, cs.CV]目的:多ウィンドウCT画像からの病理学的特徴抽出における知識蒸留フレームワーク
    • 肺CTは様々な密度を持つ解剖学的構造を捉え,病態把握に不可欠である。
    • 既存手法では,異なる密度領域間の相互作用が十分に活用されていない。
    • 知識蒸留により,より効果的な病理学的特徴抽出を目指す。
    • 知識蒸留により,COPD-CT-DFデータセットにおいて,各ウィンドウのAUCが10.1-16.5%向上した。
    • 同様の改善がRSNA PEおよびCTEPDデータセットでも確認された。
    • 交差ウィンドウ知識蒸留は,教師ありアプローチでは捉えられない病理学的特徴を学習し,汎用性の高い解析手法を提供する。

    Link: https://arxiv.org/abs/2605.12562

  • 低高度ネットワークにおけるプライバシー保護画像伝送:Federated Learningを用いたSwin Transformerベースのフレームワーク [eess.IV, cs.LG]目的:低高度ネットワークにおける効率的かつプライバシー保護された画像伝送
    • 低高度経済の発展に伴い,ドローン利用が拡大しており,画像データ伝送の需要が高まっている。
    • 限られた帯域幅と厳格なプライバシー要件が,高容量の画像データ伝送における課題となっている。
    • 分散環境下でのプライバシー保護と,帯域制約下での効率的な画像伝送を実現することを目指す。
    • 提案手法は,既存のDeepJSCCと比較して,ピーク信号対雑音比(PSNR)が少なくとも5.7dB向上した。
    • Swin Transformerベースのセマンティック通信アーキテクチャは,帯域幅制限下で多規模セマンティック特徴を効果的に抽出する。
    • Federated Learning機構により,分散デバイス間でのグローバルモデル学習を,生データを共有することなく実現する。

    Link: https://arxiv.org/abs/2605.12566

  • RF観測からの送信機位置特定のためのメタ強化学習による能動センシング [eess.SP, cs.AI]目的:GNSS干渉源の位置特定
    • 信頼性の高い位置測位は不可欠であり,特に屋内やマルチパス環境での位置特定は課題である。
    • GNSS干渉は位置測位の信頼性を脅かし,干渉源の特定は困難である。
    • マルチパスやチャネル変動下でも適応的に干渉源を特定する手法を確立すること。
    • 提案手法は,シミュレーションデータセットにおいて80.1%の局所化成功率を達成した。
    • 深層強化学習と再帰型ポリシー学習を組み合わせることで,部分的に観測可能な意思決定過程に対応した。
    • シミュレーション支援型学習は,困難な伝搬環境下でのロバストな干渉源位置特定に有効である。

    Link: https://arxiv.org/abs/2605.12569

  • コンパクトな根拠は無料か?フローズンWSI-MILにおけるタイル選択の余地を測定 [eess.IV, cs.AI, cs.CV]目的:フローズンWSI-MILモデルのスライドレベル予測を,再学習なしにコンパクトなタイルサブセットから再現できるかの検証
    • 全スライド画像(WSI)のマルチインスタンス学習(MIL)は診断支援において重要だが,予測根拠の説明性が課題である。
    • アテンションスコアは説明として利用されるが,モデルの十分な根拠を反映しているとは限らない。
    • モデルの出力に十分なタイルサブセットを特定し,コンパクトで検証可能な根拠の提示を目指す。
    • FOCIは,TransformerやMulti-branch Attentionといった集約器ではコンパクトな根拠を許容する一方,Near-minimal Attention-poolingでは選択飽和状態に陥ることを示した。
    • TransMILにおいて,FOCIは最小限の十分なタイル数を32-56%削減し,ACMIL+FOCIは最高の平均SHI(+0.465)を達成した。
    • FOCIはモデルの解釈性と監査のレイヤーとして機能し,選択されたタイルは診断の十分性ではなく,予測の局所化に役立つ候補根拠を提供する。

    Link: https://arxiv.org/abs/2605.12575

  • UM-MIMOにおける近傍・遠方場THz広帯域チャネル推定のための再帰型Transformer [eess.SP, cs.IT, cs.LG, math.IT]目的:THz通信と超大規模MIMOシステムにおけるチャネル推定手法
    • 6Gネットワークにおいて,高速化,スペクトル効率向上,ネットワーク性能改善が求められている。
    • アンテナアパチャーの拡大と高周波数化により,近傍場と遠方場の両方の影響を考慮する必要がある。
    • デジタルチェーン数の制約下で,ハイブリッドビームフォーミングにおける正確なチャネル推定を実現する。
    • 提案手法は,一度学習したTransformerブロックを反復適用することで,近傍・遠方場を同時に推定可能である。
    • 様々な散乱距離,伝搬パス数,広帯域環境への汎化性能を有することが確認された。
    • 狭帯域および広帯域シナリオにおいて,最先端手法と比較して,それぞれ約5dB,7.5dBのNMSE性能向上を達成した。

    Link: https://arxiv.org/abs/2605.12578

  • 拡散モデルにおける臨界減速 [quant-ph, cs.MS, cond-mat.dis-nn, cond-mat.stat-mech, cs.AI, cs.LG, physics.comp-ph]目的:拡散モデルのパラメータ学習における臨界減速現象の解明
    • 計算サンプリングは科学の根幹であり,近年機械学習により飛躍的な進歩がみられる。
    • 機械学習手法の成功メカニズムは未だ解明されず,理論的な制御が困難である。
    • 拡散モデルの学習における臨界減速を克服するアーキテクチャ設計を探求する。
    • 拡散モデルの学習において,特定のネットワーク構造で臨界減速が確認された。
    • アーキテクチャの深さと物理的な局所性の組み合わせが,臨界減速を抑制することが示された。
    • 層数を増やす,または局所的なスコア近似を導入することで学習時間のスケーリングが改善された。

    Link: https://arxiv.org/abs/2605.12597

  • オンライン共形予測:オンライン最適化による単調性の保証 [stat.ML, cs.LG]目的:複数カバレッジレベルにおけるネストされた予測集合の出力
    • 不確実性定量は,機械学習モデルの信頼性向上に不可欠である。
    • 既存のオンライン共形予測は,単一のカバレッジレベルに焦点を当てており,一貫性を欠く。
    • 異なるリスク許容度を持つユーザーに対応するため,複数のカバレッジレベルで有効な予測を可能にする。
    • 提案手法は,様々なカバレッジレベルにおいてネストされた予測集合を生成し,リスクスペクトル全体にわたる同時不確実性定量を実現する。
    • オンライン最適化の視点を取り入れ,予測集合のネスト性を保証しながら,予測誤差を抑制する。
    • 合成データと実データを用いた実験により,提案手法が安定したカバレッジ,厳密なネスト,および効率性の向上を達成することが示された。

    Link: https://arxiv.org/abs/2605.12668

  • 自己注意における逆温度のスケーリングに関する統一的フレームワーク [stat.ML, cs.LG, math.PR]目的:自己注意における逆温度のスケーリングの臨界値を決定する理論
    • Transformerモデルの性能向上には,長文脈処理の安定化が不可欠である。
    • 文脈長に対する逆温度のスケーリング則が,既存研究で矛盾している。
    • 注意スコアの分布に着目し,臨界逆温度を決定する理論的枠組みを確立する。
    • 注意行ごとのギャップカウント関数 $N_n$ が,最適なスケーリングを決定することを示した。
    • 上限テール累積スケールが,softmax関数の集中に不可欠な臨界逆温度スケールを与える。
    • このフレームワークは,既存のスケーリング則を統一し,注意スコアの診断に役立つ。

    Link: https://arxiv.org/abs/2605.12697

  • チューナブルな部分SWAPを用いた量子貯蔵器ネットワークにおける制御可能な量子メモリ容量 [quant-ph, cs.AI]目的:量子貯蔵器ネットワークの量子メモリ容量制御機構
    • 量子計算の発展において,複雑な問題を効率的に解決できる新たな計算モデルが求められている。
    • 量子貯蔵器計算では,メモリ容量のメカニズムが十分に理解されておらず,制御が困難である。
    • チューナブルな部分SWAPにより,量子メモリ容量の減衰率を直接制御し,メモリ容量を調整する。
    • チューナブルな部分SWAPは,ゲートベースQPU上で実現可能な量子メモリ容量制御機構である。
    • 理論的考察では,制御された振幅減衰チャネルとして説明され,その有効性が示された。
    • シミュレーションとIBM QPUを用いた実験により,短期記憶容量テストとNARMA-5データセットで検証された。

    Link: https://arxiv.org/abs/2605.12713

  • 疎な2Dから高密度3Dへの弱学習最適化:大規模生体外MRIデータのマルチラベルセグメンテーションへの応用 [math.CT, cs.ET, eess.IV, cs.CV, cs.LG]目的:高解像度生体外MRIにおけるマルチラベルセグメンテーションのための弱学習フレームワークの最適化
    • 高解像度MRIデータの体積アノテーションは高コストであり,効率的なセグメンテーション手法が求められている。
    • 疎な2Dスライスからの高密度3Dセグメンテーションにおいて,視覚的改善と最適化戦略の転移に関する指針が不足している。
    • 2D教師モデルと3D生徒モデルの学習ダイナミクスの違いを明らかにし,最適な正則化手法を特定すること。
    • 2D教師モデルは,データ不足を克服するために空間的な拡張とソフトラベリングが重要であり,White Matter LesionのDiceスコアが11ポイント以上向上した。
    • 一方,これらのテクニックを3D生徒モデルに適用すると,パフォーマンスが低下することが示された。
    • また,人間中心の前処理(CLAHEなど)は,グローバルな統計的情報を阻害し,Gray Matter LesionのDiceスコアを約25ポイント低下させた。

    Link: https://arxiv.org/abs/2605.12753

  • 大規模言語モデルにおける対称性の伝播:層剥離最適化による解明 [math.OC, cs.AI, stat.ML]目的:大規模言語モデルの学習済み重みと文脈埋め込みにおける幾何学的構造の誘導
    • 自然言語処理の発展において,大規模言語モデルは重要な役割を担う。
    • モデルの学習過程における対称性の起源と伝播メカニズムは未解明である。
    • モデルの対称性を理論的に理解し,その性質を解明することを目的とする。
    • 層剥離最適化プログラムの解析により,ターゲットの次トークン分布における対称性が,モデルの最適解に正確に伝播することが示された。
    • 特に,巡回シフト対称性を示すターゲットの場合,最適なロジット行列は巡回行列となり,出力射影と文脈埋め込みのグラム行列も巡回幾何学構造を形成する。
    • オープンソースの大規模言語モデルにおいても,理論的予測と一致する対称性が自然に発現することが実験的に確認された。

    Link: https://arxiv.org/abs/2605.12756

  • 変分オートエンコーダを用いたイールドカーブのダイナミクス:裁定の自由がない条件下で [physics.ed-ph, cs.CY, q-fin.MF, cs.LG, stat.ML]目的:イールドカーブのダイナミクスモデリング
    • 金融市場において,金利変動の正確な予測はリスク管理や資産評価に不可欠である。
    • 従来のモデルは,複雑な市場状況下で裁定機会を生み出す可能性や予測精度が低いという課題がある。
    • 深層学習の柔軟性と裁定の自由がないという理論的制約を両立する新たなモデリング手法を開発する。
    • 提案手法は,従来のモデルが抱えるマンホールド崩壊や裁定違反を大幅に抑制することを示した。
    • 複数の国通貨(USD,GBP,JPY)を用いた実証実験により,予測誤差が大幅に減少し,HJMモデルを上回る性能を確認した。
    • 位相空間ベクトル場解析により,本モデルが高い精度でマクロ経済レジームを検出し,高品質なシナリオ生成が可能であることが示された。

    Link: https://arxiv.org/abs/2605.12764

  • ISOMORPH:シミュレーション,データセット生成,予測ベンチマークのためのサプライチェーン・デジタルツイン [stat.ML, cs.LG]目的:多階層ロジスティクスネットワークのデジタルツイン
    • サプライチェーン最適化は,経済活動の効率化と安定化に不可欠である。
    • 既存の時間系列予測ベンチマークは,サプライチェーン・ロジスティクス分野を十分に網羅していない。
    • 現実的なサプライチェーンの動的特性を再現するデジタルツインを構築し,予測モデルの評価を可能にすること。
    • ISOMORPHは,解釈可能で設定可能なパラメータを持つ初の公開されたサプライチェーンのデジタルツインである。
    • 生成されたデータセットは,ブルウィップ効果など,既存のベンチマークにはない動的な現象を示した。
    • 基礎モデルのゼロショット評価は,既存のベンチマークよりも優れた予測精度を示し,デジタルツインの不確実性定量化の代替手段となり得ることを示した。

    Link: https://arxiv.org/abs/2605.12768

  • 信頼閾値を利用する際の判断基準:疑似ラベル回帰のキャリブレーション診断 [stat.ME, cs.LG, stat.ML]目的:疑似ラベル回帰パイプラインにおける信頼閾値利用の妥当性判断
    • 機械学習モデルの出力確率のキャリブレーションは,潜在グループの推定など,様々な下流タスクにおいて重要である。
    • 信頼閾値を用いることでバイアスが生じる可能性があり,その影響を事前に評価する手段が不足している。
    • 残差スコア分散から信頼閾値利用が安全かどうか判断できる決定ルールを提示すること。
    • 信頼閾値が下流回帰係数に導入する減衰バイアスの閉形式表現を導出した。
    • 残差スコア分散 $V^{*}$ が,バイアスの予測に利用できることが示された。
    • $V^{*}=0$ が分類器特徴と下流コントロールの構造的分離を導くことが明らかになった。

    Link: https://arxiv.org/abs/2605.12780

  • 単腕試験における合成対照としてのデジタルツイン [physics.soc-ph, cs.SY, eess.SY, stat.AP, cs.LG, stat.ML]目的:単腕試験における有効性と安全性の評価
    • 治療薬の承認には臨床試験が不可欠であり,倫理的・現実的な代替案が求められている。
    • 単腕試験では対照群がないため,治療効果の評価が困難である。
    • デジタルツインを用いた合成対照群を構築し,単腕試験の信頼性を向上させる。
    • デジタルツインは,機械学習モデルを用いて疾患進行を予測し,柔軟な合成対照群構築を可能にする。
    • 二重ロバスト推定法やサンプルサイズ算出法を提示し,デジタルツインの活用方法を検討した。
    • 筋萎縮性側索硬化症とハンチントン病の臨床試験データを用いて,提案手法の有効性を示した。

    Link: https://arxiv.org/abs/2605.12832

  • 不完全な証拠下におけるマーケットプレイスポリシーの意思決定支援:リプレイからローンチ準備へ [stat.AP, cs.LG]目的:マーケットプレイスポリシーのローンチ準備判断
    • マーケットプレイスは収益最大化のため,価格や割り当てポリシーを常に評価する必要がある。
    • オフライン評価で好結果が得られても,実際にローンチすると予期せぬ影響が出る場合がある。
    • 部分的識別下での過剰な意思決定を防止し,オフライン評価を監査可能な推奨へと変換すること。
    • 提案システムは,有望な証拠と実行可能な証拠を区別し,単一のパフォーマンス推定値ではなく,ローンチ準備の分類を出力する。
    • iPinYouのRTBログへの適用により,47.7%のリプレイ収益向上,45.8%の保守的な下位テール収益向上が確認された。
    • しかし,システムの推奨は直接ローンチではなく,オンライン検証への移行であった。簡略化されたパイプラインは誤ったデプロイメント推奨を示した。

    Link: https://arxiv.org/abs/2605.12840

  • Adam-SHANG:確率的滑らかな凸最適化のための収束型Adam法 [math.OC, cs.LG]目的:確率的滑らかな凸最適化における収束性
    • 機械学習の性能向上には,最適化アルゴリズムの効率化が不可欠である。
    • 既存のAdam系手法では,ステップサイズの条件が厳しく,適用範囲が限定される場合がある。
    • より緩やかな条件で収束を保証し,実用的なステップサイズ規則を確立すること。
    • 本研究で提案するAdam-SHANGは,期待収束性を理論的に保証した。
    • 保守的なスペクトル境界条件を満たすステップサイズ条件を示し,実用的なステップサイズ規則も導入した。
    • 深層学習タスクにおいて,AdamやAdamWと同等の性能を示すことが実験的に確認された。

    Link: https://arxiv.org/abs/2605.12878

  • Steer-to-Detect:LLM生成テキスト検出のための隠れ表現の探求 [stat.AP, cs.LG]目的:LLM生成テキストの検出
    • LLMの急速な発展により,機械生成テキストと人間が書いたテキストの区別が困難になっている。
    • 既存研究では,内部表現を活用するものの,クラス間の重複が大きく,識別力が低い。
    • クラス分離性を向上させるための表現操作手法を開発し,より高精度な検出を目指す。
    • 提案手法Steer-to-Detectは,観測用LLMの隠れ状態にsteering vectorを注入し,表現を改善する。
    • 表現に基づく仮説検定により検出を行い,誤検出・見逃しの確率について理論的な保証を提供する。
    • 様々な設定(分布外データや敵対的摂動を含む)において,堅牢な性能を示す。

    Link: https://arxiv.org/abs/2605.12890

  • A/Bテストのためのロバストな逐次実験計画 [stat.ML, cs.LG]目的:A/Bテストにおけるサンプル効率の向上
    • A/Bテストは製品改善に不可欠であり,効率的な実験計画が重要である。
    • 既存の実験計画はモデルの正確な指定に依存し,誤りがあると効果が低下する。
    • モデルの誤指定下でもロバストな実験計画を構築し,性能を保証すること。
    • 提案手法は,モデルの誤指定下においても最悪の場合における平均二乗誤差を抑制することが示された。
    • コンテキストバンディットおよび動的設定の両方において,統一的なフレームワークが開発された。
    • 合成データおよび大手テクノロジー企業の実際のデータを用いて,提案手法の有効性が実証された。

    Link: https://arxiv.org/abs/2605.12899

  • 弱い知識からの強い一般化のメカニズム:潜在知識からの特徴抽出 [stat.ML, cs.LG]目的:超人的AIシステムの整合性確保を目指すアプローチである,弱いモデルの出力で強いモデルをファインチューニングする手法(Weak-to-Strong Generalization)のメカニズム
    • AIシステムの性能向上は重要だが,制御や安全性の確保も不可欠である。そのための手法開発が求められている。
    • 既存の研究では,強いモデルの表現を固定するか,限定的な設定で分析しているため,汎用的な特徴学習のメカニズムは不明である。
    • 本研究では,多段階SGDが特徴学習を成功させ,事前学習済みの多様な能力を維持できるか検証し,そのメカニズムを解明する。
    • 弱い知識からの強い一般化(W2S)において,強いモデルはタスク特化型モデルの指導のもと,効率的にタスクを学習し,事前学習済みの知識を活用できることが示された。
    • W2Sは,強いモデルがターゲット特徴方向を学習によって獲得する特徴学習レジームであり,事前に与えられるものではないことを確立した。
    • W2Sは事前学習済みのオフターゲット特徴を維持する一方,標準的な教師ありファインチューニングでは,オフターゲット特徴とターゲット特徴の相関により,破滅的忘却が発生することが示された。

    Link: https://arxiv.org/abs/2605.12908

  • AIワークフローはいつリリースすべきか:ブラックボックス生成・検証システムにおける常に有効な推論 [stat.ML, cs.AI, cs.LG, stat.ME]目的:AIワークフローにおける適切なリリースタイミングの判断基準
    • AI技術の発展に伴い,生成・評価・修正を繰り返すワークフローが一般的になっている。
    • 評価スコアが変動的であるため,従来の校正手法が適用困難である。
    • ブラックボックスなワークフローでも,安全かつ効率的なリリースを可能とする。
    • 提案手法は,高スコアの失敗例を参考に評価スコアを校正し,信頼性の高いリリース判断を支援する。
    • 理論的に,保守的な参照プールを用いることで,実行不可能なタスクの誤ったリリース確率を抑制できることが示された。
    • MBPP+コーディングエージェントの事例研究では,既存手法と比較して誤った早期リリースを減少させながら,実現可能なタスクをリリースできることが確認された。

    Link: https://arxiv.org/abs/2605.12947

  • コアセット誘導条件付き速度フローマッチング [stat.ML, cs.LG]目的:階層的整流フローをデータに基づいたソース分布で拡張する生成モデル
    • 生成モデルの性能向上は,画像生成などの分野において重要な課題である。
    • 従来の階層的フローマッチングは,ソース分布からターゲット分布への輸送を学習する必要があり,計算コストが高い。
    • ターゲットデータのコアセットを利用することで,効率的な学習と高性能な生成を目指す。
    • 提案手法は,コアセットを用いて構築された閉形式の代替ソース分布を用いることで,学習コストを削減する。
    • 代替ソース分布からターゲット分布への残差を学習する軽量な補正フローを用いることで,高性能な生成を実現する。
    • MNIST, CIFAR-10, ImageNet-32, CelebA-HQなどのデータセットで,提案手法は競争力のある少ステップ生成性能を示す。

    Link: https://arxiv.org/abs/2605.12951

  • スパイク予言:自己回帰ニューロン集団予測の大量ベンチマーク [q-bio.NC, cs.LG]目的:ニューロン集団予測の評価基準の確立
    • 脳機能解明には,ニューロン集団の活動パターンを正確に予測することが不可欠である。
    • 従来の評価指標は集約的であり,予測の質を詳細に分析することが困難であった。
    • 予測の時系列忠実度,空間パターン精度,および振幅不変性に着目し,評価方法を改善する。
    • スパイク予言は,大規模な電気生理学的記録を用いた,因果的かつ自己回帰的なスパイク数予測のための最初のベンチマークである。
    • 提案された評価基準は,7つのアーキテクチャで一貫して脳領域の予測可能性ランキングを再現し,厳密な統計的検証を通過した。
    • また,ポアソン過程に則ったスパイク数領域におけるANNからSNNへの転移学習におけるKLダイスチルレーションが有効ではないことを示した。

    Link: https://arxiv.org/abs/2605.12992

  • 集団規模における次ステップのスパイク予測からの暗黙的行動復号 [q-bio.NC, cs.LG]目的:行動復号の精度向上
    • 脳活動と行動の関連解明は,脳機能理解やブレイン・マシン・インターフェース開発に不可欠である。
    • 従来の行動復号は,生データからの直接的な解析に依存しており,精度向上の限界があった。
    • スパイク予測に基づく新たな復号手法を開発し,行動復号の精度を向上させることを目指す。
    • Mambaという予測モデルの出力(予測スパイク率)は,生スパイクデータよりも高い精度でマウスの選択を復号できた。
    • Mambaの予測スパイク率は,マウスの選択を偶然レベルの2.3倍の精度で,刺激位置を約2倍の精度で復号した。
    • セッション開始時の短いキャリブレーション期間で,復号性能はほぼ限界に達し,リアルタイム処理も可能であることが示された。

    Link: https://arxiv.org/abs/2605.12999

  • 網膜血管を媒介とした疾患解析のための汎用ベジェツリー符号化反事実的フレームワーク [eess.IV, cs.CV, cs.LG]目的:網膜血管の幾何学的特徴に基づく血管疾患のバイオマーカーとしての利用
    • 網膜血管の形状は血管疾患の重要な指標である。疾患メカニズム解明と早期診断に不可欠。
    • 既存手法は画像レベルでの介入に留まり,血管構造の具体的な変化と疾患の関係を特定できていない。
    • 本研究は,血管構造を操作し,疾患予測への影響を分析することで,因果関係の検証を目指す。
    • ベジェツリー符号化反事実的フレームワーク(BTECF)を提案。血管網をベジェ曲線で表現し,構造的特徴を操作可能にした。
    • BTECFを用いた介入実験の結果,血管の曲がり具合や太さの変化が,疾患分類器の予測に用量依存的に影響を与えた。
    • 偽陽性抑制実験により,BTECFが血管構造と疾患予測の因果関係を明確に示していることを検証した。

    Link: https://arxiv.org/abs/2605.13015

  • ニューラルQAOA$^2$: 量子組合せ最適化のための微分可能なグラフ分割とパラメータ初期化 [quant-ph, cs.AI]目的:グラフ分割とパラメータ初期化の同時生成
    • 組合せ最適化問題は,現実世界の様々な課題に応用可能であり,その重要性は高い。
    • 量子ビット数の制約により,QAOAの適用範囲が限られているという課題がある。
    • グラフの構造と最適解への対応を学習し,高品質な分割とパラメータ設定を実現する。
    • 提案手法は,グラフのトポロジーから高品質な分割とパラメータ設定を学習する。
    • 183個のQUBO,Ising,MaxCutインスタンス(21~1000変数)の実験で,ヒューリスティックな手法を凌駕した。
    • 未知のグラフ構造に対しても汎化性能を示し,スケーラビリティも確認された。

    Link: https://arxiv.org/abs/2605.13072

  • 事前学習を用いた適応カーネル密度推定 [stat.ML, cs.LG, stat.ME]目的:高次元における適応カーネルによる密度推定手法
    • 高次元データ解析において,確率密度関数の推定は重要な課題である。
    • 従来のカーネル平滑化法は,高次元空間において適切なカーネルの選択が困難である。
    • 事前学習により,各データ点に応じた適応カーネルを効率的に推定することを目的とする。
    • 事前学習済みニューラルネットワークを用いて,位置適応カーネルを推奨することで高次元密度推定の効率化を実現した。
    • ターゲット分布が事前学習分布に近い場合,密度推定の精度が大幅に向上することが数値実験で示された。
    • ターゲット分布が事前学習分布と大きく異なる場合は,追加のファインチューニングにより効果を回復可能である。

    Link: https://arxiv.org/abs/2605.13092

  • 新しいDPPカーネルによる最先端ミニバッチ:離散化,ウェーブレット,および粗い目的関数 [stat.ML, cs.LG, math.PR]目的:大規模データセットの効率的なミニバッチ,コアセットなどの疎な表現を生成するためのDPPに基づく手法の進歩
    • 機械学習において,大規模データに対する計算効率が重要な課題となっている。
    • 既存のDPPベース手法では,分散減少特性を持つDPP族の構築が難しい。
    • 連続DPPを離散的なカーネルに変換する一般的な手法を確立し,計算コストを削減する。
    • ウェーブレットに基づく新しいDPPを提案し,既存のDPPよりも高い精度を保証した。
    • 連続DPPを離散カーネルに変換するメカニズムを開発し,分散減少特性を維持した。
    • DPPベースのミニバッチとコアセットの適用範囲を,滑らかさの低い目的関数を含むより広いタスクに拡張した。

    Link: https://arxiv.org/abs/2605.13127

  • 統計的特徴に基づく時系列データの償却ニューラルクラスタリング [stat.ML, cs.LG, stat.CO]目的:時系列データの統計的特徴を利用したクラスタリング手法
    • 時系列データは,金融,科学,産業など様々な分野で重要な役割を担う。
    • 従来のクラスタリング手法は,アルゴリズム選択やパラメータ調整が課題である。
    • データ駆動型のアプローチにより,自動化された適応的な時系列クラスタリングを実現する。
    • 提案手法は,シミュレーションデータから最適な分割規則を学習することで,従来のクラスタリング手法への依存を低減する。
    • 統計的特徴(自己相関,分位点自己相関など)を利用し,クラスタ形状や構造の事前指定なしにデータ駆動型のアフィニティ構造を学習する。
    • 実験結果から,提案手法は従来のクラスタリング手法と同等またはそれ以上の精度を達成することが示された。

    Link: https://arxiv.org/abs/2605.13128

  • 逆問題における幻覚:基本的な限界と検証可能な評価手法 [stat.ML, cs.CV, cs.LG]目的:逆問題における幻覚の限界と評価方法
    • 画像処理技術は医療診断や地球観測など,多岐にわたる分野で重要性を増している。
    • 深層学習モデルは,真の値がない場合,現実離れした誤った情報を生成しやすいという課題がある。
    • 逆問題の本質的な限界を明らかにし,幻覚の程度を評価する手法を開発すること。
    • 理論的な枠組みにより,幻覚はモデル固有の問題ではなく,逆問題の性質に起因することが示された。
    • 前方モデルのみを用いて,幻覚の最小限の大きさの上界を計算可能であることが明らかになった。
    • 提案手法は,様々な画像処理タスクで有効であり,AIによる幻覚を定量化・評価する方法を提供する。

    Link: https://arxiv.org/abs/2605.13146

  • 事後重み付きガウス過程による近似周期時系列の生成モデリング [stat.ML, cs.LG]目的:近似周期時系列の生成モデル
    • 産業やサイバー物理システムでは,反復構造を持つ時系列データが重要である。
    • 従来のガウス過程モデルは,周期性と変動性の両方を捉えることが難しい。
    • 反復構造と変動性を分離し,時系列データの生成を可能にすることを目指す。
    • 提案手法では,新たなカーネルを用いてガウス過程の事後分布を調整する。
    • 反復内構造と反復間変動を分離する二段階構成により,反復ごとの平均関数は同一に保ちつつ,滑らかな変動を許容する。
    • 合成データを用いた実装により,提案手法の有効性が示された。

    Link: https://arxiv.org/abs/2605.13150

  • ベイズ最適化における非線形パラメトリックモデルに対するカーネルベースの保証 [stat.ML, cs.LG]目的:非線形パラメトリックモデルの理論的保証
    • ベイズ最適化は複雑な最適化問題に有効である。しかし,その理論的基盤は十分ではない。
    • 既存研究はガウス過程などに限定され,実用的な非線形モデルの保証は不足している。
    • カーネルを用いて非線形モデルの信頼性評価を可能にし,ベイズ最適化の収束性を保証する。
    • 提案手法は,パラメータ空間におけるカーネルを利用し,モデルクラスに再生核ヒルベルト空間構造を誘導する。
    • 正則化された凸損失関数を持つモデルに対して,信頼区間を導き出すことに成功した。
    • この結果は,非線形獲得関数や代理モデルの収束保証に繋がり,ベイズ最適化の応用範囲を広げる。

    Link: https://arxiv.org/abs/2605.13160

  • 結合情報を活用した非線形動的システムにおけるベイズフィルタリングのための輸送写像 [stat.ML, cs.LG, stat.CO]目的:状態変数と観測変数間の結合に基づく,尤度不要な輸送フィルタリング手法
    • 非線形動的システムは現実世界の複雑な現象をモデル化する上で不可欠であり,その正確な状態推定が重要である。
    • 従来のベイズフィルタリングは,非線形性や非ガウス性により状態推定の精度が低下する課題がある。
    • 状態変数と観測変数の結合構造を利用し,より高精度な状態推定を実現することを目指す。
    • 提案手法は,輸送写像のブロック三角構造を利用することで,フィルタリングの解析ステップを最大平均不一致(MMD)の最小化問題として定式化する。
    • MMD最適化の非凸性を回避するため,勾配フローを用いた学習不要な輸送フィルタリング手法を導入し,MMDの最急降下方向を解析的に計算する。
    • 提案手法は,非ガウス型のフィルタリング事後分布を高精度に近似し,粒子崩壊を回避できることが示された。また,高次元問題への適用性も確認された。

    Link: https://arxiv.org/abs/2605.13174

  • LLMにおける暗黙的な補完:不確実性は欠損情報の量に応じて変化すべき [stat.ML, cs.CL, cs.LG, stat.ME]目的:不完全な情報下でのLLMの不確実性評価
    • 大規模言語モデルの利用拡大に伴い,不完全な情報からの応答能力が重要となる。
    • 既存の不確実性指標は,欠損情報の増加に対して適切に反応しない場合がある。
    • 欠損情報の量に応じて不確実性が変化する指標を開発し,LLMの信頼性を高める。
    • LLMを暗黙的な補完器と捉え,複数の補完法における不確実性指標の基準と比較した。
    • サンプリングに基づく信頼度は,精度低下にも関わらず高い値を示し,欠損情報の増加を反映しなかった。
    • エントロピーは,文脈の減少と共に増加し,精度との関連性が高く,信頼度よりも適切な指標であることが示唆された。

    Link: https://arxiv.org/abs/2605.13188