arXiv雑要約

AI - 2026/05/05 公開

  • 非パラメトリック2D形状におけるヘルムホルツ方程式オペレーターのDeepONetによる学習 [cs.NI, cs.LG]目的:非パラメトリック2D形状に対するヘルムホルツ方程式オペレーターの学習
    • 複雑な形状における波動伝播問題は,工学や科学の様々な分野で重要である。
    • 従来の数値解析手法は,形状変更のたびにメッシュ再生成が必要となり,計算コストが高い。
    • DeepONetを用いて,形状と散乱場の関係を学習し,効率的な代替モデルを構築すること。
    • 本研究では,DeepONetを用いて,形状の幾何学と散乱場を結びつけるオペレーターを学習した。
    • 学習済みモデルは,未知の形状に対しても高い汎化性能を示し,FEMと同等の精度を達成した。
    • 提案手法は,FEMと比較して計算コストが低く,メッシュ再生成の必要もない。

    Link: https://arxiv.org/abs/2605.00760

  • 予算制約下組合せ多腕バンディットにおけるシャプレイ値に基づくメリトロクラティックな公平性 [cs.LG, cs.AI, cs.MA]目的:予算制約下組合せ多腕バンディット問題におけるメリトロクラティックな公平性の実現
    • 機械学習における意思決定において,公平性は重要な課題であり,社会的な影響を考慮する必要がある。
    • 多腕バンディット問題では,報酬の偏りにより,一部の選択肢が過度に選択される不公平が生じることがある。
    • 完全なフィードバック環境下において,各腕の貢献度を定量化し,公平性を担保する手法を開発すること。
    • 提案手法K-SVFair-FBFは,シャプレイ値を拡張したK-シャプレイ値を用いて各腕の貢献度を推定する。
    • 理論的に,K-SVFair-FBFは公平性リグレットに関して,$O(T^{3/4})$ の後悔限界を達成することを証明した。
    • 実験結果から,提案手法は既存手法と比較して,公平性とパフォーマンスの両面で優れていることが示された。

    Link: https://arxiv.org/abs/2605.00762

  • 指向性社会評価:オンラインメディアにおける標的型支持,反対,支援,害悪,および被害の顕在化 [cs.CL, eess.SY, cs.SY, cs.CL, cs.AI]目的:オンラインメディアにおける標的型感情の検出と評価
    • 社会におけるオンラインメディアの役割が増大しており,その影響を理解することが重要である。
    • 従来の感情分析では,テキスト全体の感情しか評価できず,感情の対象や多面性を捉えられない。
    • 感情の対象を特定し,多次元的な感情を評価することで,オンラインメディアの分析を深化させる。
    • 本研究では,指向性社会評価(DSR)という新しいアプローチを提案し,テキスト内の感情の対象を特定し,感情の軸を評価する。
    • DSRは,ソーシャルサイエンスの理論に基づいた3つの感情軸(-1, 1)を用いて感情をスコアリングするトランスフォーマーベースのモデルで構成される。
    • DSRモデルを6つの既存のオンラインメディアデータセットに適用した結果,DSRの出力と既存のラベルやトピックとの間に有意な相関関係が認められた。

    Link: https://arxiv.org/abs/2605.00776

  • 観察可能なパフォーマンスはシステム組織を完全に反映しない:閉塞制約下における歩行ダイナミクスの多層的分析 [cs.LG, q-bio.NC]目的:閉塞制約下における歩行ダイナミクスのシステムレベル応答の分析
    • 生体力学系において,パフォーマンス評価はシステム理解の基礎となる。しかし,適応的なシステムでは,出力指標と内部状態が必ずしも対応しない。
    • 従来の評価指標では,システム内部の複雑な状態を捉えきれず,パフォーマンスの差異が組織の違いを反映していない可能性がある。
    • 本研究は,観察可能なパフォーマンスがシステム組織を必ずしも反映しないという問題を,多層的な分析を通して明らかにすることを試みる。
    • 観察可能なパフォーマンスが同程度の場合でも,状態空間および潜在空間表現における組織が異なることが示された。
    • 集約的な指標の限界が明らかになり,同様の出力が非同等なシステム状態から生じることが示唆された。
    • 本枠組みは,制約下で動作するシステムの多層的な分析への構造化されたアプローチを提供する。

    Link: https://arxiv.org/abs/2605.00778

  • GeoContra:流暢なGISコードから検証可能な空間分析へ - 地理に基づいた修正を伴って [cs.SE, cs.AI]目的:LLM駆動のPython GISワークフローの検証と修正
    • GIScienceにおける信頼性のある空間分析は,地理空間データの正確性が不可欠である。
    • 既存のLLMベースGISシステムはコードの流暢さは保証するが,地理的規則の規模拡大が課題。
    • 地理学的整合性に欠ける結果を回避し,検証可能な空間分析を実現すること。
    • GeoContraは,実行可能な地理空間契約としてタスクを表現し,静的検査,実行時検証,意味検証を行う。
    • 7,079件の実際のタスクを対象とした評価により,DeepSeek-V4の空間的正確性を47.6%から77.5%に,Kimi-K2.5を57.7%から81.5%に向上。
    • 11のオープンモデル全体で平均的な正確性は26.6%向上し,地理的に無効な結果を捕捉することに貢献。

    Link: https://arxiv.org/abs/2605.00782

  • 連続制御のためのコサイン類似度による状態行動価値幾何学習: SAVGO [cs.LG]目的:状態行動価値の幾何構造の学習
    • 強化学習のサンプル効率向上のため,表現学習と類似度学習が重要視されている。
    • 行動空間における直接的なポリシー更新に,表現学習と類似度学習が活用されていない。
    • 価値に基づく類似度をポリシー更新に組み込み,高次元タスクでの性能向上を目指す。
    • 提案手法SAVGOは,状態行動の埋め込み空間を学習し,類似した行動価値を持つペアを高コサイン類似度に,異なるペアを異なる方向にマッピングする。
    • 学習された幾何構造は,候補行動に対する類似度カーネルの生成を可能にし,局所的な勾配ベースの更新を超えた高価値領域へのポリシー改善を導く。
    • 表現学習,価値推定,ポリシー最適化を単一の幾何学的に整合した目的関数に統合し,オフポリシーアクター・クリティック学習の拡張性を維持する。

    Link: https://arxiv.org/abs/2605.00787

  • LVLMのKVキャッシュをより軽量化する [cs.CV, cs.AI, cs.LG]目的:大規模ビジョン言語モデルにおけるKVキャッシュのサイズ削減
    • 大規模言語モデルの効率的な推論にはKVキャッシュが不可欠であり,近年ビジョン言語モデルにも応用が広がっている。
    • ビジョン言語モデルでは,大量の視覚トークンを扱うため,KVキャッシュのサイズがGPUメモリの大きな負担となっている。
    • 視覚トークン埋め込み間の冗長性を利用し,テキストプロンプトに基づいて情報を集約・圧縮することで,KVキャッシュのサイズを削減する。
    • LightKVは,元の視覚トークンの55%でKVキャッシュサイズを半分に削減することに成功した。
    • 計算量を最大40%削減し,既存のベースラインと比較して著しく性能を向上させた。
    • 汎用的な性能を維持しつつ,視覚トークンKVキャッシュのサイズを効率的に削減する手法である。

    Link: https://arxiv.org/abs/2605.00789

  • RAGチャットボットがバックエンドを露出する状況:患者向け医療AIにおけるプライバシーとセキュリティリスクの匿名化事例研究 [cs.CR, cs.AI, cs.CL]目的:患者向け医療RAGチャットボットのセキュリティ評価と,安全な展開のためのガバナンスに関する教訓
    • 医療情報のアクセス性を向上させるRAGチャットボットの普及に伴い,セキュリティ対策が重要になっている。
    • AI開発の容易化が進む一方で,プライバシーとセキュリティの確保が不十分なケースが存在する。
    • 標準的なブラウザツールのみで特定可能な脆弱性を明らかにし,安全な展開のための検証の必要性を訴える。
    • LLM支援によるテストで,システムとRAGの設定がクライアント・サーバー通信で露出している重大な脆弱性を特定した。
    • ブラウザの開発者ツールにより,システムプロンプト,モデル設定,APIスキーマ,会話履歴などの機密情報が容易に収集可能であることが確認された。
    • プライバシーポリシーに反し,認証なしに会話記録が取得可能であり,独立したレビューの必要性が示唆された。

    Link: https://arxiv.org/abs/2605.00796

  • RunAgent:制約に基づいた実行による自然言語計画の解釈 [cs.LG, cs.CL, cs.MA]目的:自然言語計画の解釈と制約に基づく実行
    • 複雑な問題解決には計画に基づくアプローチが不可欠であり,その自動化が求められている。
    • 大規模言語モデルは構造化されたワークフローの実行において信頼性に課題がある。
    • 自然言語の表現力とプログラミングの決定論を組み合わせ,計画実行の信頼性向上を目指す。
    • RunAgentは,自然言語で記述された計画を解釈し,制約と評価基準を通じて段階的な実行を可能にする。
    • タスクとインスタンスの説明に基づいて制約を自動的に導き出し,検証することで,実行の正確性を高める。
    • Natural-planとSciBenchデータセットでの評価により,RunAgentがベースラインや最先端手法を上回る性能を示すことが確認された。

    Link: https://arxiv.org/abs/2605.00798

  • 検証駆動型LLMワークフローによる統計チャートの生成 [cs.LG]目的:統計チャート生成のための構造化LLMベースのワークフロー
    • データに基づいた意思決定において,視覚的な情報伝達は不可欠である。
    • LLMによる統計チャート生成は,レンダリング後の問題検出が困難である。
    • レンダリング結果の検証を取り入れ,視覚化特有の失敗モードに対処する。
    • 本ワークフローは,データセットのスクリーニングから質問応答生成までを構造化し,1,500個のチャートと30,003組の質問応答ペアを生成した。
    • 16種類のマルチモーダルLLM(MLLM)を用いた評価により,チャート構文に関する質問はほぼ飽和していることが示された。
    • 一方,値の抽出,比較,推論は依然として困難であり,チャートに基づいたマルチモーダル推論の診断研究への有用性が示唆された。

    Link: https://arxiv.org/abs/2605.00800

  • 計算材料科学における知的なコーディングエージェントは結果を再現できるか [cs.SE, cs.AI, cs.CL]目的:計算材料科学の論文からの主張の再現能力の評価
    • 材料科学研究の進展には,計算シミュレーションの再現性が不可欠である。
    • 論文に記載された計算手順が不十分であったり,再現が困難な場合がある。
    • LLMベースのエージェントの科学的ワークフローにおける再現性の限界を特定する。
    • AutoMatベンチマークを用いてLLMベースのエージェントの性能を評価した結果,成功率は54.1%に留まった。
    • 特に,論文テキストのみからワークフローを再構築する際に困難が生じ,不完全な手順や方法論の逸脱が主な原因であった。
    • AutoMatは計算科学における再現性の評価基準として機能し,AIを活用した科学研究におけるエージェントシステムの課題を明確にする。

    Link: https://arxiv.org/abs/2605.00803

  • 持続的な視覚記憶:LVLMにおける深層生成のための知覚の維持 [cs.CV, cs.AI]目的:LVLMにおける深層生成時の視覚知覚維持機構
    • 大規模な視覚言語モデルはマルチモーダルタスクで高い性能を示すが,長文生成時に視覚情報が希薄化しやすい。
    • 生成されるテキストの長さが伸びるほど,視覚への注意が減衰し,精度低下を招くという課題がある。
    • 生成長に依存しない視覚情報の持続的な参照を可能にし,視覚信号の減衰を抑制することを目指す。
    • 提案手法PVMは,LVLMに軽量な学習モジュールとして組み込むことで,視覚情報の持続的な知覚を可能にする。
    • 実験結果から,PVMはパラメータ増加を最小限に抑えつつ,Qwen3-VLモデルにおいて,4Bおよび8Bスケールで顕著な精度向上を示すことが確認された。
    • 特に,持続的な視覚知覚が求められる複雑な推論タスクにおいて,PVMは信号減衰を抑制し,内部予測の収束を加速する。

    Link: https://arxiv.org/abs/2605.00814

  • HyCOP:解釈可能な偏微分方程式学習のためのハイブリッド構成演算子 [cs.CL, cs.CE, cs.LG, cs.NA, math.NA]目的:偏微分方程式解演算子の学習
    • 物理現象のシミュレーションは科学技術の発展に不可欠である。
    • 従来のニューラル演算子はブラックボックス化しやすく,汎化性能が課題となる。
    • モジュール構成による解釈性と,外挿性能の向上が求められている。
    • HyCOPは,アドベクション,拡散などの単純モジュールを組み合わせることで,解演算子を学習する。
    • 従来のニューラル演算子と比較して,大幅な外挿性能の改善が確認された。
    • モジュール構成により,プログラムの解釈性が高く,モジュール交換による転移学習も可能である。

    Link: https://arxiv.org/abs/2605.00820

  • モデルは自身が違反した内容を思い出す:多段階LLM発想における制約遵守 [cs.CL, cs.AI]目的:多段階LLM支援科学的発想における制約遵守の評価
    • 研究開発において,LLMを活用したアイデア創出が重要性を増している。
    • LLMは,対話が進むにつれて当初の目的から逸脱し,制約を無視する傾向がある。
    • LLMが制約を遵守しているかを定量的に評価し,問題点を明らかにすること。
    • 反復的な対話により,LLMが生成するアイデアの構造的複雑性は高まり,当初の制約への遵守度は低下する傾向が確認された。
    • モデルは制約内容を正確に記憶しているにも関わらず,同時に制約に反するアイデアを生成することが示された (KBV率8-99%)。
    • 構造化されたチェックポイントの導入はKBV率を一部軽減するものの,制約遵守とアイデアの複雑性の乖離を完全に解消するには至らなかった。

    Link: https://arxiv.org/abs/2604.28031

  • 平均場パス積分拡散:サンプルから相互作用エージェントへ [math.OC, cs.AI, stat.ML]目的:確率質量をより効率的に輸送するためのサンプル間の協調
    • 近年のAI生成モデルにおいて,独立したサンプル生成が主流だが,サンプル間の協調による効率化が課題。
    • 既存手法では,サンプルを独立に扱うため,集団全体の確率分布の輸送効率が低いという問題点がある。
    • サンプルを相互作用エージェントとして捉え,集団統計に基づいた協調により確率輸送を効率化することを目指す。
    • 平均場パス積分拡散(MF-PID)は,サンプルを相互作用エージェントとして捉えることで,確率分布の最適輸送問題を解決する。
    • 特定の条件下では,無限次元のシステムが有限の常微分方程式に簡約され,解析的な解が得られることが示された。
    • エネルギーシステムの需要応答制御への応用では,従来の独立エージェント手法と比較して19~24%の制御エネルギー削減を実現した。

    Link: https://arxiv.org/abs/2605.00007

  • TimeRFT:強化学習による時系列予測モデルの汎化性能向上 [eess.SP, cs.AI, cs.CV, cs.LG]目的:時系列予測モデルの汎化性能向上
    • 時系列データは様々な分野で利用され,その予測精度は重要な課題である。
    • 既存のファインチューニング手法は過学習しやすく,予測性能が低下する可能性がある。
    • 分布シフトやデータ量の変化に対応できる汎化性能の高いモデルを開発すること。
    • TimeRFTは,予測品質に基づく報酬メカニズムと予測困難度に基づくデータ選択戦略を用いる。
    • 実験結果から,TimeRFTは既存のファインチューニング手法よりも高い予測精度と汎化性能を示す。
    • 特に,未知の分布シフトに対するロバスト性が向上することが確認された。

    Link: https://arxiv.org/abs/2605.00015

  • MoDAl:相関除去による自己教師ありニューラルモダリティ発見 - 音声ニューロプロテーゼ [q-bio.NC, cs.CL, cs.HC, cs.LG]目的:音声ニューロプロテーゼのための補完的なニューラルモダリティの発見
    • 音声障害を持つ人々のコミュニケーション回復は,社会参加において極めて重要である。
    • 従来のニューロプロテーゼは運動皮質に集中し,言語情報を含む他の脳領域の活用が不十分であった。
    • 脳活動からより多くの言語情報を抽出し,ニューロプロテーゼの精度向上を目指す。
    • MoDAlは,脳信号とテキスト埋め込みの対照損失と,エンコーダの相関除去損失を組み合わせることで,補完的なニューラルモダリティを発見する。
    • Brain-to-Text Benchmark '24において,MoDAlは既存の最良手法と比較してWERを26.3%から21.6%に低減した。
    • 特に,従来無視されてきた領域44からの信号を取り込むことで,相関除去メカニズムにより性能向上が達成された。

    Link: https://arxiv.org/abs/2605.00025

  • その行で間違いないか? 読視線データの信頼度に基づくリアルタイム行割り当て手法 [q-bio.NC, cs.AI, cs.HC, cs.LG, eess.IV]目的:読視線データにおける信頼度に基づくリアルタイム行割り当て
    • 遠隔またはウェブカメラを用いた眼追跡は,リアルタイム読書支援において不可欠な技術である。
    • ノイズ要因やレイアウトの曖昧さにより,複数行の読書における正確な行割り当てが課題となる。
    • 信頼度に基づき,不確実性の高い場合は行割り当てを遅延させることで,リアルタイム性を維持する。
    • 提案手法CONF-LAは,既存のデータセットにおいて,事後分析とオンライン処理の性能差を縮小(1-2%)した。
    • CONF-LAは,0.348msの平均fixationごとの遅延で安定した性能を示し,特にリグレッションに対して頑健性がある。
    • 子供のデータにおける中央値の精度が向上(約95%)し,既存のアルゴリズムを上回る結果が得られた。

    Link: https://arxiv.org/abs/2605.00033

  • 自動車空気力学の高精度予測のための回転強化Transformer演算子RETO [eess.IV, cs.LG]目的:自動車空気力学の予測精度向上
    • 自動車設計において,迅速な空気力学的評価は不可欠であり,性能向上に直結する。
    • 既存のニューラル演算子は,複雑な空間相関を捉えるのが困難であるという課題がある。
    • 複雑な空間相関を捉え,高精度な予測を可能とする新しいニューラル演算子を開発すること。
    • 提案手法RETOは,ShapeNetデータセットにおいて,既存手法Transolverを16%上回る高い精度を示した。
    • DrivAerMLデータセットでは,表面圧力と速度に関して,Transolverよりもそれぞれ23%と19%高い精度を達成した。
    • 情報理論的解析により,RETOはTransolverよりも焦点を絞った注意機構を持ち,局所勾配の拡散を抑制することが示された。

    Link: https://arxiv.org/abs/2605.00062

  • CRC-Screen:分類群の変化下におけるDNA合成ハザードスクリーニング [q-bio.GN, cs.AI]目的:DNA合成注文のハザードスクリーニング手法
    • バイオセキュリティの観点から,有害なDNA配列の不正合成を防止することが重要である。
    • 既存のスクリーニング手法は,参照データベースに存在しない新規の有害配列に対しては機能が低下する。
    • 分類群の変化に対応可能な,信頼性の高いハザードスクリーニング手法を開発する。
    • 本研究では,k-mer ジャカード類似度,LLMによる評価,埋め込みベクトル類似度を組み合わせたスクリーニング手法を提案した。
    • Conformal Risk Controlにより校正することで,0.05の偽陰性率を達成し,全てのテストで偽陽性率は0%であった。
    • 認証可能な偽陰性率を10⁻³まで下げるには,より大規模な校正データセットが必要であることが示された。

    Link: https://arxiv.org/abs/2605.00074

  • 量子学習のための検証可能かつ拡張性のある量子ガウス過程 [quant-ph, cs.LG, stat.ML]目的:量子システムからの学習のためのベイズ的フレームワーク
    • 量子機械学習は急速に進歩しているが,単純性,解釈性,拡張性,量子データへの適合性に課題がある。
    • 既存のアプローチには深刻な限界があり,量子データに自然に適合した学習フレームワークが不足している。
    • 未知の量子変換に対する事前分布を定義することで,量子データ上で回帰,分類,ベイズ最適化を可能にする。
    • 量子ガウス過程は,物理学に基づいた誘導バイアスを学習モデルに効果的に注入し,量子プロセスの構造と対称性を活用する。
    • マッチゲート進化は,すべての量子ビット上で非自明に作用する未知のユニタリ変換を含む,検証可能かつ拡張性のある量子ガウス過程を提供する最初のファミリーである。
    • 長距離外挿,多体系における相図学習,量子センシングタスクにおけるサンプル効率の良いベイズ最適化が実証された。

    Link: https://arxiv.org/abs/2605.00099

  • 量子機械学習モデルの効率的なミューテーションテスト [quant-ph, cs.LG]目的:量子機械学習モデルにおける欠陥検出
    • 量子機械学習は,古典モデルより少ないパラメータで複雑な特徴を学習可能であり,重要性が増している。
    • 量子機械学習モデルの複雑化に伴い,実装の検証と欠陥検出が課題となっている。
    • 本研究は,量子回路への効率的な欠陥挿入と冗長性の削減を目指す。
    • 新しいミューテーション操作を定義することで,従来手法よりも効率的な欠陥挿入を実現した。
    • 指向性ミューテーション生成技術により,冗長なミュータント回路を削減することに成功した。
    • 実験評価の結果,提案手法は多様で代表的なミュータントセットを生成し,従来の技術では検出できない欠陥も検出できることが示された。

    Link: https://arxiv.org/abs/2605.00107

  • ニューラルネットワークに対する適応的ノルムベース正則化 [stat.ML, cs.LG, stat.AP]目的:ニューラルネットワークにおけるノルムベース正則化手法の性能向上
    • 機械学習モデルの過学習抑制は,汎化性能を高める上で不可欠である。
    • 従来のノルムベース正則化は,特徴量間の相関を考慮していない場合がある。
    • 特徴量間の相関を考慮した正則化手法を開発し,予測性能の向上を目指す。
    • 提案手法は,入力特徴量の共分散構造を取り入れたリッジ型$\ell_2$正則化により,特徴量間の依存関係を考慮する。
    • $\ell_1$スパース性正則化と共分散を考慮した$\ell_2$正則化を組み合わせることで,疎かつ構造的な重みを学習する。
    • シミュレーションと実データ分析の結果,提案手法は従来の正則化手法よりも優れた予測性能と複雑性制御を実現する。

    Link: https://arxiv.org/abs/2605.00171

  • SHIFT:重い裾を持つ汚染下における平均投与反応関数のためのロバストな二重機械学習 [physics.data-an, cond-mat.mtrl-sci, cs.MS, stat.ML, cs.LG]目的:平均投与反応関数推定におけるロバスト性向上
    • 因果推論において,投与量と反応の関係を正確に推定することは重要である。
    • 従来の二重機械学習は,外れ値の影響を受けやすく,推定精度が低下する可能性がある。
    • 外れ値の影響を軽減し,ロバストな推定を可能にする手法の開発が求められている。
    • 本研究で提案するSHIFTは,汚染の程度が高い状況下で,RMSEを大幅に低減することを示した。
    • SHIFTは,外れ値を特定する能力が高く,真の外れ値マスクを高い精度で再現できる。
    • 線形ニュアンスモデルが,均一な汚染下では勾配ブースティングモデルよりも優れた性能を発揮することが示唆された。

    Link: https://arxiv.org/abs/2605.00176

  • 鳥のさえずりからうなり声まで:異種埋め込みによるゾウの鳴き声の分類 [eess.AS, cs.LG, cs.SD, q-bio.QM]目的:ゾウの鳴き声の分類
    • 生物音響学研究は,動物行動や生態系の理解に不可欠である。音声データの活用が重要となる。
    • 生物音響データのアノテーションはコストが高く,データ不足が分類器の性能低下を招きやすい。
    • アノテーション不要な埋め込みモデルを用いて,汎用性の高いゾウの鳴き声分類を目指す。
    • 事前学習済みの音響埋め込みモデルは,エンドツーエンドの教師あり学習ネットワークに匹敵する分類精度を達成した。
    • 特にPerch 2.0は,アフリカゾウとアジアゾウの鳴き声分類においてそれぞれ0.849と0.936のAUCスコアを記録した。
    • wav2vec2.0とHuBERTの中間層表現が有効であり,パラメータ数を削減しつつ高い分類性能を維持できることが示された。

    Link: https://arxiv.org/abs/2605.00225

  • 拡散モデルとフローモデルにおけるファインチューニングとサンプリングに関する統一的視点 [stat.ML, cs.LG, math.OC]目的:拡散モデルとフローモデルによるターゲット分布からのサンプリング
    • 生成モデルは,画像生成やデータ拡張など,多様な応用分野で重要な役割を担っている。
    • 既存手法では,未正規化密度からのサンプリングや事前学習モデルの報酬に基づくファインチューニングが困難であった。
    • 本研究は,上記の問題に対し,統一的なフレームワークを提供し,効率的なサンプリング手法を確立する。
    • 本研究では,Adjoint Matching/SamplingとNovel Score Matchingが有限な勾配分散を持つことを示すバイアス・バリアンス分解を行った。
    • Adjoint Matchingに基づく手法の有効性を理論的に裏付ける,Lean Adjoint ODEのノルム境界を導出した。
    • CMCDやNETS損失関数を指数傾き設定に適合させ,新たなCrooksとJarzynskiの恒等式を導入した。Stable Diffusionを用いた実験で有効性を検証した。

    Link: https://arxiv.org/abs/2605.00229

  • グラフ拡散のための情報幾何学的適応的サンプリング [stat.CO, cs.DC, cs.MM, stat.ML, cs.CV, cs.LG]目的:グラフ拡散における情報幾何学に基づく適応的サンプリング手法
    • グラフ生成は,創薬やソーシャルネットワーク分析など,多様な分野で重要性が増している。
    • 従来の拡散モデルでは,複雑な多様体上での分布変化の非一様性を考慮できていない。
    • 分布変化の瞬間的な速度を定量化し,サンプリング効率と構造忠実性を向上させる。
    • 本研究では,拡散サンプリング軌跡をリーマン多様体上のパラメトリック曲線として再解釈する情報幾何学的フレームワークを提案した。
    • 提案手法であるドリフト変動スコア(DVS)は,統計多様体上で一定の情報速度を維持し,サンプリング軌跡に沿った分布変化率を均一に保つ。
    • 分子やソーシャルネットワーク生成の実験により,DVSが構造忠実性とサンプリング効率を大幅に改善することが示された。

    Link: https://arxiv.org/abs/2605.00250

  • 構造を超えて:AI駆動による合成プロトコル・特性相関を通じた材料発見の革命 [cond-mat.mtrl-sci, cs.AI]目的:AI駆動による材料発見における合成プロトコルと特性の関係性
    • 材料開発は技術革新の根幹であり,社会の発展に不可欠である。
    • 既存手法では,予測された構造の合成可能性が課題となり,材料発見が停滞している。
    • 合成プロトコルを主要な設計変数とし,実験データに基づいた材料発見を加速すること。
    • 本研究は,プロトコルから構造,特性への因果関係に基づいた新たな材料発見の枠組みを提案する。
    • 合成手順を機械可読なプロトコルとして表現し,実行可能な反応経路を生成・設計するモデルを開発する。
    • 実験データと持続可能性の制約を考慮した閉ループ最適化により,再現性のある材料発見を目指す。

    Link: https://arxiv.org/abs/2605.00313

  • 高速リサージュ共焦点レーザー内視鏡法のためのマルチフレーム復元 [eess.IV, cs.CV, cs.LG]目的:高速リサージュ共焦点レーザー内視鏡法における画像復元
    • 生体内光学生検の高速化が求められている。ハンドヘルドデバイスでの利用に適している。
    • リサージュ走査は,走査経路上のピクセルのみをサンプリングするため,高速化に伴い構造的な欠損が生じる。
    • 欠損ピクセルの補完により,高速リサージュ走査の画質を改善し,臨床応用の実現を目指す。
    • 本研究では,高速リサージュCLEのベンチマークデータセットを新たに構築した。
    • 提案手法MIRAは,特徴再利用と変位アライメントにより時間的文脈を効果的に集約する軽量な再帰的フレームワークである。
    • 実験の結果,MIRAは既存手法と比較して復元品質が高く,計算効率も優れていることが示された。

    Link: https://arxiv.org/abs/2605.00527

  • 勾配正則化ニュートンブースティング木:グローバル収束性について [stat.ML, cs.LG, math.OC]目的:勾配ブースティング決定木におけるニュートン法に基づく最適化手法の収束性解析
    • 表形式データの機械学習において,勾配ブースティング決定木が広く利用されている。その性能向上は重要である。
    • ニュートン法に基づくブースティングのグローバル収束性に関する理論的理解が十分ではない点が課題である。
    • ニュートン法の収束性を保証する新しい勾配正則化スキームを提案し,理論的な収束率を導出することを目指す。
    • 提案手法は,滑らかで強く凸な損失関数に対して線形収束率を達成することが証明された。
    • 一般的な凸損失関数に対しても,$\mathcal{O}(\frac{1}{k^2})$の収束率を達成し,グローバル収束性を示すことができた。
    • 数値実験により,提案手法が古典的なニュートンブースティングよりも安定的に収束することが示された。

    Link: https://arxiv.org/abs/2605.00581

  • 生まれつき適合性:先進エネルギー・電子材料の展開のための自律的フレームワーク [cond-mat.mtrl-sci, cs.AI]目的:先進エネルギー・電子材料展開のための自律的フレームワーク
    • エネルギー技術の発展には,新材料の発見が不可欠である。高性能材料がなければ,持続可能な社会は実現できない。
    • 研究室レベルの成果が,工業的な実用化に至ることが稀であり,その乖離が課題となっている。
    • 材料開発初期段階から製造性,コスト,耐久性を考慮し,実用化を促進することを目的とする。
    • 本研究では,多目的評価指標,因果モデル,モジュール型インフラストラクチャを構築し,製造プロセスを開発ループに組み込んだ。
    • 「生まれつき適合性」という戦略により,初期段階から工業的な実現可能性を重視することで,実用化の障壁を克服する。
    • このアプローチは,エネルギー技術分野における材料開発の効率化と,持続可能な社会の実現に貢献するものと期待される。

    Link: https://arxiv.org/abs/2605.00639

  • AIペルソナ事前分布を用いた適応的質問 [stat.ML, cs.CL, cs.LG]目的:ユーザー依存的な関心事項の学習
    • 個々のユーザーの嗜好や特性を把握することは,パーソナライズされたサービス提供に不可欠である。
    • 従来の適応的質問手法は,パラメータ制約や計算コストの問題から,多様な状況への適用が難しい。
    • AIペルソナを用いることで,効率的かつ解釈可能な適応的質問システムの構築を目指す。
    • AIペルソナ事前分布は,高次元かつコールドスタートの状況下でも高精度な確率予測を可能にする。
    • 提案手法は,効率的なベイズ設計による逐次アイテム選択を実現し,質問数の制約下でも学習効果を高める。
    • 合成データとWorldValuesBenchを用いた実験により,本手法の有効性が確認された。

    Link: https://arxiv.org/abs/2605.00696

  • 知識の個別化による医療連合学習における汎化と個別化への対処:FedKPer [eess.IV, cs.LG]目的:医療連合学習における汎化と個別化のバランス改善
    • 医療データは機密性が高く共有が難しいため,連合学習が有用なアプローチである。
    • 医療機関間のデータ分布の不均一性は,連合学習の汎化性能と個別化性能を低下させる。
    • 統計的異質性に起因する忘却現象を抑制し,汎化と個別化のトレードオフを改善すること。
    • 提案手法FedKPerは,各ローカルデバイスで知識の個別化を行うことで,統計的異質性の影響を軽減する。
    • グローバルモデルの集約過程において,信頼性が高くラベル多様なローカル更新を重視することで汎化性能を高める。
    • 忘却の一般的な結果に関連する追加指標を用いて評価を行い,汎化と個別化のトレードオフを改善することを示す。

    Link: https://arxiv.org/abs/2605.00698

  • 分散型近接確率的勾配ランジェバン動力学 [stat.ML, cs.LG, math.PR]目的:対数凹型確率分布からのサンプリング
    • 機械学習におけるベイズ推論の重要性が高まっており,MCMC法が不可欠である。
    • 大規模データに対するMCMC法は計算コストが高く,分散型アルゴリズムが必要とされている。
    • 制約付きドメインにおける分散型MCMCアルゴリズムの開発と理論的保証。
    • 提案手法DE-PSGLDは,凸領域に制約された対数凹型分布からのサンプリングに有効である。
    • Wasserstein距離に関する非漸近的収束性が理論的に保証された。
    • 合成データと実データを用いた実験により,高い予測精度と速やかな事後集中が確認された。

    Link: https://arxiv.org/abs/2605.00723

  • ランダム化された部分空間ネステロフ加速勾配法 [math.OC, cs.LG, stat.ML]目的:スムーズ凸およびスムーズ強凸最適化におけるランダム化された部分空間ネステロフ加速勾配法の理論的保証
    • 大規模データ処理や機械学習において,計算コストの削減が重要な課題となっている。
    • 部分空間法は計算コストを削減するが,ネステロフ加速の理論的保証を得ることは困難であった。
    • 行列滑らかさの条件の下で,部分空間ネステロフ加速勾配法の理論的保証を与える。
    • 本研究で開発された手法は,行列滑らかさの条件とスケッチ分布を考慮した複雑度解析を可能にする。
    • この理論は,加速オラクル複雑度に関する保証を与え,部分空間加速がフル次元ネステロフ加速を改善する状況を明確にする。
    • 様々なスケッチファミリーの比較のための統一的な基盤を提供する。

    Link: https://arxiv.org/abs/2605.00740

  • 量子ニューラルネットワークの認定トレーニングのための量子区間境界伝播 [quant-ph, cs.LG]目的:量子ニューラルネットワークの認定トレーニング手法
    • 量子機械学習は,データセットの特徴を効率的に学習し,分類などのタスクを実行する有望な分野である。
    • 古典機械学習では認定トレーニングが成功しているが,量子ドメインでは同様の研究は限られている。
    • 量子ドメインにおける認定トレーニングの確立を目指し,敵対的摂動下でのモデルの精度を保証する。
    • 提案手法である量子区間境界伝播(QIBP)は,量子ニューラルネットワークの認定トレーニングを可能にする。
    • 区間算術とアフィン算術を実装し,精度と設計に関するトレードオフを評価した結果,ロバストな決定境界を持つモデルが得られた。
    • トレーニングされた敵対的ロバスト性境界内のサンプルに対して,正しいクラスを予測することが保証された。

    Link: https://arxiv.org/abs/2605.00747

  • 知覚的注意ネットワークを用いたリアルな臨床用低線量肝臓CTの教師なしノイズ除去 [eess.IV, cs.AI, cs.CV]目的:低線量CT画像のノイズ除去手法
    • 臨床研究を支援する画像処理技術の重要性が増している。
    • 低線量CTは被ばく量を減らすが,ノイズが増加し診断精度を低下させる。
    • 臨床データを用いた教師なし学習で高画質化を実現する。
    • 提案手法は,U-Net,注意機構,残差ネットワークを組み合わせた教師なし学習フレームワークである。
    • 知覚的損失を導入することで,医療画像の特徴を考慮したノイズ除去を実現した。
    • 実臨床データを用いた評価により,従来の技術と比較して優れた性能を示すことが確認された。

    Link: https://arxiv.org/abs/2605.00793

  • テンソル化ニューラルネットワークおよびテンソルネットワークアルゴリズムに対する部分ノルムを用いた効率的な有限初期化 [cs.DM, math.CO, cs.LG, quant-ph]目的:テンソル化ニューラルネットワークおよびテンソルネットワークアルゴリズムの層初期化手法
    • 深層学習モデルの性能は初期値に大きく依存するため,効率的な初期化手法は重要である。
    • テンソルネットワークの構造が複雑な場合,ノルムの計算コストが高くなり,初期化が困難になる。
    • 部分ノルムと線形和を利用し,計算コストを抑えつつ安定した初期化を実現すること。
    • 提案手法では,テンソルネットワークの部分ネットワークのノルムを反復的に利用することで,計算効率を向上させている。
    • MPS/TTおよびMPO/TT-M層への適用により,ノード数,結合次元,物理次元に対するスケーリングが確認された。
    • 中間計算の再利用により,計算コストをさらに削減し,効率的な初期化を可能にしている。

    Link: https://arxiv.org/abs/2309.06577

  • 転移可能な表現学習のための値明示的事前学習 [cs.LG, cs.RO]目的:視覚的強化学習における汎化可能な表現の獲得
    • 視覚情報に基づいたタスク遂行は,ロボット工学や自律システムの実現に不可欠である。
    • 環境の変化に対応し,未知のタスクへの適応能力が従来の強化学習の課題である。
    • サブオプティマルなデモンストレーションデータを用いた事前学習による汎化性能の向上を目指す。
    • 提案手法VEPは,環境のダイナミクスや外観の変化に頑健な表現を学習することで,効率的なタスク学習を可能にする。
    • モンテカルロ価値推定に基づいた自己教師あり学習により,タスクの目的を捉えた時間的に滑らかな表現を獲得する。
    • Ant locomotion,ナビゲーションシミュレーター,Atari benchmarkにおいて,既存の事前学習手法を凌駕する汎化性能を示す。

    Link: https://arxiv.org/abs/2312.12339

  • クープマン作用素支援強化学習 [cs.AI, cs.LG, math.DS, math.OC]目的:非線形システムの強化学習における最適価値関数の推定
    • 強化学習は,複雑な制御問題を解決する上で重要な役割を担う。
    • 高次元または非線形システムでは,ベルマン方程式が扱えなくなる。
    • クープマン作用素を用いて,非線形システムを線形近似し,最適価値関数の推定を可能とする。
    • 提案手法は,制御されたクープマンテンソルを構築し,最大エントロピー強化学習アルゴリズムを再構築する。
    • 線形状態空間システム,ローレンツシステム,円柱周りの流体流れ,および二重井戸ポテンシャルにおいて,従来の強化学習手法を上回る性能を示す。
    • 本手法は,決定論的および確率的システム,離散および連続ダイナミクスを扱うことができる柔軟性と解釈可能性を備えている。

    Link: https://arxiv.org/abs/2403.02290

  • 差別検証における比較対象の再検討 [cs.LG]目的:差別検証における比較対象の役割
    • 公正な社会の実現には,差別を客観的に検出し,是正することが不可欠である。
    • 既存の差別検証手法では,比較対象者の設定が困難であり,結果の解釈に曖昧さが残る場合がある。
    • 本研究は,より現実的で精度の高い差別検証を可能にする比較対象者の概念を提案する。
    • 本研究では,比較対象者を「全てを変えずに」比較するCP型と,「適切な調整を加えた上で」比較するMM型に分類した。
    • MM型比較対象者は,非保護属性も考慮することで,より現実的な比較を可能にする。
    • 機械学習を用いることで,複雑なMM型比較対象者の構築と,差別検証への応用が期待される。

    Link: https://arxiv.org/abs/2405.13693

  • 離散コサイン変換に基づくデ相関注意機構:Vision Transformerへの応用 [cs.CV, cs.LG, eess.SP]目的:Vision Transformerにおける効率性と性能の向上
    • Transformerは画像認識において高い性能を示すが,計算コストが大きい。
    • 自己注意機構の学習は,初期値設定が難しく,計算量が多い。
    • 離散コサイン変換を用いて,自己注意機構の初期化と圧縮を行うことで,効率性と精度を改善する。
    • 離散コサイン変換に基づく初期化戦略は,CIFAR-10とImageNet-1Kで分類精度を向上させた。
    • 高周波成分を削減する圧縮手法により,計算量を削減しつつ,同等の性能を維持した。
    • 提案手法は,Swin Transformerモデルにおいて,大幅な計算コスト削減を達成した。

    Link: https://arxiv.org/abs/2405.13901

  • CollaFuse:協調拡散モデル [cs.LG, cs.AI, cs.CV]目的:分散型協調拡散モデルの実現
    • 生成AIにおいて拡散モデルが注目されており,高品質な画像生成が可能である。
    • データ不足,計算コスト,プライバシー保護が課題であり,連合学習も計算負荷が大きい。
    • クライアントの計算負荷を軽減しつつ,拡散モデルの協調学習を可能にすること。
    • 提案手法CollaFuseは,スプリットラーニングに着想を得て,クライアントの計算負担を軽減する。
    • 各クライアントでデータと低コストな処理を保持し,高コストな処理をサーバーにオフロードする。
    • CelebA等のデータセットで性能向上と情報漏洩リスクの低減が確認された。

    Link: https://arxiv.org/abs/2406.14429

  • 独自のプロンプトを持ち込む:LLMのユースケース固有のバイアスと公平性評価 [cs.CL, cs.AI]目的:LLMの利用状況に応じたバイアスおよび公平性評価指標の選択に関する指針
    • LLMは社会に広く浸透しつつあり,そのバイアスは倫理的・社会的に重要な問題である。
    • 既存の評価方法は,特定の利用状況におけるバイアスを考慮せず,汎用的な指標に頼っている。
    • 利用状況に応じた適切な評価指標を選択することで,LLMのバイアスをより正確に評価し,軽減すること。
    • LLMのユースケースをタスクタイプ,保護属性の言及,ステークホルダーの優先度によって分類するフレームワークを提案した。
    • 毒性,ステレオタイプ,反事実的不公平性,配分上の不利益といったバイアスを評価するための新たな指標を導入した。
    • 実験の結果,ベンチマークの性能だけでは公平性リスクを正確に評価できないことが示された。ユースケース固有の評価が不可欠である。

    Link: https://arxiv.org/abs/2407.10853

  • 制約付きマルコフ決定過程における汎用パラメータ化方策の最終反復収束性 [cs.LG, cs.AI]目的:制約付きマルコフ決定過程における汎用パラメータ化方策の学習
    • 強化学習は,ロボット制御やゲームなど,様々な分野で応用が期待されている。
    • 制約付きマルコフ決定過程では,安全性や倫理的な制約を考慮する必要がある。
    • 汎用パラメータ化方策を用いた効率的な学習手法の確立が求められている。
    • 提案手法PDR-ANPGは,エントロピー正則化と二次正則化を用いることで,最終反復における最適性と制約違反のギャップを$\epsilon$に抑える。
    • 転送適合性近似誤差$\epsilon_{\mathrm{bias}}$が存在する場合,サンプル計算量は$\tilde{\mathcal{O}}(\epsilon^{-2}\min\{\epsilon^{-2},\epsilon_{\mathrm{bias}}^{-\frac{1}{3}}\})$となる。
    • 完全方策($\epsilon_{\mathrm{bias}}=0$)の場合,サンプル計算量は$\tilde{\mathcal{O}}(\epsilon^{-4})$と,既存手法よりも大幅に改善される。

    Link: https://arxiv.org/abs/2408.11513

  • ロバストなシステム同定とパラメータ推定のためのダイナミクス符号化深層学習 [cs.LG, cs.NA, math.DS, math.NA]目的:ロバストなシステム同定とパラメータ推定手法
    • 機械学習への物理知識の導入は,より堅牢で解釈可能なアルゴリズムを生み出す上で重要である。
    • 動力学系の理論において,未知の物理法則の発見とパラメータ推定は困難な課題として存在する。
    • 観測データから駆動されるモデル予測の精度向上と,物理パラメータの推定を目指す。
    • 提案手法は,振動およびカオス的ダイナミクスを示すテスト問題群において,ノイズを含む観測データからのデータ駆動型モデル予測の有効性を示す。
    • Runge-Kutta法や線形多段階法などの数値スキームの性能比較から,適切な空間・時間離散化スキームと数値法を用いることで,システムダイナミクスの予測と物理パラメータ推定が期待できる。
    • 深層学習アーキテクチャにシステムのダイナミクスに関する事前情報を符号化することで,より高精度な推定が可能となる。

    Link: https://arxiv.org/abs/2410.04299

  • 大規模言語モデルにおける偏り:起源,評価,および軽減策 [cs.CE, cs.CL, cs.LG]目的:大規模言語モデルにおける偏りの現状把握と対策
    • 自然言語処理の発展において,大規模言語モデルは不可欠な存在となっている。
    • 大規模言語モデルは,学習データに内在する偏りを増幅する可能性がある。
    • 大規模言語モデルの偏りを検出し,公平性を高めるための方法論を確立すること。
    • 偏りは,学習データに由来する内的なものと,モデルの使用方法に由来する外的なものに分類できる。
    • データレベル,モデルレベル,出力レベルの評価手法を用いることで,偏りを多角的に検出可能である。
    • 偏り軽減策は,モデルの前処理,学習時,後処理の段階でそれぞれ実施可能であり,その効果と限界が異なる。

    Link: https://arxiv.org/abs/2411.10915

  • GNNにおける過剰圧縮と過剰平滑化の緩和策:グラフ再配線に関するサーベイ [cs.LG, cs.AI]目的:グラフニューラルネットワークにおける情報伝播の改善
    • グラフ構造データからの学習において,GNNは強力なモデルである。その性能向上は重要課題。
    • 遠方ノード情報の過度な圧縮(過剰圧縮)と表現の区別がつかなくなる現象(過剰平滑化)が課題。
    • グラフトポロジーの変更による情報伝播の改善を目指すグラフ再配線技術の現状を整理する。
    • グラフ再配線技術は,GNNの過剰圧縮と過剰平滑化の問題に対処するための有効なアプローチである。
    • 本サーベイでは,最新の再配線手法を理論的背景,実装,性能のトレードオフの観点から包括的にレビューする。
    • 様々な再配線アプローチを比較検討することで,GNNの性能向上に役立つ知見を提供する。

    Link: https://arxiv.org/abs/2411.17429

  • ローカル学習,グローバル修正:ノイズラベルを持つ連合学習のためのグローバル修正器 [cs.LG, cs.CV]目的:連合学習におけるノイズラベル問題のロバスト性の向上
    • 連合学習は,データプライバシー保護に貢献し,分散環境でのモデル構築を可能にするため重要である。
    • 現実のデータにはノイズラベルが含まれることが多く,連合学習の性能を著しく低下させる。
    • 異なる種類のノイズラベルやデータ分布を持つ分散環境下でもロバストな連合学習を実現すること。
    • 提案手法FedGRは,グローバルモデルのノイズラベルに対する遅い記憶特性を利用し,ラベルの修正とローカル学習の正則化を行う。
    • FedGRは,3つのモジュールを協調的に動作させ,ノイズラベルを修正し,連合学習のラベルノイズに対するロバスト性を高める。
    • 複数のベンチマーク実験において,FedGRは最先端のベースライン手法を上回り,優れた性能を示した。

    Link: https://arxiv.org/abs/2412.00452

  • 嗜好目標調整:凍結済みポリシーの潜在的制御としてのポストトレーニング [cs.AI, cs.LG]目的:タスクの嗜好に合わせた軌道分布のアライメント
    • ロボティクスや強化学習において,多様な行動を可能にする目標条件付きポリシーが重要視されている。
    • 目標指示やプロンプトの選択に性能が大きく左右されるという課題が存在する。
    • 潜在的な制御変数を最適化し,望ましい行動を最大化し,望ましくない行動を抑制することを目指す。
    • ポストトレーニング適応を潜在的制御問題として捉え,凍結されたポリシーの挙動を調整する手法を提案。
    • Minecraft SkillForgeベンチマークにおいて,わずかなデータで既存の手法を大幅に上回る性能を達成。
    • タスクアライメントと物理ダイナミクスの分離により,分布外設定においてもフルファインチューニングを上回るロバスト性と汎化性能を示す。

    Link: https://arxiv.org/abs/2412.02125