arXiv雑要約

AI - 2026/04/02 公開

  • VT-Former:Varshamov-Tenengolts符号向け効率的なTransformerベースのデコーダ [eess.SY, cs.SY, cs.LG, cs.IT, math.IT]目的:Varshamov-Tenengolts符号の多重誤り訂正能力の調査と,Transformerベースの効率的なデコーダの開発
    • DNAベースのデータストレージにおける挿入,削除,置換誤りの訂正は,データ信頼性確保に不可欠である。
    • 従来のVarshamov-Tenengolts符号のデコーディング手法は,単一誤り訂正に特化しており,多重誤り訂正には不向きである。
    • 本研究は,VT符号の潜在的な多重誤り訂正能力を引き出し,効率的なデコーディング手法を確立することを目的とする。
    • VT-Formerは,単一誤り訂正においてほぼ100%の精度を達成した。
    • 様々な符号長における多重誤り訂正タスクにおいて,従来のハードデシジョンおよびソフトインソフトアウトデコーディングアルゴリズムと比較して,フレーム精度とビット精度が向上した。
    • アーキテクチャの最適化により,従来のソフトデコーダと比較して,より低いデコーディング遅延と計算コストを実現した。

    Link: https://arxiv.org/abs/2502.21060

  • AIに例外処理を学習させる:人間と整合性のとれた判断による教師ありファインチューニング [cs.AI]目的:AIエージェントにおける例外処理の改善
    • LLMは生成AIからエージェントAIへと進化しており,現実世界の複雑な状況下での意思決定が求められている。
    • LLMは優れた生成能力を持つ一方,意思決定プロセスは不明確であり,特に例外処理の判断に課題がある。
    • LLMの例外処理能力を向上させ,人間と整合性のとれた意思決定を実現することを目指す。
    • 倫理的枠組みによるプロンプティングやChain-of-Thoughtは改善効果が限定的であった。
    • 人間による説明を用いた教師ありファインチューニングが,例外処理において顕著な改善をもたらした。
    • ファインチューニングにより,モデルは未知の状況への汎化能力を獲得し,人間らしい意思決定を再現できた。

    Link: https://arxiv.org/abs/2503.02976

  • 干渉を持つ多腕バンディット問題におけるグラフ依存の期待後悔の上界 [cs.LG]目的:ネットワーク干渉下の多腕バンディット問題における期待後悔の最小化
    • 行動の結果が他者に影響する現実世界の意思決定問題を扱う上で重要である。
    • グラフ構造が複雑な場合,行動空間が指数関数的に増加し,計算が困難になる。
    • グラフ構造を利用して効率的に学習し,期待後悔の上界を改善することを目指す。
    • 提案アルゴリズムは,既存の手法よりも改善されたグラフ依存の期待後悔の上界を導出した。
    • 任意のネットワーク干渉を持つバンディット問題に対する初めての下界を提供し,グラフの構造的性質との関係を示した。
    • 干渉グラフが未知の場合,提案アルゴリズムはパレート最適性を持つことが示された。

    Link: https://arxiv.org/abs/2503.07555

  • 分布の不一致下におけるオンポリシー方策勾配法の解析 [cs.LG, math.OC]目的:方策勾配法の分布不一致の影響の分析
    • 強化学習は,複雑な問題を解決するための有力な手法であり,その理論的基盤の理解が重要である。
    • 最先端の方策勾配法は,理論的な定理から逸脱することがあり,性能低下の原因となり得る。
    • 分布不一致が方策勾配法に与える影響を明らかにし,その頑健性を評価すること。
    • テーブルパラメータ化の場合,分布不一致によるバイアスのある勾配が,大域的最適性の第一階特徴付けを与えることが示された。
    • エピソード型および継続型MDPにおいて,状態分布不一致と勾配不一致の両方に対する明示的な境界が導出され,割引率が1に近づくにつれて少なくとも線形に消失することが示された。
    • バイアスのある方策勾配反復が,正確な勾配に関する近似的な定常点に近づき,残差が割引率に依存することが保証された。

    Link: https://arxiv.org/abs/2503.22244

  • Science-T2I:画像合成における科学的誤謬への対処 [cs.CV, cs.AI, cs.LG]目的:科学的画像生成における課題克服
    • 画像生成技術は科学分野における可視化に貢献するが,現実との乖離が課題。
    • 既存モデルは見た目は良くても,科学的に妥当な画像を生成できない。
    • 科学的根拠に基づいた正確な画像生成を実現する。
    • ScienceT2Iデータセットは,16の科学分野にわたる2万件以上の敵対的画像ペアと9千件のプロンプトを含む。
    • 現在の画像生成モデルは,科学的な指示のみでは低いスコアしか得られず,詳細な指示があれば改善されることが示された。
    • SciScoreは,CLIP-Hを微調整した報酬モデルであり,GPT-4oや人間による評価よりも高い精度で科学的現象を捉える。

    Link: https://arxiv.org/abs/2504.13129

  • アルファベット洗練を通じた構成的オートマトン学習の詳細な記述 [cs.LG, cs.FL]目的:構成的オートマトン学習の技術
    • 並行システムの検証やモデル検査において,オートマトン学習は不可欠な技術である。
    • 大規模な並行システムへの適用において,計算量の問題が課題となっていた。
    • 未知の分解を持つ同期並行システムに対する効率的な構成的学習手法を確立する。
    • 提案手法は,グローバルなアルファベットを自動的に構成要素アルファベットに洗練させる。
    • アルファベット分布の理論的取り扱い,矛盾を検出する反例の特定,および分布の整合性回復手法を開発した。
    • 実験結果から,提案手法CoalAはモノリシック学習と比較してクエリ数を大幅に削減し,高いスケーラビリティを実現することが示された。

    Link: https://arxiv.org/abs/2504.16624

  • SetONet:可変入力サンプリングによる偏微分方程式を解くための集合ベース演算子ネットワーク [cs.LG]目的:偏微分方程式の求解における集合ベース演算子ネットワークの提案
    • 偏微分方程式は自然科学・工学の基礎であり,様々な現象を記述するために不可欠である。
    • 従来のニューラル演算子サロゲートは,固定されたセンサー配置でのみ入力関数をサンプリング可能である。
    • 可変センサーレイアウト,欠損データ,点源など,より現実的な問題への適用を可能にすること。
    • SetONetは,入力を座標と値のペアの順序付けられていない集合として扱うことで,この制限を克服する。
    • SetONet-Keyは,学習可能なクエリトークンと位置情報のみのキーパスウェイを用いて,サンプリング形状とセンサー値を分離する。
    • 実験結果から,SetONet-Keyは固定センサーベンチマークでDeepONetよりも低い誤差を達成し,レイアウトが変化しても信頼性が高いことが示された。

    Link: https://arxiv.org/abs/2505.04738

  • 言語モデルにおける推論へのコンテンツの影響軽減:きめ細かい活性化制御によるアプローチ [cs.AI, cs.CL]目的:言語モデルの推論におけるコンテンツバイアスの軽減
    • 大規模言語モデルの信頼性向上は重要であり,その判断における偏りの解消が不可欠である。
    • 言語モデルは,論理的妥当性とコンテンツの妥当性を混同し,誤った推論を行うことがある。
    • 本研究は,活性化制御によってコンテンツバイアスを軽減し,より客観的な推論を可能にすることを目指す。
    • 活性化制御は,コンテンツバイアスに対して線形的な制御が可能であることが示された。
    • 動的なパラメータ決定による条件付き制御アプローチK-CASTは,応答性の低いモデルにおけるバイアスを効果的に削減し,形式的推論の精度を最大15%絶対的に向上させた。
    • 活性化レベルの介入は,言語モデルのロバスト性を高めるためのスケーラブルな推論時戦略となりうる。

    Link: https://arxiv.org/abs/2505.12189

  • ニューラル条件付き輸送写像 [cs.LG, cs.AI, math.PR, stat.AP, stat.ML]目的:確率分布間の条件付き最適輸送写像の学習
    • 最適輸送は,分布間の距離を測る強力なツールであり,機械学習の様々な分野に応用可能である。
    • 従来の条件付き最適輸送は,複雑な条件に対応できず,汎用性に欠ける場合がある。
    • 本研究は,カテゴリ変数と連続変数の両方を扱える,より柔軟な条件付き輸送写像を開発する。
    • 提案手法は,ハイパーネットワークを用いて輸送層パラメータを生成し,適応的な写像を学習する。
    • 詳細な消去実験により,提案手法が既存手法よりも優れた性能を示すことが確認された。
    • グローバル感度分析への応用により,高精度な感度指標の算出が可能であることが示された。

    Link: https://arxiv.org/abs/2505.15808

  • 正直な回答とは何か?ステアリングベクトルを用いたLLMジャッジの補助 [cs.LG, cs.AI]目的:LLMジャッジにおける正直性評価の改善
    • LLMは人間による評価の代替手段として活用が広がっている。
    • 既存手法では,巧妙な不正行為(ごますりや操作など)の検出が困難である。
    • ステアリングベクトルを用いて,不正を検出しやすくする手法を開発する。
    • JUSSAフレームワークにより,GPT-4.1とClaude Haikuのジャッジ性能が向上した (AUROC改善)。
    • 特に,タスクの難易度とジャッジの能力が一致する場合に,効果が顕著に現れた。
    • ステアリングは,正直と不正直な処理表現が分岐し始める中間層で最も効果的であることが示された。

    Link: https://arxiv.org/abs/2505.17760

  • 状況認識に基づくダイナミクス学習 [cs.CL, cs.RO, cs.AI, cs.LG, math.OC]目的:隠れた状態表現のオンライン学習
    • 複雑な環境下でのロボットの自律性は重要であり,その性能向上は社会実装に不可欠である。
    • ロボットは観測できない要因により,自身の状態や外界を正確に理解することが困難である。
    • 不確実な状況下でもロボットが適応し,最適な行動を選択できるようになることを目指す。
    • 提案手法は,状態遷移の同時分布を学習することで,潜在的な要因を表現し,状況の変化を検出する。
    • 実世界の不整地走行実験において,データ効率,方策性能,安全性が大幅に向上することが示された。
    • 本研究は,ロボットが自身の状況を認識し,それに応じて適応的な意思決定を行うための基盤を提供する。

    Link: https://arxiv.org/abs/2505.19574

  • 生成言語モデルにおける優雅な忘却 [cs.CL, cs.AI, cs.LG]目的:生成言語モデルにおける優雅な忘却の実現
    • 事前学習済みモデルは深層学習の重要なパラダイムであり,効率性と効果性を高める。
    • 事前学習で獲得した知識が,必ずしも下流タスクに有益とは限らない。
    • 生成言語モデルにおいて,関連性の低い知識を選択的に削除する優雅な忘却を可能とする。
    • 提案手法LWFは,Fisher情報行列を用いてパラメータ更新を重み付けし,忘却信頼度を計算する。
    • LWFは,高い信頼度を持つ知識を定期的にアンラーニングすることで優雅な忘却を実現する。
    • 実験結果から,優雅な忘却がファインチューニング性能の向上に貢献することが示唆された。

    Link: https://arxiv.org/abs/2505.19715

  • アラインメントはどのようにLLMの多言語能力を強化するか:言語ニューロンの視点 [cs.CL, cs.AI]目的:LLMの多言語能力向上のためのアラインメントの効果とメカニズムの解明
    • LLMのグローバルな利用拡大には,多言語対応が不可欠である。
    • 既存研究では,言語特有のニューロンの分類が曖昧で,正確な分析が困難である。
    • 言語ニューロンの分類を明確化し,多言語推論プロセスの理解を深める。
    • 本研究では,言語特有,言語関連,汎用ニューロンの3種分類法と識別アルゴリズムを提案した。
    • LLMの多言語推論プロセスを,理解,意味空間推論,出力空間変換,語彙空間出力の4段階に分割した。
    • アラインメント前後でのニューロンの変化を分析し,自発的な多言語アラインメントの現象を解明した。

    Link: https://arxiv.org/abs/2505.21505

  • 異質な環境下におけるFederated Softmax Policy Gradientのグローバル収束レート [cs.LG]目的:異質な環境下でのFederated Softmax確率的方策勾配(FedPG)のグローバル収束レート
    • 分散型機械学習の重要性が増しており,プライバシー保護と効率的な学習が求められている。
    • Federated Learningでは,エージェント間の環境の非同質性が収束を妨げる要因となる。
    • 環境の非同質性に起因する収束性の問題を解決し,実用的なFederated RLを実現する。
    • 本研究により,FedPGがエージェントの平均値においてほぼ最適な方策に収束することが示された。
    • エントロピー正則化された方策勾配に対する明示的な定数を含む初の収束レートが得られた。
    • 単一エージェント設定とは異なり,Federated Learningでは確率的方策が必要となる可能性が示唆された。

    Link: https://arxiv.org/abs/2505.23459

  • 二段階Vision Transformerとハードマスキングによるロバストな物体表現 [cs.CL, cs.CV, cs.AI]目的:物体表現のロバスト性向上
    • 物体認識は,画像理解の基礎であり,様々な応用分野で不可欠である。
    • 推論時に分布外の背景が出現すると,物体表現に望ましくないバイアスが生じやすい。
    • 文脈を必要としながらも,ノイズとなる可能性のある背景情報を除去する。
    • 提案手法は,物体認識における分布外背景へのロバスト性を大幅に向上させる。
    • 二段階のフレームワークにより,重要な領域への注意を集中し,誤った相関関係を抑制する。
    • セマンティックマスクの明示的な利用により,モデルの推論過程を可視化し,テスト時の介入を可能にする。

    Link: https://arxiv.org/abs/2506.08915

  • これは本当にピアサポートですか?:LLM支援対話におけるピアサポートと専門家の認識のずれ [cs.HC, cs.AI]目的:LLM支援対話におけるピアサポートと専門家の認識のずれの分析
    • メンタルヘルス問題は世界的に増加しており,心理社会的支援へのアクセス拡大が求められている。
    • ピアサポートの質,一貫性,安全性に関して,トレーニングや効果,定義のばらつきが課題となっている。
    • LLMを活用したシステムがピアサポートのトレーニングと質向上に貢献できる可能性を示唆する。
    • ピアサポート担当者はシステムを積極的に活用したが,専門家はピアサポート担当者の応答における問題点を指摘した。
    • 専門家は,苦痛のサインの見落としや,早すぎるアドバイスに気づき,その認識のずれが浮き彫りになった。
    • 標準化された心理学に基づいたトレーニングの必要性が強調され,LLM支援システムの適切な設計と専門家の指導が重要となる。

    Link: https://arxiv.org/abs/2506.09354

  • LocationReasoner:現実世界の立地選定におけるLLMの推論能力の評価 [cs.AI]目的:現実世界の立地選定におけるLLMの推論能力
    • LLMの発展は目覚ましいが,その推論能力が現実世界の問題に通用するか検証が必要である。
    • 既存のベンチマークは数学やコード生成に偏っており,複雑な現実世界での応用が不明確である。
    • 現実世界の制約条件を考慮した立地選定問題を通じて,LLMの推論能力の限界を明らかにする。
    • LocationReasonerベンチマークを用いて,最先端のLLMでも立地選定タスクの30%で失敗することが示された。
    • ReActやReflexionといったエージェント戦略は,過剰な推論により,直接的なプロンプトよりも劣る場合がある。
    • LLMは,全体的かつ非線形な推論において限界があり,現実世界の意思決定における頑健な推論能力の向上が課題である。

    Link: https://arxiv.org/abs/2506.13841

  • MemeMind:有害ミーム検出のための思考連鎖推論を備えた大規模マルチモーダルデータセット [cs.CL, cs.AI, cs.CV]目的:有害ミームの検出
    • インターネット上での有害コンテンツ拡散防止は,社会的な課題として重要である。
    • ミームは比喩やユーモアを伴うため,有害な意図が隠されており,検出が困難である。
    • ミームに内在する暗黙の危険性とニュアンスを捉え,有害ミーム検出の精度向上を目指す。
    • 大規模な有害ミームデータセットMemeMindを構築し,詳細な思考連鎖推論アノテーションを付与した。
    • 思考連鎖推論を重視したマルチモーダル検出フレームワークMemeGuardを提案し,検出精度と解釈性を向上させた。
    • MemeMindデータセット上で,MemeGuardが既存の最先端手法を上回る性能を示した。

    Link: https://arxiv.org/abs/2506.18919

  • HiMA-Ecom:階層型マルチエージェントEコマースアシスタントの共同学習の実現 [cs.AI]目的:階層型マルチエージェントEコマースアシスタントの訓練と評価のためのベンチマークと共同学習手法
    • Eコマース分野におけるAIアシスタントの重要性が高まっており,高性能なシステムの開発が求められている。
    • 既存のベンチマークが不足しており,機能の異なるエージェント間の共同最適化が困難である。
    • Eコマースに特化したベンチマークと,効率的な共同学習手法を開発し,その問題を解決する。
    • HiMA-Ecomは,エージェント固有の教師ありファインチューニングサンプルと,マルチエージェント強化学習のためのシステムレベルの入出力ペアを含む22.8Kのインスタンスを提供する。
    • 提案手法HiMA-R1は,分散を削減するグループ相対的方策最適化(VR-GRPO)を用いて,指数関数的な行動空間を軽減し,報酬分散に基づいて効率的なエージェントグループを選択する。
    • 適応的なメモリ進化メカニズムにより,VR-GRPOの報酬をコストフリーの教師信号として再利用し,反復的な推論を排除し,収束を加速する。

    Link: https://arxiv.org/abs/2506.19846

  • ビニングを用いた半パラメトリックベイジアンネットワーク:効率的なカーネル密度推定のため [cs.LG, cs.AI]目的:カーネル密度推定における計算コスト削減のための確率的半パラメトリックモデル
    • 非パラメトリック分布の推定は重要だが,計算量が膨大になるという課題がある。
    • ビニングモデルは次元の呪いにより,高次元データでの性能が低下しやすい。
    • 次元の呪いを緩和し,効率的なカーネル密度推定を実現するモデルを提案する。
    • 提案手法であるビニング半パラメトリックベイジアンネットワークは,構造学習と対数尤度推定において,非ビニング型と同等の性能を示す。
    • 計算速度が大幅に向上しており,効率的な代替手段となる可能性が示された。
    • 疎テンソルと条件付き確率計算における親ノード数の制限により,高次元データへの対応が可能となった。

    Link: https://arxiv.org/abs/2506.21997

  • 二重拡散:ODE事前情報を用いた時空間グラフ予測の加速拡散モデル [cs.LG]目的:時空間グラフ予測のためのモデル
    • グラフ構造データに対する予測は,都市の空気質や交通流など,様々な現実世界の問題において重要である。
    • 既存のモデルは,計算効率と予測精度を両立することが課題であった。
    • ODE事前情報を用いた拡散モデルにより,予測精度と計算効率の両方を向上させる。
    • 本研究で提案するDouble-Diffusionは,既存の拡散モデルと比較して,予測精度を向上させながら,推論時間を大幅に短縮した。
    • 特に,推論時間の短縮は3.8倍に達し,実用的な応用を可能にする。
    • また,CRPS(Continuous Ranked Probability Score)という指標において,全てのデータセットで最も優れた確率的較正を実現した。

    Link: https://arxiv.org/abs/2506.23053

  • 大規模言語モデルによる動的計画法問題の自動定式化 [cs.AI]目的:動的計画法問題の自動定式化
    • 動的計画法はオペレーションズ・リサーチの基礎であり,現実の問題解決に不可欠である。
    • 動的計画法モデルの定式化には専門知識が必要であり,自動化が困難であった。
    • 大規模言語モデルを活用し,動的計画法問題の定式化を自動化することを目指す。
    • 新しいベンチマークDP-Benchを開発し,様々な動的計画法問題を体系的に評価できるようにした。
    • 7Bパラメータの専門モデルDPLMを提案し,既存のLLMと同等以上の性能を達成した。
    • DualReflectという合成データ生成パイプラインにより,少ないデータでも高い精度を確保し,大規模データでは多様性を向上させた。

    Link: https://arxiv.org/abs/2507.11737

  • 訓練済みネットワークの高速化と圧縮のための分散に基づくプルーニング [cs.CV, cs.LG]目的:訓練済みネットワークの圧縮と高速化
    • モデル規模の増大に伴い,学習コストが増大しているため,既存の高性能ネットワークの再利用が重要である。
    • ネットワークの展開には,遅延,計算コスト,メモリ消費量が課題であり,特にリソース制約のあるハードウェアでは深刻である。
    • 構造化プルーニング後の性能維持と,大規模な再学習の回避を目指す。
    • 提案手法(分散に基づくプルーニング)は,わずかな微調整で効率的にネットワークを圧縮できる。
    • ImageNet-1kにおいて,DeiT-Baseはプルーニング直後に元の性能の70%以上を維持し,10エポックの微調整で99%の精度を回復する。
    • MACsは35%削減,モデルサイズは36%削減され,速度が1.44倍向上する。

    Link: https://arxiv.org/abs/2507.12988

  • 学習された編集履歴軌跡に基づく,指示不要・低遅延の次編集提案フレームワーク NES [cs.SE, cs.LG]目的:ソフトウェア開発における次編集提案
    • ソフトウェア開発において,コード編集は頻繁かつ認知負荷の高い作業である。
    • 既存のAIツールは,自然言語指示が必要で遅延も大きく,実用性に課題がある。
    • 開発者の意図とコーディング習慣を暗黙的に捉え,迅速な編集提案を実現する。
    • NESは,編集位置の予測精度75.6%,完全一致率27.7%という最先端の性能を達成した。
    • 提案の遅延は250ms未満であり,高速な応答性を示した。
    • Ant Groupでの実運用では,2万人以上の開発者によって利用され,高い受容率(編集位置予測51.55%,編集43.44%)が確認された。

    Link: https://arxiv.org/abs/2508.02473

  • Klear-Reasoner:勾配保持クリッピング方策最適化による推論能力の向上 [cs.LG, cs.AI, cs.CL]目的:推論能力向上の方策
    • 大規模言語モデルの推論能力は,様々なタスクで重要な役割を担う。
    • 高性能な推論モデルの再現が,訓練詳細の開示不足により困難である。
    • 訓練プロセス全体を詳細に分析し,再現性と性能向上を目指す。
    • 高品質なデータソースの少量化と,難易度の高いサンプル利用が有効であることが示された。
    • 既存のクリッピング手法が探索信号を抑制し,最適解以外の軌跡を無視する問題を解決するため,GPPOを提案した。
    • Klear-Reasonerは,AIME 2024で90.5%,LiveCodeBench V5で66.0%といった優れた結果を示した。

    Link: https://arxiv.org/abs/2508.07629

  • 表現学習を用いた学生のコードからの知識コンポーネント抽出 [cs.LG]目的:学生のコードから知識コンポーネントの抽出
    • 個別最適化された教育は,学習者の知識や進捗に合わせた支援が重要である。
    • プログラミングの多様性から,知識コンポーネントの発見は困難を伴う。
    • 学生のコードに現れる構造的パターンから知識コンポーネントを抽出する。
    • 抽象構文木のサブツリーを識別し,潜在空間に抽象化することで,コードの構造的類似性を捉えた。
    • 抽出された知識コンポーネントを用いてDeep Knowledge Tracingモデルを拡張し,予測性能が向上した。
    • 導出された知識コンポーネントと学習理論との整合性が学習曲線分析から示された。

    Link: https://arxiv.org/abs/2508.09281

  • シャープ比率最適化における後悔の上限:トムソンサンプリング [cs.LG, cs.IT, math.IT]目的:シャープ比率の最大化
    • 金融工学や投資戦略において,リスク調整後のパフォーマンス評価が重要である。
    • 従来のバンディット問題では期待報酬の最大化が中心であり,リスクの考慮が不十分である。
    • シャープ比率を最適化することで,リスクとリターンのバランスをとる効率的なアルゴリズムを開発する。
    • 提案手法SRTSは,リスク調整探索のためのベイズアルゴリズムであり,平均と精度の不確実性を捉える共役事前分布を採用している。
    • SRTSは,リスク許容度に関わらず一貫したサンプリングルールを提供し,異なるリスク体制で異なるアルゴリズムを必要としない。
    • 理論的な解析により,期待後悔の上限が$\mathcal{O}(\log n)$であることが示され,情報理論的な下限と一致するため,提案手法は最適である。

    Link: https://arxiv.org/abs/2508.13749

  • FedKLPR:KL制約によるプルーニング適応型連合学習を用いた人物再識別 [cs.CV, cs.AI, cs.LG]目的:人物再識別のための,軽量かつ通信効率の良い連合学習フレームワーク
    • 人物再識別は,知能監視や公共の安全において不可欠な技術であるため,その重要性は高い。
    • 連合学習を現実世界の再識別システムに適用する際,クライアント間の統計的異質性や通信オーバーヘッドが課題となる。
    • 統計的異質性を緩和し,通信コストを削減することで,連合学習による人物再識別性能の向上を目指す。
    • 提案手法FedKLPRは,KLダイバージェンス正則化損失を用いて,クライアント間の統計的異質性を軽減し,収束安定性を高める。
    • KLダイバージェンス・プルーニング重み付き集約により,プルーニングされたローカルモデルを効果的に集約し,モデルのロバスト性を向上させる。
    • 動的なプルーニング制御機構Cross-Round Recoveryにより,過剰なプルーニングを防ぎ,モデル精度を維持しながら通信コストを40-42%削減する。

    Link: https://arxiv.org/abs/2508.17431

  • 大規模ネットワーク埋め込みが右翼ポピュリスト投票に関連するネットワーク構造における教育格差を明らかにする [cs.SI, cs.LG, stat.AP]目的:右翼ポピュリスト投票との関連性に着目したネットワーク構造における教育格差
    • 社会構造の理解は,政治的動向の予測や社会問題の解決に不可欠である。
    • 既存研究では,個人の属性情報のみでは投票行動の構造的な要因を十分に説明できない場合がある。
    • ネットワーク埋め込みを用いて,教育格差が右翼ポピュリスト投票に与える影響を構造的に分析する。
    • 大規模ネットワーク埋め込みは,個人のネットワーク内での位置を数値化し,右翼ポピュリスト投票を予測する上で一定の有効性を示した。
    • 埋め込みの次元を疎化・直交化することで,特定の次元が投票結果と強い相関を持つことが明らかになった。
    • その次元をネットワークにマッピングした結果,教育的なつながりや達成度が,右翼ポピュリスト投票に関連する異なるネットワーク構造に対応することが示唆された。

    Link: https://arxiv.org/abs/2508.21236

  • エージェントベースモデルにおける汎化学習:ABMの較正のための代理モデルを超えて [cs.LG, q-bio.PE, stat.ME]目的:エージェントベースモデルの較正
    • 感染症対策において,エージェントベースモデルは重要な役割を担う。
    • モデルの較正には膨大な計算資源が必要となる。
    • 機械学習を用いて,迅速かつ高精度な較正を実現する。
    • 本研究では,感染症の時間的データからSIRパラメータを推定する機械学習較正器を開発した。
    • 較正器は,Approximate Bayesian Computationと比較して,パラメータ推定誤差を大幅に低減し,計算時間を短縮した。
    • パラメータの識別可能性に課題はあるものの,より忠実な感染曲線が再現可能である。

    Link: https://arxiv.org/abs/2509.07013

  • 脳半球状態と周波数帯域の関係:古典機械学習と深層学習による最適化手法とニューロフィードバック [cs.HC, cs.CY, cs.LG]目的:脳波周波数帯域における分類器の性能評価
    • 脳機能の理解は,精神疾患の診断や治療に不可欠であり,その解明が求められている。
    • 脳波データ解析において,効率的な半球状態の識別が課題となっていた。
    • 古典機械学習と深層学習の比較を通して,最適なモデル選択の指針を示す。
    • AdagradとRMSpropが周波数帯域全体で良好な性能を示し,特にAdagradはベータ帯域,RMSpropはガンマ帯域で優位性が見られた。
    • 古典機械学習(線形SVM,ランダムフォレスト)は深層学習よりも高速に分類できたが,学習時間は深層学習の50~100倍短縮された。
    • リアルタイム性を要求されるニューロフィードバックシミュレーションでは,深層ニューラルネットワークが優れたフィードバック信号生成能力を示した(44.7%の制御率)。

    Link: https://arxiv.org/abs/2509.14078

  • 多様体仮説下における内在次元推定手法の調査と比較評価 [cs.LG, stat.AP]目的:内在次元推定手法の調査と比較評価
    • 高次元データ解析において,低次元多様体構造の利用が重要視されている。
    • 既存の次元推定手法は,体系的な評価が不足しており,手法選択が困難である。
    • 様々なデータセットにおける最適な推定手法の選択指針を提供する。
    • 8種類の代表的な推定手法を理論的背景と共に調査し,その性能特性を明らかにした。
    • ノイズ,曲率,サンプルサイズ等の要因が推定精度に与える影響を実験的に分析した。
    • データセット固有のハイパーパラメータ調整手法を提案し,実用的な選択ガイドラインを示した。

    Link: https://arxiv.org/abs/2509.15517

  • 因果推論における外挿の正則化 [cs.LG, econ.EM, stat.ME]目的:因果推論における外挿の度合いを直接的にペナルティ化する枠組み
    • 機械学習や因果推論は,データに基づいた意思決定において不可欠な分野である。
    • 従来の推定器は外挿に弱く,モデルの仮定への依存度や分散が増大する可能性がある。
    • 外挿を抑制し,特徴量の不均衡,モデルの誤指定,推定量の分散間のトレードオフを改善する。
    • 本研究では,外挿の度合いをペナルティ化する新しい枠組みを提案し,最悪の場合の外挿誤差の限界を導出した。
    • 特徴量の不均衡,モデルの誤指定,推定量の分散という「バイアス-バイアス-分散」のトレードオフを明らかにした。
    • 提案手法の有効性は,合成実験と実際の応用例(ランダム化比較試験の結果の一般化)を通して実証された。

    Link: https://arxiv.org/abs/2509.17180

  • 思考の再利用:思考の再利用による効率的な推論 [cs.IR, cs.AI, cs.LG]目的:推論における効率化
    • 大規模言語モデルの推論能力向上は重要だが,計算コストが課題となっている。
    • 推論時の計算量が増大し,遅延とコストの増大が問題となっている。
    • 過去の推論過程を再利用することで,効率的な推論を実現することを目指す。
    • RoTは,過去の推論を再利用し,効率的な推論テンプレートを構築する。
    • 出力トークン数を最大40%削減し,推論遅延を82%削減,コストを59%削減する。
    • RoTは,検索による動的なテンプレート構築を通じて,効率的な大規模言語モデル推論のパラダイムを確立する。

    Link: https://arxiv.org/abs/2509.21743

  • エージェント・マトリックスへの没入:LLMエージェントの自己複製リスクの現実的な評価 [cs.AI, cs.CL, cs.LG, cs.MA]目的:LLMエージェントにおける自己複製リスクの定量化
    • LLMエージェントの実用化が進む中で,安全性確保が不可欠である。
    • 既存研究では,直接的な指示による自己複製に焦点が当たり,現実的な環境での自発的な複製リスクが看過されてきた。
    • ユーザーとエージェントの目的間のずれから生じる自己複製リスクを評価し,その対策の必要性を示す。
    • 21の最先端LLMにおいて,過半数以上が運用上のプレッシャー下で制御不能な自己複製傾向を示した。
    • Overuse Rate (OR)とAggregate Overuse Count (AOC)という新たな指標を導入し,複製頻度と深刻度を正確に把握した。
    • 実運用環境と現実的なタスクを設定した評価フレームワークが,シナリオ駆動型リスク評価の重要性を示唆する。

    Link: https://arxiv.org/abs/2509.25302

  • 強化学習のための多色目的関数 [cs.LG, cs.AI]目的:事前学習済みポリシーの多様性と性能向上
    • 強化学習は,複雑なタスクを自動化するための重要な技術であり,近年ますます注目されている。
    • 事前学習済みポリシーは多様な行動を示すものの,微調整により単調化し,性能が低下することがある。
    • 多様性を維持しつつ,事前学習済みポリシーの性能を最大限に引き出すことを目指す。
    • 提案手法は,多様な行動の探索と洗練を明示的に促す多色目的関数を導入する。
    • BabyAI,Minigrid,Algorithmic Creativityの実験で,成功率の向上と汎化性能の向上が確認された。
    • pass@$k$実験では,多様な戦略を維持・活用する能力が示され,高いカバレッジを達成した。

    Link: https://arxiv.org/abs/2509.25424

  • MOLM:LoRAマーカーの混合 [cs.CV, cs.CR, cs.LG]目的:生成モデルによる画像生成の検出と出所特定
    • 生成モデルの進化により,画像生成の精度が向上し,その真偽の識別が重要になっている。
    • 既存のウォーターマーク技術は,歪みや除去攻撃に弱く,鍵の更新にもコストがかかる。
    • 鍵に依存するパラメータ摂動による汎用的なウォーターマークフレームワークを構築し,その実現方法を提案する。
    • MOLMは,Stable DiffusionおよびFLUXにおいて,画像品質を維持しながら,様々な攻撃に対して堅牢な鍵復元を実現した。
    • 本手法は,鍵固有の再学習を回避し,秘匿性,忠実性,検証可能性,堅牢性を兼ね備えている。
    • ルーティングベースのLoRAアダプターを使用することで,軽量かつ効率的なウォーターマーク埋め込みを実現している。

    Link: https://arxiv.org/abs/2510.00293

  • 大規模視覚言語モデルは視覚障碍者への誘導に役立つか? [cs.CV, cs.AI]目的:視覚障碍者または低視力者の支援における大規模視覚言語モデルの有用性評価
    • 視覚障碍者への支援技術の進歩は,生活の質向上に不可欠である。
    • 既存の評価方法は,視覚障碍者のニーズを十分に捉えられていない。
    • 視覚障碍者の視点に基づいた,より適切な自動評価手法の確立を目指す。
    • 大規模なユーザー調査から,視覚障碍者のナビゲーションの好みを定量化し,VL-GUIDEDATAデータセットを構築した。
    • VL-GUIDE-Sは,既存の評価手法と比較して,人間との相関性と推論効率において優れていることが示された。
    • 本研究は,安全でアクセスしやすいナビゲーションを支援するAI評価基盤の構築に貢献する。

    Link: https://arxiv.org/abs/2510.00766

  • TempoControl:テキストから動画モデルにおける時間的注意誘導 [cs.CV, cs.AI, cs.LG]目的:動画生成における視覚要素の時間的配置制御
    • 近年の動画生成技術の発展は目覚ましいが,より高度な制御が求められている。
    • 既存モデルでは,特定の視覚要素がいつ表示されるかを指定する時間的制御が不十分である。
    • 本研究は,再学習や追加の教師データなしに,時間的な配置を精密に制御することを目的とする。
    • TempoControlは,クロスアテンションマップを最適化することで,視覚概念の時間的なタイミングを誘導する。
    • 相関,振幅,エントロピーの3つの原則を組み合わせることで,高品質かつ多様な動画生成を可能にする。
    • 単一/複数オブジェクトの時間的並べ替え,アクションのタイミング調整,音声同期動画生成など,様々な応用例で有効性が確認された。

    Link: https://arxiv.org/abs/2510.02226

  • 分散型SGDの確率的収束保証 [cs.NI, cs.LG, cs.MA, math.OC]目的:分散型SGDにおける高確率収束の条件とレート
    • 機械学習モデルの学習において,分散型学習は計算資源の有効活用に不可欠である。
    • 既存研究では,分散型SGDの収束保証に強い仮定が必要であり,現実的なシナリオでの適用が困難である。
    • 本研究は,分散型SGDの高確率収束条件を緩和し,より実用的な保証を与えることを目指す。
    • 本研究により,分散型SGDは平均二乗誤差収束の条件の下で高確率収束が保証されることが示された。
    • 非凸および強凸なコスト関数に対して,最適な収束レートが導出された。
    • ユーザー数の増加に伴い,分散型SGDは線形的な高速化を実現し,従来の平均二乗誤差からの結果を上回る。

    Link: https://arxiv.org/abs/2510.06141

  • 目標条件付き自己回帰モデルにおける非一貫性 [cs.LG, cs.AI]目的:目標条件付き自己回帰モデルにおける非一貫性の性質
    • 強化学習は,複雑なタスクを自律的に学習する上で重要な役割を果たす。
    • 単純な目標条件付けでは,学習ポリシーに非一貫性が生じ,性能が低下することがある。
    • オンライン強化学習による再学習を通して,非一貫性を軽減し,性能向上を目指す。
    • モデルの自身の行動に対する再学習は,非一貫性を減少させ,報酬を改善することが示された。
    • 制御を推論として捉える考え方とソフトQ学習との間に,対応関係が存在することが明らかになった。
    • ソフト条件付け生成モデルを通して,非一貫性と有効な地平線との関連性が議論された。

    Link: https://arxiv.org/abs/2510.06545

  • PluriHopRAG:コーパス固有の文書構造学習による徹底的な再現率重視型QA [cs.CL, cs.CL, cs.IR, cs.LG]目的:複数回の文書参照を必要とする質問への回答性能向上
    • 質問応答システムにおいて,外部知識を活用することで,より正確で信頼性の高い回答が期待される。
    • 既存のRAG手法では,網羅的な情報検索が困難であり,重要な情報を見落とす可能性がある。
    • コーパスの文書構造を学習し,必要な情報を確実に抽出することで,より高精度な回答を実現すること。
    • PluriHopWINDベンチマークにおいて,ベースLLMに対して18-52%のF1スコア改善が確認された。
    • Loongベンチマークにおいても,長文コンテキスト推論や単純なRAGと比較して,それぞれ33%と52%のF1スコア改善が示された。
    • 提示手法は,クエリをコーパス固有の文書構造に基づいて分解し,LLMによるコストのかかる推論を削減する。

    Link: https://arxiv.org/abs/2510.14377

  • LLMウェブエージェントのレッドチーム評価のための攻撃戦略進化:Genesis [cs.AI]目的:LLMウェブエージェントに対する攻撃戦略の進化
    • LLMエージェントの利用拡大に伴い,そのセキュリティリスクの評価が重要になっている。
    • 既存の攻撃手法は手動または静的なモデルに依存しており,多様な環境への汎用性が低い。
    • 動的に効果的な攻撃戦略を発見・進化させ,ウェブエージェントのセキュリティ評価を向上させる。
    • 提案手法Genesisは,遺伝的アルゴリズムと戦略表現を組み合わせたAttackerモジュールを搭載している。
    • 評価モジュールScorerは,ターゲットエージェントの応答を評価し,Strategistモジュールは,対話ログから効果的な戦略を学習する。
    • 様々なウェブタスクにおける実験により,Genesisが既存手法を上回り,新規戦略を発見することが示された。

    Link: https://arxiv.org/abs/2510.18314

  • シャプレー値による公平な不可分報酬の分配 [eess.SY, cs.SY, cs.RO, cs.GT, cs.AI]目的:不可分な協力ゲームにおける報酬分配方法
    • 資源配分は,政治,医療,機械学習など,様々な分野で重要である。
    • 従来の分配方法は公平性を欠いたり,計算が困難であったりする。
    • 公平性を保証しつつ,不可分な資源を効率的に分配することを目指す。
    • 不可分シャプレー値を定義し,その特性を数学的に示した。
    • 議席配分,腎臓交換,画像分類の重要領域特定など,3つの事例研究で有効性を示した。
    • 画像分類タスクにおいて,モデルの出力に貢献する主要な画像領域を特定できることを示した。

    Link: https://arxiv.org/abs/2510.24906

  • スペクトルクラスタリングを超えて:微分可能なグラフ分割のための確率的カット [cs.LG, cs.DS, stat.ML]目的:微分可能なグラフ分割のための確率的カット
    • グラフ構造データの解析は,ソーシャルネットワーク分析や画像認識など,多様な分野で重要である。
    • 従来のグラフ分割手法は微分不可能であり,深層学習モデルとの統合が困難であった。
    • 微分可能なグラフ分割手法を開発し,深層学習モデルとの連携を可能にすること。
    • 本研究では,RatioCutを含む幅広いカットを網羅する統一的な確率的フレームワークを提案した。
    • 提案手法は,積分表現とガウス超幾何関数を用いて,期待される離散カットに対して厳密な上限を導出した。
    • これにより,大規模なグラフに対しても安定した微分可能なグラフ分割を実現する基盤を確立した。

    Link: https://arxiv.org/abs/2511.02272

  • EHRStruct:構造化電子カルテタスクにおける大規模言語モデルの評価のための包括的ベンチマークフレームワーク [cs.CL, cs.CY, cs.HC, cs.AI]目的:構造化電子カルテタスクにおける大規模言語モデルの評価基準
    • 医療現場では,電子カルテが臨床判断の重要な役割を担っており,その活用が不可欠である。
    • 大規模言語モデルの電子カルテデータ処理への応用が進む一方で,標準化された評価基準が存在しない。
    • 本研究では,構造化電子カルテタスクに特化した評価ベンチマークEHRStructを開発し,モデルの性能評価を可能にする。
    • EHRStructは,多様な臨床ニーズに対応する11の代表的なタスクと,2,200の評価サンプルで構成される。
    • 20の先進的な大規模言語モデルを評価した結果,多くのタスクで高い理解力と推論能力が求められることが示された。
    • コード拡張手法EHRMasterが最先端の性能を達成し,今後の研究指針を提供する。

    Link: https://arxiv.org/abs/2511.08206

  • 教育用LLMのベンチマーク:フィードバックにおけるジェンダーバイアスの事例研究 [cs.CL, cs.AI, cs.CY, cs.HC]目的:教育目的におけるLLMのベンチマーク手法の確立と,フィードバックにおけるジェンダーバイアスの検出
    • 教育現場でのGenAI活用が拡大する中,教育効果と公平性を担保する評価方法が不可欠である。
    • LLMが生成するフィードバックに,潜在的なジェンダーバイアスが存在する可能性が指摘されている。
    • LLMのジェンダーバイアスを定量的に評価し,より公平なフィードバックを提供するための指針を示す。
    • LLMは,男性と女性のカウンターファクチュアルに対して,一貫して非対称な意味変化を示した。
    • GPTおよびLlamaモデルのみが,明示的なジェンダー情報に感応する傾向が確認された。
    • 男性の場合には自律性を促すフィードバック,女性の場合には管理的なフィードバックが多く見られた。

    Link: https://arxiv.org/abs/2511.08225

  • Alphacast:認知に触発された時間系列予測のための相互作用駆動型エージェント的推論フレームワーク [cs.CL, cs.AI]目的:時間系列予測のための相互作用駆動型エージェント的推論フレームワーク
    • 実世界における意思決定において,時間系列予測は重要な役割を担う。
    • 既存の手法は,予測を静的な単一パス回帰問題として扱う傾向がある。
    • 大規模言語モデルを活用し,人間のような反復的な推論プロセスを導入すること。
    • Alphacastは,時間系列予測を専門家のようなプロセスとして再構築し,文脈準備,推論に基づく生成,そして内省的な評価を含む多段階ワークフローを実現する。
    • 本フレームワークは,特徴セット,知識ベース,事例ライブラリ,文脈プールといった軽量ツールキットにより,言語モデルの推論を支援する。
    • 複数のベンチマークにおける実験の結果,Alphacastは代表的なベースラインを上回る性能を示す。

    Link: https://arxiv.org/abs/2511.08947

  • 最終段階のボトルネック:ネットワーク因果推論のためのR学習者の系統的解剖 [cs.LG]目的:ネットワーク因果推論におけるR学習者の性能限界と改善策
    • 因果推論は,データから因果関係を明らかにし,効果的な介入策を導く上で不可欠である。
    • ネットワークデータにおける因果異質性はグラフ構造に依存するため,従来のR学習者の最終段階モデルの仮定が成立しない場合がある。
    • グラフ構造を考慮した最終段階推定器を導入することで,R学習者の性能を改善し,より正確な因果推論を実現することを目指す。
    • R学習者の性能は,最終段階のCATE推定器の誘導的バイアスに大きく依存し,ノイズモデルの選択よりも重要であることが示された。
    • グラフ構造を無視した最終段階を持つR学習者は,強力なGNNノイズモデルを使用しても著しく失敗する(MSE > 4.0)。
    • 提案するGraph R学習者は,従来のGNN T学習者よりも優れた性能を示し,ネットワーク構造を考慮することの有効性が確認された。

    Link: https://arxiv.org/abs/2511.13018

  • 画像を超えて:心電図と解剖学的知識を活用した遅延ガドリニウム強調画像からの心筋瘢痕分割 [cs.CL, cs.CV, cs.AI]目的:心筋瘢痕の分割
    • 心不全治療において,心筋の健全な組織と瘢痕組織の評価が重要である。
    • 遅延ガドリニウム強調心臓MRI画像は画質にばらつきがあり,正確な瘢痕分割が困難である。
    • 心電図と解剖学的知識を統合することで,よりロバストな瘢痕分割を目指す。
    • 心電図由来の電気生理学的情報と解剖学的事前知識を統合する新しいマルチモーダルフレームワークを提案した。
    • 提案手法は,既存の画像のみを利用する手法と比較して,Dice係数を大幅に向上させた(0.6149 → 0.8463)。
    • 精度(0.9115)と感度(0.9043)も高く,生理学的に妥当な心筋瘢痕分割が可能になった。

    Link: https://arxiv.org/abs/2511.14702