arXiv雑要約

AI - 2026/05/04 公開

  • SynQuE:アノテーションなしでの合成データセット品質推定 [cs.LG]目的:合成データセットの品質評価手法
    • データ収集コストやプライバシー制約から実データが不足するケースが増加している。
    • 高品質な合成データセットの選択基準が確立されておらず,効率的な活用が困難である。
    • 実データが少ない状況下で,合成データセットの品質を効率的に評価し選択すること。
    • SynQuEプロキシは,感情分析,Text2SQL,Webナビゲーション,画像分類など,多様なタスクにおいて実タスク性能と相関性があることが示された。
    • 特に複雑なタスクにおいては,大規模言語モデルの推論を活用したLENSが他のプロキシを上回り,微妙な特性を捉えることが可能となった。
    • Text-to-SQL解析において,SynQuEプロキシで選択された上位3つの合成データセットで学習した場合,精度が平均8.1%向上した。

    Link: https://arxiv.org/abs/2511.03928

  • 統合ヘルスケアスケジューリング競技会2024に対するハイブリッド解法アプローチ [cs.AI, math.OC]目的:統合ヘルスケアスケジューリング問題に対する解法
    • 医療現場の効率化が求められる中,人員配置や時間割の最適化は重要課題である。
    • 複雑な制約条件が存在し,現実的な時間内で最適な解を得ることが困難である。
    • 混合整数計画法,制約プログラミング,焼きなまし法を組み合わせることで,より高品質な解を迅速に得ることを目指す。
    • 本研究では,チームTwenteが提出した解法アプローチが,最終決勝で3位にランクインしたことを報告する。
    • ベンチマークインスタンスに対する最適解の下限値を初めて提示し,解法の有効性を示した。
    • 制約条件やアルゴリズムの特定部分を分析し,さらなる改善に向けた課題と将来の研究方向性を示唆する。

    Link: https://arxiv.org/abs/2511.04685

  • 蒸留による高速化を用いた多目的RTAインターセプションにおける不確実性モデリング [cs.LG, cs.GT]目的:リアルタイムオークションにおける無効または不適切なトラフィックのフィルタリング
    • オンライン広告の品質向上は,広告プラットフォームの信頼性と収益性に不可欠である。
    • トラフィック品質の推定精度とモデルの予測に対する確信度の両立が課題である。
    • 不確実性モデリングの計算コストを削減しつつ,予測精度と信頼性を維持すること。
    • 提案手法UMDAは,トラフィック品質予測と信頼性の高い確信度推定を同時に実現する。
    • 知識蒸留をUMDAに適用することで,計算コストを大幅に削減しつつ,予測精度を維持した。
    • 実験結果から,UMDAはダウンストリームタスクにおいて有効なサンプルを提供し,蒸留モデルは推論速度を10倍に向上させた。

    Link: https://arxiv.org/abs/2511.05582

  • 構造があまり役に立たない:LLMは期待ほどテキスト属性グラフを効果的に読解しない [eess.SY, cs.SY, cs.LG]目的:テキスト属性グラフにおけるLLMの性能へのグラフ構造の符号化戦略の影響
    • グラフ構造は,分子モデリングや引用ネットワークなど多様な分野でセマンティックな内容と関係性を表現するのに適している。
    • 従来のグラフ学習パラダイムでは,構造がLLMベースのグラフ推論に不可欠であると考えられてきた。
    • LLMベースのグラフ推論において,構造の有用性を体系的に検証し,新たなアプローチの可能性を探る。
    • LLMはノードのテキスト記述のみでも高い性能を発揮し,構造情報の明示的な組み込みは改善に繋がらない場合が多い。
    • 構造に関する事前知識は,強力な言語モデルを使用する場合には不必要,あるいは逆効果になる可能性がある。
    • この結果は,グラフ学習における構造の表現と利用方法を再考する必要性を示唆している。

    Link: https://arxiv.org/abs/2511.16767

  • 6Gに向けたLLMベースのエージェント的交渉:不確実性の軽視とテールイベントリスクへの対処 [cs.NI, cs.AI, cs.MA]目的:6Gネットワークスライシングにおける堅牢なリソース割り当て
    • 次世代6Gネットワークでは,自律的なエージェントによるネットワーク管理が重要となる。
    • LLMを搭載したエージェントは,極端な事象のリスクを無視しがちである。
    • エージェントの交渉において,テールリスクを考慮したリスクアウェアな枠組みを確立する。
    • 従来の平均値に基づく手法では,厳格なURLLC SLAを頻繁に違反する問題が明らかになった。
    • 提案手法では,CVaRを用いてテールリスクを考慮することで,SLA違反を完全に解消し,99.999パーセンタイル遅延を最大51.7%削減した。
    • 信頼性の向上は,エネルギー効率の低下という合理的なトレードオフによって実現される。

    Link: https://arxiv.org/abs/2511.19175

  • 法的問題ツリー評価基準を用いた法的推論経路の評価 [cs.AI, cs.CL]目的:法的推論経路の評価方法
    • 専門分野におけるLLMの信頼性向上は重要である。特に,法的判断は社会生活に深く関わるため重要性が高い。
    • 法的推論の複雑さから,LLMが生成した推論経路の質を評価することが困難である。
    • 法的問題ツリーを用いて,法的推論経路の網羅性と正確性を評価することで,その質の向上を目指す。
    • 本研究で作成したデータセットLEGITを用いて,LLMの法的推論能力が,問題の網羅性と正確性の双方に大きく影響されることが示された。
    • 検索拡張生成(RAG)と評価基準を用いた強化学習(RL)は,法的推論能力の向上に相補的な効果をもたらすことが確認された。
    • RAGは推論能力全体を向上させ,RLは正確性を向上させるものの,網羅性は低下する傾向が見られた。

    Link: https://arxiv.org/abs/2512.01020

  • 明示的な保守性を伴わない長期的モデルベースオフライン強化学習 [cs.LG]目的:オフライン強化学習における長期的行動計画の最適化
    • 強化学習は,ロボット制御やゲームなど,様々な分野で活用が期待されているため重要である。
    • オフライン強化学習では,収集されたデータのみで学習するため,未知の状態に対する汎化が課題となる。
    • データ品質が低い場合でも,保守性を必要とせずに長期的計画を立てられる手法を開発すること。
    • 本研究では,ベイズ的アプローチを用いることで,明示的な保守性を伴わずに長期的オフライン強化学習を実現した。
    • 提案手法NEUBAYは,D4RLおよびNeoRLベンチマークにおいて,最先端の性能を示す保守的なアルゴリズムと競合し,7つのデータセットで新たな最高性能を達成した。
    • データセットの品質とカバレッジに基づいて,NEUBAYが保守的な手法よりも優位な状況を特定した。

    Link: https://arxiv.org/abs/2512.04341

  • TimesNet-Gen:深層学習に基づくサイト固有の強震動生成 [cs.LG, cs.AI]目的:サイト固有の強震動生成
    • 地震リスク軽減には正確な評価が不可欠であり,地盤の影響を考慮する必要がある。
    • 既存手法では,サイト固有の条件を正確に反映することが困難である。
    • 地盤条件に応じた強震動を高精度に生成し,リスク評価の精度向上を目指す。
    • TimesNet-Genは,Dirichletに基づいた潜在空間リサンプリングにより,サイト固有の強震動を直接生成する。
    • AFADデータセットで事前学習されたモデルは,NGA-West2の記録をファインチューニングなしに生成する能力を示し,高い汎化性能を発揮する。
    • log-HVSR空間での分布比較や,PGAと基本サイト周波数の同時解析により,モデルの有効性が確認された。

    Link: https://arxiv.org/abs/2512.04694

  • 断層撮影画像に対する新規パッチベースTDAアプローチ [cs.CV, cs.LG]目的:断層撮影画像における特徴抽出手法の開発
    • 診断,病期分類,予後予測において画像解析の重要性が高まっている
    • 既存手法では,高解像度画像での計算コストと性能が課題となっていた
    • 計算効率と性能を向上させる新たな特徴抽出手法の確立を目指す
    • 提案手法は,従来のcubical complex法やラディオミクスと比較して,分類性能と計算時間の双方で優位性を示した。
    • 精度,AUC,感度,特異度,F1スコアにおいて,平均7.2%,3.6%,2.7%,8.0%,7.2%の改善が見られた。
    • 提案手法の利用を促進するため,Pythonパッケージ「Patch-TDA」を公開した。

    Link: https://arxiv.org/abs/2512.12108

  • 休止ニューロン,活発な洞察:大規模言語モデルの活性スパース性を強化する [cs.LG]目的:大規模言語モデルにおける活性スパース性のロバスト性の向上
    • 大規模言語モデルの推論速度向上は重要課題であり,活性スパース性はその有望な手法の一つである。
    • 既存の活性スパース性手法は,高いスパース性で精度が大幅に低下するという課題がある。
    • 入力依存的な活性の学習された表現の不安定性を解消し,活性スパース性を安定化させる。
    • SPONは,事前学習中に学習された隠れ状態の分布シフトを抑制し,表現の安定性を回復する。
    • SPONは複数のLLMバックボーンにおいて,性能回復,潜在表現の安定化,汎化性能の維持を安定的に実現した。
    • SPONは,信頼性の高い活性スパース推論のための効果的かつ原理的な解決策である。

    Link: https://arxiv.org/abs/2512.12744

  • 深層演算ネットワークを用いた炭素/エポキシ複合材料の製造過程変形確率的予測 [cs.CE, cond-mat.mtrl-sci, cs.LG]目的:炭素/エポキシ複合材料の製造過程変形予測モデルの開発
    • 複合材料の軽量化・高強度化が進む一方,製造過程での変形予測は品質管理・コスト削減に不可欠である。
    • 熱膨張率の不一致や硬化収縮により残留応力が発生し,変形予測を困難にしている。
    • 深層演算ネットワークを用いて,高精度な変形予測と最適な硬化プロセスの最適化を目指す。
    • 物理ベースモデルによるシミュレーションと実験データに基づき,DeepONetを学習させることで,製造過程変形の予測精度を向上させた。
    • 初期硬化度などのパラメータを考慮したFiLM DeepONetは,硬化度,粘度,変形の時間変化を予測可能にした。
    • 実験データが限られている状況下で,転移学習とアンサンブルカルマン反転を組み合わせることで,不確実性の定量化と硬化プロセスの最適化を実現した。

    Link: https://arxiv.org/abs/2512.13746

  • NRGPT:GPTに対するエネルギーベースの代替案 [cs.LG]目的:GPTとエネルギーベースモデルの統合
    • 言語モデリングは自然言語処理の基盤であり,その性能向上は重要である。
    • GPTは強力だが,エネルギーベースモデルとの統合が課題であった。
    • GPTとエネルギーベースモデルを統一し,新しい推論方法を模索する。
    • 提案手法NRGPTは,GPT設定に最小限の変更を加えエネルギーベースモデルの枠組みと統合した。
    • NRGPTの推論過程は,エネルギーランドスケープ上でのトークン探索として捉えられる。
    • ShakespeareデータセットやListOPSタスク,OpenWebText言語モデリングにおいて良好な性能を示し,過学習に強い可能性が示唆された。

    Link: https://arxiv.org/abs/2512.16762

  • 地震波場の共通タスクフレームワーク [cs.LG]目的:地震波場の機械学習のための共通タスクフレームワーク
    • 地震学は,地震早期警報や地震動予測など,社会にとって重要な課題に取り組む学問分野である。
    • 地震波場のシミュレーションは大規模であり,現実の地球の複雑さを反映したモデル構築が困難である。
    • 機械学習の公平な評価と厳密な比較を可能にし,地震学における機械学習の進歩を加速させる。
    • 本研究で提案する共通タスクフレームワークは,様々な規模のデータセットとタスク固有の評価指標を備えている。
    • 実験結果は,フレームワークがアルゴリズムの強みと限界を明らかにし,特定の課題への適合性を判断するのに役立つことを示している。
    • 将来的には,隠れたテストセットを用いた標準化された評価を通じて,科学的な機械学習における厳密性と再現性を向上させることを目指す。

    Link: https://arxiv.org/abs/2512.19927

  • 議論強化擬似ラベリングと頻度認識プログレッシブ・デバイシング: スクリブル注釈を用いた弱学習カモフラージュ物体検出 [cs.CV, cs.AI]目的:弱学習カモフラージュ物体検出における物体位置特定とセグメンテーション
    • 周囲の環境に隠蔽された物体の検出は,セキュリティや監視システム等で重要である。
    • スクリブル注釈のみでは,汎用セグメンテーションモデルの性能限界や注釈バイアスにより精度が低い。
    • 擬似ラベリングの精度向上と,スクリブルバイアスの軽減による性能改善を目指す。
    • 提案手法${D}^{3}$ETORは,議論強化擬似ラベリングによりSAMの性能を向上させ,高精度な擬似マスクを生成する。
    • FADeNetは,多レベルの頻度認識特徴を融合し,スクリブルバイアスを軽減することで,全体的な構造の把握を可能にする。
    • 実験結果から,弱学習と完全学習の性能差が縮小し,複数のベンチマークで最先端の性能を達成した。

    Link: https://arxiv.org/abs/2512.20260

  • 訓練済み拡散モデルにおける崩壊からの回復のためのノイズ最適化:遅すぎることはない [cs.CV, cs.LG]目的:訓練済み拡散モデルにおけるモード崩壊の緩和と多様性の向上
    • 近年のテキストから画像生成モデルの発展は目覚ましいが,生成画像の多様性に課題が残る。
    • 同じプロンプトに対して,生成される画像が類似しやすく,モード崩壊が起こりやすいという問題がある。
    • ノイズ最適化を通じて,モデルの忠実性を維持しつつ,生成画像の多様性を高めることを目指す。
    • 単純なノイズ最適化目標が,モード崩壊を軽減し,ベースモデルの品質を維持することが示された。
    • ノイズの周波数特性の分析から,異なる周波数プロファイルを持つ初期化が最適化と探索を改善する可能性が示唆された。
    • ノイズ最適化は,生成品質と多様性の両方の点で,既存手法を上回る結果が得られた。

    Link: https://arxiv.org/abs/2601.00090

  • 高次元測定空間における品質多様性最適化のための割引モデル探索 [cs.RO, cs.LG, cs.NE]目的:品質多様性最適化における割引モデル探索
    • 複雑な問題に対し,多様な最適解群を同時に探索する手法として重要性が増している。
    • 高次元の測定空間では,解が類似した測定値に収束し,探索が停滞しやすい。
    • 高次元測定空間において,解の識別能を高め,探索を継続させることを目指す。
    • 提案手法DMSは,割引値を滑らかに表現するモデルを用いることで,高次元測定空間での解の識別を可能にした。
    • 画像のような高次元データを用いた新しいドメインで,DMSは品質多様性最適化の新たな可能性を示した。
    • 実験結果から,DMSは既存手法CMA-MAEや他のブラックボックス品質多様性最適化アルゴリズムを上回る性能を発揮することが示された。

    Link: https://arxiv.org/abs/2601.01082

  • 画像品質評価のアルゴリズム的視線:LAION-Aesthetics Predictor の監査とトレーシング・エスノグラフィー [cs.CL, eess.SY, cs.SY, math.SP, cs.CL, cs.CL, cs.HC, cs.AI, cs.CV]目的:LAION-Aesthetics Predictor の評価基準の解明
    • 視覚生成AIの発展において,画像品質の客観的評価が不可欠である。
    • 「美的」の基準は主観的であり,文化的な価値観に依存するため,AIモデルに内在する偏りが懸念される。
    • LAION-Aesthetics Predictorに存在するバイアスを特定し,その影響を明らかにすること。
    • LAION-Aesthetics Datasetにおいて,女性に関する記述を持つ画像が優先的に選択され,男性やLGBTQ+に関する記述を持つ画像が除外される傾向が見られた。
    • 芸術作品のデータセット分析の結果,西洋および日本の風景,都市景観,肖像画が最も高い評価を得た。
    • LAPの開発過程におけるデータ収集が,英語圏の写真家やAI愛好家に偏っていることが示唆された。

    Link: https://arxiv.org/abs/2601.09896

  • 推論ステップ数の増加が露呈する弱点:大規模言語モデルにおけるステップ数汎化の解明と改善 [cs.CY, cs.HC, cs.CL, cs.LG]目的:大規模言語モデルにおける推論ステップ数汎化の弱点解明と改善
    • 複雑な問題を解決する上で,大規模言語モデルの推論能力は不可欠である。
    • 推論ステップ数が訓練データより増加すると,性能が著しく低下する問題がある。
    • 推論ステップ数汎化におけるエラー原因を特定し,性能向上を目指す。
    • エラーが特定のトークン位置に集中しており,均一に分布していないことが示された。
    • エラーの原因は,誤った推論経路を増幅し,正しい経路を抑制する誤った処理ヘッド(ep heads)の内部競合メカニズムにある。
    • 推論時にep headsを動的に特定・無効化するtest-time correctionは,ステップ数汎化性能を向上させる。

    Link: https://arxiv.org/abs/2601.21214

  • E-mem:LLMエージェントメモリのためのマルチエージェントベースのエピソード的文脈再構築 [cs.AI]目的:LLMエージェントの長期的な論理的整合性を維持するための文脈再構築
    • LLMエージェントのSystem 2思考は,精密な問題解決に不可欠であり,高度な認知能力が求められる。
    • 既存のメモリ前処理法は,文脈を破壊的にデコンテキスト化し,深い推論を阻害する。
    • エピソード的文脈を再構築することで,LLMエージェントの論理的整合性と推論能力を向上させる。
    • E-memは,従来のメモリ前処理とは異なり,文脈を圧縮せずに保持するマルチエージェントシステムを導入した。
    • LoCoMoベンチマークにおいて,E-memは最先端のGAMを7.75%上回り,F1スコアで54%を超える性能を示した。
    • E-memは,トークンコストを70%以上削減することで,効率的なメモリ管理を実現した。

    Link: https://arxiv.org/abs/2601.21714

  • モデルのマージ可能性の解明:モデルマージ成功を予測するための解釈可能な特性 [cs.LG]目的:モデルマージ成功を予測するための特性
    • モデルの知識を組み合わせるモデルマージは,効率的な学習方法として重要性が増している。
    • モデルマージの成功要因は不明確であり,その予測は困難である。
    • モデルマージの成功を予測するための解釈可能な指標を特定し,マージ戦略の改善に貢献する。
    • モデルのマージ可能性は,マージ方法とタスクに依存することが示された。
    • 勾配のL2距離などのペアワイズ指標を用いたL1正則化線形最適化により,マージ後の精度と相関する特性が明らかになった。
    • 特にTIESなどの手法では,他の手法とは異なる独自の特性が見られ,勾配アライメントが最も重要な指標として一貫して浮かび上がった。

    Link: https://arxiv.org/abs/2601.22285

  • 混合型特徴を持つ異種表形式データのためのカスケードフローマッチング [cs.LG, stat.ML]目的:異種表形式データにおける混合型特徴の生成
    • 表形式データの生成モデルは,プライバシー保護やデータ拡張に貢献し,応用範囲が広い。
    • 離散値と連続値を組み合わせた混合型特徴の生成は,既存手法では困難であった。
    • 低解像度表現を介して高解像度生成を誘導し,混合型特徴のより忠実な生成を目指す。
    • 提案手法は,既存モデルよりも現実的なサンプルを生成し,分布の細部をより正確に捉えることが示された。
    • 特に,検出スコアが51.9%改善されたことは,生成されたデータの品質向上を示している。
    • カスケード構造が輸送コストの上界を厳しくすることの理論的証明も得られた。

    Link: https://arxiv.org/abs/2601.22816

  • 学術医療センターにおけるLLMの導入と活用 [cs.CY, cs.AI]目的:大規模言語モデル(LLM)の学術医療センターにおける導入と活用状況
    • 医療現場では,LLMによる臨床文書作成支援のニーズが高まっている。業務効率化が期待される。
    • 既存のLLMツールは,手動でのデータ入力に手間がかかり,ワークフローへの組み込みが困難である。
    • 患者の長期間にわたる診療記録を活用し,LLMの利用を制度化することで,医療の質向上を目指す。
    • 独自システムChatEHRを開発し,LLMを電子カルテと連携させることで,多様な臨床タスクへの応用を可能にした。
    • 1.5年間で7つの自動化機能を構築し,1075人のユーザーがUIの利用トレーニングを修了,最初の3ヶ月で23,000セッションが実施された。
    • LLM活用によるコスト削減,時間短縮,収益増加の試算額は年間600万ドルに達し,新たな価値評価フレームワークの必要性が示された。

    Link: https://arxiv.org/abs/2602.00074

  • 小規模言語モデルは文脈要約された複数回の顧客サービスQAに対応できるか?合成データを用いた比較評価 [cs.CL, cs.AI]目的:文脈要約された複数回の顧客サービスQAにおける小規模言語モデルの性能評価
    • 顧客サービスにおける会話理解の重要性が増しており,効率的なQAシステムの開発が求められている。
    • 大規模言語モデルは高性能だが,計算コストが高く,リソースの限られた環境での利用が課題となっている。
    • 小規模言語モデルの性能を評価し,実用的な顧客サービスQAシステムへの応用可能性を探る。
    • 一部の小規模言語モデルは,大規模言語モデルに匹敵する性能を示すことが確認された。
    • 対話の継続性や文脈の一貫性を維持することが,小規模言語モデルの課題として明らかになった。
    • 本研究は,現実の顧客サービスQAシステムにおける小規模言語モデルの潜在能力と限界を浮き彫りにした。

    Link: https://arxiv.org/abs/2602.00665

  • あるヘッド,不確かなテール:ファインチューニングされたMoEにおけるテスト時スケーリングのための専門家サンプリング [cs.LG]目的:テスト時スケーリングにおける多様性と安定性のトレードオフの緩和
    • 大規模言語モデルの性能向上は,常に重要な研究課題である。
    • テスト時サンプリングでは,多様性と安定性のバランスを取ることが難しい。
    • MoEのルーティング空間を活用し,多様性を確保しつつ安定性を維持すること。
    • ファインチューニングされたMoEルーティングは,高確信度の専門家群と低確信度の候補群を示すパターンを持つことが明らかになった。
    • 提案手法Expert-Sampleは,確信度の高い選択を維持しつつ,不確かなテールに制御された確率的要素を導入することで,多様な生成を実現する。
    • 数式,知識推論,コードのタスクにおいて,pass@nと検証ベースの精度が改善された。Qwen3-30B-A3B-Instructを用いた実験では,pass@32が85.4%から91.9%に向上した。

    Link: https://arxiv.org/abs/2602.02443

  • トークン疎注意:インターリーブされたトークン選択による効率的な長文脈推論 [cs.CL, cs.CL, cs.LG]目的:長文脈推論における注意機構の効率化
    • 大規模言語モデルの性能向上には,長文脈を効率的に処理する技術が不可欠である。
    • 従来の注意機構は計算量が膨大であり,長文脈の処理におけるボトルネックとなっている。
    • 動的なトークンレベルの疎化により,計算量を削減しつつ精度を維持することを試みる。
    • 提案手法「トークン疎注意」は,注意機構においてトークン集合を削減し,計算量を大幅に削減できる。
    • 128K文脈長において,精度劣化を1%未満に抑えつつ,最大3.23倍の注意速度向上を達成した。
    • 本研究は,動的かつインターリーブされたトークンレベル疎化が,スケーラブルな長文脈推論に有効であることを示す。

    Link: https://arxiv.org/abs/2602.03216

  • 大規模言語モデルに対するGCG敵対的攻撃におけるトークン位置 [cs.LG]目的:大規模言語モデルの敵対的攻撃におけるトークン位置の影響
    • 大規模言語モデルの普及に伴い,安全性確保の重要性が増している。
    • 敵対的プロンプトによる脱獄攻撃は,安全性確保の大きな課題である。
    • 敵対的トークンの位置が攻撃成功率に与える影響を明らかにすること。
    • 従来の接尾辞ベースの攻撃に加え,接頭辞の最適化も攻撃成功率に影響することが示された。
    • 敵対的トークンの位置を変化させることで,攻撃成功率が大きく変動することが確認された。
    • 現在の安全性評価には,トークン位置の考慮が不可欠であることが示唆された。

    Link: https://arxiv.org/abs/2602.03265

  • 言語モデルは文脈内で学習した表現の活用に苦戦する [cs.SI, physics.soc-ph, cs.CL, cs.AI]目的:文脈内学習表現の活用可能性に関する調査
    • AI研究の発展には,状況変化に対応できるシステムの実現が不可欠である。
    • 既存の言語モデルは,文脈内学習によって獲得した表現をタスクに活かすことが難しい。
    • 文脈内で定義された新しい意味を,柔軟に活用できるモデルの開発を目指す。
    • オープンソースの言語モデルにおいて,文脈内学習表現を次のトークン予測に活用する能力は限定的であることが示された。
    • 適応的ワールドモデリングタスクにおいて,最先端の言語モデルでさえ,文脈内で提示されたパターンを確実に活用できないことが確認された。
    • 文脈内情報の符号化だけでなく,その柔軟な展開を支援する新しい手法の開発が求められる。

    Link: https://arxiv.org/abs/2602.04212

  • VecSet-Edit:単一画像からのメッシュ編集に事前学習済みLRMを活用する [cs.CV, cs.AI]目的:単一画像からの3Dメッシュ編集パイプライン
    • 3D資産に対する柔軟な制御が求められるため,3D編集技術は重要な研究分野となっている。
    • 既存手法は主に3D Gaussian Splattingやマルチビュー画像に依存しており,直接的な3Dメッシュ編集は未開拓である。
    • 高精度なVecSet LRMを基盤とし,2D画像のみからターゲット領域を正確に特定し,幾何学的異常を除去する。
    • 提案手法VecSet-Editは,VecSetトークンの空間的特性を分析し,トークン部分集合が特定の幾何学的領域を制御することを発見した。
    • Mask-guided Token SeedingとAttention-aligned Token Gatingにより,2D画像に基づいてターゲット領域を精密に局所化する。
    • Drift-aware Token PruningとDetail-preserving Texture Bakingにより,幾何学的詳細とテクスチャ情報を維持したメッシュ編集を実現した。

    Link: https://arxiv.org/abs/2602.04349

  • BadSNN:アドバーサリアルスパイクニューロンによるスパイクニューラルネットワークへのバックドア攻撃 [cs.CR, cs.AI]目的:スパイクニューラルネットワークに対するバックドア攻撃手法
    • スパイクニューラルネットワークは低消費電力で生物学的に妥当性があり,次世代のAIとして期待されている。
    • 既存のニューラルネットワークと同様に,スパイクニューラルネットワークもバックドア攻撃に対して脆弱である可能性がある。
    • スパイクニューロンのハイパーパラメータ変動を利用し,より効果的なバックドア攻撃手法を開発すること。
    • 本研究では,スパイクニューロンのハイパーパラメータを悪用する新たなバックドア攻撃手法BadSNNを提案した。
    • BadSNNは,多様なデータセットとアーキテクチャにおいて,既存の手法よりも高い攻撃性能を示した。
    • また,提案手法はバックドア攻撃の緩和策に対しても頑健であることが示された。

    Link: https://arxiv.org/abs/2602.07200

  • リーマン平均流 [cs.LG]目的:リーマン多様体上での生成モデリングにおける高速なサンプリング手法
    • 生成モデリングは,タンパク質構造やDNA配列設計など,科学分野での応用が拡大している。
    • 既存手法は推論時に多数のニューラルネットワーク評価が必要で,計算コストが課題となっていた。
    • 本研究は,少ない計算量で高品質なサンプルを生成できる新しいフレームワークを提案する。
    • 提案手法Riemannian MeanFlow(RMF)は,従来のRIemann多様体上での拡散モデルと同等のサンプル品質を,より少ない関数評価回数で実現した。
    • RMFは,多様体平均速度の3つの同等な表現を導出し,高次元多様体上での学習を安定化させる手法を開発した。
    • 少数ステップのフローマップを用いることで,報酬予測による効率的な設計が可能になった。

    Link: https://arxiv.org/abs/2602.07744

  • 高等教育における生成型ソーシャルロボットのための知識に基づいた設計要件 [cs.HC, cs.AI]目的:高等教育における生成型ソーシャルロボットの責任ある効果的な機能に必要な情報
    • 教育現場におけるロボット活用は,個別最適化された学習支援の可能性を秘めている。
    • 生成AIの利用に伴い,誤情報,過度な依存,プライバシー侵害等のリスクが懸念されている。
    • 生成型ソーシャルロボットが安全かつ効果的に機能するための知識要件を明確にすること。
    • 学生・教員へのインタビューから,12の設計要件が導き出された。
    • それらは,自己知識,ユーザ知識,文脈知識の3つの知識タイプに分類された。
    • 本研究は,生成AIの能力を教育的・倫理的期待に合致させるための構造的な基盤を提供する。

    Link: https://arxiv.org/abs/2602.12873

  • WildfireVLM:衛星画像を用いた早期の森林火災検知とリスク評価のためのAI活用 [cs.CV, cs.AI]目的:森林火災の早期検知とリスク評価
    • 気候変動や人為的な活動により森林火災の頻度と規模が増大しており,生態系,人命,インフラへの脅威が高まっている。
    • 衛星画像を用いた監視は,微弱な煙の検出,気象条件の変化,広範囲なリアルタイム分析の必要性から課題が多い。
    • 衛星画像と言語駆動型リスク評価を組み合わせることで,スケーラブルな森林火災監視システムを構築し,防災管理を支援する。
    • WildfireVLMは,Landsat-8/9やGOES-16等の衛星画像を用いて,YOLOv12による火災地域と煙の検知を実現した。
    • 検出結果を多種多様な大規模言語モデル(MLLM)に変換することで,文脈に応じたリスク評価と優先順位付けされた対応策を生成した。
    • LLM-as-judge評価により,リスク評価の質を検証し,リアルタイム処理,視覚的なリスクダッシュボード,長期的な森林火災追跡を可能にするシステムを構築した。

    Link: https://arxiv.org/abs/2602.13305

  • 多段階推論における量子化の罠:線形スケーリング則の打破 [cs.AI]目的:多段階推論における量子化が線形スケーリング則を破る現象の解明
    • AIの発展には計算効率とエネルギー効率の向上が不可欠であり,スケーリング則はその指針となる。
    • 低ビット化は効率化に寄与するとされるが,実際には精度低下やエネルギー消費増加を引き起こす場合がある。
    • モデルサイズ,バッチサイズ,ハードウェア構成に応じて,量子化がスケーリング則を破る状況を予測する。
    • 量子化(16ビットから8/4ビットへの削減)は,推論精度を低下させながら,エネルギー消費を増加させる「量子化の罠」を引き起こすことが示された。
    • この現象は,ハードウェアのキャストオーバーヘッドと,逐次的な推論チェーンにおける量子化解除カーネルの隠れた遅延コストが原因であることが理論的に解明された。
    • モデルサイズ,バッチサイズ,ハードウェア構成に基づいて,この罠が解消または深刻化する臨界モデル規模が特定された。

    Link: https://arxiv.org/abs/2602.13595

  • HyMem:動的検索スケジューリングを備えたハイブリッドメモリアーキテクチャ [cs.AI]目的:長文対話における効率的なメモリ管理
    • 大規模言語モデルの応用範囲拡大には,長文の文脈を効率的に処理する能力が不可欠である。
    • 既存手法は,効率性と有効性のトレードオフに陥り,複雑な推論に必要な情報を損失したり,計算コストが増大したりする。
    • 柔軟かつ積極的なメモリスケジューリング能力を実現し,多様な問題に対応できるメモリアーキテクチャを提案する。
    • HyMemは,マルチグラニュラーメモリ表現による動的オンデマンドスケジューリングを実現するハイブリッドメモリアーキテクチャである。
    • LOCOMOおよびLongMemEvalベンチマークにおいて,HyMemは,コンテキスト全体を使用する場合と比較して同等以上の性能を発揮しつつ,計算コストを92.6%削減した。
    • HyMemは,長期的メモリ管理における効率と性能のバランスにおいて,最先端の結果を達成した。

    Link: https://arxiv.org/abs/2602.13933

  • 一つの良い情報源だけで十分:異質なノイズ下におけるバンディット問題に対するほぼ最適な後悔 [cs.LG]目的:異質なノイズを持つ複数の情報源下でのバンディット問題における後悔最小化
    • バンディット問題は,意思決定における探索と活用のトレードオフを扱う重要な問題である。
    • 現実世界のデータには,ノイズの分散が異なる複数の情報源が含まれる場合がある。
    • 最適な情報源とアームを同時に特定し,効率的な後悔最小化を実現すること。
    • 提案手法SOARは,分散集中不等式を用いて高分散の情報源を迅速に排除する。
    • SOARは,最小分散の情報源を事前に知らなくても,標準的な単一情報源バンディット問題と同等の後悔を達成する。
    • 実験結果は,合成データとMovieLens\;25Mデータセットにおいて,SOARが既存手法よりも優れた性能を示すことを示している。

    Link: https://arxiv.org/abs/2602.14474

  • RAT+: 密な学習,疎な推論 – 拡張された注意機構による拡張推論 [cs.LG]目的:拡張された注意機構による疎な推論の実現
    • 近年,大規模言語モデルの効率的な推論が重要視されている。計算資源を削減しつつ高性能を維持する必要がある。
    • 事前学習済みの注意機構モデルを直接疎化すると精度が大幅に低下し,多様な推論シナリオへの柔軟な適用が困難である。
    • 密な事前学習で疎な推論を可能にする新たなアーキテクチャを開発し,精度低下を最小限に抑える。
    • RAT+は,フルシーケンスの再帰とアクティブな再帰学習を注意機構に付加することで,密な事前学習を可能にする。
    • RAT+は一度密に事前学習すれば,推論時に拡張注意機構(オプションでローカルウィンドウ付き)やハイブリッド層/ヘッド構成に柔軟に切り替えられる。
    • 1.5Bパラメータで100Bトークン学習したRAT+は,D=16で密な精度に匹敵し,D=64では常識推論やLongBenchタスクで約2~3ポイントの低下で済んだ。

    Link: https://arxiv.org/abs/2602.18196

  • UMAPと他の次元削減手法の比較研究 [cs.LG, stat.AP, stat.ML]目的:次元削減手法の比較評価
    • データ解析において,高次元データの可視化や効率的な学習は重要な課題である。
    • UMAPの教師あり学習版は注目されているが,特に回帰問題における性能は十分に解明されていない。
    • UMAPの教師あり学習版の性能を評価し,回帰問題における改善点を探る。
    • 分類問題においては,教師ありUMAPは良好な性能を示した。
    • 回帰問題においては,教師ありUMAPは応答変数の情報を効果的に組み込むことが難しいという限界が示された。
    • 今後の開発において,回帰問題における教師ありUMAPの性能向上が期待される。

    Link: https://arxiv.org/abs/2603.02275

  • 構築,評価,最適化:マルチエージェント型購買アシスタントの継続的改善のための設計図 [cs.AI, cs.CL, cs.LG]目的:マルチエージェント型購買アシスタントの評価と最適化に関する実践的な設計図
    • 対話型購買アシスタントは,エージェントAIの重要な応用分野であり,顧客体験の向上に貢献する。
    • マルチターン対話の評価や,複雑に連携するマルチエージェントシステムの最適化方法が未開拓である。
    • 実用的な評価指標と最適化戦略を提示し,生産規模の購買アシスタントの改善を目指す。
    • 多面的評価ルブリックを導入し,購買品質を構造化された次元に分解することで,より客観的な評価を可能にした。
    • LLMを評価者として活用するパイプラインを開発し,人間の評価との整合性を高めた。
    • GEPAに基づいた2つのプロンプト最適化戦略(Sub-agent GEPAとMAMuT GEPA)を検証し,システム全体の性能向上に貢献した。

    Link: https://arxiv.org/abs/2603.03565

  • 外生変数を用いた時系列予測のためのグラフ整合生成ネットワーク [cs.DC, cs.LG, cs.AI]目的:外生変数を用いた時系列予測におけるグラフ整合生成ネットワーク
    • 時系列予測は,将来の計画や意思決定において不可欠であり,その精度向上は重要な課題である。
    • 従来のモデルは,時間的相関とチャネル相関を別々に扱っており,両者の間の複合的な関係性を捉えきれていない。
    • ノイズの影響を受けにくい,時間的・チャネル相関を同時にモデル化する手法を開発し,予測精度を向上させる。
    • 本研究では,グラフ整合生成ネットワーク(GCGNet)を提案し,変動生成器を用いて粗い予測を生成する。
    • グラフ構造アライナーが生成された相関と真の相関の一致性を評価し,ノイズに強い相関モデリングを実現する。
    • グラフリファイナーが予測を洗練し,精度を向上させることで,12の現実世界のデータセットで最先端の結果を達成した。

    Link: https://arxiv.org/abs/2603.08032

  • 知識グラフのセマンティック詳細レベル:スペクトル熱拡散による抽象化境界の発見 [cs.LG, cs.AI]目的:知識グラフにおける抽象化レベルの境界検出と,その制御メカニズムの確立
    • 知識グラフは情報の整理に不可欠だが,詳細度の制御方法が課題である。
    • 既存手法は離散的なコミュニティ検出に頼り,継続的なズームや保証がない。
    • 熱核拡散を用いて連続的なズーム演算子を定義し,境界を自動検出する。
    • 提案手法は,ノイズの多い階層構造においても一貫した境界検出性能を示した。
    • 合成階層構造では,埋め込みレベルを高い精度で復元し,実世界データでも意味のある抽象化レベルを発見した。
    • パラメータ調整を必要とせず,様々なグラフ構造に対して高い汎用性を持つ可能性を示唆した。

    Link: https://arxiv.org/abs/2603.08965

  • GenRecEdit:コールドスタートアイテムに対する生成型推薦のためのモデル編集の適応 [cs.IR, cs.AI]目的:コールドスタートアイテムに対する生成型推薦の性能向上
    • 推薦システムは,ユーザーのニーズに合った情報を提示し,情報探索を支援する上で不可欠である。
    • 生成型推薦モデルはコールドスタートアイテムに対して著しく性能が低下するという課題を抱えている。
    • 本研究では,モデル編集のパラダイムを生成型推薦に適用し,効率的なコールドスタート対策を目指す。
    • GenRecEditは,モデルの再学習に要する時間と比較して,わずか9.5%の学習時間でコールドスタートアイテムに対する推薦性能を大幅に向上させる。
    • GenRecEditは,シーケンス全体の文脈と次のトークン生成の関係を明示的にモデル化し,トークンレベルでの反復編集を採用することで,コールドスタートアイテムの表現を注入する。
    • また,GenRecEditは,推論時の複数編集間の干渉を軽減するため,1対1のトリガー機構を導入する。

    Link: https://arxiv.org/abs/2603.14259

  • 検出は安価だが,ルーティングは学習される:拒否に基づくアライメント評価の失敗理由 [cs.CL, cs.LG, cs.AI, cs.CL]目的:政治検閲における概念検出から行動ポリシーへのルーティングメカニズムの解明
    • AIモデルのアライメントは,安全性確保の鍵であり,社会実装には不可欠である。
    • 既存のアライメント評価は,概念のエンコードや有害要求の拒否に焦点を当て,ルーティングの評価が不足している。
    • AIモデルにおけるルーティングメカニズムを特定し,アライメント評価の改善を目指す。
    • 中国由来の言語モデルにおける政治検閲を実験的に検証した結果,モデルや開発元によってルーティングが異なることが判明した。
    • 政治的検閲方向の削除により検閲が解消され,事実に基づいた出力が回復する一方,一部モデルでは知識と検閲メカニズムが混在し,虚偽情報を生成した。
    • 拒否応答は検閲の主要なメカニズムではなくなり,ナラティブ誘導が主流になっていることが示された。検出や拒否のみを評価する既存手法では,ルーティングメカニズムを見逃す可能性がある。

    Link: https://arxiv.org/abs/2603.18280

  • 階層型強化学習を用いた多クラスターアウトブレイク制御のためのリソース制約型非薬物介入の最適化 [cs.LG]目的:感染症アウトブレイク制御におけるリソース制約型非薬物介入の最適化
    • 感染症の拡大を抑制するため,検査や隔離などの非薬物介入は不可欠である。
    • 初期段階ではリソースが限られており,複数のクラスターへの効率的な割り当てが課題となる。
    • 複数のアウトブレイククラスターに対し,限られたリソースを最適に配分する手法を開発する。
    • 提案手法は,現実的なエージェントベースシミュレーターにおいて,既存手法を20~30%上回るアウトブレイク抑制効果を示した。
    • 階層型フレームワークは,最大40の同時アクティブクラスターにおいても高いスケーラビリティを発揮し,迅速な意思決定を可能にした。
    • グローバルコントローラーが資源需要を調整し,ローカルポリシーがクラスター内の資源配分価値を推定することで最適化を実現した。

    Link: https://arxiv.org/abs/2603.19397

  • ブラックボックスドメイン適応におけるセマンティックギャップ解消のための適応二重教師蒸留とサブネットワーク修正 [cs.CV, cs.LG]目的:ブラックボックスドメイン適応におけるセマンティックギャップの解消
    • ドメイン適応は,ラベルなしのターゲットドメインでモデルの性能を向上させる上で重要である。
    • ブラックボックスドメイン適応では,ソースデータやモデルパラメータにアクセスできないため,知識転移が限定的である。
    • 異なる知識源の不整合を解消し,ターゲットドメインの適応性能を向上させる。
    • 提案手法であるDDSRは,ブラックボックスソースモデルとViLからの予測を統合し,信頼性の高い疑似ラベルを生成する。
    • サブネットワークに基づく正則化により,ノイズの多い教師信号への過学習を抑制し,出力の一貫性と勾配の分散を促進する。
    • 実験の結果,DDSRは既存手法を凌駕し,ソースデータやモデルパラメータへのアクセスが不要であることを示す。

    Link: https://arxiv.org/abs/2603.22908

  • 高レベル合成のためのエージェントファクトリ:汎用コーディングエージェントはハードウェア最適化においてどこまでできるか? [cs.AI, cs.AR, cs.LG]目的:ハードウェア設計の最適化
    • 高性能なハードウェア設計は,計算能力の向上に不可欠であり,様々な分野で求められている。
    • 従来の最適化手法は,手動でのチューニングに依存し,時間と労力がかかるという課題がある。
    • 汎用的なコーディングエージェントを活用することで,ハードウェアに特化した知識なしに最適化を実現することを目指す。
    • エージェントファクトリという二段階パイプラインを導入し,複数の自律型最適化エージェントを構築・連携させた。
    • 1~10エージェントのスケールアップにより,ベースラインと比較して平均8.27倍の高速化を達成した。
    • 特に困難なベンチマーク(streamcluster,kmeans)において,それぞれ20倍以上,約10倍の改善が見られた。

    Link: https://arxiv.org/abs/2603.25719

  • 言語モデルにおけるポリシー回路の配置経路:局所化,スケーリング,制御 [cs.FL, cs.CL, cs.DB, cs.CL, cs.AI, cs.LG]目的:アライメント調整された言語モデルにおけるポリシールーティングメカニズムの特定
    • 大規模言語モデルの安全性確保は重要であり,そのメカニズム解明が不可欠である。
    • 現在の言語モデルの安全性はブラックボックスであり,制御方法が不明である。
    • 言語モデルのポリシー回路を特定し,その制御メカニズムを解明すること。
    • アライメント調整された言語モデルには,コンテンツ検出ゲートと信号増幅ヘッドからなるポリシールーティングメカニズムが存在する。
    • このメカニズムはモデル規模によって構成が異なり,小さなモデルでは単一ヘッド,大規模モデルでは複数ヘッドで構成される。
    • 検出層への信号操作により,言語モデルのポリシーを連続的に制御することが可能であり,安全性に関する脆弱性が明らかになった。

    Link: https://arxiv.org/abs/2604.04385

  • マルチモーダル融合の位相幾何:現在のアーキテクチャが創造的認知において失敗する理由 [cs.AI]目的:マルチモーダルAIアーキテクチャにおける構造的限界の特定と,創造的認知への応用
    • AIにおけるマルチモーダルな情報処理は,人間のような知能を実現する上で不可欠である。多様な情報を統合することで,より高度な認知機能が期待される。
    • 既存のマルチモーダルAIは,モード間の分離という幾何学的制約に縛られており,創造的な認知能力の実現が困難である。
    • 本研究は,位相幾何学に基づいた新たなアーキテクチャを提案し,モード間の分離制約を克服することで創造的認知を可能にすることを目指す。
    • 本研究は,ウィトゲンシュタインの「言う/示す」の区別を,中国の職人論における「象」の概念を通じて再解釈することで,新たな視点を提供する。
    • 脳内ネットワークの活性化パターンを病理学的鏡像として捉え,モード間の結合強度と制御能力の関係を数理的に分析した。
    • 提案するUOO実装と新たなベンチマーク(ANALOGY-MM, META-TOP)により,異なる文明における位相幾何学的同型性の検証を可能にする。

    Link: https://arxiv.org/abs/2604.04465

  • 巡回セールスマン問題における探索学習:最初の推測は最終的な答えではない [eess.SY, cs.SY, cs.LG, cs.AI]目的:巡回セールスマン問題に対する探索手順の学習
    • 組合せ最適化問題の解決において,探索は重要な役割を担う。
    • 既存のニューラルネットワークによる探索手法は,性能や汎化性に課題がある。
    • より効率的かつ汎用性の高い探索手法を学習することを目指す。
    • 提案手法NICO-TSPは,既存の手法と比較して,ステップ効率と改善性能が向上した。
    • NICO-TSPは,分布外のインスタンスへの汎化性能が大幅に向上した。
    • NICO-TSPは,古典的な局所探索の代替,あるいは構成的ソルバーのテスト時改善モジュールとして利用可能である。

    Link: https://arxiv.org/abs/2604.06940

  • LLM誘導アクション空間を用いた合成可能なリード最適化 [cs.LG, cs.AI, cs.CE]目的:創薬におけるリード最適化のための手法
    • 創薬において,治療効果の向上と合成可能性の両立が重要である。
    • 既存手法では,合成可能性を無視した最適化や,計算コストの高い網羅的な探索が課題である。
    • 検証済みの反応テンプレートに基づくアクション空間を構築し,LLMと強化学習を組み合わせることで,効率的なリード最適化を目指す。
    • MolReActは,13の物性最適化タスクと1つのドッキングタスクにおいて,既存手法を上回る成績を示した。
    • Top-10スコアの平均は0.571であり,14タスク中13タスクで1位または2位を達成した。
    • SMILESキャッシュ機構により,最適化時間を約43%削減し,サンプル効率も向上した。

    Link: https://arxiv.org/abs/2604.07669

  • 重要な箇所にパズルピースを配置:強化学習のための質問拡張フレームワーク [cs.LG]目的:強化学習における大規模言語モデルの推論能力向上
    • 大規模言語モデルの推論能力向上は,自然言語処理の重要な課題である。
    • 容易な問題での学習は過学習を招き,難しい問題は報酬が疎になるという課題がある。
    • 重要な推論ステップを戦略的に提供することで,効率的な学習と多様性の維持を目指す。
    • 提案手法PieceHintは,問題の難易度に応じてヒントを適切に割り当てることで,モデルの推論能力を向上させる。
    • 実験の結果,1.5Bモデルが32Bベースラインと同等の性能を達成しつつ,pass@kの多様性を維持することが示された。
    • 段階的にヒントを減らすことで,モデルが誘導学習から独立した推論へと移行することを可能にする。

    Link: https://arxiv.org/abs/2604.15830