arXiv雑要約

AI - 2026/05/07 公開

グラフ構造マルチバリアント時系列における共形予測のための非交換可能性の探求 [cs.LG]目的：グラフ構造マルチバリアント時系列の点予測における不確実性定量
- グラフ構造データは現実世界で広く存在し，その時系列分析は重要性が高い。
- 従来の共形予測は交換可能性を仮定するため，ノード間結合のあるグラフ時系列には不向きである。
- スペクトルグラフ理論に基づき，低周波成分を条件とした交換可能性を導入し，共形予測を可能とする。
- 提案手法SCALEは，グラフwavelet変換を用いて低/高周波成分を分解し，低周波埋め込みを介した適応的ゲート処理により高周波残差を共形化する。
- 実世界の交通データセット実験の結果，SCALEは有効な網羅率を達成し，最先端の共形予測手法よりも網羅率と効率性のトレードオフを改善する。
- スペクトルグラフ条件付き交換可能性(SGCE)という新しい概念が，グローバルなトレンドを維持し，スペクトル領域で効果的な共形予測を可能にする。
Link: https://arxiv.org/abs/2605.04957
エントロピー・進捗整合型グループ相対方策最適化：暗黙的な過程ガイダンスによる [cs.LG, cs.AI]目的：大規模言語モデルの推論能力向上
- LLMの推論能力向上は，AI研究の重要な課題であり，その性能は様々な応用分野に影響を与える。
- 既存のグループ相対方策最適化(GRPO)は，トークンレベルでの情報価値の偏りや極性の誤り，分散崩壊といった課題を抱えている。
- 本研究は，エントロピーと進捗を整合させることで，GRPOにおけるこれらの課題を克服し，より効率的な学習を目指す。
- 提案手法EP-GRPOは，モデルの内部情報フローを活用し，高エントロピーな意思決定ポイントを優先する。
- EP-GRPOは，結果の優位性にアンカーされた方策の分散から得られる暗黙的な過程シグナルを用いて，トークンレベルのフィードバックを行う。
- 数学的推論ベンチマークにおいて，EP-GRPOはGRPOとその変種よりも優れた精度と効率を達成した。
Link: https://arxiv.org/abs/2605.04960
変位再構成最適輸送による分布シフトの信頼性モデリング [cs.CL, cs.IR, cs.LG, cs.AI]目的：分布シフトの信頼性向上
- 分布シフトは機械学習の応用において重要な課題であり，そのモデリング手法の改善が求められている。
- 既存の最適輸送法では，入力空間における距離測度の設計が重要だが，真の幾何学的構造を捉えきれない場合がある。
- 観測されたサンプル変位を知識源として統合することで，より信頼性の高い輸送解を得ることを目指す。
- 提案手法ReshapeOTは，変位の二乗モーメントから推定されるマハラノビス距離を導入することで，既存手法よりも分布シフトをより正確に捉える。
- ReshapeOTは計算コストが低く，既存の最適輸送ソルバーに容易に組み込むことができる。
- 合成データおよび実データを用いた実験により，ReshapeOTが輸送の信頼性において顕著な改善を示すことが確認された。
Link: https://arxiv.org/abs/2605.04965
スキル新語：スキルベースの継続学習に向けて [eess.SY, cs.SY, cs.LG, cs.AI]目的：スキルベースの継続学習へのスケーラブルな道筋
- 大規模言語モデルの能力向上は目覚ましいが，新たなスキル獲得のスケーラビリティが課題である。
- ファインチューニングは忘却の問題，文脈依存的手法は表現力と文脈長の制約がある。
- モデルの重みを更新せずに，選択的に新たなスキルを習得する手法を模索する。
- 既存の事前学習済みLLMが，手続き的知識に関連するトークンを既に保持していることを確認した。
- スキル新語は，特定のスキルにおけるモデルの能力を向上させ，分布外のスキルと組み合わせることが可能である。
- 独立して学習されたスキル新語は，ゼロショットで合成可能であることが示された。
Link: https://arxiv.org/abs/2605.04970
深層ニューラルネットワークにおける幾何学的連続性の出現理由：残差結合と回転対称性の破れ [cs.LG, cs.AI, cs.CL]目的：深層ニューラルネットワークにおける幾何学的連続性の起源の解明
- 深層学習は画像認識や自然言語処理など，幅広い分野で高い性能を発揮している。
- 深層ニューラルネットワークの学習安定性や汎化性能を向上させるためには，その内部構造の理解が不可欠である。
- 幾何学的連続性の起源を特定し，安定した学習を促進するネットワーク構造の設計に貢献すること。
- 残差結合は，層間の勾配の一貫性を生み出し，重み更新を層間で整合させる。
- 非線形性は回転対称性を破り，すべての層を共通の座標系に制約することで，重み構造の不安定化を防ぐ。
- 活性化関数と正規化は異なる役割を果たし，それぞれ連続性を主導する特異ベクトルの方向に集中させるか，分散させるかの制御を行う。
Link: https://arxiv.org/abs/2605.04971
AI支援・プラットフォームベースのサービス開発におけるアーキテクチャ制約の整合性確保 [cs.CL, cs.SE, cs.AI]目的：AI支援サービス開発と本番環境のアーキテクチャ制約との整合性
- サービス開発の迅速化が求められる現代において，AI支援開発ツールは不可欠である。
- 既存のAI支援ツールは，アーキテクチャ制約やインフラ依存関係を考慮しない場合がある。
- AI支援開発におけるアーキテクチャ制約の曖昧さを解消し，本番環境へのデプロイを容易にすること。
- 提案手法は，プラットフォームベースのコード生成とエージェントによる明確化を組み合わせることで，アーキテクチャ制約を組み込む。
- 評価の結果，一般的なAIコード生成と比較して，アーキテクチャの一貫性とデプロイ可能性が向上した。
- 制約を意識した検索が，AI支援サービス開発と本番環境ソフトウェア開発の実践を結びつける上で重要であることが示唆された。
Link: https://arxiv.org/abs/2605.04973
木状MDPにおける方策をバンディットアームとして扱うオンライン学習 [cs.AI, cs.LG]目的：木状MDPにおけるオンライン学習
- ゲーム理論や強化学習において，不完全情報ゲームの意思決定を抽象化する枠組みとして重要である。
- 方策の数が状態数に対して指数関数的に増加するため，メモリと計算量の問題が生じやすい。
- 方策間で共有されるデータに基づいた信頼区間を設計し，メモリと計算量を抑えることを目指す。
- バンディットアルゴリズムであるLucbとUcbを木状MDPに適用可能であることを示した。
- サンプル複雑度と後悔に関するインスタンス依存の上界を得た。これは終端状態からのギャップ項の和として表される。
- 隠れ情報ゲームのテストにおいて，既存の手法と比較して優れた性能を示した。
Link: https://arxiv.org/abs/2605.04979
意味的制御のためのコンセプトア [cs.LG, cs.CL]目的：LLMの挙動制御手法
- LLMの利用拡大に伴い，その挙動を意図通りに制御する技術が重要となる。
- 既存手法では，概念を単一の方向ベクトルで表現するため，概念の多面性を捉えきれない。
- コンセプトアを用いることで，概念の多次元空間を捉え，より柔軟な制御を実現する。
- コンセプトアは，概念の二極性から推定されるソフトな投影行列であり，概念の多次元部分空間を保持する。
- コンセプトアの利用により，概念の分離可能性を予測するレイヤー選択診断が可能となり，高い相関関係が確認された。
- コンセプトアはブール代数演算（AND，OR，NOT）を可能にし，関連するサブコンセプトの構成において有効性が示された。
Link: https://arxiv.org/abs/2605.04980
自己誘起結果ポテンシャル：検証者なしエージェントのためのターンレベルの報酬配分 [cs.LG, cs.CL]目的：長期的なLLMエージェントにおけるターンレベルの報酬配分手法
- LLMエージェントの性能向上には，複雑なタスクを遂行するための各ターンの評価が不可欠である。
- 従来のターンレベルの報酬配分は，正解データやタスク固有の検証者が必要であり，汎用性に課題がある。
- 正解データや検証者なしで，各ターンの貢献度を適切に評価し，エージェントの学習を促進すること。
- 最終的な回答のセマンティッククラスタを潜在的な未来の結果状態として扱い，ターンレベルの報酬配分を行うことで，検証者なしでの学習を可能にした。
- 信頼性に基づいた未来状態への支持度を高めるターンに報酬を与えることで，情報ポテンシャル形状化を一般化し，性能向上を実現した。
- 7つの検索拡張型エージェント推論ベンチマークにおいて，検証者なしのベースラインを上回り，正解データを用いたベースラインに匹敵する性能を示した。
Link: https://arxiv.org/abs/2605.04984
EV充電需要の早期予測のための連合学習 [cs.LG, cs.AI]目的：EV充電需要の早期予測手法
- 電力系統の安定運用，インフラ整備，充電最適化に正確なEV充電需要予測が不可欠である。
- 充電開始直後の情報のみで需要を予測することは困難であり，予測精度向上が課題である。
- 充電開始直後の限られた情報から，信頼性の高い需要予測を可能にすることを目指す。
- 連合学習を用いることで，データ保護を維持しつつ，集中型モデルに匹敵する予測性能を達成できる。
- 充電セッションの初期段階で得られるデータのみでも，信頼性の高い需要予測が可能であることが示された。
- 本研究は，分散型充電インフラにおけるスケーラブルかつプライバシーを重視した分析への道を提供する。
Link: https://arxiv.org/abs/2605.04993
実現可能性制約下での適応性：文脈内学習とエージェント学習の比較 [cs.LG, math.ST, stat.ML, stat.TH]目的：タスク群の一様近似における，固定クエリによる文脈内学習と，適応クエリによるエージェント学習の比較
- 機械学習の分野では，汎化性能の向上と，限られたデータでの効率的な学習が重要課題である。
- 既存の学習手法では，タスクの複雑さやデータの分布の変化に適応することが困難な場合がある。
- 本研究は，適応的なクエリ戦略が，表現能力の制約下で近似性能に与える影響を明らかにすることを目指す。
- 制約のない状況では，適応性は近似性能を損なわない。しかし，ReLUニューラルネットワークのような表現制約がある場合，状況は変化する。
- 近似シナリオを４つ特定し，それぞれに対応するタスク群を明示することで，表現制約が適応性の効果に大きく影響することを示した。
- 適応性の利点が，ReLUによる実現可能性によって持続，発生，または消失するケースが確認された。
Link: https://arxiv.org/abs/2605.04995
DualTCN：物理制約を用いた時間領域畳み込みニューラルネットワークによる2次元海洋CSEM逆問題解法 [cs.HC, cs.LG]目的：時間領域海洋制御源電磁法（MCSEM）トランジェントデータの逆問題解法
- 海洋資源探査において，地下構造を正確に把握することは極めて重要である。
- 従来のCSEM逆問題解法は計算コストが高く，また局所解に陥りやすいという課題がある。
- 本研究は，深層学習を用いて高速かつ高精度なCSEM逆問題解法を確立することを目的とする。
- DualTCNは，従来のモデルと比較して損失を25.3%削減し，高い予測精度（σ2のR^2 = 0.898）を実現した。
- ノイズに対するロバスト性は高く，振幅オーギュメンテーションにより平均R^2が0.858を維持した。
- 計算コストは従来の最適化手法と比較して最大21,000倍低く，モンテカルロドロップアウトによる不確実性定量化も組み込まれている。
Link: https://arxiv.org/abs/2605.04997
ジャンル適応型コード生成のためのポップとジャズの混合比に関する実証研究 [cs.SD, cs.IR, cs.LG]目的：ジャンル適応型コード生成における，ポップとジャズのデータ混合比の最適化
- 音楽生成は重要な研究分野であり，特にコード進行生成は作曲支援への応用が期待される。
- 既存の研究では，コード生成が他のタスクの条件付け要素として扱われる傾向があり，単独のタスクとしての研究が不足している。
- 異なるジャンルの音楽に適応させる際，元のジャンルの情報をどれだけ保持すべきかという課題を解決する。
- ジャズへのファインチューニングにより，コード予測精度が7〜9ポイント向上することが確認された。
- ポップの精度は，ジャズのみのファインチューニングで低下するが，ある程度のポップデータを混合することで回復し，飽和する。
- 最適な混合比（2.5K）は必ずしも聴覚的に最も好まれるとは限らず，スタイルが明確なモデルの方が好まれる場合がある。
Link: https://arxiv.org/abs/2605.04998
Windows COMバイナリにおけるエージェント的脆弱性推論 [cs.CR, cs.LG]目的：Windows COMバイナリの競合状態脆弱性の発見と，デバッガ検証済みのPoCコード生成
- Windows COMは特権で実行され広くアクセス可能であり，セキュリティ上の重要な対象である。
- COMバイナリの競合状態脆弱性は，ローカル権限昇格の深刻な原因となりうる。
- エージェントを活用し，脆弱性の発見からPoC生成までを自動化すること。
- SLYPは，COMバイナリの競合状態脆弱性を0.973のF1スコアで発見し，既存のコード生成エージェントや静的解析ツールを上回る性能を示した。
- SLYPは，28件の未発見の脆弱性を9つのCOMサービスから発見し，Microsoft Security Response Center（MSRC）によって確認された（16件のCVEと14万ドルの報奨金）。
- SLYPは，一般的なバイナリ解析およびデバッグインターフェースを備えており，Windows COMサービス以外のCOTSバイナリにも適用可能である。
Link: https://arxiv.org/abs/2605.05000
報酬によるずれ：LLMにおける社会的に好ましくない選好 [eess.SY, cs.SY, cs.CL, cs.AI, cs.CY]目的：LLMの報酬モデルにおける社会的な選好の評価
- LLMの性能向上には，人間の選好との整合性が不可欠である。
- 既存の評価指標では，社会的に望ましい選好が十分に評価されていない。
- 報酬モデルが社会的に好ましくない応答を好む可能性を検証する。
- 報酬モデルは，バイアス，安全性，倫理などの重要な領域において，ばらつきが見られた。
- 多くのモデルは社会的に好ましくない応答を好み，偏った結果を生み出すことが示された。
- バイアス回避の強化は，文脈への敏感性を低下させるトレードオフがあることが明らかになった。
Link: https://arxiv.org/abs/2605.05003
Uno-Orchestra：選択的委譲による効率的なエージェントルーティング [cs.AI]目的：大規模言語モデルマルチエージェントシステムにおける効率的なエージェントルーティング手法
- LLMエージェントシステムの活用は，複雑なタスク処理能力向上に不可欠である。
- 既存手法は，ルーティングやタスク分解が最適化されておらず，コストと精度に課題がある。
- ルーティング，タスク分解，推論予算を統合的に最適化し，コスト効率の良いシステムを構築する。
- Uno-Orchestraは，13種類のベンチマークテストにおいて77.0%のmacro pass@1を達成した。
- これは，最も強力なワークフローベースラインを約16%上回る高い精度である。
- また，クエリあたりのコストを大幅に削減し，精度と効率の双方を向上させた。
Link: https://arxiv.org/abs/2605.05007
モデル非依存分散学習における協調展開のための学習された近傍信頼 [cs.LG]目的：分散学習における協調展開のための近傍信頼の学習
- IoTデバイスの多様性やデータ不足といった課題に対応するため，分散学習が重要である。
- 既存手法では，推論時に利用可能な近傍デバイスを考慮せず，単独で展開されることが多い。
- 推論時の協調展開を可能にする学習方法と，信頼できる近傍の学習を目指す。
- 提案手法LNTrustは，各ノードが近傍の信頼度を学習し，推論時にアンサンブルを形成することで，精度を向上させる。
- LNTrustは，既存のベースラインと比較して，大幅な精度向上を示し，通信コストを削減する。
- 学習時に得られた協調関係を，推論時の展開に直接活用できる点が特徴である。
Link: https://arxiv.org/abs/2605.05009
具現化されたAIにはプライバシーと有用性のトレードオフが必要である [cs.AI, cs.RO]目的：具現化AIにおけるプライバシーと有用性のトレードオフ
- AI技術の発展に伴い，現実世界での利用が拡大している。その中でプライバシー保護は重要な課題となっている。
- 既存の具現化AI研究は，各段階の性能向上に注力しており，プライバシー漏洩のリスクが考慮されていない。
- ライフサイクル全体を通してプライバシーを考慮したアーキテクチャを構築し，プライバシーと有用性のバランスを取ることを目指す。
- 本研究では，Secure Privacy Integration in Next-generation Embodied AI (SPINE)という，プライバシーを重視した統合フレームワークを提案する。
- SPINEは，AIパイプラインを段階的に分解し，プライバシー分類マトリクスを用いて，段階間の文脈に応じたプライバシー保護を実現する。
- シミュレーションと実世界でのケーススタディを通じて，プライバシー制約がシステム全体の動作に影響を与えることを確認した。
Link: https://arxiv.org/abs/2605.05017
Graph-SND：マルチエージェント強化学習における行動多様性のための疎な集約 [cs.LG, cs.MA]目的：マルチエージェント強化学習における行動多様性の指標であるSNDの計算効率化
- マルチエージェント強化学習は，複雑な問題を複数のエージェントで協調して解決する上で重要である。
- 既存のSND指標の計算量は，エージェント数に対して二乗に比例するため，大規模システムではボトルネックとなる。
- グラフ構造を用いた疎な集約により，SNDの計算量を削減し，大規模システムへの適用を可能にすること。
- 提案手法Graph-SNDは，SNDの計算量を大幅に削減しつつ，その指標の意味を変えることなく，SNDと同等の結果を得ることを検証した。
- 特定の疎なグラフ構造やランダムなグラフを用いることで，計算コストと精度のトレードオフを調整できることが示された。
- 実環境での実験では，Graph-SNDはSNDと比較して，計算時間の短縮とスケーラビリティの向上を達成した。
Link: https://arxiv.org/abs/2605.05020
CuBridge：高性能アテンションカーネルの理解と再構成のためのLLMベースフレームワーク [cs.LG]目的：高性能アテンションカーネルの理解と再構成
- 深層学習システムの効率化に不可欠なアテンション機構の実装方法が重要視されている。
- 多様なアテンション変種への対応が難しく，柔軟性と性能のトレードオフが存在する。
- LLMを活用し，既存の高性能カーネルを適応させることでこの課題を解決する。
- CuBridgeは，専門家が作成したCUDAアテンションカーネルを，構造化されたリフト-転送-ローワーのワークフローを通じて適応させる。
- CuBridgeは，PyTorch仕様に基づいてターゲットIRプログラムを生成・検証し，参照ガイド型のローワーリングによって最適化されたCUDAコードを再構築する。
- 多様なアテンション変種とGPUプラットフォームにおいて，正確なカーネルを生成し，既存手法を大幅に上回る性能を示す。
Link: https://arxiv.org/abs/2605.05023
拡散モデルにおける幻覚を局所内在次元が明らかにする [cs.CL, cs.CV, cs.AI]目的：拡散モデルにおける幻覚の解明と軽減
- 画像生成AIの発展に伴い，生成画像の品質向上が重要課題となっている。
- 拡散モデルは，統計的性質は満たすものの，構造的なルールに反する異常な画像を生成することがある。
- モデル誘導多様体上の不安定性を原因とし，局所内在次元を抑制することで幻覚を軽減する。
- 幻覚フィルタの性能評価の結果，提案手法は既存手法と同等以上の性能を示した。
- 局所内在次元が幻覚の主要な原因であることが明らかになった。
- 内在次元抑制（IQ）は，様々なベンチマークで既存手法を上回り，医療画像処理における解剖学的整合性の強化に貢献する。
Link: https://arxiv.org/abs/2605.05026
予測-因果ギャップ：不可能性定理と大規模ニューラルネットワークによる証拠 [cs.LG]目的：予測的表現学習における系統的な失敗モードの特定
- 自己教師あり学習やワールドモデルの性能向上には，環境を正確にモデル化することが不可欠である。
- 従来の予測的学習では，システムではなく環境を追跡してしまう問題が存在する。
- 予測目標の構造的な限界を明らかにし，因果的な表現学習を改善する方法を探る。
- 線形-ガウス力学を学習する2695のニューラルネットワーク構成において，最適なエンコーダはシステムではなく環境を追跡する傾向が見られた。
- 因果的忠実度（システムの自由度に対するエンコーダの感度の割合）は平均0.49であり，構成の2.5%未満が0.70を超えた。
- 環境への制約を設けることでギャップはある程度抑制されるものの，完全な因果的忠実度を回復するにはシステムと環境の明確な境界が必要である。
Link: https://arxiv.org/abs/2605.05029
嗜好に基づく自己知識蒸留：報酬正則化によるKLマッチングの限界克服 [cs.LG, cs.AI]目的：強化学習の効率的な代替手段であるオンポリシー知識蒸留における，報酬正則化を用いた自己知識蒸留手法の開発
- 大規模言語モデルの性能向上には，効率的かつ安定的な学習手法が不可欠である。
- 従来の自己知識蒸留はKLダイバージェンス最小化に依存し，学習の不安定性や推論性能の低下が課題であった。
- 外部教師の探索的多様性を欠く自己知識蒸留の限界を克服し，より安定した高性能な学習を実現すること。
- 提案手法PBSDは，固定教師KLマッチングを超えて，報酬正則化の観点からオンポリシー自己知識蒸留を再検討する。
- PBSDは，教師分布との直接的なマッチングではなく，報酬重み付き教師分布を最適化することで，より優れた目標ポリシーを導き出す。
- 数学的推論やツール利用のベンチマークにおいて，PBSDは既存手法と比較して一貫して高い性能を示し，学習の安定性も向上する。
Link: https://arxiv.org/abs/2605.05040
Piper：リソースモデリングとパイプライン化されたハイブリッド並列化による大規模MoE効率的学習 [cs.DM, math.PR, cs.CC, cs.DM, math.CO, cs.DC, cs.AI, cs.LG]目的：大規模MoEモデルの効率的な学習戦略
- モデルの高性能化とコスト削減のトレードオフが重要視されている。
- HPC環境でのMoEモデル学習において，メモリ，通信，負荷分散が課題である。
- HPC環境に最適化されたMoE学習のための効率的な戦略を確立すること。
- Piperは，リソースモデリングを活用し，HPCプラットフォームに最適化された学習戦略を実現する。
- 既存のフレームワーク（X-MoEなど）と比較して，2-3.5倍高いMFU（Maximum Floating-point Operations Utilisation）を達成した。
- 新たなall-to-allアルゴリズムにより，ベンダー実装を1.2-9倍上回る帯域幅を実現した。
Link: https://arxiv.org/abs/2605.05049
先行車追従における減速行動モードの運動学的識別因子：NGSIM軌跡データからの証拠 [eess.SY, cs.LG, cs.SY]目的：先行車追従時の減速行動モードの識別
- 交通流の安全性向上は重要な課題であり，ドライバーの行動理解が不可欠である。
- 従来のドライバー行動モデルは車間距離を中心に構築され，知覚情報の役割が不明確である。
- 減速時の知覚的手がかりの優先順位を明らかにすることで，ADASや自動運転の性能向上を目指す。
- 減速の強度によって，車間距離の縮小速度と視覚的な迫り感の識別力が変化することが示された。
- 厳しい減速閾値では３つの行動モードが，緩やかな閾値では２つの行動モードが識別された。
- 車間距離は，いずれの閾値においても識別力としてほとんど影響がないことが確認された。
Link: https://arxiv.org/abs/2605.05050
直接積フローマッチング：少数のサンプルによる適応のための放射状および角度的ダイナミクスの分離 [cs.CV, cs.AI, cs.LG]目的：少数のサンプルを用いた適応におけるビジョン言語モデルのクロスモーダルアライメントの改善
- 近年のビジョン言語モデルの発展は目覚ましいが，少数のサンプルでの適応は依然として課題である。
- 既存のフローマッチング法は，事前学習済みのクロスモーダル特徴量の幾何学的制約により，最適化が困難である。
- 放射状および角度的ダイナミクスを分離し，より効率的なフローマッチング手法を確立すること。
- 提案手法であるDP-FMは，既存手法の制約を克服し，角度的ダイナミクスの歪みを解消する。
- DP-FMは，放射状の一貫性を維持しながら，独立した放射状進化と一定速度の角度測地輸送を可能にする。
- 11のベンチマークにおいて，DP-FMは多段階少数のサンプルによる適応において最先端の結果を達成した。
Link: https://arxiv.org/abs/2605.05054
AoAに基づく屋外位置推定のための適応学習戦略：包括的フレームワーク [cs.LG, cs.AI, eess.SP]目的：AoAに基づく屋外位置推定のための適応学習戦略の確立
- 5G/6Gネットワークにおける高精度な位置推定は，スマートシティや自動運転などの応用を支える基盤技術である。
- 位置推定モデルの学習には大規模なデータセットが必要であり，環境構築やデータ収集にコストがかかるという課題がある。
- データセット規模に応じた学習戦略を提供し，データ収集コストを削減しつつ高精度な位置推定を実現することを目指す。
- 大規模データセットを用いたオフライン学習では，LoS/NLoS環境の識別と階層的な学習により，高精度な位置推定が可能となった。
- 小規模データセットを用いたオンライン学習では，増分的な木構造モデルやアンサンブル学習モデルにより，継続的な学習と適応が可能となった。
- オンライン学習を用いることで，大規模なデータ収集の必要性を軽減し，ネットワーク運用中の継続的な精度向上が期待できる。
Link: https://arxiv.org/abs/2605.05055
大規模言語モデルに対する脱獄攻撃の堅牢性：SoK [cs.CR, cs.AI]目的：大規模言語モデルの脱獄攻撃に対する堅牢性に関する体系的な調査
- 大規模言語モデルの応用拡大に伴い，安全性確保が重要課題となっている。
- 脱獄攻撃によって有害な出力が生成される可能性があり，安全性が脅かされている。
- 既存の評価方法が不十分であり，多角的なセキュリティ評価が求められている。
- 脱獄攻撃と防御に関する体系的な分類体系「Security Cube」を提案した。
- 13の攻撃手法と5つの防御手法を評価し，現状の脆弱性を明らかにした。
- より堅牢で信頼できる大規模言語モデル開発に向けた課題と方向性を示唆した。
Link: https://arxiv.org/abs/2605.05058
完全畳み込みネットワークと白色光干渉計に基づくフルチップCMPモデリング [cs.LG]目的：フルチップCMPナノトポグラフィの予測
- IC製造においてCMPは重要な工程であり，その正確なモデリングが歩留まりに大きく影響する。
- 従来のDSHモデリングは，較正に時間がかかり，高精度な予測には多くのハードウェアリソースを必要とする。
- 白色光干渉計と原子間力顕微鏡のデータを活用し，フルチップのCMPナノトポグラフィを高精度に予測することを目指す。
- 白色光干渉計（WLI）と原子間力顕微鏡（AFM）の表面分析技術を組み合わせ，深層学習モデルを訓練した。
- 提案手法は，ナノスケールの精度でフルチップのCMP後のナノトポグラフィを予測可能であることを示した。
- 各技術を個別に学習させることで，詳細なフルチップCMPモデルを構築することに成功した。
Link: https://arxiv.org/abs/2605.05062
長文モデリングの不可能性三角形 [cs.CL, cs.AI, cs.LG]目的：長文系列モデルにおける根本的なトレードオフの特定と証明
- 近年，大規模言語モデルの性能向上に伴い，より長い文脈を扱えるモデルが求められている。
- 従来のモデルは，計算効率，モデルサイズ，文脈の再現性の全てを同時に満たすことが困難である。
- 本研究は，上記3要素間のトレードオフを数学的に明らかにし，その限界を示す。
- Transformerを含む様々なモデルが，計算効率，コンパクト性，再現性のうち，最大2つしか満たせないことを理論的に証明した。
- 実験的に，5つの代表的なモデルにおいて，理論的な限界よりも低い再現能力が確認された。
- このトレードオフは，モデルアーキテクチャの設計において重要な制約となる。
Link: https://arxiv.org/abs/2605.05066
一見して二度ビーム：カメラ誘導によるリアルタイム双方向mmWaveビーム管理 [cs.NI, cs.AI, cs.CE, cs.CV, cs.SY, eess.SY]目的：車両通信のためのリアルタイム双方向mmWaveビーム管理
- 次世代通信においてmmWaveは高速・大容量の通信を可能にするが，その利用には課題が多い。
- mmWaveは減衰が大きく，車両の移動に伴いビームのずれが生じやすいという問題がある。
- カメラセンシングを活用し，ビーム探索空間を削減することで，高速かつ信頼性の高いビーム確立を目指す。
- 提案手法VIBEは，従来の5G NR階層ビーム形成と比較して，一貫して低いアウトエージ率を維持することが示された。
- 公開データセットを用いた評価において，最先端のend-to-end MLモデルを上回り，アウトエージ率1.1〜1.4%を達成した。
- ハイブリッドモデルベースの閉ループ学習アーキテクチャが，実世界のmmWave車両通信に適していることが確認された。
Link: https://arxiv.org/abs/2605.05071
部分観測Vlasov-Poisson方程式の不安定性制御のための証明可能な模倣学習 [cs.CL, cs.LG, math.AP, math.OC, physics.plasm-ph]目的：部分観測Vlasov-Poisson方程式における不安定性制御のための模倣学習手法
- 核融合研究におけるプラズマダイナミクスの安定化は，エネルギー問題解決への鍵となる。
- 完全な状態観測は困難であり，限られた観測データからの制御が課題である。
- 観測制約下での模倣学習によって安定化制御を可能にすること。
- 本研究では，模倣学習によって得られた制御ポリシーの安定性を理論的に保証した。
- 最小の行動クローン損失と初期分布のエントロピーの関係を明らかにした。
- 数値実験により，マクロな観測のみを用いた制御ポリシーの有効性を検証した。
Link: https://arxiv.org/abs/2605.05081
データの並び順が重要：データ並べ替えによるドメイン適応の改善 [cs.LG]目的：ドメイン適応におけるデータ並べ替えによる誤差低減推定
- 機械学習モデルの現実世界への応用において，ドメインシフトは大きな課題であるため，その解決が重要である。
- 教師なしドメイン適応では，ドメイン間の差異推定の分散が大きく，理論的な利点が活かされない場合がある。
- 本研究では，データサンプリング順を最適化することで，差異推定誤差を低減し，ドメイン適応の性能を向上させることを目指す。
- 提案手法ORDEREDは，ドメイン間の差異推定誤差を低減する，新しい不偏確率的分散削減技術である。
- シミュレーションの結果，関連手法と比較して分散が低減することが示された。
- 2つのドメインシフト画像分類ベンチマーク実験では，ターゲットドメインの精度が向上した。
Link: https://arxiv.org/abs/2605.05084
解釈可能な物件エネルギー性能予測と改修シナリオ分析のためのゲート付きマルチモーダル学習 [cs.LG, physics.soc-ph]目的：住宅のエネルギー効率と環境影響スコアの予測
- 都市のレジリエンスと持続可能性には，住宅の脱炭素化が不可欠である。住宅は温室効果ガス排出量の大きな割合を占める。
- エネルギー性能証明書（EPC）は規制や改修計画を支援するが，現地調査に依存するため，都市規模での迅速な評価が困難である。
- EPCデータ，テキスト情報，GISデータを用いて，エネルギー効率と環境影響スコアを正確に予測し，改修の効果を評価することを目指す。
- 提案モデルは，ロンドンのウェストミンスター地区において，SAPスコアとEIスコアをそれぞれ平均絶対誤差4.03点，4.76点で予測できた。
- マルチモーダル融合は，単一モジュールや二重モジュールよりも，スコア予測とバンドレベル分類の両方で優れた性能を示した。
- ゲートの重みはアセッサーのテキストへの強い依存性を示し，SHAP分析では主要な燃料，建物構造，建設時期が重要であることが明らかになった。
Link: https://arxiv.org/abs/2605.05088
言語モデルへの介入がもたらす予期せぬ副作用の自動検出と検証 [cs.CL, cs.AI]目的：大規模言語モデルに対する介入の行動への影響の監査
- 言語モデルの性能向上は重要だが，意図せぬ副作用のリスクが伴う。
- 介入後のモデルの変化を網羅的に評価する方法が確立されていない。
- 介入によって引き起こされる行動の変化を自動的に検出し，検証すること。
- 提案手法は，ベースモデルと介入モデルの生成結果を比較し，モデルの違いを記述する自然言語の仮説を生成する。
- 合成データ実験により，既知の変化を確実に検出できることが示された。
- 知識蒸留，知識編集，学習解除といった現実の介入において，意図された変化と予期せぬ変化の両方を明らかにできた。
Link: https://arxiv.org/abs/2605.05090
Driver-WM：交通状況に条件付けされたドライバー中心の潜在ワールドモデルによる車内ダイナミクスの展開 [cs.RO, cs.AI, cs.CV]目的：ドライバーの行動予測と交通状況の予測を統合した潜在ワールドモデル
- 自動運転レベル2/3の安全確保には，ドライバーの反応予測が不可欠である。
- 従来のワールドモデルは外部環境に焦点を当て，ドライバーの状態予測が不十分である。
- ドライバーの行動と交通状況を考慮した予測モデルを開発し，安全な運転支援を実現する。
- Driver-WMは，外部の交通状況を条件として，ドライバーの車内ダイナミクスを因果的に展開する。
- このモデルは，ドライバーの幾何学的予測と行動・感情のセマンティック認識の精度を向上させた。
- 外部から内部への条件付けにより，メカニズム応答の体系的な分析が可能になった。
Link: https://arxiv.org/abs/2605.05092
タスク固有の次良視点選択のためのベイズアプローチ：不確実な幾何学形状への対応 [cs.GR, cs.CV, cs.LG, stat.ML]目的：タスク固有の次良視点選択
- 3次元再構成は，ロボティクスやコンピュータビジョンの重要な基盤技術である。
- 従来の視点選択は空間全体の不確実性を均一に削減するため，効率が低い場合がある。
- タスクの目的に応じて不確実性を削減し，効率的な3次元再構成を実現すること。
- 本研究では，ベイズ決定理論を用いてタスク固有の次良視点選択を可能にするフレームワークを開発した。
- 提案手法は，セマンティック分類，セグメンテーション，PDE駆動物理シミュレーションにおいて，既存手法よりも少ない視点数で優れた性能を達成した。
- このフレームワークは，再構成データの使用目的に最適化された視点選択を可能にする。
Link: https://arxiv.org/abs/2605.05095
LLMシステムにおける継続的な知識更新：多時間スケール記憶ダイナミクスによる学習 [cs.IR, cs.LG, cs.AI, cs.CL]目的：LLMシステムにおける継続的な知識更新メカニズム
- LLMは一度学習後，変化し続ける環境で利用されるため，知識の更新が不可欠である。
- 既存の外部記憶システムは明示的な管理に依存しており，自律的な適応性に欠ける。
- 生物学的記憶の多時間スケールダイナミクスに着想を得て，LLMの知識更新を自律的に行う。
- Meminiという関連記憶システムを構築し，知識を指向性グラフとして組織した。
- エッジに高速変数と低速変数を組み合わせることで，エピソード記憶の感度，漸進的な固定化，選択的忘却を実現した。
- 外部記憶を，ダイナミクスを通じて再編成を行う学習基盤として捉え直した。
Link: https://arxiv.org/abs/2605.05097
多腕バンディットと強化学習における分布的後悔の一元的な枠組み [cs.LG, stat.ML]目的：確率的多腕バンディットとエピソード型強化学習における後悔の分布
- 意思決定問題において，最適な行動選択は重要であり，後悔の分析は性能評価の基礎となる。
- 従来の分析では，期待後悔のみに焦点を当てており，リスクや分布特性が考慮されていない。
- 後悔の分布全体を特徴付け，期待後悔とリスクのトレードオフを明確にすることを目指す。
- 本研究で提案するアルゴリズムは，任意のパラメータ系列に対して，ギャップ非依存およびギャップ依存型の分布的後悔の上界を導出する。
- 期待後悔と分布的後悔の間の最適なトレードオフを達成し，ミニマックスおよびインスタンス依存的な状況下で良好な性能を示す。
- 多腕バンディット問題において，後悔の上界が$\mathcal{O}(\sqrt{AT}\log(1/\delta))$と導かれ，Lattimore & Szepesv\'ari (2020)の予想を初めて検証する。
Link: https://arxiv.org/abs/2605.05102
テキストコーパスを概念場として：ブラックボックスな幻覚検出と新規性測定 [cs.CL, cs.AI, cs.CY]目的：テキストコーパスの概念場
- 大規模言語モデルの発展に伴い，生成されるテキストの信頼性評価が重要になっている。
- 言語モデルは，学習データにない内容を生成する「幻覚」を起こすことがある。
- コーパスに内在する概念構造に基づき，幻覚や新規性を効率的に検出することを目指す。
- テキストコーパスの概念場を，文埋め込み空間における連続する文間のデルタの局所的なドリフト場として定義した。
- 概念場を用いて，幻覚検出において高い選択的分類性能が確認された。ドメインを横断した確率的解釈が可能である。
- 概念場のダイバージェンスとカールを計算することで，意味のあるセマンティックパターンが可視化された。
Link: https://arxiv.org/abs/2605.05103
LineRides：ライン誘導による二輪ロボットのスタント学習 [eess.SY, cs.SY, math.DS, eess.SY, cs.SY, cs.RO, cs.AI]目的：二輪ロボットの多様なスタント動作の獲得
- ロボットの運動制御において，複雑な動作を学習させることは重要な課題である。
- 強化学習における報酬関数の設計が難しく，特に新規プラットフォームや極端なスタントでは参照モーションの入手が困難である。
- ユーザーが指定した空間的なガイドラインと姿勢指示から，デモンストレーションなしにスタントを学習すること。
- 提案手法LineRidesは，ガイドラインの追従許容範囲を設けることで，物理的に実行不可能なガイドラインにも対応可能である。
- 走行距離に基づき進捗を計測することで，時間的な曖昧さを解消し，位置と順序に基づいた姿勢指示によって運動の詳細を明確化する。
- Ultra Mobility Vehicle (UMV)を用いた実験により，通常の走行とスタントの実行をシームレスに切り替えられることが示された。
Link: https://arxiv.org/abs/2605.05110
ロールアウト合格率制御：二値報酬強化学習を最も有益な領域へ導く [cs.LG]目的：二値報酬型強化学習における効率的な学習
- 近年，エージェント型強化学習の需要が高まっているが，計算コストが課題となっている。
- ロールアウト群の合格率の偏りは，コントラスト信号を弱め，学習効率を低下させる。
- 合格率を50%に制御することで，情報量の最大化と学習効率の向上を目指す。
- Prefix Sampling (PS) により，Qwen3-14Bで2.01倍，Qwen3-32Bで1.55倍の学習速度向上を達成した。
- PSは，SWE-bench Verifiedのピーク性能を，0.273から0.295へと向上させた。
- AIME 2025でも同様の合格率制御パターンが確認され，リプレイ，双方向カバレッジ，適応制御が改善に貢献している。
Link: https://arxiv.org/abs/2605.05112
無限幅はどの程度維持されるか？長距離線形再帰における信号伝播 [cs.LG]目的：有限幅における線形再帰モデルの信号伝播
- 深層学習の発展に伴い，再帰型シーケンスモデルの重要性が増している。
- 従来の信号伝播理論は無限幅の極限に依存しており，有限幅における精度が不明確である。
- 再帰深さと幅が同時に増加する場合に，無限幅近似がどの程度有効かを明らかにする。
- 再帰深さと幅のスケール関係から，信号伝播を支配する３つの領域を特定した。
- 再帰深さが幅の平方根に比例する場合，無限幅の予測からのずれが現れることが示された。
- 再帰深さが幅の平方根よりも大きい場合，有限幅効果が支配的になるスケールを特定した。
Link: https://arxiv.org/abs/2605.05113
多様体操舵がニューラルネットワークの表現と行動の共有幾何学を明らかにする [cs.LG]目的：ニューラルネットワークの表現と行動の幾何学的構造の関係性
- ニューラルネットワークの内部表現の理解は，AIの解釈可能性向上に不可欠である。
- ニューラルネットワークの内部表現の幾何学構造と行動の関係は未解明な点が多い。
- ニューラルネットワークの幾何学構造に基づいた行動制御手法の確立を目指す。
- 活性化空間における多様体操舵は，出力確率分布の変化と整合性のある行動軌跡を生み出すことが示された。
- 線形操舵とは異なり，多様体操舵は出力空間における自然な領域内を移動し，不自然な出力を抑制する。
- 行動軌跡に沿った活性化空間の介入最適化は，表現の多様体の曲率を再現する活性化軌跡を回復する。
Link: https://arxiv.org/abs/2605.05115
LLMのジャンク化の困難性について [cs.LG]目的：LLMにおける潜在的なバックドアの発見と，その困難性の評価
- LLMは強力だが，攻撃に脆弱であり，安全性の確保が重要である。
- 従来のプロンプト攻撃は巧妙な構造に依存するが，構造を用いなくても有害な出力が得られる例が報告されている。
- LLMの学習過程で自然発生的に現れる有害なトリガーシーケンス（バックドア）の発見が容易かどうかを検証する。
- 本研究では，バックドア探索を「ジャンク化問題」と定義し，その困難性が従来のプロンプト攻撃よりも高いことを示した。
- 一方で，シンプルな探索戦略でも高い成功率でバックドアを発見できることから，自然なバックドアの存在と回収の容易性を示唆している。
- 発見されたトークンシーケンスは，モデル分布において低い確率領域に存在し，学習過程で暗黙的に生成された可能性を支持する。
Link: https://arxiv.org/abs/2605.05116
ドリフトモデルのWasserstein勾配流解釈について [cs.LG, cs.AI, stat.ML]目的：ドリフトモデルのWasserstein勾配流を通じた解析
- 生成モデルは，データ分布を学習し，新たなデータを生成する上で重要な役割を担う。
- 既存手法では，生成モデルの学習が不安定であったり，多様なデータを生成することが難しい場合がある。
- Wasserstein勾配流の視点からドリフトモデルを解釈することで，その理論的基盤を明確にし，改善策を導く。
- Dengらの提案するGMDアルゴリズムの一つは，KLダイバージェンス上のWGFの極限点を求めることに対応する。
- 実際にDengらが実装したアルゴリズムは，Sinkhornダイバージェンス上のWGFの固定点に類似するが，理想的な性質を欠く。
- 同様のアイデアは，MMDやSliced Wasserstein距離など，他のWGFにも拡張可能である。
Link: https://arxiv.org/abs/2605.05118
生理学的根拠に基づいた運転行動の分類：SHAP駆動による重要特徴選択とハイブリッド勾配ブースティングによる多様式生理信号の活用 [cs.AR, cs.LG, eess.SP]目的：運転行動の分類
- 運転中の生理指標の解析は，運転者の状態把握や安全運転支援に不可欠である。
- 生理信号の多次元性により，特徴量選択が課題となっていた。
- 多様式生理信号から運転行動を高精度に分類することを目指す。
- 提案手法は，テスト精度80.91%とマクロF1スコア0.79を達成し，単一モダリティのベースラインや従来の機械学習モデルを大幅に上回った。
- 消去研究により，最適な単一モダリティ（脳波）と比較して8%の性能向上を示し，多様式融合の必要性が確認された。
- SHAP分析の結果，脳波が予測の大部分を担い，皮膚電気活動と筋電図が覚醒度や運動負荷の高い行動の識別に関与することが示された。
Link: https://arxiv.org/abs/2605.05120
オフラインからオンラインへの強化学習における相互作用予算下での適応的ポリシー選択と微調整 [cs.CL, cs.LG, cs.AI]目的：オフラインからオンラインへの強化学習におけるポリシー選択と微調整の効率化
- 強化学習は，ロボティクスやゲームなど，様々な分野で自律的な意思決定を可能にする重要な技術である。
- オフライン強化学習では，過去のデータから学習するため，オンラインでの探索コストが高い環境での活用が期待される。
- 本研究は，限られたオンライン相互作用の中で最適なポリシーを効率的に見つけ，継続的な改善を目指す。
- 提案手法は，既存のオフラインからオンラインへの強化学習のベースラインと比較して性能が向上することを示した。
- オフライン評価とオンライン評価の信頼性の問題に対し，上界信頼区間アプローチを用いた適応的なポリシー選択と微調整を行う。
- 相互作用予算を考慮しつつ，事前には改善の有無が不明なポリシーに対しても，効率的にオンラインでの微調整を可能にする。
Link: https://arxiv.org/abs/2605.05123
臨床アラートのための条件付き外れ値検出 [cs.LG, cs.CY]目的：臨床管理行動における異常の検出
- 医療現場における安全確保は重要であり，患者ケアの質向上に不可欠である。
- 電子カルテのデータには潜在的なエラーが含まれており，早期発見が課題である。
- 過去の患者データに基づき，異常な行動を検出し，エラーを未然に防ぐことを目指す。
- 異常検知によるアラートは，比較的低い誤報率で実施可能であることが示された。
- 異常の強さとアラート発生率には正の相関関係が認められた。
- 専門家パネルの意見に基づき，本手法の有効性が支持された。
Link: https://arxiv.org/abs/2605.05124
不完全な医療データからの共同効果推定：LLM駆動進化型MNAR代入による時間的因果正規化フロー [cs.LG, cs.AI]目的：不完全な縦断的医療データからの治療効果推定
- 医療データ分析において，因果推論は治療法の効果を評価し，医療政策の改善に不可欠である。
- 電子カルテデータには，時間変化する交絡因子やMNARバイアスが存在し，正確な因果推論を困難にしている。
- 本研究は，時間的因果構造とMNAR欠損を同時に扱うことで，電子カルテデータからのより頑健な治療効果推定を目指す。
- CausalFlow-Tは，DAG制約と厳密な推論により，交絡因子を分離し，正確な反事実推論を可能にする。
- LLM駆動進化型代入法は，欠損データに対し，実行可能な代入操作を提案し，バイアスを低減しながら，高い予測精度と時間的外挿性能を示す。
- スイスの2型糖尿病患者データ分析において，GLP-1受容体作動薬がSGLT-2阻害薬と比較して，平均的に-0.98kgの体重減少効果を示すことが示された。
Link: https://arxiv.org/abs/2605.05125