arXiv雑要約

AI - 2026/06/19 公開

報酬が欠損確率に依存するマルコフ決定過程におけるオフポリシー評価 [stat.ML, cs.LG]目的：報酬が欠損確率に依存するマルコフ決定過程におけるオフポリシー評価手法
- オフライン強化学習は，実世界のデータから効率的に学習可能。医療やマーケティング等への応用が期待される。
- 記録の不完全性等により，報酬が欠損しているデータが頻繁に存在する。欠損メカニズムが無視できない場合，バイアスが生じる。
- 報酬欠損確率に依存する状況下で，正確なオフポリシー評価を行うための手法を開発し，バイアスを軽減すること。
- 報酬依存のプロペンシティモデルと将来状態をシャドウ変数として利用し，完全データ条件付き平均報酬を特定する。
- 明示的に欠損メカニズムをモデル化することなく条件付き平均報酬を復元するブリッジ関数を導入し，二重サンプリングを回避。
- 復元された報酬を伝播させ，過去の欠損指標に依存するターゲットポリシーを可能にするFitted-Q-Evaluation様式のエスティメータを提案。
Link: https://arxiv.org/abs/2606.20206
学習と汎化の統計的性質 [cond-mat.mtrl-sci, cs.CE, stat.ML, cs.LG, hep-ph, physics.data-an]目的：深層学習の統計的性質の解明
- 深層学習は様々な分野で目覚ましい成果を上げているため，その本質を理解することは重要である。
- 古典的な統計学の直感に反する現象が多く，理論的な理解が十分ではない。
- 深層学習モデル構築の選択や，物理学への応用における制約を明らかにすること。
- 深層学習におけるニューラルスケーリング則という現象に着目し，その特徴と驚くべき点を物理学の視点から分析した。
- 深層学習モデル構築における様々な選択が，性能にどのように影響するかを考察した。
- 物理学の問題に機械学習を適用する際の制約と誘導バイアスとの関連性について議論した。
Link: https://arxiv.org/abs/2606.20299
量子リング全削減：分散学習における通信とプライバシーの利点 [quant-ph, cs.DC, cs.LG]目的：分散学習のための通信効率と情報理論的なプライバシーの向上
- 機械学習モデルの規模拡大に伴い，分散学習の重要性が増している。
- 分散学習における通信量とプライバシー保護が課題となっている。
- 量子通信を利用して，これらの課題を同時に解決することを目指す。
- 量子リング全削減により，通信量を理論的に最適化された係数2で削減可能。
- 検証されたエンタングルメントを通じて，古典的なプロトコルでは不可能な情報理論的なプライバシー保証を実現。
- 勾配の衝突検出において，量子的な優位性を示す。特に，Margin-based alignment testingとTieAuditにおいて，古典的な通信量と比較して著しい優位性がある。
Link: https://arxiv.org/abs/2606.20344
共通ノイズにおけるWasserstein不確実性の下でのロバストQ学習 [math.OC, cs.AI, cs.LG, math.PR, stat.ML]目的：平均場制御問題に対するロバストQ学習アルゴリズム
- 大規模システム制御において，多数のエージェントの相互作用を平均場として近似することで，問題を扱いやすくする手法である。
- 共通ノイズの確率分布が不明確な場合，制御性能が低下する可能性がある。分布の不確実性にロバストな手法が求められている。
- 共通ノイズのWasserstein距離に基づく不確実性を考慮し，ロバストなQ学習アルゴリズムを開発することで，性能劣化を抑制する。
- 提案手法は，同期および非同期学習スキームの両方に対して収束性が証明され，有限時間反復回数についても評価された。
- 数値実験の結果，非同期実装は理想的なベルマン反復と比較して良好な性能を示し，共通ノイズの誤指定に対するロバスト性を示した。
- また，非同期Q学習アルゴリズムの収束行動についても観察された。
Link: https://arxiv.org/abs/2606.20356
HEPTv2：荷電粒子再構成のためのエンドツーエンド効率的な点Transformer [hep-ex, cs.LG]目的：荷電粒子の軌跡再構成における精度と効率の向上
- 高エネルギー物理学において，粒子の軌跡再構成は基本的な推論問題であり，実験の根幹をなす。
- 高輝度LHCでは，衝突密度の増加に伴い，追跡の精度と効率を維持することが課題となっている。
- エンドツーエンドで最適化可能な点Transformerアーキテクチャによる，高速かつ高精度な軌跡再構成を目指す。
- HEPTv2は，TrackMLデータセットにおいて，98.6%のダブルマジョリティ追跡効率と0.8%の偽陽性率を達成した。
- 推論時間は約15ms，ピークメモリ使用量は0.4GBであり，従来のTransformerやグラフベースパイプラインと比較して，効率と速度の両方を向上させた。
- HEPTv2は，リアルタイムの粒子再構成において，HL-LHCに必要な精度と効率を提供できることを示した。
Link: https://arxiv.org/abs/2606.20437
SSH-Net：競合リスク下における故障時間分布関数の予測のための深層ニューラルネットワーク - GPUデータへの応用 [stat.ML, cs.LG, stat.AP, stat.CO]目的：競合リスク下の故障時間分布予測
- 工学分野では競合リスクが頻繁に観測され，複雑な状況下での時間生存分析に課題をもたらす。
- ニューラルネットワークの構造の複雑さから，様々なデータ入力に対するハイパーパラメータ調整が困難である。
- 複雑な構造を持つシステムの各レベルを考慮した，より精度の高い故障時間予測を実現する。
- 提案手法SSH-Netは，ニューラルネットワーク構造をデータ構造と関連付け，異なる共変量グループが個別のサブネットワークを通じて故障予測に影響を与える。
- シミュレーション研究において，Brierスコア，AUC，RMSEなどの指標を用いてSSH-Netの予測精度が検証された。
- Titan GPUの故障時間データを用いた実験により，SSH-Netが故障時間分布関数を予測する能力が示された。
Link: https://arxiv.org/abs/2606.20451
拡散に基づく音声生成のための音声分類器の再利用 [eess.AS, cs.AI, cs.LG]目的：拡散生成における分類器の再利用による音声生成手法
- 音声合成技術は，人間と機械の自然な対話を可能にする重要な技術である。
- 従来の分類器ガイダンスは，分類器と拡散モデルの2つのモデルを必要とし，計算コストが高い。
- 単一のモデルで高品位な音声合成を可能にし，計算コストとメモリ使用量を削減すること。
- 事前学習済みの音声分類器を拡散生成の基盤として再利用できることを示した。
- 分類器の中間表現を再利用する軽量なサブネットワークを訓練することで，条件付き生成が可能となった。
- これにより，メモリフットプリントと計算コストを削減しつつ，高音質の音声合成を実現できる。
Link: https://arxiv.org/abs/2606.20457
マルチエージェントおよび汎用多体系の最適秩序 [q-fin.RM, cs.AI, nlin.AO, physics.soc-ph]目的：マルチエージェントシステムにおける，エージェントの行動と集合的観察間のフィードバックループの分析枠組み
- 複雑なシステムにおける集合的行動を理解し，最適化することは，社会システムや自然現象の解明に不可欠である。
- エージェント間の相互作用や，全体としてのシステムの秩序と強靭性の関係性が十分に解明されていない。
- エージェントのパワー分布と応答関数を設計することで，集合知と最適秩序の創出条件を明らかにすること。
- エージェントのパワーと応答関数という二つの変数から，総パワー，有用パワー，エントロピーなどのマクロな特性が導出された。
- リスク選好係数に基づいたシステムレベルの効用関数を導入し，生産性，安定性，適応性を両立する最適秩序の度合いを算出した。
- 強い同期化は集団的生産性を向上させる可能性があるが，同時にシステム全体の脆弱性を高め，移動性を低下させる可能性が示唆された。
Link: https://arxiv.org/abs/2606.20485
多量子系における変分法と古典ニューラルネットワークを用いたエントロピー推定 [quant-ph, cs.LG]目的：多量子系におけるフォン・ノイマンエントロピーの推定
- 量子情報科学において，量子状態のエントロピーは量子系の性質を理解する上で重要な指標である。
- 大規模量子系では，量子状態の完全な測定が困難であり，効率的なエントロピー推定手法が求められている。
- 変分量子アルゴリズムと古典ニューラルネットワークを用いて，効率的かつ高精度なエントロピー推定を実現すること。
- 変分量子アルゴリズムは，少数の量子ビットで高い精度を示す一方，量子ビット数が増加すると性能が飽和する傾向が確認された。
- 古典ニューラルネットワークは，量子ビット数が増加するにつれて性能が向上し，大規模量子系への適用に適していることが示された。
- 古典ニューラルネットワークは，全状態トモグラフィーに必要な測定量の12.5%で90%程度の精度を達成可能であり，ロバスト性も高い。
Link: https://arxiv.org/abs/2606.20504
多様な蒸留：大規模基盤モデルとドメイン専門家からの多様な知識蒸留 [cs.LG, cs.AI]目的：大規模基盤モデルからコンパクトなドメインモデルへの知識蒸留における性能向上
- 基盤モデルの知識を効率的に伝達することで，特定ドメインのモデル性能を向上させることが重要である。
- 基盤モデルとドメインモデルの間には，容量，アーキテクチャ，モダリティのギャップが存在し，知識伝達を困難にしている。
- 多様な教師モデルの知識を効果的に統合し，性能ギャップを縮小することを目的とする。
- 多様な教師委員会を導入することで，知識蒸留の性能が大幅に向上することが示された。
- 提案手法DiverseDistillは，教師の出力を学生モデルの表現空間に整列させることで，異質教師間の多様性を活用する。
- 推奨タスクにおいて，教師と学生の性能ギャップの73-114%を回復し，既存手法を上回る結果が得られた。
Link: https://arxiv.org/abs/2402.14035
区分線形関数を最小変数数の関数で表現すること [cs.DM, cs.LG, cs.SC]目的：区分線形関数の表現における最小変数数の特定
- 機械学習や最適化問題において，区分線形関数は重要な役割を担う。
- 区分線形関数の効率的な表現方法が未だ十分に解明されていない。
- 区分線形関数を表現する上で必要な最小変数数を理論的に定める。
- 任意の連続な区分線形関数は，高々n+1個のアフィン線形関数のmax関数として表現可能である。
- 関数Fと，その分解に必要な最小変数の数との間には対応関係が存在する。
- 入力空間のテッセレーションとmax関数の変数の数は密接に関連している。
Link: https://arxiv.org/abs/2406.02421
自己注意に基づく非線形基底変換による動的光ファイバ伝送行列のコンパクトな潜在空間モデリング [cs.LG]目的：動的光ファイバ伝送行列の潜在空間をコンパクトにモデリングすること
- 多モード光ファイバは次世代医療内視鏡に不可欠であり，細胞レベルでの画像解像度を実現する可能性を秘めている。
- 光ファイバ内での光の散乱は画像を乱雑にするため，従来の補正方法は静的な線形行列方程式に依存しており，動的な変化に対応できない。
- 自己注意層を用いて光ファイバ伝送行列の表現を変換し，コンパクトな低次元表現を得ることで，この問題を解決する。
- 提案手法は，光ファイバ基底の疎性を大幅に向上させ，参加比pを0.01～0.11の範囲に抑えることに成功した。
- 変換された表現を用いることで，元の行列を10%未満の再構成誤差で再現可能であり，可逆性も実証された。
- このアプローチは，任意の座標表現と長距離相関を持つ光ファイバ行列に適しており，画像再構成ネットワークの性能向上に貢献する。
Link: https://arxiv.org/abs/2406.07775
回転機械の故障診断における，認識的不確実性と確率的不確実性を考慮した深層学習モデルの評価 [cs.LG]目的：回転機械の故障診断のための深層学習モデルにおける，認識的不確実性と確率的不確実性の評価
- 機械の故障は，生産性低下や安全上の問題を引き起こすため，早期発見が重要である。
- 従来の故障診断手法では，未知の故障やノイズに対する対応が不十分である。
- 深層学習モデルを用いて，未知の故障やノイズにロバストな故障診断システムを構築することを目指す。
- 不確実性を考慮した深層学習モデルは，未知の故障やノイズが発生した場合でも，信頼性の高い故障検出を可能にする。
- 特に，深層アンサンブルモデルは，認識的不確実性の存在下において，優れた性能を示した。
- 確率的不確実性の影響を受けやすい環境下でも，深層アンサンブルモデルは，他のモデルと比較して性能劣化が少ない。
Link: https://arxiv.org/abs/2412.18980
マルチエージェントシミュレーションのための統一混合モデルフレームワークUniMM [cs.AI, cs.MA, cs.RO]目的：マルチエージェント行動の多峰性に対応したシミュレーション手法の確立
- 自動運転システムの安全性評価において，現実的な他者行動のシミュレーションは不可欠である。
- 既存手法では，行動の多様性表現と，閉ループ環境下での分布シフトへの対応が課題となっていた。
- 混合モデルを用いたシミュレーションにおいて，分布シフトを抑制し，より現実的なシミュレーションを可能にすること。
- 提案手法UniMMは，回帰ベースの混合モデルや離散NTPモデルを含む主流の手法を統一的に扱うことができる。
- 閉ループサンプル生成アプローチにより，分布シフトを軽減し，現実的なシミュレーションを実現した。
- UniMMフレームワークにおける様々なモデル設定の検討により，WOSACベンチマークにおいて最先端の性能を達成した。
Link: https://arxiv.org/abs/2501.17015
深層Transformerのダイナミクスの統一的視点 [cs.CY, cs.LG, math.AP]目的：深層Transformerのダイナミクス解析
- 機械学習の性能向上にTransformerが不可欠であり，その理論的理解が重要である。
- Transformerの多層構造における注意機構の反復適用が，複雑なダイナミクスを生み出している。
- Transformerのダイナミクスを確率測度の進化として捉え，数学的な解析を通じて解明を目指す。
- 本研究では，TransformerのダイナミクスをVlasov方程式（Transformer PDE）としてモデル化し，様々なself-attention機構に対してwell-posednessとmean-field limitを証明した。
- コンパクトでない初期条件（ガウス分布）においてもTransformer PDEがガウス測度の空間を不変に保つことを示した。
- 深層Transformerにおけるデータの異方性進化と，離散化された場合に見られたクラスタリング現象を捉えた。
Link: https://arxiv.org/abs/2501.18322
敵対的依存性最小化 [cs.LG, cs.CV]目的：特徴量の統計的独立性の実現
- 表現学習において，冗長性の削減は重要であり，効率的な特徴抽出に繋がる。
- 共分散に基づく手法では，非線形な関係性が残存し，完全な独立性を達成できない。
- 非線形な関係性も考慮し，特徴量間の依存性を最小化することで，よりロバストな表現学習を目指す。
- 敵対的学習により，特徴量間の統計的依存性を最小化するアルゴリズムADMを提案した。
- 理論的に，最適解において互いに独立な表現が得られることを証明し，実験的に収束性も確認した。
- PCAの拡張，画像分類の汎化性能向上，自己教師あり学習における次元崩壊の防止などへの応用可能性を示した。
Link: https://arxiv.org/abs/2502.03227
グローバル生活水準指標：主要経済国における長期的分析のための機械学習フレームワーク [cs.LG, cs.AI, econ.EM, stat.AP, stat.ML]目的：主要経済国における生活水準の長期的分析
- 世界経済や地政学的状況の変化は生活費や生活の質に影響を与えるため，長期的な影響を理解する必要がある。
- 既存の指標では，生活水準を多角的に評価できていない場合がある。
- 社会経済的・インフラストラクチャ要因を統合した包括的な生活水準指標を開発し，政策立案に役立てること。
- 本研究では，様々な経済指標を組み合わせたグローバル生活水準指標を提示した。
- 機械学習フレームワークを用いて，一部の国の経済指標の欠損値を補完し，1970年以降の主要経済国の生活水準指標を作成した。
- この指標は，医療，雇用，治安などの改善が必要な分野を特定するための実用的なツールとなりうる。
Link: https://arxiv.org/abs/2502.06866
規制されたソーシャルメディアプラットフォーム下における言語進化のシミュレーション：大規模言語モデルと遺伝的アルゴリズムの相乗的アプローチ [cs.SI, cs.AI, cs.NE]目的：ソーシャルメディアプラットフォームにおける言語戦略の進化過程
- ソーシャルメディアは情報伝達の重要な手段であり，その影響力は大きい。
- プラットフォームの規制により，ユーザーは巧妙な回避戦略を用いるようになる。
- 規制下での言語進化をシミュレートし，効果的な対策を検討すること。
- 対話ラウンド数の増加に伴い，途切れない対話ターン数と情報伝達の正確性が大幅に向上した。
- 抽象的なパスワードゲームと現実的な違法ペット取引シミュレーションの両方で有効性が確認された。
- 40人の参加者によるユーザー調査により，生成された対話と戦略の現実世界での妥当性が検証された。
Link: https://arxiv.org/abs/2502.19193
車両パネル部材のメッシュベースクラッシュワースネス予測のためのグラフニューラルネットワークによる代理モデル [eess.SY, cs.LG, cs.SY]目的：車両パネル部材のクラッシュワースネス予測
- 自動車の安全性向上は重要であり，特にBピラー等の構造部材のクラッシュ性能評価が不可欠である。
- 詳細な形状を持つ3次元部品のクラッシュ解析には高コストな有限要素法が用いられ，設計サイクルを遅らせる原因となっている。
- 複雑な構造形状に対応し，高精度かつ高速なクラッシュワースネス予測を可能にする代理モデルの開発が求められている。
- 提案手法ReGUNetは，FEメッシュをグラフ構造で表現することで，複雑な形状の部品に対応し，高い予測精度を実現した。
- ReGUNetは，既存手法と比較して，平均変形予測誤差を52%以上削減し，計算効率を大幅に改善した。
- ReGUNetは，車両パネル部材のクラッシュワースネス評価を迅速化し，設計サイクルの加速に貢献する。
Link: https://arxiv.org/abs/2503.17386
TerraMind：地球観測のための大規模生成マルチモーダルモデル [cs.HC, cs.RO, cs.SY, eess.SY, cs.CL, eess.SY, cs.SY, cs.CV, cs.AI]目的：地球観測のための大規模生成マルチモーダル基盤モデル
- 地球規模の課題解決に，衛星データ等の多様な空間情報の活用が不可欠である。
- 既存モデルでは，異なる種類の地球観測データを効率的に統合することが困難である。
- 多様な地球観測データを統合し，新たな応用展開を可能にするモデルを開発する。
- TerraMindは，トークンレベルとピクセルレベルの二重スケール表現を組み合わせることで，多様な地球観測データの融合を実現した。
- 「モダリティ思考(Thinking-in-Modalities)」という新たな手法により，ファインチューニングや推論時に人工データを生成し，モデル性能を向上させた。
- PANGAEA等のベンチマークにおいて，既存モデルを上回る性能を達成し，地球観測分野への応用可能性を示した。
Link: https://arxiv.org/abs/2504.11171
FreshRetailNet-50K：生鮮小売における潜在需要の復元と予測のための在庫切れ注釈付き検閲需要データセット [cs.LG]目的：生鮮小売における検閲された需要データの推定
- 小売業において正確な需要予測は，在庫および価格設定方針の策定に不可欠である。
- 在庫切れ時の検閲された販売データが，需要予測に系統的なバイアスを引き起こす。
- 在庫切れ時の正確な需要復元と，それを用いたロバストな需要予測モデルの開発。
- 本研究で提供するFreshRetailNet-50Kデータセットは，高頻度な時系列データと在庫切れの注釈によって，従来の課題を克服する。
- 2段階の需要モデリングにより，予測精度が2.73%向上し，需要過小評価のバイアスがほぼゼロに減少した。
- 本データセットは，需要補完，生鮮在庫最適化，因果関係に基づいた小売分析など，新たな研究の方向性を提供する。
Link: https://arxiv.org/abs/2505.16319
フラッピング翼ドローンのハイブリッド制御のための強化学習双子法 [cs.RO, cs.LG]目的：フラッピング翼ドローンの制御における性能，ロバスト性，サンプル効率の向上
- フラッピング翼ドローンは，その構造と飛行原理から複雑な制御が課題となる。
- 従来の制御手法では，時間変化する非線形性や不完全なセンサーデータへの対応が困難。
- 強化学習と物理モデルを組み合わせることで，効率的かつ安全な制御を実現する。
- 強化学習双子法は，実環境とデジタルツイン間の知識伝達により，サンプル効率を改善した。
- デジタルツインの性能と実環境との一貫性に基づいてエージェントを切り替えることで，ロバスト性を向上させた。
- オフライン識別，オンライン識別，事前学習とオンライン適応を含む3つの初期化方法で有効性が確認された。
Link: https://arxiv.org/abs/2505.18201
バイオアコースティック測位：種に特有の音を地理的信号として [cs.SD, cs.LG, eess.AS]目的：バイオアコースティック信号を用いた地理的測位の可能性
- 生態学研究において，種の分布範囲は重要な情報であり，生息環境の理解に不可欠である。
- 従来の測位技術では，音響情報のみから広範囲な地理的場所を特定することが困難であった。
- 種に特有の音響信号に含まれる地理的情報を活用し，高精度な測位手法を確立することを目指す。
- 本研究では，種の分布範囲予測と検索ベースの測位を組み合わせたハイブリッド手法を提案した。
- 記録された音響信号に含まれる種が多様であるほど，また，時間空間的に集約することで測位精度が向上することが示された。
- 音声と映像の両方を利用するマルチモーダル測位においても，バイオアコースティック信号の有効性が確認された。
Link: https://arxiv.org/abs/2505.18726
分布シフトとAI安全性：概念的・方法論的相乗効果 [cs.LG, cs.AI]目的：分布シフトとAI安全性の概念的・方法論的相乗関係
- AIの社会実装が進む中，その安全性確保は喫緊の課題である。
- AIモデルは学習時と異なる環境下で性能が低下する分布シフトの影響を受けやすい。
- 分布シフトとAI安全性の課題を統合的に解決する手法の確立を目指す。
- 分布シフトへの対策が，AI安全性の目標達成に貢献する可能性があることが示された。
- 特定の分布シフトとAI安全性の問題は，互いに形式的に還元可能であることが明らかになった。
- 分布シフトとAI安全性研究の連携を深めるための統一的な視点を提供した。
Link: https://arxiv.org/abs/2505.22829
MEAL：継続型マルチエージェント強化学習のためのベンチマーク [cs.AI]目的：継続型マルチエージェント強化学習の評価基準
- 強化学習研究において，ベンチマークは重要な役割を果たす。
- 計算資源の制約により，長期間のタスクシーケンスを用いた研究が困難であった。
- マルチエージェント環境における継続学習の評価基準を確立し，課題を明らかにする。
- MEALベンチマークは，JAXとGPUを活用することで，100タスクのシーケンスを数時間で学習可能にした。
- 長期間のタスクシーケンスにおいて，小規模な実験では見られない課題が明らかになった。
- 継続型マルチエージェント強化学習の研究を促進し，適応学習の限界を示す。
Link: https://arxiv.org/abs/2506.14990
ワールドモデル批判 [cs.CL, cs.HC, cs.MA, cs.NI, cs.LG, cs.AI, cs.CL, cs.CV, cs.RO]目的：現実世界の実行可能な可能性のシミュレーション
- 汎用人工知能の開発において，環境をシミュレートするワールドモデルの重要性が高まっている。
- ワールドモデルの定義，構築方法，評価方法など，基本的な概念について議論が不足している。
- 目的のある推論と行動を可能にするワールドモデルの主要な設計要素を検討し，新たなアーキテクチャを提案する。
- ワールドモデルの主要な設計要素として，データ，表現，アーキテクチャ，学習目標，利用法を分析した。
- 汎用ワールドモデルのためのGenerative Latent Prediction（GLP）アーキテクチャを提案した。
- このモデルに基づき，Physical, Agentic, and Nested（PAN）AGIシステムの実現可能性を示唆した。
Link: https://arxiv.org/abs/2507.05169
異常検知におけるベンチマークの再考 [eess.SY, cs.SY, eess.SY, cs.SY, cs.LG]目的：異常検知におけるベンチマーク手法の改善
- 異常検知は，不正行為や故障の早期発見に不可欠であり，様々な分野で重要性が増している。
- 既存のベンチマークでは，単純なアルゴリズムが高度な手法と競合し，実用的な性能評価が困難である。
- 応用分野ごとの特性を考慮したベンチマークにより，適切なアルゴリズム選択を支援することを目的とする。
- 既存のベンチマークが，異常検知アルゴリズムの進歩を阻害しているという問題点が指摘された。
- 異常検知の応用分野を分類し，各分野に特化したベンチマークを構築する必要性が示された。
- 分野ごとの特性に基づいた評価により，アルゴリズムの性能をより正確に比較することが可能となる。
Link: https://arxiv.org/abs/2507.15584
都市環境における学習ベースのRFタスクに対するレイトレーシングの限界について [cs.NI, cs.AI, cs.LG]目的：都市環境における学習ベースのRFタスクのためのレイトレーシングの現実性評価
- 無線通信技術は現代社会の基盤であり，その性能向上が不可欠である。
- 電波伝搬予測の精度が低いと，無線ネットワークの最適化が困難となる。
- 高精度な電波シミュレーションによって，現実環境での性能予測を改善することを目指す。
- シミュレータの忠実度は，基地局ごとの測定値とシミュレーション値の相関係数によって評価された。
- アンテナの位置と向きがシミュレーション結果に大きく影響することが示された。
- シミュレーションデータの最適化により，位置特定誤差が改善されたが，実データのみの場合と比較して依然として誤差が大きい。
Link: https://arxiv.org/abs/2507.19653
オープンRANベースITSにおけるミッション割り当てとタスクオフローディング [cs.DC, cs.AI, cs.GT, cs.LG, cs.NI]目的：オープンRANベースのITSにおけるミッション割り当てとタスクオフローディングの最適化
- 自動運転技術の発展に伴い，リアルタイムでの情報処理が不可欠となっている。
- 既存研究では，ミッション間の相互依存性やオフローディングコストが十分に考慮されていない。
- ミッション間の依存関係とオフローディングコストを考慮した最適化を目指す。
- 提案手法Oranitsは，車両協調を通じて効率的な処理を実現するシステムモデルである。
- メタヒューリスティック手法CGG-AROは，ミッション完了数と全体的な利益をそれぞれ約7.1％と7.7％向上させた。
- 深層強化学習フレームワークMA-DDQNは，ミッション完了数と全体的な利益をそれぞれ11.0％と12.5％向上させた。
Link: https://arxiv.org/abs/2507.19712
HGCN(O): イベント系列データにおける結果予測のための自己調整GCNハイパーモデルツールキット [cs.LG]目的：イベント系列データにおける結果予測のための自己調整型GCNツールキット
- ビジネスプロセスの効率化が重要視される中，将来の状態予測が不可欠である。
- イベント系列データの不均衡性に対応した予測モデルの構築が課題である。
- GCNモデルの自動最適化により，予測精度と安定性を向上させることを目指す。
- HGCN(O)は，O-GCN，T-GCN，TP-GCN，TE-GCNを含む複数のGCNアーキテクチャを統合している。
- GCNConvモデルは不均衡データにおいて優れた性能を発揮し，他のモデルは均衡データで安定した性能を示す。
- 実験の結果，HGCN(O)は従来の予測手法と比較して優れた性能を証明した。
Link: https://arxiv.org/abs/2507.22524
サポート境界経験混合による継続学習 [cs.LG, cs.CV]目的：逐次的なタスクで訓練されたモデルにおける破滅的忘却の軽減
- 機械学習モデルは，新しいタスクを学習する際に以前の知識を失う傾向がある。
- 経験再生はデータ分布を近似するが，決定境界が脆弱になりやすい。
- 決定境界付近の表現を強化し，継続学習の安定性と頑健性を向上させる。
- 提案手法である経験混合(EB)は，CIFAR-10で10%の精度向上を示した。
- CIFAR-100, Tiny ImageNet, ImageNet1Kにおいても，それぞれ6%, 14%, 2%の精度向上を確認した。
- サポート境界データ(SBD)は，決定境界付近の特徴空間を豊かにすることで，安定した学習を実現する。
Link: https://arxiv.org/abs/2507.23534
AIによる学術知識の未来：コミュニティの視点 [cs.RO, cs.RO, cs.DL, cs.AI]目的：学術知識の構造化と統合に関する課題と協力の促進
- 学術情報の爆発的増加により，知識の効率的な整理と利用が不可欠となっている。
- 学術分野におけるAIツールの導入は進むものの，人材不足や分野特化型のソリューションの少なさなどが課題である。
- 学際的な対話と協力体制を構築し，学術知識の構造化と統合を加速させることを目指す。
- 研究コミュニティ間での連携不足が，方法論やモデルの共有を妨げ，進捗を遅らせていることが示唆された。
- 学術知識の構造化と統合における共通の課題と，新たな協力の方向性が特定された。
- 分野を超えた対話を促進するための方法論，および将来の研究方向性が提案された。
Link: https://arxiv.org/abs/2509.02581
構築から注入へ：大規模言語モデルの編集に基づくフィンガープリント [cs.CL, cs.AI, cs.LG]目的：大規模言語モデルの不正な再配布や商用利用からの保護
- 大規模言語モデルの普及に伴い，知的財産保護の重要性が増している。
- 既存のフィンガープリント技術は，防御的なフィルタリングやモデル変更によって弱体化しやすい。
- 構築と注入の両面で頑健なフィンガープリント技術を開発し，所有権の検証を確実にする。
- コード混合フィンガープリント（CF）は，低パープレキシティのコード混合と高複雑性制約により，検知されにくさと自然さを両立する。
- 多候補編集（MCEdit）は，構造的に冗長なトリガー-ターゲットマッピングを構築し，モデル変更に対する耐性を高める。
- 実験により，提案手法が実用性に影響を与えずに，所有権の検証において高い性能を示すことが確認された。
Link: https://arxiv.org/abs/2509.03122
オフライン報酬評価と方策探索による生成型自動入札の強化 [cs.RO, cs.LG, cs.AI]目的：生成型自動入札の性能向上
- 広告効果を最大化するため，自動入札は不可欠なツールである。
- 既存の生成型自動入札法は，静的なデータセットの範囲を超えた探索が困難である。
- オフラインデータを超えた安全かつ効率的な探索を可能にする。
- 提案手法AIGB-Pearlは，生成計画と方策最適化を統合することで，性能のボトルネックを解消する。
- 軌道評価器を構築し，生成されたスコアの質を評価することで，安全な探索を保証するKL制約付きスコア最大化スキームを設計した。
- シミュレーションおよび実世界の広告システムにおいて，提案手法が最先端の性能を示すことが確認された。
Link: https://arxiv.org/abs/2509.15927
RoboSSM: 状態空間モデルによるスケーラブルな文脈内模倣学習 [cs.RO, cs.AI]目的：文脈内模倣学習におけるスケーラビリティ向上
- ロボットの多様なタスクへの適応が求められており，少ないデータでの学習が重要である。
- Transformerベースの手法は計算コストが高く，長いプロンプトに対して性能が低下する。
- 状態空間モデルを用いて，Transformerの制約を克服し，より長い文脈での学習を実現する。
- RoboSSMは，Transformerに代わり，線形時間推論が可能な最新のSSMであるLonghornを用いる。
- LIBEROベンチマークにおいて，RoboSSMは未知のタスクや長期間のタスクにおいて，Transformerベースの手法よりも優れた汎化性能を示した。
- SSMが文脈内模倣学習の効率的かつスケーラブルな基盤となり得ることを初めて実証した。
Link: https://arxiv.org/abs/2509.19658
Transformerの頑健性に対する影響力誘導型コンコリックテスト [cs.SE, cs.LG]目的：Transformerモデルの頑健性を評価するためのコンコリックテスト手法
- 深層学習モデルのセキュリティ確保は重要であり，敵対的攻撃に対する耐性が求められる。
- 既存の敵対的サンプル探索手法は効率が悪く，計算コストが高い場合がある。
- 影響力分析を用いて，効率的に敵対的サンプルを発見し，Transformerモデルの脆弱性を評価する。
- 提案手法は，CIFAR-10データセットにおいて，3つのTransformerモデルで60%の成功率を達成した。
- 従来のブラックボックスアプローチと比較して，成功率が大幅に向上し，攻撃時間も短縮された。
- SHAP値に基づく経路優先順位付けにより，コンコリックテストの実用性が高まったことが示された。
Link: https://arxiv.org/abs/2509.23806
AAPA：大規模言語モデルのポストトレーニングにおける敵対的アンカリングによる選好アライメント [cs.AI]目的：大規模言語モデルのポストトレーニングにおける選好アライメントの改善
- 大規模言語モデルの性能向上は，人間との対話やタスク遂行能力に不可欠である。
- 既存手法は，専門家のデモンストレーションへの過学習や報酬の不完全性による逸脱のリスクがある。
- 敵対的アンカリングにより，選好最適化における安定した意味的基盤を提供し，性能向上を目指す。
- AAPAは，既存のポストトレーニング目標に文レベルの敵対的アンカリング信号を追加するプラグインフレームワークである。
- 実験の結果，AAPAは様々なモデル規模でベースライン目標を安定的に改善した。
- 特に，Qwen3-0.6BとQwen3-4Bにおいて，GRPOベースラインをそれぞれ5.77%，3.75%上回る改善が見られた。
Link: https://arxiv.org/abs/2509.25148
電力系統保護における故障分類と位置特定のための機械学習モデルの制御された比較 [cs.AI, cs.LG, eess.SP]目的：電力系統保護における故障分類および位置特定のための機械学習モデルの性能比較
- 系統規模の拡大と多様化により，従来の保護方式の信頼性確保が課題となっている。
- 研究毎にデータセットや評価条件が異なるため，機械学習モデルの性能比較が困難である。
- 共通のデータセットと条件で機械学習モデルを比較し，性能評価の基準を確立すること。
- 故障分類においては，高性能な非線形モデルは10msでF1スコア0.98以上を達成した。
- 故障位置特定においては，上位モデルは全評価期間で10%程度の定位誤差で安定した性能を示した。
- 系統のトポロジーによって定位精度が変動することから，時間情報だけでなく系統構成の影響が示唆された。
Link: https://arxiv.org/abs/2510.00831
TetriServe：混合DiTワークロードの効率的な提供 [cs.LG, cs.DC]目的：拡散Transformer（DiT）モデルの効率的な画像生成処理
- 高画質画像生成に優れるDiTモデルの活用が重要視されている。
- 既存の提供システムでは，異なる解像度や締め切りに対応できず，GPU利用効率が低い。
- 締め切りに応じた並列度調整により，GPU利用効率とSLO達成率の向上を目指す。
- TetriServeは，時間区切りによるラウンドベースのスケジューリング機構を導入した。
- ステップレベルでの並列度適応により，GPU時間消費を最小限に抑え，締め切り遅延を削減する。
- 最先端のDiTモデルを用いた評価で，既存手法と比較して最大32%高いSLO達成率を達成した。
Link: https://arxiv.org/abs/2510.01565
BLISS：言語モデル事前学習のための軽量な二層影響スコアリング法 [cs.LG]目的：言語モデル事前学習におけるデータ選択のための効率化と汎化性能向上
- 大規模言語モデルの性能は，学習データの質に大きく依存するため，効率的なデータ選択が不可欠である。
- 既存手法は外部の事前学習モデルに依存し，データ選択の効果とモデル自体の影響を分離することが難しい。
- BLISSは外部モデルに依存せず，長期的な影響を考慮することで，より高品質なデータセットを効率的に選択する。
- BLISSは，外部の事前学習モデルに頼らず，小規模なプロキシモデルを用いてデータ選択を行う。
- 二層最適化問題を導入し，プロキシモデルの収束時における長期的な影響をスコアリングする。
- 1Bモデル設定において，最先端手法と比較して1.7倍の学習速度で同等の性能を達成し，複数の下流タスクで優位性を示す。
Link: https://arxiv.org/abs/2510.06048
ヒューマノイド・エブリデイ：オープンワールドにおけるヒューマノイド操作のための包括的なロボットデータセット [eess.SY, cs.SY, eess.SY, cs.SY, cs.RO, cs.LG]目的：オープンワールドにおけるヒューマノイド操作のための大規模で多様なデータセット
- ヒューマノイドロボットは複雑な動作能力を持つが，実用化にはさらなるデータと学習環境が必要である。
- 既存のデータセットは固定環境に限定されるか，タスクの種類が少なく，人間とのインタラクションや移動能力が不足している。
- 多様なタスク，人間とのインタラクション，移動能力を含む大規模データセットを構築し，評価プラットフォームを提供する。
- 本データセットは，RGB，深度，LiDAR，触覚情報を含む高品質なマルチモーダルデータを10.3kの軌跡，300万フレーム以上収録している。
- 260のタスクを7つのカテゴリに分類し，ロボットの学習における強みと限界に関する分析を行った。
- クラウドベースの評価プラットフォームを導入し，研究者がポリシーを容易に展開し，性能フィードバックを得られるようにした。
Link: https://arxiv.org/abs/2510.08807
汎用ダイグラフ対照学習：二つの空間的視点 [cs.LG]目的：有向グラフにおける対照学習の質の向上
- グラフ構造データは，ソーシャルネットワーク等，現実世界の複雑な関係性を表現する上で不可欠である。
- 既存のグラフ対照学習は無向グラフに偏っており，重要な方向性情報を活用できていない。
- 有向グラフの持つ方向性と局所的な非対称性を考慮した対照学習手法を開発し，性能を向上させる。
- 提案手法S2-DiGCLは，磁気ラプラシアンに個別の摂動を導入し，エッジの位相と方向性を適応的に調整する。
- パスに基づくサブグラフ拡張戦略により，細粒度の局所的な非対称性とトポロジ依存性を捉える。
- 7つの現実世界の有向グラフデータセットにおいて，ノード分類とリンク予測で最先端の性能を達成した。
Link: https://arxiv.org/abs/2510.16311
MENTOR：ツール利用蒸留のための柔軟な教師最適化報酬による強化学習 [cs.CL, cs.AI]目的：小規模言語モデルへのツール利用能力の蒸留
- 大規模言語モデルの能力を小規模モデルへ移行することで，実用的な応用が可能となるため。
- 教師データの厳格な模倣は，未知の状況への汎化性能を低下させるという課題がある。
- 柔軟な報酬設計により，小規模モデルの能力制限を克服し，汎化性能を向上させる。
- MENTORは，教師の参照をガイドとしてツール利用行動を促し，行動の整合性と下流タスクの性能のバランスを取る。
- 実験の結果，MENTORはSFTや厳格なRLベースラインと比較して，未知の状況におけるツール利用性能を向上させた。
- 検証可能なツール利用環境において，厳格な軌道複製よりも柔軟なツール利用の整合性が，適応性のある小規模モデルの開発に有効であることが示唆された。
Link: https://arxiv.org/abs/2510.18383
CAGE：曲率を考慮した勾配推定による高精度な量子化対応学習 [cs.LG]目的：低ビット量子化対応学習における精度向上
- 深層学習モデルの効率化は，エッジデバイスでの利用拡大に不可欠である。
- 量子化対応学習は精度劣化が課題であり，フル精度モデルとの差が残存する。
- 量子化による損失増加を抑制する勾配補正手法により，精度低下を最小限に抑える。
- CAGEは，勾配推定に曲率情報を導入し，量子化制約下での損失最小化を両立する。
- 理論的には，量子化最適化におけるパレート最適解の概念を導入し，CAGEの収束性を保証する。
- 実験的に，CAGEは既存手法と比較して精度が向上し，特に3ビット量子化において4ビット量子化と同等の精度を達成する。
Link: https://arxiv.org/abs/2510.18784
臨床推論のための公平なグループ相対ポリシー最適化 (EQPO) [cs.LG]目的：臨床推論における公平性の向上
- 医療AIは診断性能で目覚ましい進歩を遂げているが，少数派グループにおいて精度が低いという課題がある。
- 既存の強化学習ベースの学習は，データに含まれる偏りを増幅させる可能性がある。
- グループ間の表現，タスクの難易度，データソースに応じてサンプルを適応的に重み付けすることで公平性を改善する。
- EQPOは，QoQ-Med3-8BにおけるF1スコアの標準偏差を43.9%削減し，グループ間のF1スコアの最大差を42.7%縮小した。
- MedGemma-4Bでは，公平性改善ベースラインと比較して予測の偏りを27.2%削減し，同時にF1スコアを12.5%向上させた。
- 学習軌跡の分析から，EQPOは最適化の過程で公平性を着実に改善し，暗黙的に発見されたグループは人口統計学的属性と一致することが示された。
Link: https://arxiv.org/abs/2510.19893
テニス予測における非推移的優位性の捉え方：グラフニューラルネットワークアプローチ [cs.LG]目的：テニスにおける非推移的優位性のモデリングと予測精度の向上
- テニス予測は，スポーツ分析において重要な課題であり，公平なランキングや試合結果の予測に不可欠である。
- 従来のレーティングシステムは，推移律を前提としているため，非推移的な関係性を十分に捉えられない場合がある。
- 非推移的な関係性を明示的にモデル化することで，より正確な予測と，従来のシステムでは捉えきれない洞察を得ることを目指す。
- 提案モデルは，既存のレーティングシステムと同程度の予測性能を示し，65.7%の精度，0.214のブライヤー・スコアを達成した。
- 無条件の精度では改善は見られなかったものの，予測包含テストの結果，提案モデルは相補的な情報を提供することが示された。
- 提案モデルと既存のシステムの組み合わせによる予測は，既存システム単体での予測を大きく上回り，特に非推移的な対戦において効果が期待される。
Link: https://arxiv.org/abs/2510.20454
推論能力の向上を超えて：大規模推論モデルにおける汎用能力の忘却の軽減 [eess.SY, cs.SY, cs.LG, cs.AI]目的：大規模推論モデルにおける汎用能力の忘却軽減策
- 近年の言語モデルや画像認識モデルの性能向上には，強化学習が不可欠である。特に，検証可能な報酬を用いた強化学習は，数学やマルチモーダルな推論能力の向上に貢献している。
- 強化学習による能力向上は，モデルが基礎的な能力を忘れてしまうという問題を引き起こす可能性がある。既存の正則化手法では，広範な知識の維持が保証されない。
- 本研究では，動的な目的関数の重み付けによるリプレイ戦略RECAPを提案し，汎用能力の維持と推論能力の向上を目指す。
- 提案手法RECAPは，Qwen2.5-VL-3BおよびQwen2.5-VL-7Bを用いた実験において，汎用能力の維持に有効であることが示された。
- RECAPは，タスク内報酬との柔軟なトレードオフを可能にし，推論能力の向上にも貢献する。
- 本手法は，既存の強化学習パイプラインに容易に組み込むことができ，追加のモデル学習や大規模なチューニングは不要である。
Link: https://arxiv.org/abs/2510.21978
SIGMA：エージェント型数学的推論のための検索拡張型オンデマンド知識統合 [cs.AI, cs.CL]目的：エージェント型数学的推論における知識統合
- 数学的推論は複雑であり，正確な知識アクセスと多段階思考が不可欠である。
- 既存の検索拡張モデルは，単一の視点に依存し，柔軟な検索戦略に乏しい。
- 複数の情報源からの知識を効率的に統合し，推論の精度と効率を向上させる。
- SIGMAは，独立したエージェントが推論，検索，結果の統合を行う統合フレームワークである。
- 各エージェントは仮説的な情報を生成し，文脈に依存した効率的な知識統合を実現する。
- MATH500，AIME，GPQAなどのベンチマークで，既存システムを大幅に上回り，性能を7.4%向上させた。
Link: https://arxiv.org/abs/2510.27568
データシフト下における画像分類器の深層アンサンブルの線形モード接続性 [cs.LG]目的：深層アンサンブルにおける線形モード接続性
- 深層学習の安定性，汎化性能，モデル多様性に影響する重要な概念である。
- データシフトが線形モード接続性に与える影響が不明確であった。
- データシフトの影響を軽減する条件を特定し，効率と多様性のバランスを解明する。
- データシフトは，ノイズ源として作用し，学習率やバッチサイズの影響を受けることが示された。
- 線形モード接続性により学習されたモデルは，異なる領域に収束するモデルより類似した誤りを起こす傾向がある。
- 線形モード接続性は，学習効率と多様なアンサンブルから得られる利点のバランスをとる上で有効である。
Link: https://arxiv.org/abs/2511.04514
シーソーに別れを告げる：ハイブリッド意図の二重制約による正確なロングテールセッションベース推薦へ [cs.IR, cs.AI]目的：ロングテールセッションベース推薦の精度向上
- 推薦システムにおいて，多様性の確保は重要であり，ロングテールアイテムの活用が不可欠である。
- 従来のロングテール対策は精度低下を招き，多様性と精度の両立が課題であった。
- セッションに無関係なノイズを識別・抑制することで，ロングテールと精度のトレードオフを解消する。
- 提案手法HIDは，属性情報を考慮したスペクトルクラスタリングにより，アイテムと意図のマッピングを再構築し，ノイズの識別を実現した。
- 多様性と精度に関する二重制約損失を導入することで，アイテムとセッションの表現学習を効果的に制御した。
- 複数のSBRモデルとデータセットにおける実験により，HIDがロングテール性能と推薦精度を同時に向上させることが示された。
Link: https://arxiv.org/abs/2511.08378