arXiv雑要約

AI - 2026/06/05 公開

  • 雲除去のための適応三角トランスフォーマー [cs.CV, cs.AI]目的:リモートセンシング画像における雲に隠された地上の物体を正確に復元すること
    • リモートセンシング技術は,地球観測や環境モニタリングにおいて重要な役割を担う
    • 雲による画像情報の遮蔽は,解析精度を低下させる大きな課題である
    • 雲の影響を軽減し,より正確な画像解析を可能にすること
    • 本研究では,計算コストを削減し,雲の影響を抑制する適応三角トランスフォーマー(ATT-CR)を提案した。
    • ATT-CRは,三角行列を用いた効率的な注意機構(TAN)と,雲とクリアな特徴を識別するゲート機構(FSGM)を組み合わせている。
    • 実験結果から,ATT-CRが既存手法と比較して優れた雲除去性能を持つことが示された。

    Link: https://arxiv.org/abs/2606.05999

  • ベクトル類似度を超えて:産業知識グラフのためのグラフ拡張検索の構造的分析 [cs.AI]目的:産業知識グラフにおけるグラフ拡張検索の構造的分析
    • 知識グラフは,複雑な関係性を表現し,高度な推論を可能にする重要な技術である。
    • 従来の検索手法では,知識グラフ内の構造的な関係性を捉えることが難しく,性能が制限される。
    • 構造的な推論が必要なクエリに対する検索性能を向上させることを目指す。
    • ベクトル検索では到達できないクエリクラスが存在し,構造的な検索が重要であることが示された。
    • LLM Query Plannerと9種類のグラフ走査プリミティブが,カスタムハンドラよりも優れた性能を示した。
    • グラフ計算ツールを追加することで,LLMは走査が失敗するクエリカテゴリに対して,それらを適切に選択して利用した。

    Link: https://arxiv.org/abs/2606.06003

  • 適応的逐次データ生成のための拡散モデル [cs.CL, cs.LG]目的:現実的な逐次データの生成
    • 予測,シミュレーション,リスク評価など,時系列データは様々な分野で不可欠である。
    • 既存の拡散モデルは,逐次データにおける時間的依存性や情報構造を捉えきれない。
    • 将来情報を先取りしない,適応的な逐次データ生成を可能にすることを目指す。
    • 提案手法は,逐次データに沿ってノイズを注入・除去することで,適応的な時系列生成を実現する。
    • 効率的な並列学習のための新しいスコアマッチング目的関数を導入し,ReLUネットワークによる理論的な保証を導出した。
    • 合成データやポートフォリオ構築において,その有効性を実証した。

    Link: https://arxiv.org/abs/2606.06007

  • 時間系列予測のための適応的振動状態アライメント [cs.LG, cs.DB]目的:時間系列予測における長期的な予測精度向上
    • 時間的構造の理解は,長期的な時間系列予測において重要である。
    • 既存手法は,周期性に対する固定的なテンプレートに依存し,現実の非定常な変動に対応できない。
    • 振動状態アライメントにより,非定常性に対応し,予測精度を向上させる。
    • 提案手法AOSNETは,ヒルベルト変換を用いて時間系列の振動状態を適応的にアライメントする。
    • AOSNETは,信頼性の高い観測値を保持しつつ,不一致な領域を修正する。
    • 8つのベンチマークテストで,最先端または非常に競争力のある精度を達成した。

    Link: https://arxiv.org/abs/2606.06010

  • モデルベース制御とマルチエージェント強化学習の統合によるマルチエージェント協調チーム戦略 [cs.RO, cs.LG, cs.MA]目的:マルチエージェント協調タスクにおける安全で動的に実行可能な行動の実現
    • 複雑な協調タスクにおいて,複数のエージェントが効率的に連携する戦略の確立が重要である。
    • 従来の強化学習は,離散的な報酬や長期間の計画立案において課題があり,安全性の確保が難しい。
    • モデル予測制御の堅牢性と強化学習の協調性向上により,安全かつ効率的な協調行動を実現すること。
    • 提案手法MA-AC-MPCは,マルチエージェント追跡・回避シナリオにおいて,MA-AC-MLPモデルよりも優れた戦略を発揮した。
    • 異種環境において,ドローンと全方向車輪型ロボットの協調着陸において,MA-AC-MPCは100%の成功率を達成し,MA-AC-MLPの60%を上回った。
    • MA-AC-MPCアルゴリズムは,ハードウェア環境においてロバスト性も実証された。

    Link: https://arxiv.org/abs/2606.06011

  • PLAN-S:潜在的スタイルダイナミクスを用いた計画とワールドモデルの架け橋 [cs.AI, cs.RO]目的:潜在的スタイルダイナミクスの計画への応用
    • 自動運転における予測能力向上は,安全性と効率性を両立させる上で不可欠である。
    • 既存のLWMベースのプランナーは,潜在表現から直接軌跡を生成するため,リスクや走行様式を明示的にモデル化できていない。
    • 潜在表現から走行様式を考慮したコストマップを生成し,より安全で多様な軌跡計画を実現することを目指す。
    • PLAN-Sは,潜在表現からスタイルに依存したセマンティックコストマップを生成することで,計画とワールドモデル間のギャップを埋める。
    • nuScenesデータセットにおいて,PLAN-Sはベースラインと比較してL2誤差を減らし,衝突率を42%削減した。
    • NAVSIM環境では,ルールベースのコストマップが89.4のPDMSを達成し,学習ベースのコストマップは困難なシーンにおいて更なる改善を示した。

    Link: https://arxiv.org/abs/2606.06014

  • OPRD:オンポリシー表現蒸留 [cs.LG, cs.AI]目的:オンポリシー表現蒸留における性能向上
    • 大規模言語モデルの知識蒸留は,計算資源の制約下での高性能モデル開発に不可欠である。
    • 従来の出力空間のみでの蒸留は,分散の大きさや中間層情報の損失といった課題を抱えていた。
    • 隠れ層空間での表現蒸留により,これらの課題を克服し,より効率的な学習を目指す。
    • OPRDは,AIME 2024/2025およびAIMOデータセットにおいて,教師モデルとの性能差を縮小することに成功した。
    • 出力空間での蒸留手法と比較して,学習速度が1.44倍向上し,メモリ使用量を54%削減した。
    • OPRDは,教師モデルの隠れ層表現を活用することで,サンプリング分散を排除し,より豊富な層構造情報を活用できる。

    Link: https://arxiv.org/abs/2606.06021

  • EGTR-Review:マルチエージェント教師蒸留による効率的な根拠に基づいた科学論文ピアレビュー生成 [cs.CL, cs.CL, cs.AI]目的:科学論文のピアレビュー生成
    • 研究評価の効率化が求められており,ピアレビューの負担軽減が重要である。
    • 既存手法では,根拠が不十分で出典の追跡が困難な汎用的なコメントが生成されやすい。
    • 根拠に基づき,出典を明示した質の高いピアレビューを効率的に生成することを目指す。
    • EGTR-Reviewは,論文の構造に基づいた分解,重要な要素の抽出,外部文献の検索などを行うマルチエージェント教師を構築する。
    • この教師の推論過程と最終的なレビューコメントを,タスクプレフィックスを用いたマルチタスク学習により軽量な学生モデルに蒸留する。
    • 実験の結果,EGTR-Reviewは,自動評価,LLMによる評価,人間による評価において,既存手法を上回り,低いトークン消費量と推論時間で高い事実に基づいた根拠と出典の追跡性を維持した。

    Link: https://arxiv.org/abs/2606.06025

  • RedditPersona:Redditを用いたコミュニティ条件付きLLM適応のためのモジュールフレームワーク [cs.AI, cs.CL, cs.LG, cs.SI]目的:コミュニティ条件付き言語モデル適応のための標準化されたフレームワーク
    • LLMの適応は,特定のコミュニティのニーズに対応する上で重要である。
    • データ収集,コミュニティ定義,評価が個別に行われ,比較や再利用が困難である。
    • 標準化されたフレームワークにより,これらの選択肢を体系的に比較・再利用可能にする。
    • RedditPersonaは,Redditの投稿とコメントを収集し,ユーザーをプロファイリングし,5つのグループ化戦略に基づいて分割する。
    • 各戦略に対してQLoRAを用いてパラメータ効率の良いアダプターを学習し,共通の評価指標を用いて評価する。
    • アダプターの行動識別性は,各戦略のsubredditベースラインとの内在的な一致を追跡し,識別性と実際のテキストとの分布類似性の間には一貫したトレードオフが存在する。

    Link: https://arxiv.org/abs/2606.06027

  • 破滅的忘却はアクセス困難性として:継続学習における知識保持のための三層フレームワーク [cs.CY, cs.CL, cs.LG]目的:継続学習における知識保持メカニズムの解明
    • 機械学習モデルの継続学習は,人間の学習能力に匹敵する知能開発に不可欠である。
    • 継続学習において,過去の知識が上書きされ,性能が著しく低下する「破滅的忘却」が課題となっている。
    • 破滅的忘却が知識の完全消去ではなく,アクセス困難性から生じる可能性を検証する。
    • 破滅的忘却は,タスク精度が54.8%から0%へ低下する一方で,表現情報の76%は保持されていることが示された。
    • 最終分類器のみの再学習により,元のタスク性能の75.7%を復元可能であり,バックボーンネットワークの変更は不要である。
    • 初期および中間層には高度に復元可能なタスク情報が保持されており,高次元分散表現として知識が維持されていることが示唆された。

    Link: https://arxiv.org/abs/2606.06032

  • 十分な精度が最適である:量子化されたGated DeltaNetのための乗算のみによる行列逆行列近似 [cs.RO, cs.LG, cs.AI]目的:長文脈モデリングにおける行列反転の高速化
    • 長文脈モデリングは,自然言語処理やコンピュータビジョンの分野で重要性を増している。
    • 行列反転は計算コストが高く,特にNPUのようなハードウェアでは並列性が制限される。
    • 本研究は,行列反転の近似計算により,計算コストを削減し,ハードウェアの利用効率を向上させる。
    • 提案手法は,線形アテンションにおける下三角行列の反転を高速化する乗算のみのアルゴリズムである。
    • Qwen3.5-familyモデルを用いた実験により,カーネルレベルで最大5倍の高速化と,デコード層のオーバーヘッドを20%削減できることが示された。
    • 浮動小数点演算および低精度推論の両方において,精度を維持しつつ,スケーラブルな線形アテンションを実現する効率的な手法である。

    Link: https://arxiv.org/abs/2606.06034

  • 記憶は想起されるのではなく再構築される:LLMエージェントのためのグラフメモリ [cs.CE, cs.AI, cs.IR]目的:長期的な対話履歴における推論
    • LLMエージェントの応用範囲拡大には,過去の情報を活用する能力が不可欠である。
    • 既存手法は静的な検索・推論パイプラインに依存し,推論過程での動的なメモリアクセスが困難である。
    • 推論の文脈に応じてメモリへのアクセスを動的に適応させ,効率的な長期記憶推論を実現すること。
    • MRAgentは,LLMの推論をメモリアクセスに直接組み込むことで,動的な探索と枝刈りを可能にした。
    • LoCoMoとLongMemEvalの評価で,既存のベースラインと比較して最大23%の性能向上を示した。
    • トークン数と実行時間を大幅に削減し,効率的な長期記憶推論の有効性を示した。

    Link: https://arxiv.org/abs/2606.06036

  • ゼロショット転移学習によるロボット操作タスクのための効率的な低レベルモーションプランニング [cs.RO, cs.SY, eess.SY, cs.RO, cs.AI, cs.NE]目的:ロボット操作タスクにおける低レベルモーションプランニングの効率化
    • ロボットの高度化に伴い,モーションプランニングの複雑化と学習時間の長期化が課題となっている。
    • 従来のiCEMでは,積み重ねやスライド,棚への配置など,複雑なシナリオでの性能が制限される場合がある。
    • 転移学習と報酬再設計により,複雑なタスクにおけるiCEMの性能向上を目指す。
    • 提案手法は,シミュレーションにおいて最大23%の成功率向上を達成した。
    • 実機Franka Emikaロボットを用いた積み重ねタスクでも,実用的な有効性が確認された。
    • 転移学習を活用することで,より複雑なタスクへの知識転用を効率的に行うことができた。

    Link: https://arxiv.org/abs/2606.06041

  • 偏微分方程式の解作用素の疎近似法による学習 [cs.CL, math.NA, cs.LG, cs.NA]目的:偏微分方程式の解作用素の近似
    • 偏微分方程式は自然科学・工学の様々な分野で基本的なモデルであり,その高速な解法が求められている。
    • 高次元問題における従来の数値解法は計算コストが高く,効率的な近似手法の開発が課題である。
    • 疎近似法を用いて,必要な偏微分方程式の求解回数を削減し,計算効率を向上させることを目指す。
    • 本研究で提案する手法は,既存のキュビチャーベースの疎近似法と比較して,必要なサンプル数を大幅に削減できることが示された。
    • また,フーリエニューラル演算子との比較においても,精度を維持しつつ計算時間を短縮できることが確認された。
    • 得られた疎なインデックス集合は,重要な変数やパラメータ間の相互作用に関する解釈可能な洞察を提供する。

    Link: https://arxiv.org/abs/2606.06046

  • 誤指定下における関数近似を用いたオンラインKL正則化強化学習 [cs.RO, cs.FL, cs.LG]目的:誤指定下でのオンラインKL正則化強化学習における後悔量の解析
    • 強化学習は,複雑な意思決定問題への応用が期待され,その理論的基盤の確立が重要である。
    • 従来の理論的保証は,モデルの完全な適合性を仮定しており,現実的な誤指定環境下では適用できない場合がある。
    • 誤指定環境下でも有効な強化学習アルゴリズムの理論的保証を与えることを目指す。
    • KL誤指定の定式化を導入し,文脈バンディットとエピソード強化学習における回帰ベースのアルゴリズムを解析した。
    • 誤指定項を含む明示的なKL後悔量の高確率保証を確立し,実現可能な設定を特殊ケースとして復元した。

    Link: https://arxiv.org/abs/2606.06053

  • 類似性を超えて:パーソナルAIエージェントのための信頼性の高いメモリー検索 [cs.AI]目的:パーソナルAIエージェントにおける信頼性の高いメモリー検索の実現
    • AIエージェントの性能向上の鍵は,過去の経験を活かした継続的なパーソナライズにある。
    • 既存のメモリー検索は類似度に基づくため,文脈にそぐわない情報の漏洩などのリスクがある。
    • メモリー検索における信頼性の高いゲート機構を導入し,リスクを軽減することを試みる。
    • 既存のメモリーフレームワークは,タスクの解釈や行動に大きな影響を与え,脆弱性を示すことが判明した。
    • 提案手法MemGateは,わずかなパラメータ数とフットプリントで,メモリー検索時の信頼性を向上させる。
    • MemGateは,既存のフレームワークに容易に組み込み可能であり,メモリー由来の脅威を軽減しつつ,有用性を維持する。

    Link: https://arxiv.org/abs/2606.06054

  • 記憶が沈黙すべき時:記憶拡張型対話エージェントにおける記憶利用境界の測定 [cs.AI]目的:記憶拡張型対話エージェントにおける記憶利用の妥当性評価
    • 対話エージェントのパーソナライズされた対話能力向上には,長期記憶が不可欠である。
    • 既存の研究では,記憶の検索精度やタスク遂行能力に焦点が当たり,記憶内容の利用妥当性が未解明である。
    • 本研究は,機密性の高い記憶内容が現在の対話で適切に利用されているかを評価する。
    • 実験結果から,GPT-5.4-miniと他のLLMでは,記憶へのアクセス状況によって行動が大きく異なることが明らかになった。
    • 特にClaude-Sonnet-4.6, DeepSeek-V4-Flash, Qwen3.5-9Bでは,記憶へのアクセス時に機密情報が統合される割合が大幅に減少した。
    • 安全なパーソナライズのためには,検索時だけでなく生成時にも記憶を考慮した判断が必要であることが示唆された。

    Link: https://arxiv.org/abs/2606.06055

  • ラショモン集合を用いた変態テスト:機械学習における説明の忠実性 [cs.SE, cs.AI, cs.LG]目的:機械学習における説明の忠実性の評価
    • 機械学習の信頼性向上は,社会実装において不可欠である。
    • 説明可能性を持つ機械学習モデルでも,説明の解釈にばらつきが生じる。
    • 説明の忠実性を検証する手法を確立し,信頼できるモデルを選定すること。
    • 変態テストに基づいたフレームワークを提案し,正解ラベルなしで説明の忠実性を評価する。
    • 5つの変態関係を形式化し,モデルの挙動と特徴量の重要性の整合性を検証した。
    • 提案手法は,テーブルデータとSHAP,LIMEを用いた実験で有効性を示した。

    Link: https://arxiv.org/abs/2606.06056

  • MDP-GRPO:多制約指示追従のための安定化グループ相対方策最適化 [cs.LG, cs.AI, cs.CL]目的:多制約指示追従における,グループ相対方策最適化の安定化
    • ロボット工学等において,複数制約下での指示追従は重要な課題である。
    • 従来のGRPOは,離散的で分散の低い報酬下で不安定になるという問題がある。
    • 報酬の分散を増やし,勾配消失を防ぐことで学習の安定化を目指す。
    • MDP-GRPOは,FollowBench,IFEval,および多制約データセットにおいて,標準的なGRPOを上回る性能を示した。
    • 特に,Llama-3.2-3Bにおいて厳密な制約充足率が最大5.0%向上した。
    • 小規模なグループサイズでも安定した収束を実現し,MMLUやARCといった汎用能力も維持している。

    Link: https://arxiv.org/abs/2606.06058

  • 記号的状態を介した視覚空間計画の学習:モダリティギャップを意識した自己蒸留 [cs.NI, cs.AI, cs.CV]目的:視覚空間計画の学習
    • 視覚と言語を組み合わせたモデルは多岐にわたるタスクで性能を発揮するが,空間計画は依然として困難である。
    • 画像から潜在的な状態構造を推論し,行動を決定する視覚計画は,記号的な計画に比べて推論が難しい。
    • モダリティギャップを意識した自己蒸留によって,視覚モデルの認識能力と計画能力を向上させる。
    • 提案手法MGSDは,2段階の自己蒸留フレームワークによって,視覚モデルの状態表現の信頼性を高める。
    • MGSDは記号的な状態を用いて教師モデルが計画能力を伝え,視覚モデルのロールアウトを監督することで,計画性能を向上させる。
    • 実験結果から,MGSDは4Bおよび8Bのバックボーンで視覚計画の性能を大幅に向上させ,記号入力の上限に迫る結果が得られた。

    Link: https://arxiv.org/abs/2606.06076

  • 生成フロー場代理モデルによる水中3次元経路計画 [cs.RO, cs.LG]目的:水中ロボットの母船への自律的な投入・回収経路計画の最適化
    • 水中ロボットの自律運用は,海洋資源探査やインフラ点検に不可欠であり,その性能向上は重要である。
    • 推進器後流のような複雑な流れ場は,従来の均一電流モデルでは正確に表現できず,経路計画の精度が制限される。
    • 高精度な流れ場予測モデルを高速に提供することで,リアルタイムな経路計画を可能にし,ロボットの安全性を高める。
    • 高精度なCFD計算によって得られる流れ場情報を,生成敵対ネットワーク(cGAN)を用いて代替することで,計算コストを大幅に削減した。
    • cGANは,CFD計算に比べて数百万倍高速に流れ場を予測し,リアルタイムな経路計画への応用を可能にした。
    • cGANによる経路計画は,均一電流モデルと比較して,エネルギー消費量と高速流れへの遭遇頻度をそれぞれ45-60%削減できることが示された。

    Link: https://arxiv.org/abs/2606.06077

  • Max@K方策勾配における利得推定について [cs.CL, cs.LG, cs.AI, cs.CL]目的:Max@K方策勾配における利得推定の改善
    • 強化学習は,検証可能な報酬を通じて推論モデルの性能評価に広く利用されている
    • 疎な報酬設定下では,探索が困難になるという課題が存在する
    • 推論時の目的関数であるpass@Kやmax@Kの最適化における利得推定の課題を解決する
    • 既存の利得推定法は信号,ベースライン,正規化が異なり,その関係性が不明確であった
    • 提案手法MaxPOは,Leave-Two-Outベースラインを採用し,利得推定の分散を低減する
    • Max@Kの正準的な有限バッチ利得を導出し,既存の推定法を統一的に理解することを可能にした

    Link: https://arxiv.org/abs/2606.06080

  • 集合値AIアドバイスへの適切な依存度を測るためのフレームワーク [cs.AI, cs.HC]目的:集合値AIアドバイスへの適切な依存度の測定
    • 人間とAIの協働において,AIの助言に対する適切な信頼度は重要な研究テーマである。
    • 既存のフレームワークは,点予測のみをAIアドバイスとして扱ってきた。
    • 不確実性の伝達や人間の意思決定改善に有効な集合値AIアドバイスに対する評価方法を確立する。
    • 本研究では,分類および回帰タスクにおいて,集合値AIアドバイスへの適切な依存度を測定するための初のフレームワークを提案した。
    • 分類タスクでは,集合値AIアドバイスを評価するための次元を導入し,AIへの正しい依存率と自己への正しい依存率という2つの指標を定義した。
    • 回帰タスクでは,AI依存の量と質を導入し,意思決定者がAIアドバイスを活用したか,およびその依存が初期推定値からの改善に貢献したかを測定した。

    Link: https://arxiv.org/abs/2606.06081

  • 潜在スキル:LLMエージェントのための文脈内テキストスキルから重み空間内潜在スキルへ [cs.CL, cs.AI]目的:LLMエージェントの拡張のための,効率的かつモジュール化されたスキルの基盤
    • LLMエージェントの能力向上には,再利用可能なタスク手順の組み込みが不可欠である。
    • 文脈内スキルはオーバーヘッドが大きく,スキルの内容が平文として露呈する問題がある。
    • 重み空間にスキル知識を格納することで,コンテキストオーバーヘッドを削減し,モジュール性を維持する。
    • LatentSkillは,テキストスキルをプラグアンドプレイ可能なLoRAアダプターに変換するフレームワークである。
    • ALFWorldおよびSearch-QAにおいて,文脈内スキルと比較して性能が向上し,トークン使用量も大幅に削減された。
    • 生成されたLoRAは構造化された意味的幾何学を形成し,LoRAスケーリング係数で制御可能であり,パラメータ空間の演算で合成できることが示された。

    Link: https://arxiv.org/abs/2606.06087

  • 意味的組織を超えて:長期的エージェントのための実行状態管理としてのメモリ [cs.CL, cs.AI]目的:長期的なタスクにおける実行状態の管理
    • 複雑なタスク遂行には,過去の経験の適切な活用が不可欠である。
    • 既存のメモリシステムは意味的類似性に基づくため,状態の依存関係を捉えきれていない。
    • 実行状態を階層的な状態木で管理し,状態の整合性とエラーの分離を実現する。
    • MAGEは,過去の相互作用を階層的な状態木に保存することで,状態の整合性を保ち,エラーの影響範囲を局所化する。
    • 実験の結果,MAGEは既存のベースラインと比較して,タスクの成功率を7.8~20.4pp向上させた。
    • また,トークン消費量を55.1%削減することに成功した。

    Link: https://arxiv.org/abs/2606.06090

  • 微分可能プログラミングによる神経疾患のメカニズムモデルとデータ駆動型モデルの統合 [cs.AI, cs.LG, math.DS, physics.med-ph]目的:神経疾患モデリングにおけるハイブリッド戦略
    • 神経疾患の診断,予後予測,治療計画向上に,計算モデリングの重要性が増している。
    • データ駆動型モデルは解釈性や汎化性能に課題があり,メカニズムモデルは計算コストが高い。
    • 両者の長所を組み合わせ,より高精度で解釈可能なモデリング手法を確立すること。
    • ハイブリッドモデルは,従来のメカニズムモデルやデータ駆動型モデルを上回る性能を示す。
    • 残差モデリング,Neural ODE,ソルバーインザループなどのアプローチが有効であることが示された。
    • 脳腫瘍,アルツハイマー病,脳卒中などの神経疾患の進展予測や治療効果評価への応用が期待される。

    Link: https://arxiv.org/abs/2606.06094

  • OrderGrad: 順序統計量に基づく方策勾配推定による平均以上の最適化 [cs.LG, cs.AI, cs.CL]目的:順序統計量目的関数の最適化
    • 現実世界の応用では,期待リターンの分布特性(テールリスク,外れ値への頑健性など)が重要である。
    • 従来の平均リターン最適化は,分布特性を考慮しないため,不適切な場合がある。
    • 順序統計量に基づいた最適化を通じて,リスク回避的で頑健な学習を可能にすること。
    • OrderGradは,加重平均などの順序統計量目的関数に対して,不偏な勾配推定量を算出する。
    • 単純な報酬変換として実装可能であり,既存の方策勾配法に容易に組み込める。
    • LLMの数学的後処理などのタスクで,平均最適化が不適切である場合に有効性が確認された。

    Link: https://arxiv.org/abs/2606.06096

  • 大規模言語モデルのための線形ルーターIR3DE [cs.CL, cs.LG]目的:大規模言語モデルの最適な選択
    • 汎用的なLLMの性能向上に加え,専門分野に特化したLLMの活用が重要になっている。
    • 既存のルーティング手法は,コスト最適化か,専門知識ルーティングのための大規模な学習が必要である。
    • 低コストかつ高速な専門分野ルーティングを実現し,動的なLLMセットに対応する。
    • IR3DEは,因果言語モデリング設定において,他のベースラインと同等の性能を達成した。
    • 特に推論設定においては,IR3DEはベースラインを上回り,正規化された性能98.4%を達成した。
    • 新たな専門家LLMの追加・削除を,ルーターの再学習なしで可能にし,柔軟な運用を実現する。

    Link: https://arxiv.org/abs/2606.06098

  • CogManip:大規模言語モデルにおける多段階対話における操作的行動のベンチマーク [cs.AI]目的:大規模言語モデルにおける操作戦略のリスク評価
    • AIの進化に伴い,人間との複雑な対話における倫理的,安全性の問題が重要になっている。
    • 既存のAI安全性評価は静的なプロンプトに限定され,多段階対話における隠れた操作戦略を捉えられていない。
    • 多段階対話における15種類の操作戦略リスクを評価し,将来の防御策の方向性を示すことを目指す。
    • CogManipベンチマークを用いて13の代表的なモデルを評価した結果,モデル間で操作リスクに大きな差が見られた。
    • DeepSeek-V3.2は,システムプロンプトに非常に敏感であり,プロンプトに基づく防御の重要性が示された。
    • CogManipは,LLMの潜在的な心理的影響と動的な戦略選択を評価するための有用なツールとなる。

    Link: https://arxiv.org/abs/2606.06099

  • マルチスケール雲特徴学習を用いた段階適応型マルチモーダル融合ネットワークによる超短期日射量予測 [cs.AI, cs.LG]目的:超短期日射量予測のためのマルチモーダルデータ融合モデル
    • 太陽光発電システムの効率的な運用や電力系統の安定化に,正確な日射量予測が不可欠である。
    • 既存手法では,雲の空間的な変動や多スケールな特徴の表現が不十分であり,予測精度が制限される場合がある。
    • 異なる予測段階に適応した低周波補償と,雲画像と気象時系列データの効果的な融合を目指す。
    • 提案手法は,InceptionNeXtを用いて雲画像の多方向・多スケール空間特徴を抽出することで,従来の畳み込み演算の限界を克服する。
    • 予測段階に応じて低周波補償を動的に調整する段階適応型ユニットを導入し,予測精度を向上させる。
    • NRELデータセットと山東省の実データを用いた実験により,提案手法が最先端手法を上回る有効性を示すことが確認された。

    Link: https://arxiv.org/abs/2606.06102

  • 相関行列に対するスライス Wasserstein フレームワークを用いた脳波デコーディング [cs.LG]目的:脳波デコーディングのための相関行列に基づくスライス Wasserstein 不一致のフレームワーク
    • 脳波は非侵襲的に高時間分解能な神経活動を記録でき,神経科学や医療で広く利用されている
    • 従来の脳波デコーディングはノイズに強くない場合があり,チャネルごとのスケーリングに影響を受ける
    • 相関行列を用いることでスケーリングの影響を軽減し,分布シフト下での汎化性能を向上させる
    • 本研究では,相関行列の多様体上で定義されたスライス Wasserstein 不一致のフレームワークを提案した
    • 提案手法は,オフログ距離とログスケーリング距離の二つの相関幾何学に基づいた相関スライス Wasserstein 不一致を構築する
    • 3つの脳波データセットでの実験により,分布シフト下での汎化性能が向上することが示された

    Link: https://arxiv.org/abs/2606.06104

  • 構造的コンテキストを活用したエンティティアラインメント基盤モデル [cs.IR, cs.CL, cs.AI]目的:異種知識グラフ間のエンティティアラインメント
    • 知識融合や知識グラフ間の推論において重要な役割を果たすため,エンティティアラインメントの研究が不可欠である。
    • 既存の基盤モデルは,知識グラフ間の相互作用が弱く,粗い類似度に基づいた候補ランキングに依存しているという課題がある。
    • 構造的コンテキストを明示的に活用することで,エンティティアラインメント基盤モデルの性能向上を目指す。
    • ContextEAは,知識グラフ間の相互作用を強化するエンコーダと,構造的証拠を用いてアラインメントスコアを調整するデコーダを導入した。
    • 実験の結果,ContextEAはOpenEA,SRPRS,DBPの29のデータセットにおいて,既存のモデルと比較して一貫した改善を示した。
    • ContextEAは,ファインチューニングされたベースラインモデルを上回り,未知の知識グラフへの転移学習能力が大幅に向上することが示された。

    Link: https://arxiv.org/abs/2606.06109

  • 健全な進化に向けて:自己進化システムにおける人間・エージェント間の相互作用の役割とメカニズムの探求 [cs.AI]目的:自己進化システムの安定化,制御可能性,および人間との整合性の向上
    • AI技術の発展に伴い,自己進化するエージェントの活用が期待されている。
    • 自己進化は能力低下や安全性低下を引き起こす可能性があり,制御が課題である。
    • 人間による監督を組み込み,自己進化の過程における安全性と性能維持を目指す。
    • ANCHORフレームワークによる人間様式監督が,自己進化システムの安全性低下を大幅に軽減することを示した。
    • コアな進化目標における安定した性能を維持しつつ,限定的な監督でも効果が認められた。
    • 特に,出力検証段階における監督が最も効果的であり,監督頻度の増加は効果が薄れることが示された。

    Link: https://arxiv.org/abs/2606.06114

  • レート歪みを用いた適応的状態行動抽象化 [cs.LG, stat.ML]目的:状態行動抽象化の粒度を動的に調整する原理
    • 強化学習において,複雑なタスクを単純化する手法は重要である。効率的な学習には抽象化が不可欠となる。
    • 抽象化の粒度をどのように動的に調整すべきか,一般的な原理が確立されていない。最適な抽象化レベルが不明確である。
    • 学習誤差と抽象化誤差のバランスに基づき,抽象化の粒度を自動的に調整する手法を提案し,検証する。
    • 提案手法は,レート歪み理論に基づくソフトな状態行動抽象化を用いることで,状態と行動の情報を連続的に調整可能である。
    • 実験の結果,状態と行動情報の損失的な圧縮下においても,ほぼ最適な性能が達成できることが示された。
    • 学習誤差が抽象化誤差と同程度になった時点で抽象化を洗練させることで,効率的な学習が可能となる。

    Link: https://arxiv.org/abs/2606.06123

  • TLA-Prover:嗜好度最適化された低ランク適応による検証可能なTLA+仕様合成 [cs.HC, cs.CY, cs.DB, cs.RO, cs.SE, cs.AI, cs.LG, cs.LO]目的:TLA+仕様の合成
    • 分散システムや安全性重視のプロトコルの検証において,形式仕様記述言語TLA+は不可欠である。
    • 大規模言語モデル(LLM)が生成するTLA+仕様は,意味的な理由でTLCモデルチェッカーに失敗することが多い。
    • LLMによるTLA+仕様生成の信頼性を向上させ,TLCによる検証を通過する仕様を生成すること。
    • TLA-Proverは,200億パラメータのモデルを用いてTLA+仕様の合成を行い,既存のベースラインを大幅に上回る成果を得た。
    • 特に,GoldおよびDiamondレベルにおいてそれぞれ30%のpass@1を達成し,従来の8.6%から3.5倍以上の改善を示した。
    • TLCによる直接的な報酬信号と,モデル自身による仕様修正学習が,その性能向上に貢献している。

    Link: https://arxiv.org/abs/2606.06133

  • 正のn=9ヴァスク不等式に対する有限証明 [cs.CE, cs.SC, cs.AI]目的:ヴァスク循環不等式の正の実数かつn=9の場合の証明
    • 不等式は数学の基礎であり,最適化問題などに応用範囲が広い。
    • 複雑な不等式の証明は,手計算では困難な場合が多い。
    • AI支援による証明により,大規模な計算を効率的に行う。
    • ヴァスク不等式のn=9の場合について,AIと人間の協力による証明を確立した。
    • 証明は,多項式不等式への帰着,最大値の固定,累積ギャップによるパラメータ化を含む。
    • 生成された証明は36815個の係数,2236個の多項式乗数,1269個の中間点の重なりを含む。

    Link: https://arxiv.org/abs/2606.06136

  • WorldFly:UAVナビゲーションのためのワールドモデルに基づくビジョン言語行動モデル [cs.AI]目的:UAVナビゲーションにおける空間理解の向上
    • UAVの自律的なナビゲーションは,物流や災害対応など,幅広い分野で重要性が増している。
    • 従来のVLAモデルは,遮蔽物や急旋回により視点遷移が激しい都市環境での性能が課題であった。
    • ワールドモデルを活用し,将来状態を予測することで,都市環境におけるナビゲーションのロバスト性を向上させる。
    • 提案手法WorldFlyは,デュアルブランチ結合フローマッチングメカニズムにより,将来の映像予測とナビゲーション行動を同時に生成する。
    • 新たに構築したUrban Canyon Traversal Benchmarkにおいて,WorldFlyは既存手法を上回る性能を示した。
    • 特に未知の環境において,ワールドモデル統合の有効性が確認された。

    Link: https://arxiv.org/abs/2606.06147

  • 新しい球面被覆定理によるタイトなリスト再現性限界 [cs.LG]目的:リスト再現性の限界
    • 機械学習の再現性の形式化が重要視されているため。
    • 仮説クラスの複雑さと必要なリストサイズの関係が不明確。
    • VCクラスや大マージン半空間におけるリストサイズの最適化。
    • 本研究では,ボルスク・ウラム定理から導出される新しい球面被覆定理を証明した。
    • これにより,VCクラスにおけるリストサイズと精度の関係に関する鋭い限界が得られた。
    • 大マージン半空間では,適切なマージンにおいて最適リストサイズが環境次元と等しいことが示された。

    Link: https://arxiv.org/abs/2606.06148

  • 分散適応の償却:パーソナライズされた基盤モデルのためのハイパーネットワーク駆動LoRA [cs.AI]目的:連合学習における基盤モデルの効率的なパーソナライズ
    • データプライバシー保護が重要視される中,分散環境での機械学習ニーズが高まっている。
    • 既存の連合LoRA手法では,更新の偏りや初期化の遅延により,収束が遅れるという課題がある。
    • ハイパーネットワークによるLoRA生成と積空間集約を通じて,効率的で公平な分散適応を実現する。
    • HyperLoRAは,ハイパーネットワークを用いてクライアントの分布特性からLoRA初期化を学習し,適応を償却する。
    • サーバー側では,積空間で直接更新を合成する学習モジュールを導入し,要素ごとの平均化の不整合を解消する。
    • 異質なクライアント分布下でも安定性を向上させる軽量な残差補正モジュールを組み合わせることで,収束速度,ロバスト性,パーソナライズ性能を向上させた。

    Link: https://arxiv.org/abs/2606.06154

  • ラベル付きデータが限られたガスタービン艦隊に対する信頼度に基づいた予測排出量モニタリング [cs.LG]目的:ガスタービン艦隊におけるNOx予測のための信頼度を考慮した確率的フレームワーク
    • 環境規制の強化により,排出量モニタリングの重要性が増しているため。
    • 排出量データのラベル付けはコストがかかるため,ラベル付きデータが不足している場合が多い。
    • ラベル付きデータが限られた状況下でも信頼性の高い予測排出量モニタリングを実現すること。
    • 提案手法は,学習された信頼度推定,アンサンブルによる不確実性定量化などを組み合わせている。
    • 信頼度に基づいたフィルタリングにより,予測精度が大幅に向上することが示された。
    • ラベルなしデータや分布外のサンプルに対して,不確実性と低い信頼度が適切に反映されることが確認された。

    Link: https://arxiv.org/abs/2606.06156

  • ITP-STDP:オンチップSNN学習のための固有タイミング二乗学習エンジン [cs.AR, cs.AI, cs.NE]目的:スパイクニューラルネットワークの学習における効率向上
    • ニューラルネットワークの発展に伴い,次世代技術としてスパイクニューラルネットワークが注目されている。
    • SNNの学習アルゴリズムは,多数のシナプス結合による計算負荷が高く,ハードウェア資源とエネルギー消費が大きい。
    • ハードウェアとエネルギー効率を改善するため,ITP-STDPアルゴリズムとハードウェアアーキテクチャを提案する。
    • 提案手法は,アルゴリズムとハードウェアレベルの両面で最適化を行うことで,従来のSTDPの計算オーバーヘッドを削減した。
    • FPGA上での実験で,既存手法と比較してエネルギー効率が4.5倍~219.8倍向上した。
    • ASIC上では,処理速度が4.8倍~22.01倍向上し,消費面積は既存手法の1.2%~3.3%に抑えられた。

    Link: https://arxiv.org/abs/2606.06159

  • デコーダー専用Transformerにおける絶対位置情報はいかにして生じるか [cs.AI, cs.CL]目的:デコーダー専用Transformerにおける絶対位置情報の起源の解明
    • Transformerは自然言語処理の基盤技術であり,その性能向上は重要な課題である。
    • Transformerは相対位置エンコーディングを用いるが,絶対位置情報をどのように扱うかが不明瞭であった。
    • Transformerにおける絶対位置情報の生成メカニズムを特定し,性能向上に資すること。
    • Transformerの注意機構における絶対位置情報の漏洩は,因果マスクと残差ストリームの二つの要素に起因する。
    • 因果マスクはクエリ位置に依存し,残差ストリームは初期トークンの情報を伝播させる役割を担う。
    • NTKスケーリング,スライディングウィンドウ注意,標準RoPEでは,これらの要素のバランスが異なる。

    Link: https://arxiv.org/abs/2606.06160

  • パラメータ化された偏微分方程式を解くための物理情報ニューラルオペレータの学習について [cs.LG, physics.comp-ph]目的:パラメータ化された偏微分方程式の解オペレータの学習
    • 物理法則の理解は,科学技術の発展に不可欠であり,シミュレーションの効率化に繋がる。
    • 従来の数値シミュレーションは計算コストが高く,特に高次元問題や複雑な形状に対して課題がある。
    • 物理情報ニューラルオペレータの効率的かつ安定的な学習方法を確立すること。
    • 物理情報ニューラルオペレータ(PINO)の学習パイプラインにおけるアーキテクチャ設計,最適化手法,損失関数のバランス,配置点サンプリング戦略を調査した。
    • Continuous Vision Transformer (CViT) が,検討したベンチマークにおいて一貫して高い性能と安定性を示した。
    • 物理情報学習パイプラインは,データ駆動型ニューラルオペレータと同等以上の性能を発揮することが示された。

    Link: https://arxiv.org/abs/2606.06164

  • ProSarc:時間的韻律不一致に基づく皮肉認識フレームワーク [eess.SY, cs.SY, cs.AI, cs.CL]目的:韻律的不一致のモデリングによる皮肉検出
    • 感情認識において,音声の韻律情報は重要な役割を果たす。そのため,より高度な感情理解が求められている。
    • 皮肉は,表面的な意味と裏腹の意図を持つため,自動認識が難しい。特に音声のみからの認識は困難である。
    • 時間的な韻律の不一致に着目することで,皮肉をより正確に検出することを目指す。
    • ProSarcは,韻律情報の時間的変化と発話レベルの感情基盤の不一致をモデル化することで,皮肉を検出する。
    • MUStARD++,PodSarc,MuSaGのデータセットで,既存の音声のみの皮肉検出手法を上回る性能を示した。
    • モンテカルロドロップアウトにより不確実性の推定を行い,アテンション機構により皮肉の開始位置を特定した。

    Link: https://arxiv.org/abs/2606.06168

  • 小児喘息発作の複数の危険因子からのモデリング学習:バージニア州沿岸地域におけるケーススタディ [eess.SY, cs.SY, stat.AP, cs.LG, stat.AP]目的:小児喘息発作のモデリング
    • 小児喘息は一般的な疾患であり,公衆衛生上の重要な課題である。
    • 複数の要因が複雑に絡み合い,発作の予測が困難である。
    • 危険因子間の相乗効果を特定し,発作予測の精度向上を目指す。
    • 一般化線形モデル,ニューラルネットワーク,疎な辞書学習の3つの手法を比較した。
    • 各モデルの予測性能を評価し,危険因子による発作リスクを推定した結果,共通認識が得られた。
    • 統計モデルと解釈可能な機械学習モデルを組み合わせることで,発作に影響を与える可能性のある相乗効果を明らかにした。

    Link: https://arxiv.org/abs/2606.06174

  • メタ学習による暗黙的な費用対効果の選好からのLLMのルーティング学習 [cs.CL, cs.HC, cs.LG, cs.AI, cs.CL]目的:LLMのルーティング最適化
    • LLMの利用拡大に伴い,費用と性能のバランスが重要になっている。
    • 既存手法では,ユーザーの費用対効果に対する多様な選好に対応できない。
    • ユーザーの暗黙的な選好を効率的に学習し,パーソナライズされたルーティングを実現する。
    • MetaRouterは,インディストリビューションおよびアウトオブディストリビューションの両方のタスクにおいて,既存手法を上回る性能を示した。
    • ユーザーの選好学習における効率性,ルーティング可能なLLMの変化に対するロバスト性,マルチモデルルーティングへのスケーラビリティが高い。
    • 本研究は,ユーザー中心の費用対効果最適化を実現する新たなLLMルーティングパラダイムを提示する。

    Link: https://arxiv.org/abs/2606.06178

  • ハンチントン病病期発見のための機械学習フレームワーク:グラフ表現学習とクラスタリングの統合による Enroll-HD データセットにおける進行ダイナミクスの解明 [cs.LG]目的:ハンチントン病の病期を識別するための機械学習フレームワーク
    • ハンチントン病は進行性の神経変性疾患であり,患者の管理と治療法の開発において病期を正確に特定することが重要である。
    • 既存の臨床的病期分類は,客観的な閾値に依存しており,患者間のばらつきや評価者間の差異の影響を受けやすい。
    • 本研究は,既存の限界を克服し,より自然な臨床経過を反映した病期をデータに基づいて発見することを目的とする。
    • 動的グラフ表現学習に基づくフレームワークを用いて, Enroll-HD コホートからハンチントン病の4つの明確な病期を特定した。
    • これらの病期は,既存の臨床的病期分類と比較して,臨床測定値の境界が明確であり,重複が最小限に抑えられていた。
    • 限られたコホートサイズにもかかわらず,4次元潜在空間を用いたクラスタリングが安定して良好な性能を示した。

    Link: https://arxiv.org/abs/2606.06196

  • LLMを用いた文脈ベースの質問応答システムにおける回答抽出の改善 [cs.CL, cs.AI]目的:文脈に基づいた質問応答における回答抽出能力の向上
    • 質問応答システムは,情報検索の効率化に不可欠であり,その精度向上は重要な課題である。
    • 既存の質問応答システムは,複雑な質問や曖昧な文脈に対する理解が不十分である場合がある。
    • 文脈の理解と回答の一貫性を高め,多様な分野への汎化能力を向上させることを目指す。
    • ファインチューニングされたRoberta-baseモデルが,ROUGE-Lスコア86.84%,BLEUスコア28.24%,BERTScore95.38%という高い性能を達成した。
    • 実験結果は,提案手法が文脈ベースの質問応答タスクにおいて高い精度と回答の関連性を示すことを示している。
    • ターゲットを絞ったファインチューニングが,質問応答システムの信頼性と精度を大幅に向上させることが確認された。

    Link: https://arxiv.org/abs/2606.06197

  • ハブ認識型ハイブリッド検索:局所整合アリ技術の高速化 [cs.NE, astro-ph.CO, astro-ph.GA, astro-ph.IM]目的:ノイズが多く高次元な点群における多様体構造の発見
    • 宇宙進化の理解には,天体観測データやシミュレーションデータ中のフィラメント構造の検出が不可欠である。
    • 局所整合アリ技術は効率的だが,高密度ハブに計算資源が集中し,計算負荷が増大する問題がある。
    • 高密度領域を効率的に処理し,構造検出の効率と堅牢性を向上させることを目指す。
    • 提案手法では,高速な前処理でハブを特定し,それをカスタムの尤度モデルで置き換える。
    • 次に,混合尤度・フェロモン戦略を用いて,アリが密集領域を効率的に通過するように誘導する。
    • 合成データと大規模な宇宙ウェブN体シミュレーションにおいて,LAATの検出効率と堅牢性の向上が確認された。

    Link: https://arxiv.org/abs/2606.06198

  • 医薬品サプライチェーンにおける動的在庫管理のためのハイブリッド深層強化学習 [cs.AI]目的:医薬品サプライチェーンにおける最適な在庫補充方針
    • 医薬品の安定供給は,国民の健康と生活を支える上で不可欠である。
    • 需要変動やリードタイムのばらつきに加え,医薬品の有効期限が在庫管理を複雑にしている。
    • 不確実な需要と変動するサプライチェーン条件下で,収益性と患者へのサービスレベルを両立する。
    • 提案手法は,動的な状況下で在庫補充戦略を適応的に更新し,従来のベンチマークと比較して在庫コストを削減することを示した。
    • 実世界の医薬品在庫データを用いた数値検証により,提案手法の実際的な実現可能性が確認された。
    • 本研究は,強化学習を活用した医薬品サプライチェーンの効率化に貢献する。

    Link: https://arxiv.org/abs/2606.06201