arXiv雑要約

AI - 2026/05/07 公開

  • RLearner-LLM:大規模言語モデルにおける論理的根拠と流暢性のバランス調整 – ハイブリッド直接選好最適化によるアプローチ [cs.CL, cs.AI]目的:大規模言語モデルの論理的整合性と流暢性を改善するための手法
    • 知識集約型生成タスクにおいて,大規模言語モデルの性能向上は重要な課題である。
    • 既存の直接選好最適化(DPO)は,流暢性を優先し,論理的正確性を犠牲にする傾向がある。
    • 本研究は,DPOにおける論理的整合性の欠如を解消し,より正確な知識生成を目指す。
    • RLearner-LLMは,DeBERTa-v3 NLIシグナルと検証用LLMスコアを組み合わせることで,人間のアノテーションなしに性能を向上させた。
    • 生物,医学,法律など五つの分野で実験した結果,SFTと比較して最大6倍のNLIスコア改善が確認された。
    • コンパクトなベースモデルにおいても,ハイブリッドDPOがNLIスコアを向上させ,推論速度も改善された。

    Link: https://arxiv.org/abs/2605.04539

  • 電力分布ブリッジング,自己報酬RL,自己蒸留 [cs.LG]目的:電力分布を通じたサンプリング,自己報酬KL正則化RL,自己蒸留の関係性の解明
    • 大規模言語モデルの推論能力において,強化学習の役割が議論されている背景がある。
    • サンプリングや蒸留はLLMの性能向上に有効だが,RLとの関連性が不明確である。
    • 電力分布を用いて,サンプリング,RL,蒸留を統合的に理解し,効率的な手法を開発する。
    • 電力分布は,サンプリング,自己報酬KL正則化RL,自己蒸留を結びつける役割を担うことが示された。
    • 電力自己蒸留は,電力サンプリングと同等の性能を,より低い推論コストで実現可能である。
    • 真の報酬の改善は,電力分布下における真の報酬と自己報酬の共分散に依存することが明らかになった。

    Link: https://arxiv.org/abs/2605.04542

  • UniVer:多段階・多ドラフト推測デコーディングの一元的視点 [cs.CL, cs.LG]目的:大規模言語モデルの推測デコーディングにおける検証問題の解決
    • 大規模言語モデルの高速化は,実用上の重要な課題である。
    • 従来の検証手法では,多段階性と多ドラフト性を同時に最適化できていない。
    • 候補ツリーの水平・垂直次元間の関係性を活用し,検証の効率化を目指す。
    • UniVerは,ツリーベースの検証を条件付き最適輸送問題として定式化する。
    • 接頭辞受容確率を動的なスケーリングファクタとして利用し,ドラフト選択を誘導する。
    • 実験により,UniVerが標準的なリジェクションサンプリングと比較して受容長を4.2%~8.5%改善することが示された。

    Link: https://arxiv.org/abs/2605.04543

  • 段階適応オーディオ拡散モデリング [cs.SD, cs.AI]目的:オーディオ拡散モデルの学習効率向上
    • 近年のオーディオ生成・修復技術の進歩は著しいが,計算コストが大きい。
    • 従来の学習法では,学習信号の重要度を固定しており,効率が悪い。
    • 学習段階に応じた信号の重要度調整により,効率的な学習を目指す。
    • SSL空間での不一致の傾きから学習段階を把握し,段階に応じた学習メカニズムを開発した。
    • 早期段階ではSSLガイダンスを減衰させ,意味的構造の学習を促進する。
    • 段階適応戦略により,収束が改善され,生成・スペクトル再構成の精度が向上した。

    Link: https://arxiv.org/abs/2605.04547

  • 気象時系列データに基づくブドウ園病害リスクのイベントベース早期警告 [cs.LG]目的:ブドウ園病害リスクの早期警告
    • 持続可能な農作物保護のため,病害リスクの早期発見が重要である。
    • 従来の病害予測は日単位での分類に偏りがちで,実用的な短期警告には不十分である。
    • 病害リスク期間への移行予測というイベントベースの手法で,短期警告の精度向上を目指す。
    • イベントベースの定式化は,実用的な短期警告を可能にする。
    • XGBoost,LSTM,TCN等のモデルは,再現率,リードタイム,誤警報率において異なるトレードオフを示す。
    • 環境時系列学習における問題設定の重要性と,イベントベース予測の有効性が示された。

    Link: https://arxiv.org/abs/2605.04548

  • ニューラルネットワークによる領域制限を用いた構造化非正規帯行列の擬似スペクトル計算の高速化 [math.NA, cs.LG, cs.NA]目的:非正規帯行列の擬似スペクトル計算の高速化
    • 流体解析や制御システムなど,動的システムの安定性や過渡挙動を理解する上で重要。
    • 大規模な計算では,計算コストが高く,効率的な手法が求められている。
    • ニューラルネットワークを用いて,計算が必要な領域を予測し,計算量を削減する。
    • ニューラルネットワークが行列の特徴から敏感領域を予測することで,擬似スペクトル計算の効率が向上した。
    • 検証データによる閾値調整により,敏感領域の信頼性のある網羅が保証された。
    • 非正規帯行列に対する数値実験で,従来の計算手法と比較して大幅な高速化が確認された。

    Link: https://arxiv.org/abs/2605.04550

  • カウンター・ダイナ:カウンターファクチュアル建築モデルを用いたデータ効率的な強化学習ベースのHVAC制御 [cs.LG, cs.SY, eess.SY]目的:データ効率的なHVAC制御のための強化学習手法
    • 建物エネルギー管理の最適化は,エネルギー消費の削減と快適性の向上に不可欠である。
    • 従来の強化学習は,大量のデータが必要であり,実用化には時間がかかる。
    • カウンターファクチュアルモデルを用いて,データ効率を向上させ,実用的なHVAC制御を実現する。
    • 提案手法Counter-Dynaは,既存手法と比較して,学習に必要な環境とのインタラクション期間を大幅に短縮した。
    • BOPTESTフレームワークを用いたシミュレーションにより,5.3%から17.0%のコスト削減効果が確認された。
    • 本研究は,HVAC制御における強化学習の実用化に向けた重要な一歩となる。

    Link: https://arxiv.org/abs/2605.04555

  • 大規模音声埋め込みベンチマーク(MSEB)におけるLLMの性能評価 [cs.SD, cs.LG]目的:大規模音声埋め込みベンチマーク(MSEB)におけるLLMの性能
    • 音声処理技術は,多様な応用分野で不可欠であり,その進歩が求められている。
    • 既存の音声モデルは,特定のタスクに特化しており,汎用性に課題がある。
    • LLMを用いた音声処理の可能性を探り,最適なモデリング手法を明らかにすること。
    • GeminiやGPTといった主要なLLMをMSEBの8つの主要な機能で評価した結果,性能とロバスト性にモーダリティギャップが残存することが示された。
    • 最適なモデリング手法は特定されず,ユースケースの要件やレイテンシ,コスト,推論深度などの前提条件に依存することが明らかになった。
    • 単一のマルチモーダルバックボーンが複雑なタスク固有のパイプラインに取って代わる可能性が示唆された。

    Link: https://arxiv.org/abs/2605.04556

  • 効率的な形状制御による高解像度衛星画像合成 [cs.CV, cs.AI]目的:高解像度衛星画像合成手法
    • 機械学習モデルの性能向上に,高品質な衛星画像データが不可欠である。
    • リモートエリアや稀な事象に関する高解像度衛星画像は,入手が困難である。
    • 既存の拡散モデルを制御し,形状に沿った画像合成を可能にすること。
    • 提案手法は,ウィンドウ化されたクロスアテンションモジュールを用いることで,効率的な形状制御を実現した。
    • 既存の制御手法と比較して,同等の性能を維持しつつ,形状制御マップとの整合性が向上した。
    • 現在の評価手法の限界が示され,整合性評価の重要性が強調された。

    Link: https://arxiv.org/abs/2605.04557

  • Dream-MPC:潜在的想像を用いた勾配ベースのモデル予測制御 [cs.LG, cs.AI, cs.RO]目的:モデル予測制御と潜在的想像を組み合わせた手法の開発
    • 強化学習におけるモデルベースの手法は,ロボット制御などに応用が期待され,その重要性が増している。
    • 従来の勾配ベース手法は,勾配フリー手法に比べて性能が劣ることが課題となっていた。
    • 学習された世界モデルと不確実性の正則化により,勾配ベースの性能を向上させることを目指す。
    • Dream-MPCは,展開されたポリシーから少数の候補軌道を生成し,学習された世界モデルを用いて勾配上昇により最適化する。
    • 24の連続制御タスクにおいて,Dream-MPCは基盤となるポリシーの性能を大幅に向上させ,勾配フリーMPCや最新のベースラインを上回った。
    • 最適化の反復を時間的に償却することで,計算コストを削減し,効率的な制御を実現した。

    Link: https://arxiv.org/abs/2605.04568

  • パラメータダイナミクスからリスクスコアリングへ:LLMファインチューニングにおけるサンプルレベルの安全性劣化の定量化 [cs.AI, cs.LG]目的:LLMファインチューニングにおけるサンプルレベルの安全性劣化の定量化
    • 大規模言語モデルの安全性確保は重要であり,その脆弱性を理解する必要がある。
    • 少数の良性サンプルでのファインチューニングが,学習済みの安全性を損なう現象が課題である。
    • パラメータの動的な変化を分析し,安全性劣化のリスクをサンプルレベルで評価することを目的とする。
    • 本研究では,ファインチューニング中のパラメータダイナミクスが安全性劣化の重要なメカニズムであることを見出した。
    • 良性サンプルでのファインチューニングが,パラメータを危険な方向に累積的にシフトさせ,安全性を損なうことを明らかにした。
    • 提案手法SQSDは,サンプルが安全劣化に与える影響を定量化し,様々なモデルやデータセットで有効性が確認された。

    Link: https://arxiv.org/abs/2605.04572

  • 拡散から修正フローへ:テキストに基づくセグメンテーションの再考 [cs.CL, cs.HC, cs.CV, cs.AI]目的:テキストプロンプトからの画像セグメンテーション
    • 従来の固定カテゴリセグメンテーションより柔軟で応用範囲が広い。
    • 拡散モデルの生成的性質が,識別的なセグメンテーションタスクに悪影響を及ぼす。
    • 拡散モデルのノイズ除去プロセスに依存しない,直接的なマッピング学習を目指す。
    • 提案手法RLFSegは,潜在空間内で画像からセグメンテーションマスクへの直接マッピングを修正フローを用いて学習する。
    • 従来の拡散モデルベースの手法と比較して,特にゼロショットシナリオで大幅に性能が向上する。
    • ラベルの改良と適応的なワンステップサンプリング戦略により,単一推論ステップでも高い精度を実現する。

    Link: https://arxiv.org/abs/2605.04590

  • HeterSEED:異種グラフにおける異質性に対する意味と構造の分離 [cs.LG, cs.AI]目的:異質性を持つグラフ学習における意味的・構造的分離
    • 現実世界の複雑な関係性を表現するため,異種グラフの利用が重要である。
    • 異種グラフでは,ノード間の特徴量類似度が関係性の意味と一致しない場合がある。
    • HeterSEEDは,異質性下で誤情報を伝播させる問題を解決することを目指す。
    • HeterSEEDは,意味的チャネルと構造的チャネルを分離することで,異種グラフにおける表現学習を行う。
    • 理論的に,HeterSEEDは既存手法よりも表現力が高く,異質性による予測バイアスを低減することが証明された。
    • 実験結果から,HeterSEEDは特に異質性が強い状況下で,既存の異種グラフ学習手法を上回ることが示された。

    Link: https://arxiv.org/abs/2605.04594

  • KVキャッシュメモリ制約下におけるLLM推論の安定性解析のための待ち行列理論的枠組み [cs.LG, cs.AI, math.OC]目的:LLM推論の安定性条件
    • LLMの急速な普及により,大規模な推論における効率性が重要課題となっている。
    • LLM推論は計算負荷に加え,GPUメモリを圧迫するKVキャッシュがボトルネックとなる。
    • GPUリソースの適切なプロビジョニングを可能にする安定性条件の導出を目指す。
    • 待ち行列理論に基づくフレームワークを構築し,計算とGPUメモリ制約を考慮した安定性・不安定性条件を導出した。
    • リクエスト到着率と導出された安定サービスレートを組み合わせることで,適切なクラスタサイズを算出できる。
    • 実際のGPU環境における実験により,理論的予測の精度が確認された。誤差は通常10%以内である。

    Link: https://arxiv.org/abs/2605.04595

  • 参照に基づくカテゴリ検出:カテゴリ認識を伴う教師なし物体検出 [cs.CE, cs.CV, cs.AI]目的:カテゴリを意識した物体検出
    • 物体検出は画像認識の重要な要素であり,自動運転やロボティクス等,幅広い応用が期待される。
    • 教師あり学習には大量のアノテーションが必要であり,コストや手間がかかるという課題がある。
    • アノテーションなしでカテゴリを認識し,物体検出の精度向上を目指す。
    • 提案手法RefCDは,参照画像と予測オブジェクト間の特徴量の類似性を活用し,カテゴリを意識した物体検出を可能にする。
    • カテゴリのラベルがない状態でも,カテゴリ特有の特徴を学習するための損失関数を導入することで,高い検出精度を実現した。
    • 参照画像を使用しないカテゴリ非依存検出もサポートしており,汎用性の高いフレームワークである。

    Link: https://arxiv.org/abs/2605.04606

  • SensingAgents:ロバストなIMU活動認識のためのマルチエージェント協調フレームワーク [cs.RO, cs.AI]目的:IMUを用いた活動認識におけるロバスト性の向上
    • モバイルヘルス,スマート環境,人間-コンピュータ相互作用の基盤技術であり,生活の質向上に貢献する。
    • ラベル付きデータの大量必要性,位置依存性,推論の不透明性などが課題となっている。
    • マルチエージェント協調推論により,センサーデータの矛盾やノイズに対するロバスト性を実現する。
    • SensingAgentsは,既存のシングルエージェントおよびマルチエージェントLLMモデルを大幅に上回り,ゼロショット設定で79.5%の精度を達成した。
    • 特に,マルチセンサーデータが競合またはノイズを含む複雑なシナリオにおいて,高い性能を示した。
    • 本研究は,ユビキタスセンシングシステムのロバスト性と解釈可能性を向上させるための,マルチエージェント協調推論の可能性を示唆する。

    Link: https://arxiv.org/abs/2605.04608

  • VocalParse:大規模オーディオ言語モデルを用いた統一的かつスケーラブルな歌声書き起こし [cs.SD, cs.AI]目的:歌声書き起こしモデルの性能向上
    • 歌声合成システムの進化には,高品質な歌声注釈が不可欠である。
    • 手動での注釈作成はコストと専門知識が必要であり,自動注釈技術が求められている。
    • 既存のシステムが抱える複雑性,音符と歌詞のずれ,汎化性能の低さを解決する。
    • VocalParseは,歌詞,メロディ,音符の対応関係を同時にモデル化する新しいプロンプト形式を採用した。
    • Chain-of-Thought戦略により,歌詞を先行して生成することで文脈の混乱を軽減し,構造的利点を維持した。
    • 複数の歌声データセットにおいて,最先端の歌声書き起こし性能を達成した。

    Link: https://arxiv.org/abs/2605.04613

  • 検索を超えて:コード検索のためのマルチタスクベンチマークとモデル [cs.SE, cs.AI]目的:コード検索パイプライン全体の評価
    • ソフトウェア開発において,コード検索は開発効率を大きく左右する重要な要素である。
    • 既存のベンチマークは,データ汚染,ラベルノイズ,二値関連性の問題を含んでいる。
    • より現実的なコード検索パイプライン全体の評価と改善を目指す。
    • 新たに構築されたCoREBベンチマークは,データ汚染を抑制し,複数のタスクに対応している。
    • コード間検索においては,コード特化型埋め込みが汎用エンコーダより優れていることが示された。
    • 開発者スタイルの短いキーワードクエリでは,全てのモデルで検索性能が著しく低下した。CoREB-Rerankerは3つのタスク全てで一貫した改善を実現した。

    Link: https://arxiv.org/abs/2605.04615

  • 成人学習を支援するAI技術の設計に関するガイドライン [cs.CY, cs.AI]目的:成人学習を支援するAI技術設計のガイドライン
    • 生涯学習社会の進展に伴い,成人学習の重要性が高まっている。
    • AI教育技術はK-12教育に偏っており,成人学習者のニーズに対応できていない。
    • 成人学習に適したAI技術設計の指針を提示し,その活用を促進すること。
    • AI技術の導入データに基づき,テーマ分析を実施し,設計上の課題と考慮事項を特定した。
    • その結果,将来のAI成人学習技術に役立つ19の設計ガイドラインを策定した。
    • 策定したガイドラインの有用性を,既存システムへの評価を通じて示した。

    Link: https://arxiv.org/abs/2605.04616

  • ウェアラブルヒューマンアクティビティ認識における効率的なテスト時適応のための時間構造の重要性 [cs.CV, cs.HC, cs.LG]目的:ウェアラブルヒューマンアクティビティ認識におけるテスト時適応の効率化
    • ウェアラブルデバイスの普及により,人々の活動認識の需要が高まっている。
    • 異なる利用者間でのデータ分布のずれにより,認識精度が低下する問題がある。
    • テストデータを用いてモデルをオンラインで適応させ,精度低下を抑制することを目指す。
    • 本研究では,時間構造を特徴量に基づく推論信号として捉えることで,テスト時適応の性能向上を試みた。
    • 提案手法SIGHTは,軽量かつバックプロパゲーションを必要としないフレームワークであり,エッジデバイスでのリアルタイム展開を可能にする。
    • 実世界のデータセットにおける評価により,SIGHTが既存のテスト時適応手法を上回る性能を示すことが確認された。

    Link: https://arxiv.org/abs/2605.04617

  • ジャズハーモニーにおけるeグラフを用いたライブラリ学習 [cs.LG, cs.AI, cs.SC]目的:ジャズハーモニーのパターン学習のモデル
    • 音楽のパターンは高度に構造化された理解を必要とするため,その学習メカニズムの解明が重要である。
    • 既存の手法では,音楽パターンの内在化プロセスを捉えきれていないという課題がある。
    • ライブラリ学習とeグラフを用いて,人間の音楽パターン学習の側面を捉えるモデルを構築すること。
    • 提案モデルは,ハーモニー進行のコーパスから簡潔な生成ルールを発見し,学習を可能にする。
    • 演繹的構文解析とライブラリ学習を統合することで,プログラムとライブラリの空間を効率的に探索する。
    • プログラムとライブラリの直観性,および人間が作成したハーモニー解析との類似性において,人間の学習パターンとの一致が確認された。

    Link: https://arxiv.org/abs/2605.04622

  • AuditRepairBench:エージェント修理における評価者チャネルランキング不安定性のためのペア実行トレースコーパス [cs.AI, cs.SE]目的:評価者チャネルランキング不安定性の問題に対する,エージェント修理手法の評価用コーパス
    • エージェント修理は,ソフトウェアの自動修復において重要な技術であり,その信頼性向上が求められている。
    • 評価者の構成変更によりランキングが変動し,評価者由来の信号に依存する手法で問題が生じている。
    • 評価者チャネルのランキング不安定性を定量的に評価し,その影響を軽減するための手法を提供する。
    • AuditRepairBenchは,576,000個のセル(実行済み96,000個)を含むペア実行トレースコーパスである。
    • モジュール化されたスクリーニングアーキテクチャにより,ランキング変動の原因となるチャネルを特定可能。
    • スクリーニングガイド型ブラインドパッチは,ランキングの変動を55〜74%(平均62%)削減し,手法のロバスト性を向上。

    Link: https://arxiv.org/abs/2605.04624

  • 意味を保持する埋め込みに関する勾配は,大規模言語モデルの不確実性を伝える [cs.CL, cs.AI]目的:大規模言語モデルの不確実性評価
    • 大規模言語モデルの信頼性確保は重要であり,幻覚を起こしやすい性質を抑制する必要がある。
    • 既存の不確実性評価手法はサンプリングに依存し,計算コストや分散が大きいという課題がある。
    • サンプリング不要で計算効率の良い,勾配に基づく不確実性評価手法を提案し,信頼性向上を目指す。
    • 提案手法SemGradは,意味空間における勾配を計算することで,不確実性を効率的に評価する。
    • 意味を保持する埋め込みを特定するSemantic Preservation Score (SPS)を導入し,勾配の安定性を評価する。
    • SemGradとパラメータ勾配を組み合わせたHybridGradは,既存手法と比較して優れた性能を示す。

    Link: https://arxiv.org/abs/2605.04638

  • FAAST:テスト時教師あり適応のための閉形式高速重みによる前方のみの連合学習 [cs.RO, cs.RO, cs.LG, cs.CL]目的:テスト時教師あり適応のための効率的な手法
    • 事前学習済みモデルの活用は重要だが,学習コストや推論コストが課題となる。
    • 従来の適応手法は,バックプロパゲーションのコストが高いか,メモリ消費量が多い。
    • テスト時の適応を,低コストかつ省メモリで実現すること。
    • FAASTは,ラベル付きサンプルを高速重みに解析的に変換することで,前方のみで適応を可能にする。
    • バックプロパゲーションベースの適応と同等以上の性能を,90%以上の適応時間短縮で達成した。
    • メモリやコンテキストベースの手法と同等の性能を,最大95%のメモリ使用量削減で実現した。

    Link: https://arxiv.org/abs/2605.04651

  • 閾値誘導型最適化による視覚生成モデルの調整 [cs.CL, cs.LG]目的:視覚生成モデルと人間のフィードバックの整合
    • 視覚生成モデルの性能向上には,人間の評価に基づく調整が不可欠である。
    • ペア比較に基づく既存手法は,フィードバック収集の拡張性に課題がある。
    • 単一の評価値から効率的にモデルを調整する手法の開発が求められている。
    • 本研究では,経験的なスコア統計から推定される閾値を導入する新たなフレームワークを提案した。
    • これにより,ペア比較なしで,単一の評価値から効果的な最適化が可能になった。
    • 拡散モデルとマスク生成モデルを用いた実験で,既存手法を上回る性能が確認された。

    Link: https://arxiv.org/abs/2605.04653

  • 臨床領域におけるエビデンスに基づく異常検知 [cs.LG]目的:臨床における異常検知手法の開発と検証
    • 患者ケアの質の向上は医療現場において重要であり,異常検知はその一助となる。
    • 患者データは複雑で多様なため,異常な状態や意思決定の特定は困難である。
    • 過去の患者データから学習した確率モデルを用いて,異常な治療決定を特定する。
    • ベイズネットワークなどの確率モデルから統計量を導出し,異常検知に活用する。
    • 術後心臓病患者の治療決定における異常を検出し,評価することに成功した。
    • 提案手法は,患者の状態に応じた適切な治療判断を支援する可能性を示す。

    Link: https://arxiv.org/abs/2605.04664

  • 患者管理における特徴量重要度分析 [cs.CL, cs.LG]目的:臨床データの特徴量が医師の検査依頼や投薬判断に与える影響
    • 医療現場での意思決定支援は,患者ケアの質向上と医療資源の効率化に不可欠である。
    • 医師の判断は多様な要素に左右され,その根拠を特定することは困難である。
    • 医師の意思決定に重要な特徴量を特定し,予測モデルの精度向上を目指す。
    • 術後心臓病患者4486人の電子カルテデータから,検査依頼と投薬判断のパターンを分析した。
    • 医師の検査依頼や投薬判断は,全特徴量のごく一部から予測できる場合が多いことが示された。
    • 本研究は,医師の意思決定を支援するための特徴量選択に貢献すると考えられる。

    Link: https://arxiv.org/abs/2605.04666

  • ITBoost:情報理論的信頼性に基づくロバストなブースティング [cs.LG]目的:ノイズのあるラベルに対するロバスト性を高めるブースティング手法
    • 表形式データ学習において,勾配ブースティングは強力かつ広く利用されている。
    • ラベルにノイズが含まれる場合,ブースティングの性能が低下しやすい。
    • 信頼性の低いラベルが学習に与える影響を軽減し,ロバスト性を向上させる。
    • ITBoostは,残差軌跡の複雑さを最小記述長原理によって測定し,信頼性の低いサンプルを抑制する。
    • 理論的に,ラベルノイズ下でのITBoostの一般化誤差の上界が導出されている。
    • 様々な表形式データベンチマークで,ITBoostは既存のブースティングモデルや深層学習モデルと比較して,ノイズ環境下でより優れたロバスト性を示す。

    Link: https://arxiv.org/abs/2605.04671

  • CodeEvolve:LLM駆動による進化最適化 - 実行時間情報を活用したターゲット選択による多言語コード改善 [cs.SE, cs.AI]目的:プログラム性能およびコード品質の向上
    • ソフトウェアの性能改善は,システム全体の効率性と応答性に不可欠である。
    • 従来の最適化手法は,ボトルネックの特定や手動チューニングに依存し,時間と労力がかかる。
    • LLMを活用し,自動化されたターゲット選択とコード改善により,効率的な最適化を実現する。
    • CodeEvolveは,Java Flight Recorderを活用し,実行コストの高いコンポーネントを自動的に特定する。
    • 大規模Javaコードベースにおいて,7つのホットスポット関数で平均15.22倍の速度向上を達成した。
    • Apex最適化実験では,MCTS拡張構成により,20プログラム中平均19.5個の有効なプログラムが生成された。

    Link: https://arxiv.org/abs/2605.04677

  • 脳波に基づく視覚復号のための多層双方向生体模倣学習 [cs.AR, cs.CV, cs.AI]目的:脳波と視覚刺激の対応付けによる画像検索の精度向上
    • 脳波を用いた視覚復号は,ブレイン・マシン・インターフェースや認知機能解明に不可欠である。
    • 質の高い学習データ不足と,画像情報と脳の視覚処理の構造的・生理的差異が課題である。
    • 視覚情報の構造的差異を軽減し,脳の階層的処理に沿った特徴抽出を実現することで復号精度を向上させる。
    • 提案手法MB2Lは,ゼロショット脳波-画像検索において,上位1件正答率80.5%,上位5件正答率97.6%を達成した。
    • 既存手法を大幅に上回り,被験者や実験設定に依存しない高い汎化性能を示した。
    • 視覚情報の適応的ぼかしと,生体模倣視覚特徴抽出が,脳波と視覚特徴の整合に貢献している。

    Link: https://arxiv.org/abs/2605.04680

  • 空間トランスクリプトミクス遺伝子発現予測のための六角シフトウィンドウTransformer (HEXST) [cs.LG, cs.CV]目的:空間トランスクリプトミクス遺伝子発現予測の精度向上
    • 組織内の空間分解能遺伝子発現プロファイリングは重要だが,コストとスループットが課題である。
    • 既存モデルは直交座標系を前提とし,広く使われる六角サンプリングプラットフォームに対応できていない。
    • 六角座標系に最適化されたTransformerモデルによる遺伝子発現予測精度の向上を目指す。
    • HEXSTは,六角座標系で効率的な局所-大域的文脈モデリングを実現し,高精度な遺伝子発現予測を可能にした。
    • ポイントごとの回帰だけでなく,コントラストを重視した微分目的関数と転移学習を組み合わせることで,遺伝子ごとの空間的コントラストを維持した。
    • 7つの空間トランスクリプトミクスデータセットで,最先端モデルを凌駕する性能を示した。

    Link: https://arxiv.org/abs/2605.04682

  • 平均注意型Transformerと算術回路 [cs.CC, cs.AI, cs.LG]目的:Transformerエンコーダの計算能力に関する分析
    • 自然言語処理の発展に伴い,Transformerモデルの計算能力の理解が重要である。
    • Transformerの計算能力と,既存の計算モデル(算術回路など)との関係は未だ不明な点が多い。
    • Transformerがどのような算術回路をシミュレート可能か解明し,その限界を明らかにする。
    • 平均ハード注意を用いることで,Transformerエンコーダが算術回路をシミュレートできることを示した。
    • シミュレート可能な回路は,定数深さを持ち,無限の加算,二進乗算,符号ゲートを使用する。
    • 実数,有理数,およびその間の環におけるTransformerにおいて,同様の結果が得られた。

    Link: https://arxiv.org/abs/2605.04683

  • 金融時系列におけるニューラルパラメータ化による時間不均一マルコフ力学の学習 [cs.LG, q-fin.MF]目的:金融時系列における時間不均一マルコフ力学の学習
    • 非定常な確率システムのモデリングは,金融工学をはじめ,幅広い分野で重要である。
    • 高分解能・高ノイズ環境下では,古典的マルコフ遷移演算子の経験的推定がデータ不足により困難である。
    • ニューラルネットワークをパラメータ化エンジンとして活用し,時間変動マルコフ遷移行列を生成すること。
    • 学習された演算子は,複雑な体制転換を捉えることに成功した。
    • 状態条件付きモデルは平均行異質性$\bar{\rho} = 0.0073$を達成し,状態非依存アブレーションは正確にゼロに崩壊した。
    • 演算子の行エントロピーは実現分散と$r = -0.62$($p \approx 10^{-251}$)の強い負の相関を示し,高ボラティリティ体制では遷移力学が均質化されることが示された。

    Link: https://arxiv.org/abs/2605.04690

  • 継続的なマルウェア取り込みパイプラインに対するグレーボックスポイズニング [eess.SY, cs.SY, nlin.AO, cs.CR, cs.LG]目的:マルウェア検出パイプラインに対する現実的なグレーボックスポイズニング攻撃
    • 現代のマルウェア対策は,大量の脅威に対応するため,継続的なデータ取り込みと機械学習に依存している。
    • 継続学習システムにおいて,検知を回避しつつ高いポイズニング効果を持つ摂動を生成することが困難である。
    • マルウェア検出パイプラインに対するポイズニング攻撃の影響と,その防御策の有効性を評価すること。
    • 微小なIATベースの摂動により,コンパクトなポイズニングサンプルが生成でき,検知のリコールを著しく低下させる。
    • ホモジニアスアンサンブルを用いた防御機構は,最大95.6%のポイズニング試行を識別・フィルタリングし,同時に正当なデータの保持率を高く維持する。
    • 本研究は,実運用パイプラインにおける堅牢な取り込み前検証の必要性を強調する。

    Link: https://arxiv.org/abs/2605.04698

  • 疎なトークンで十分:トークン認識勾配最適化による音声言語モデルの脱獄 [cs.NI, cs.DM, cs.CR, cs.AI, cs.CL, cs.LG, cs.SD]目的:音声言語モデルの脱獄攻撃における最適化手法
    • 音声言語モデルの安全性確保は,その社会実装において不可欠であり,潜在的なリスクの軽減が重要である。
    • 既存の脱獄攻撃は,音声波形全体を密に更新するため,計算コストが高く,効率性に課題がある。
    • 音声波形の勾配構造に着目し,重要度の低いトークンを削減することで,効率的な脱獄攻撃を実現する。
    • 提案手法TAGOは,既存手法と比較して優れた性能を示し,高い攻撃成功率を維持する。
    • Qwen3-Omniにおいては,トークン保持率を0.25に削減しても,攻撃成功率(ASRl)は87%から86%へのわずかな低下で済む。
    • この結果は,密な波形更新が冗長であることを示唆し,今後の研究におけるトークンレベル勾配構造の活用を促す。

    Link: https://arxiv.org/abs/2605.04700

  • 忠実な顔: テキストから動画生成における姿勢に忠実な顔の同一性保持 [cs.CV, cs.AI]目的:テキストから動画生成における顔の同一性保持
    • 動画生成技術の発展は,多様なコンテンツ制作を可能にする重要な技術である。
    • 既存手法では,顔の姿勢変化や隠蔽によって同一性が損なわれる課題がある。
    • 姿勢変化や隠蔽に強い,顔の同一性を保持する動画生成技術を確立すること。
    • 提案手法「FaithfulFaces」は,姿勢情報を共有するアライナーにより,異なる視点からの顔の姿勢を調整・整合させる。
    • Euler角埋め込みを用いて姿勢情報を明示的に表現することで,姿勢に忠実な顔の事前知識を提供し,同一性保持を促進する。
    • 大規模な顔姿勢多様性を持つ高品質な動画データセットを構築し,提案手法の有効性を実験的に示した。

    Link: https://arxiv.org/abs/2605.04702

  • 3D医療ボリュームデータのための立方差分拡張とコントラスト学習によるウォーターマーク [cs.CR, cs.LG]目的:3D医療ボリュームデータの所有権と真正性を保護する可逆ゼロウォーターマーク手法
    • 遠隔医療では3Dボリュームデータの利用が拡大しており,診断精度向上に不可欠である。
    • ネットワーク経由でのデータ共有は,改ざんや不正コピーのリスクを伴う点が課題である。
    • 3D攻撃に対する堅牢性を保ちつつ,データの完全性と診断精度を維持する。
    • 提案手法Vol-Markは,コントラスト学習を用いた特徴抽出器と立方差分拡張(c-DE)技術により,高いウォーターマーク埋め込み性能を実現した。
    • Vol-Markは,様々な攻撃シナリオにおいて0.90以上の高い正答率(ACC)を安定的に達成し,既存手法を上回る堅牢性を示した。
    • データの完全性検証と所有権検証の両方を可能にし,遠隔医療におけるデータセキュリティを強化する。

    Link: https://arxiv.org/abs/2605.04705

  • PINNにおける微分可能な化学反応ソルバー:パラメータ化された強直な反応系の解法 [cs.LG]目的:パラメータ化された強直な反応系の解法
    • 科学計算における深層学習の応用が期待されており,物理法則や最適化を学習可能な要素として組み込む試みが進んでいる。
    • 従来の物理情報ニューラルネットワークは,強直な化学反応系のような複雑な問題に対しては適用が困難であった。
    • 強直な化学反応系にも適用可能な,物理情報ニューラルネットワークの拡張を目指す。
    • 提案手法では,微分可能な化学反応ソルバー,パラメータ化された解のためのネットワーク構造,および強直な反応に合わせた残差重み付けを導入した。
    • 水素燃焼に関連する微分方程式を用いて評価を行った結果,従来法では解けなかった強直な化学システムに対しても有効であることが示された。
    • 物理情報ニューラルネットワークの適用範囲が,強直な化学システムを含むより広範な科学計算問題に拡大された。

    Link: https://arxiv.org/abs/2605.04708

  • ELVIS:長距離視覚MPCのためのアンサンブルキャリブレーション潜在的想像力 [cs.LG, cs.RO, cs.SY, eess.SY]目的:長距離視覚制御における信頼性ある計画の実現
    • ロボットの自律性を高める上で,視覚情報に基づいた高度な制御技術は不可欠である。
    • 学習された潜在的ダイナミクスを用いた長距離計画は,分岐する未来と多峰性のアクション価値分布を抱える。
    • 視覚的遮蔽によるモデル誤差の累積を抑制し,ロバストな長距離計画を可能にすること。
    • ELVISは,DreamerスタイルのRSSMを用いて計画を行い,分岐するロールアウト下でのモード平均化を回避する。
    • アンサンブルキャリブレーションと不確実性を考慮したlambda-returnにより,深層的な想像力を安定化させる。
    • DeepMind Control Suiteの14タスクで,TD-MPC2やDreamerV3を凌駕する性能を達成し,実環境での砂噴射タスクにも転移可能であることを示した。

    Link: https://arxiv.org/abs/2605.04709

  • 予算を考慮した自動オプティマイザ設定調整器 [cs.AI, cs.LG, math.OC]目的:大規模モデル学習におけるオプティマイザ設定の最適割り当て
    • 大規模モデル学習では,GPUメモリ使用量が課題となる。
    • ネットワークブロックごとに勾配の特性が異なり,一律の設定では非効率。
    • メモリ制約下で,各ブロックに適切な設定を割り当てることでメモリ効率を改善。
    • BAOCは,勾配の統計的指標に基づいてリスクを定量化し,メモリと時間制約下でリスクを最小化する設定を決定する。
    • ビジョン,言語,拡散モデルの実験により,BAOCが学習品質を維持しつつオプティマイザの状態のメモリ使用量を大幅に削減することが示された。
    • BAOCは,より安価な設定を適用するリスクを評価し,最適な設定を割り当てることでメモリ効率を高める。

    Link: https://arxiv.org/abs/2605.04711

  • SPHERE:深層強化学習における専門家混合モデルのスペクトル可塑性の低下緩和 [cs.LG]目的:深層強化学習におけるスペクトル可塑性の低下とその緩和策
    • 強化学習は,複雑なタスクの自動学習を可能にする重要な技術である。
    • 継続学習において,モデルは新しいスキルを学習する能力が低下しやすい。
    • 専門家混合モデルにおけるスペクトル可塑性の低下を抑制し,継続学習性能を向上させる。
    • SPHEREは,専門家混合モデルのスペクトル可塑性損失を軽減するParsevalペナルティである。
    • MetaWorldとHumanoidBenchにおいて,継続的強化学習の平均成功率をそれぞれ133%と50%向上させた。
    • 学習を通して,より高いスペクトル可塑性を維持することに貢献する。

    Link: https://arxiv.org/abs/2605.04712

  • SOC-ICNN値関数の正確な双対幾何 [cs.LG, cs.AI, math.OC]目的:SOC-ICNNの双対的視点からの正確な一次および局所二次幾何学的構造
    • 最適化問題の解決にニューラルネットワークを活用する研究は,複雑な問題を効率的に解決する可能性を秘めている。
    • ICNNはブラックボックス化しやすく,内部の挙動を理解することが困難であるという課題がある。
    • SOC-ICNNの双対変数を読み出すことで,ホワイトボックスでの推論を可能にすること。
    • SOC-ICNNのサポートスロープ,サブディファレンシャル,方向微分,局所ヘッセ行列は,双対変数の最適解から直接導出できる。
    • これらの結果は,ブラックボックスな自動微分を超えた,ホワイトボックスSOC-ICNN推論のための幾何学的素子を提供する。
    • 数値実験により,正確な乗数読み出し,局所ヘッセ行列の公式,構造的に退化した入力における集合値の挙動が検証された。

    Link: https://arxiv.org/abs/2605.04722

  • 属性を考慮した順序付き推薦のための畳み込みニューラルネットワークの再考 [cs.IR, cs.LG]目的:属性を考慮した順序付き推薦における次のアイテムの予測
    • 推薦システムにおいて,ユーザーの行動履歴に基づいた高精度な予測は不可欠である。
    • 既存手法は計算コストが高く,長期的なユーザー履歴の処理に制約がある。
    • 効率的な系列モデリングによる,長期的なユーザー嗜好のより正確な把握を目指す。
    • 提案手法ConvRecは,線形計算量でコンパクトな系列表現を生成する。
    • 階層的なダウンサンプリングと畳み込み層により,多様な系列パターンを捉える。
    • 4つの実データセットで最先端手法を上回り,畳み込みアーキテクチャの有効性を示す。

    Link: https://arxiv.org/abs/2605.04723

  • ビートから侵害へ:攻撃的AIがプレイリストから機密ユーザー情報を推測する方法 [cs.CR, cs.AI]目的:プレイリストからの機密個人情報(PII)推測による攻撃的AIの脅威の定量化
    • AI技術の普及により,サイバー攻撃への悪用(攻撃的AI)が深刻化している。
    • 公開されたデータから個人情報を推測されるリスクが存在する。
    • プレイリストという公開情報から個人情報を推測される脆弱性を明らかにし,対策を検討する。
    • 開発したmusicPIIrateは,最先端の推測精度を達成し,年齢,国,性別,嗜好,性格特性など幅広い属性を推測可能である。
    • 既存手法と比較して,15の属性推測タスクのうち9つでsuperiorな性能を示した。
    • 提案する防御策JamShieldは,ダミープレイリストを注入することで,推測のF1スコアを平均10%低減する効果が確認された。

    Link: https://arxiv.org/abs/2605.04724

  • プログラミング知識追跡における信頼性の確保:アテンション拡張モデルと実験プロトコルの再評価 [cs.IR, cs.LG, cs.SE]目的:プログラミング知識追跡モデルの信頼性評価に関する研究
    • プログラミング学習支援において,学習者の知識状態を正確に把握することは重要である。
    • 既存研究では,モデル設定や実験手順の違いにより,評価結果にばらつきが生じる可能性がある。
    • 一貫性のある評価プロトコルを確立し,モデルの性能を客観的に比較することを目指す。
    • アテンション機構の次元設定が性能評価に影響を与えることが示された。
    • 学生の解答順序が時間的因果関係に違反し,楽観的な結果をもたらす可能性があることが示された。
    • 厳密な評価プロトコル下では,アテンション拡張モデルと標準DKTの性能差は縮小し,複雑なアーキテクチャが常に優れた性能をもたらすわけではないことが明らかになった。

    Link: https://arxiv.org/abs/2605.04727

  • AISSA:AIベースの学生スライド分析ツールの実装と展開 [cs.HC, cs.AI, cs.SE]目的:学生の学術発表用スライドに対する形成的フィードバックの提供
    • 高等教育において,口頭発表スライドへの適切なフィードバックは学習効果に不可欠である。
    • 大規模なクラスでは,教員が詳細な形成的フィードバックを事前に提供することは現実的に困難である。
    • スライドの評価基準に基づいた,大規模な形成的フィードバックの効率的な提供を目指す。
    • AISSAは,LLMとラーニングアナリティクスダッシュボードを組み合わせ,スライドの定量的なスコアと定性的なフィードバックを自動的に生成する。
    • パイロット展開の結果,AISSAは技術的に信頼性が高く,経済的にも実行可能であることが示された。
    • 学生は,AISSAを反復的なスライド改善に役立つと評価しており,その有用性が確認された。

    Link: https://arxiv.org/abs/2605.04729

  • ロールアウトによるシミュレーションベース計画における共通乱数利用 [cs.LG]目的:確率的環境における意思決定のためのシミュレーションベース計画
    • 不確実な環境下での意思決定において,シミュレーションによる計画法は重要な手法である。
    • シミュレーションの結果には分散が生じやすく,精度の高い意思決定を阻害する要因となる。
    • シミュレーションの分散を削減し,計画の性能向上を目指す。
    • 共通乱数を用いることで,特定の深さにおけるロールアウトポリシーの相対的な有用性の分散を削減できることが示された。
    • 合成タスクにおける実験により,提案手法がタスクのパフォーマンスを向上させることが確認された。
    • 年金分配タスクやゲーム「ルード」への適用を通して,実用的な有効性が示唆された。

    Link: https://arxiv.org/abs/2605.04732

  • 没入型ビデオロールプレイングのための報酬分解強化学習 [cs.AI]目的:ビデオに基盤を置いたロールプレイング対話における,視覚的雰囲気とキャラクターの独自性の向上
    • 仮想現実やインタラクティブな物語など,没入型アプリケーションにおいて,雰囲気と緊張感の描写は不可欠である。
    • 既存のテキストベースのロールプレイングモデルは,シーンの雰囲気や緊張感の変化を反映するのが難しいという課題がある。
    • 視覚情報への注意,内部解釈の形成,文脈に応じた対話生成を分離することで,より人間らしいロールプレイングを実現する。
    • 提案手法EBM-RLは,テキストのみのロールプレイングや大規模なビジョン言語モデルと比較して,没入型ロールプレイングのベンチマークにおいて大幅な性能向上を示した。
    • EBM-RLは,視覚的雰囲気の一貫性とキャラクターの独自性を同時に向上させることに成功した。
    • 追加のファインチューニングなしに,EBM-RLは,ドメイン外のVideoQAベンチマークにおいても高い汎化性能を示した。

    Link: https://arxiv.org/abs/2605.04733

  • OSAQ:正確な低ビットLLM量子化のための外れ値自己吸収 [cs.LG]目的:LLMの低ビット量子化における外れ値の抑制と性能向上
    • 大規模言語モデルの利用拡大には,計算資源と推論速度の課題解決が不可欠である。
    • 量子化によるモデル圧縮は有効だが,重み分布の外れ値が性能低下の主要因となる。
    • ヘッセ行列の低ランク性を活用し,外れ値を効率的に抑制する量子化手法を開発する。
    • 提案手法OSAQは,ヘッセ行列の安定した零空間を利用し,外れ値を抑制する重み変換を効率的に行う。
    • OSAQはオフラインで重みに吸収されるため,推論時のオーバーヘッドは発生しない。
    • 2ビット量子化において,GPTQとの組み合わせで,従来のGPTQと比較して40%以上のperplexityの低下を実現した。

    Link: https://arxiv.org/abs/2605.04738

  • AICoFe:高等教育におけるAIを活用した協調的フィードバックシステムの導入と展開 [cs.HC, cs.AI, cs.SE]目的:高等教育における批判的思考力育成のためのAIを活用した協調的フィードバックシステム
    • 高等教育において,学生の批判的思考力育成は重要であり,ピアフィードバックはその有効な手段の一つである。
    • 学生によるピアフィードバックの質が安定せず,その効果が十分に発揮されないという課題がある。
    • AIを活用し,質の高いフィードバックを提供することで,ピアフィードバックの効果を高めることを目指す。
    • 本システムは,GPT-4.1-mini,Gemini 2.5 Flash,Llama 3.1などのLLMを組み合わせたパイプラインを用いて,定量的な評価基準と定性的な観察を統合し,一貫性のある実行可能なフィードバックを生成する。
    • 教師がAI生成のドラフトを修正・調整する「教師ループ型」のワークフローを導入し,フィードバックの質を担保する。
    • SQLとMongoDBを組み合わせたハイブリッドなデータインフラストラクチャにより,フィードバックのトレーサビリティとバージョン管理を実現している。

    Link: https://arxiv.org/abs/2605.04740