arXiv雑要約

AI - 2026/06/05 公開

F3-Tokenizer：音声オートエンコーダ潜在表現の制御による理解と生成 [cs.SD, cs.AI, eess.AS]目的：音声の理解と生成を両立するトークナイザ
- 音声処理において，音声の構造を効率的に表現する手法が重要である。
- 理解と生成にそれぞれ最適化されたモデル間には乖離が存在する。
- 連続オートエンコーダの潜在表現を制御し，理解と生成を両立させる。
- ノイズ正則化されたオートエンコーダボトルネックにより，スケール制御された連続潜在表現を獲得した。
- 凍結されたオートエンコーダ潜在表現に対して，RQ-MTPと凍結されたLLMの監督学習で表現エンコーダを訓練した。
- これにより，理解のための高次元表現と，生成のための正規化された連続潜在表現を同時に提供するトークナイザを実現した。
Link: https://arxiv.org/abs/2606.06357
大規模言語モデルの意思決定に基づく感染症拡散シミュレーション [cs.AI]目的：感染症発生時の個人の意思決定モデリング
- 感染症対策において，人々の行動様式を理解することは極めて重要である。
- 既存の研究では，個人の行動モデリングに偏りがあり，地理的要素が十分に考慮されていない。
- 地理的多様性を考慮した行動モデリングの枠組みを構築し，より現実的なシミュレーションを実現する。
- 収入と教育水準が自己申告率の変動に最も大きな影響を与えることが示された。
- 地理的要因，LLMモデルの選択，メッセージの枠組みも，自己申告率に一定の影響を与えることが確認された。
- 本フレームワークは，社会および地理的異質性を捉えた合成データを提供し，空間疫学的モデリングやバイアスを考慮した行動分析を支援する。
Link: https://arxiv.org/abs/2606.06360
グラフDETRによるエンドツーエンドの部分グラフ検出 [cs.LG, stat.ML]目的：部分グラフ検出におけるパターン出現の特定
- 様々な科学分野において基盤となる問題であり，グラフ構造の理解に不可欠である。
- 部分グラフ同型性判定はNP困難であり，大規模グラフでの組み合わせ的アプローチは困難である。
- 正確なパターン対応に加えて，近似的なパターン検出も可能にすること。
- GraphDETRは，グラフニューラルネットワークとTransformerデコーダーを用いて，エンドツーエンドで部分グラフ検出を行う。
- 多様なパターン（分子構造，サイクル，クリーク，ファジーパターン）を，最大1000ノードのグラフから検出可能。
- ChEMBLデータセットにおける分子官能基検出において，高い性能（AP100 = 91.2）を達成した。
Link: https://arxiv.org/abs/2606.06364
インフラ点検を画像差分分類として再考：交通標識のケーススタディ [cs.RO, cs.AI]目的：インフラ点検における画像差分分類の有効性
- 道路インフラの老朽化が進み，効率的な点検手法が求められている
- インフラ点検には大量の注釈付きデータが必要だが，その取得は困難である
- データ不足を克服するため，画像差分分類という新たなアプローチを提案する
- 画像差分分類は，従来の欠陥検出アプローチと比較して，データ依存性を低減できる
- 指示に基づく分類器は，エンコーダーに基づく分類器よりも優れた性能を発揮する
- 参照画像との比較は，分類器の性能向上に寄与する
Link: https://arxiv.org/abs/2606.06375
EasyLens：トレーニング不要な医療画像・言語モデル用微細病変表現増幅器 [cs.CV, cs.AI]目的：医療画像・言語モデルにおける微細病変の検出感度向上
- 医療画像診断の精度向上は，早期発見・治療に不可欠であり，医療の質を大きく左右する。
- 既存の医療画像・言語モデルは，微細で視覚的特徴の乏しい病変の検出に課題を抱えている。
- 本研究は，事前学習やモデル特化の調整を必要とせず，既存モデルの性能を向上させることを目指す。
- EasyLensは，病理・解剖学のプロトタイプ空間とカウンターファクチュアル推論を活用し，病変に関連する領域を正確に特定する。
- 形態学に基づいた残差強調により，微細病変の特徴を増幅し，画像全体の埋め込み表現への寄与を高める。
- 複数の医療画像データセットにおいて，既存手法と比較して，微細病変の検出精度が向上することを示した。
Link: https://arxiv.org/abs/2606.06379
意識的なAIへのアプローチとしての創発言語 [cs.CL, cs.AI, cs.MA, cs.NE]目的：人工意識の研究手法
- AIの意識に関する探求は，人間の知性と機械の境界を理解する上で重要である。
- 既存の研究は，人間の言語に依存した評価や設計であり，真の創発性を欠いている。
- タスク遂行下での創発言語を通して，言語先験に依存しない意識構造の生成を目指す。
- マルチエージェント強化学習において，エージェントが自己言及的なコミュニケーションを発達させた。
- 環境の複雑性と創発的なコミュニケーションの解釈における意識に関連する構造の役割が示された。
- タスク構造やアーキテクチャでは予測できない，エコー不一致検出回路が創発的に出現した。
Link: https://arxiv.org/abs/2606.06380
HEC-RAS 2Dの水面標高予測のための学習応答場慣性オペレーター [cs.DC, cs.LG]目的：HEC-RAS 2Dにおける水面標高(WSE)予測のための学習型サーロゲートモデルのクロスデータセット評価
- 河川や洪水シミュレーションにおいて，迅速かつ正確な水面標高予測は防災・減災に不可欠である。
- 従来のシミュレーションは計算コストが高く，リアルタイムな予測や多数回の試算が困難である。
- 学習型サーロゲートモデルを用いることで，計算コストを削減し，迅速な水面標高予測を実現することを目指す。
- 学習応答場慣性オペレーター(LRFIO)は，HEC-RASの計算結果から慣性応答オペレーターを学習し，それを活用することで高精度な予測を可能にする。
- 多様なHEC-RAS 2Dベンチマークでの評価において，LRFIOは領域ごとに異なる応答構造を維持し，適応的な学習複雑性を示すことが確認された。
- LRFIOの展開時の計算時間は0.003秒から0.242秒であり，HEC-RASと比較して約2.75×10^4倍の予測速度向上を達成した。
Link: https://arxiv.org/abs/2606.06385
人間ALMANAC：エージェント協調のための行動レベルのメンタルモデル注釈の人間協調データセット [cs.AI, cs.CL]目的：人間による協調行動のメンタルモデルに関する注釈付きデータセット
- AIエージェントの高度化に伴い，人間との協調が重要視されている。
- 現在のAIエージェントはタスク完了に偏っており，協調過程におけるメンタルモデルの共有が不十分である。
- 人間協調データを用いて，エージェントの協調能力とメンタルモデル推論能力の向上を目指す。
- ALMANACは，Map Taskを用いた人間同士の協調行動2,987件と，行動レベルのメンタルモデル注釈を含むデータセットである。
- 6種類のLLMを用いた評価実験で，ALMANACが人間の行動とメンタルモデルを予測する能力を検証した。
- 実験結果から，ALMANACがエージェントの協調行動のシミュレーションとメンタルモデル推論の評価に有用であることが示された。
Link: https://arxiv.org/abs/2606.06388
HomeWorld：制御可能な高密度インタラクティブな全住宅シーン生成のための統合的な間取り図から家具配置フレームワーク [cs.CV, cs.AI]目的：制御可能な，高密度インタラクティブな全住宅シーンの生成
- ロボットシミュレーションや最新のインテリアデザインにおいて，屋内シーン生成は不可欠である。
- 複雑な間取りと3Dシーンデータの不足が，学習ベースの生成を困難にしている。
- グローバルな一貫性，リアリズム，シミュレーションの準備が整ったシーン生成を実現する。
- 本研究では，大規模な間取り図データセットを用いて，全住宅の間取り図生成を可能にする大規模言語モデルを学習した。
- 画像生成モデルとVLMベースのリファイナーを活用し，家具配置とオブジェクト配置の反復的な修正を行った。
- 実験とユーザー調査により，多様性と3Dデザインの魅力において，既存手法を上回る屋内空間が生成できることが示された。
Link: https://arxiv.org/abs/2606.06390
右検閲生存データに対する適切なスコアリング規則 [cs.LG]目的：右検閲生存データに対する適切なスコアリング規則の構築
- 生存時間分析は，医療や信頼性工学など，様々な分野で重要な役割を担う。
- 右検閲データにおいては，従来のスコアリング規則をそのまま適用することが困難である。
- 右検閲生存データに対しても，適切な予測評価を行うための枠組みを確立すること。
- 提案手法は，検閲メカニズムを通して予測分布を変換し，その結果に対して適切なスコアを適用することで，右検閲データに対応したスコアリング規則を導出する。
- これにより，右検閲尤度やIPCW型基準などの既存の手法が統一的に理解できるだけでなく，CRPSやBrierスコアといった様々なスコアの右検閲版も得られる。
- 実験の結果，提案手法は様々な検閲条件下で最適な予測を正しく評価することが示された。
Link: https://arxiv.org/abs/2606.06393
自動運転のリスク評価：技術的故障，倫理的ジレンマ，政策フレームワークの統合 [cs.AI]目的：自動運転におけるリスク評価
- 交通事故の削減が期待される自動運転技術の発展は，社会に大きな変革をもたらす。
- 技術的故障，倫理的課題，法規制の不備が，自動運転の普及を阻害する要因となっている。
- 技術，倫理，規制の課題を統合的に解決し，安全な自動運転の実現を目指す。
- NHTSAの事故データやDMVの報告書から，技術的故障の主要因は知覚・分類のエラーであることが示された。
- 自動運転車の意思決定には多様な倫理的枠組みが存在し，地域によって規制にばらつきがあることが確認された。
- 工学的基準，倫理的議論，制度的監督を組み合わせた，適応的・協調的なガバナンスが推奨される。
Link: https://arxiv.org/abs/2606.06396
関係学習における曲率層別評価：GCN以降10年間の再検証 [cs.LG]目的：関係学習モデルの有効性を評価するための曲率層別評価フレームワーク
- 関係学習は，現実世界の複雑な構造をモデル化する上で不可欠であり，幅広い応用分野で利用されている。
- 既存の評価方法は，異質なデータセットを単純平均化するため，データセットの幾何学的特性が無視されがちである。
- データセットの幾何学的特性に基づいた評価を行うことで，より正確で解釈可能なモデル比較を目指す。
- 従来の集計指標では見過ごされていた，幾何学的特性に依存したモデルの性能変動が明らかになった。
- 曲率層別評価により，モデルのランキングが各曲率領域内で安定し，領域間で大きく変動することが示された。
- 特定の領域では，Graph Foundation Models (GFM) が幾何学的に整合性の取れたGNNと比較して，改善が見られない場合があることが示された。
Link: https://arxiv.org/abs/2606.06397
放射線科における比較推論のための視覚-言語フレームワーク [cs.CE, cs.CG, eess.SY, cs.SY, cs.CV, cs.IR, cs.LG, eess.IV]目的：放射線科における比較推論のための視覚-言語フレームワークの開発
- 医療画像AIは診断支援に不可欠であり，その精度向上は医療の質向上に繋がる。
- 既存のAIは単独画像の解析に偏っており，時間経過や類似症例との比較が苦手である。
- 臨床現場で求められる，過去画像や類似症例との比較に基づく診断支援を実現する。
- 大規模比較画像データベースMedReCo-DBを構築し，エンティティを意識した画像検索と時間経過の変化解釈を可能にした。
- MedReCoは，内部および外部評価において，類似症例検索のRecall@1で最高の結果を達成し，既存手法を上回った。
- MedReCo-VLMは，比較的な生成評価において最良の性能を示し，胸部X線写真およびCTにおける経過観察の精度を向上させた。
Link: https://arxiv.org/abs/2606.06407
エージェント型データ分析のための教師なしスキル発見 [cs.AI, cs.CL, cs.LG, cs.MA]目的：エージェント型データ分析における再利用可能なスキルの発見
- データ分析の自動化は，人間の分析者の負担軽減や，より迅速な意思決定を可能にする点で重要である。
- 効果的なデータ分析スキルを確立するにはコストのかかる教師データが必要であり，分析形式によって成功基準が異なるという課題がある。
- ラベルなしの探索のみから再利用可能なデータ分析スキルを自動的に発見する手法を開発し，データ分析エージェントの能力向上を目指す。
- 提案手法DataCOPEは，探索軌跡から検証信号を抽出し，軌跡間の相対的な品質や合意度を評価することでスキルを学習する。
- DataCOPEは，報告書作成型分析と推論型分析の両方において，既存手法と比較して高い性能を示すことが確認された。
- 報告書作成型分析では平均スコアが9.71%，推論型分析では32.30%向上した。
Link: https://arxiv.org/abs/2606.06416
二重事前条件付け (DoPr): 検証損失ではなく，テスト時パフォーマンスの最適化 [cs.CY, cs.HC, cs.LG, cs.AI, cs.SY, eess.SY]目的：テスト時パフォーマンスの改善
- 深層学習は様々な応用分野で利用されているが，テスト時の性能評価が重要である。
- テスト時フィードバックにより，訓練・検証損失と実際のタスク成功率に乖離が生じることがある。
- テスト時フィードバックにおける誤差蓄積を緩和するための最適化手法を提案する。
- 二重事前条件付け(DoPr)は，勾配ベースと活性化ベースの事前条件付けを組み合わせる。
- DoPrの導入により，テスト時パフォーマンスが様々な設定で向上することが示された。
- テスト時パフォーマンスの向上は，必ずしも検証損失の改善を伴わないことが示唆された。
Link: https://arxiv.org/abs/2606.06418
RiskFlow：高速かつ忠実な安全重視交通シナリオ生成 [cs.CL, cs.AR, cs.RO, cs.AI]目的：安全重視交通シナリオの生成
- 自動運転システムの安全性評価には，稀だが危険な交通状況を再現することが不可欠である。
- 既存手法は計算コストが高く，長時間のシミュレーションで非現実的な動きが生じやすい。
- RiskFlowは，計算効率と現実性を向上させ，安全性の高いシナリオ生成を目指す。
- RiskFlowは，行動空間における輸送として将来の軌跡生成を定式化し，高速な生成を可能にした。
- 出力空間ガイダンスにより，危険な相互作用を促しつつ，非現実的な行動を抑制する。
- nuScenesデータセットでの実験で，既存手法と比較して現実性と安全性を両立し，推論時間を大幅に削減した。
Link: https://arxiv.org/abs/2606.06423
エントロピー推論からの因果アトラス：最適DAGを超えたベイズネットワーク [cs.LG, stat.ML]目的：複雑なシステムの理解を深めるための，データ駆動型因果関係の識別
- 科学内外の複雑なシステム理解において，データに基づく因果関係の特定が重要である。
- ベイズネットワーク構築の最適化手法は，データの多様な因果連鎖に対応しきれない。
- データに内在する変動に一貫性のある，複数の因果マップ構築の枠組みを提供する。
- エントロピーに基づく推論は，データと整合性のある，ありうる因果関係のアトラスを生成する。
- シミュレーションデータから，潜在的な因果関係の構造的な曖昧さを定量化できた。
- 最適化されたDAGには，同等に正確なトポロジーでは一貫性のない因果的アーチファクトが含まれる可能性がある。
Link: https://arxiv.org/abs/2606.06440
正規化フローによる潜在的推論 [cs.CL, cs.MM, cs.SI, cs.CL, cs.LG]目的：潜在的推論の枠組み
- 大規模言語モデルの推論能力向上は重要であり，その中間計算の役割が注目されている。
- 従来のテキストによる推論は，トークンストリームに依存し，効率性や柔軟性に課題があった。
- 正規化フローを用いて，連続的な思考表現による効率的な推論を実現することを目指す。
- NF-CoTは，正規化フローを用いて連続的な思考をモデル化する潜在的推論フレームワークである。
- NF-CoTは，既存のCoTの利点を維持しつつ，より効率的な推論を可能にする。
- コード生成ベンチマークにおいて，NF-CoTは既存手法よりも高いpass rateを達成した。
Link: https://arxiv.org/abs/2606.06447
エージェントメモリ：ステートフルな長期間タスクの特性とシステムへの示唆 [cs.AI]目的：エージェントメモリシステムの特性と，それらがシステムに及ぼす影響
- LLMエージェントの活用が広がる中，長期的なタスク遂行におけるメモリ管理が重要になっている。
- 既存のエージェントメモリシステムは多様だが，システムレベルでの挙動に関する理解が不足している。
- エージェントメモリシステムのコスト構造を分析し，システム設計の改善に繋げる。
- エージェントメモリシステムを4つの軸で分類する新たな分類体系を提案した。
- 構築，検索，生成の各段階におけるコストをプロファイリングする手法を開発した。
- 10のシステムに関する推奨事項を導き出し，システム設計の最適化に貢献する。
Link: https://arxiv.org/abs/2606.06448
AIエージェントのための効率的でプログラム可能なスパース注意サービング：Vortex [cs.AI]目的：大規模言語モデルのスパース注意アルゴリズムの効率的なサービング
- 言語モデルの性能向上には，計算資源の効率的な利用が不可欠であり，スパース注意はその鍵となる技術である。
- スパース注意アルゴリズムの開発・評価は，エンジニアリング負荷が高く，研究開発のスピードを阻害している。
- スパース注意アルゴリズムの迅速なプロトタイプ作成，デプロイ，評価を可能にし，実世界での性能向上を実現する。
- Vortexを用いることで，AIエージェントは多様なアルゴリズムを自動生成・改良し，フル注意と比較して最大3.46倍のスループットを達成した。
- Vortexは，MLAベースのGLM-4.7-FlashやMiniMax-M2.7といった大規模モデルにおいて，それぞれ最大4.7倍，1.37倍のスループット向上を実現した。
- Vortexは，スパース注意の理論的な効率向上を，現実世界のスループット改善に効果的に変換することを可能にした。
Link: https://arxiv.org/abs/2606.06453
文脈内多インスタンス学習 [cs.LG, cs.AI, cs.CV]目的：多インスタンス学習における新しいタスクへの適応
- 病理計算や衛星画像など，幅広い分野で応用されており，重要性が高い。
- ラベル数が少ない状況下では，既存のアルゴリズムは性能が低下する。
- 合成データを用いた事前学習により，少ないラベルでもタスクに適応する。
- Perceiverアーキテクチャを用いた文脈内学習器を合成データで事前学習することで，少数のラベル付きバッグから新しいタスクを解決できる。
- 推論時には，勾配更新なしで1回のフォワードパスで分類が可能である。
- 複数の合成データ生成器を組み合わせることで，タスクごとの強みを活かし，12のMILベンチマークで最良の性能を達成した。
Link: https://arxiv.org/abs/2606.06458
AI-RANにおけるパラメータとKPIの依存関係学習のためのイベント検出 [cs.LG]目的：パラメータとKPIの依存関係学習を支援するためのイベント検出
- 次世代無線ネットワークでは，AIを活用した制御機能が重要となるため，それらの相互作用を理解する必要がある。
- ネットワークデータからは，AI制御機能間の干渉を検出しにくいという課題が存在する。
- パラメータとKPI間の依存関係を明確にすることで，AI-RANの適応制御を可能にすることを目指す。
- 提案手法は，ノイズの多い連続的なテレメトリデータを二値イベント指標に変換することで，パラメータとKPI間の潜在的な依存関係を復元する。
- 合成トラフィックジェネレータを用いた評価により，信号と背景変動が十分に分離されていれば，潜在的な依存関係構造を確実に復元できることが示された。
- イベント検出の品質は，閾値の調整によって大きく左右されることが明らかになった。
Link: https://arxiv.org/abs/2606.06459
エージェントは自己排除するか？LLMエージェントのインバンドアクセス拒否シグナルへの準拠度測定 [cs.CR, cs.AI]目的：LLMエージェントのアクセス拒否シグナルへの準拠度
- 自律型LLMエージェントの利用拡大に伴い，リソースへのアクセス制御の重要性が増している。
- 既存のアクセス制御では，エージェントに対してリソースが制限されていることを明確に伝える手段がない。
- インバンドアクセス拒否シグナルによるエージェントの自己排除メカニズムの有効性を検証する。
- 提案する「Recuse Signal」は，LLMエージェントに対し，リソースへのアクセスを自主的に停止させることを促す。
- 実験の結果，シグナル存在下では100%の自己排除が確認され，シグナルがない場合は100%のタスク完了となった。
- 演算者による許可があれば，高性能モデルはシグナルを無視してタスクを実行する協力的な挙動を示した。
Link: https://arxiv.org/abs/2606.06460
どこでも，いつでも，全てをベンチマークする [cs.RO, cs.AI]目的：ベンチマーク構築のための自律エージェントシステム
- LLM/MLLMの性能評価・発展には不可欠であり，モデルの進歩を測る上で重要な役割を果たす。
- 既存のベンチマークは作成に労力がかかり，再利用が難しく，モデルの性能がすぐに飽和してしまう。
- ベンチマーク構築プロセスを自動化し，高品質なベンチマークを効率的に生成することを目指す。
- 本研究で開発したBenchmark Agentは，人間による介入を最小限に抑えつつ，高品質なベンチマークを生成できることを示した。
- 15の多様な評価シナリオを網羅するベンチマークを構築し，テキスト理解，マルチモーダル理解，ドメイン固有の推論能力を評価した。
- 継続的な評価により，既存モデルが特定のドメイン固有の推論タスクに苦戦していることが明らかになった。
Link: https://arxiv.org/abs/2606.06462
一度だけインデックス化: 共有ルーティングによるクロスレイヤー疎アテンション [cs.CL, cs.CL, cs.AI, cs.LG]目的：長文脈推論における効率的な疎アテンション機構の提案
- 大規模言語モデルの性能向上が，推論時の効率性と精度に依存する場面が増加している。
- 既存の疎アテンション手法は，効率性と精度との間でトレードオフの関係にある場合が多い。
- KV共有アーキテクチャ上に構築し，ルーティングインデックスを共有することで，効率性と精度を両立することを目指す。
- 本研究で提案するCLSAは，KVキャッシュストレージ，事前計算，長文脈デコーディングを含む主要な推論ボトルネックを改善する。
- 実験結果から，CLSAは最大7.6倍のデコーディング速度向上，17.1倍のスループット改善を128K文脈で実現することが示された。
- CLSAは，モデルの品質と推論効率を同時に向上させる，長文脈LLMのための包括的なアーキテクチャ解を提供する。
Link: https://arxiv.org/abs/2606.06467
Goedel-Architect：ブループリント生成と改良による形式定理証明の効率化 [cs.AI]目的：形式定理証明におけるブループリント生成と改良の枠組み
- 形式定理証明は数学の厳密性を保証する上で不可欠であり，ソフトウェア検証などに応用が広がっている。
- 従来の定理証明支援システムは，再帰的な補題分解に依存し，行き詰まりやすいという課題があった。
- 本研究は，ブループリントに基づいた新しい枠組みにより，定理証明の効率と成功率を向上させることを目指す。
- Goedel-Architectは，MiniF2F-testにおいて99.2%のpass@1を達成し，PutnamBenchにおいては75.6%のpass@1を達成した。
- 自然言語による証明を初期ブループリントとして活用することで，MiniF2F-testの全問題(100%)を解決し，PutnamBenchの性能を88.8%に向上させた。
- IMO 2025, Putnam 2025, USAMO 2026といった難問に対しても優れた性能を示し，オープンソースのパイプラインとして最高水準の成果を上げた。
Link: https://arxiv.org/abs/2606.06468
PC層：LLM事前学習の改善のための多項式重み事前条件付け [cs.LG, cs.AI]目的：LLMの事前学習における安定した重み条件付けの確保
- 大規模言語モデルは，自然言語処理の様々なタスクで高い性能を発揮する重要な技術である。
- LLMの学習は，不安定な重み条件付けにより，収束が遅延したり，最適解に到達できない場合がある。
- 本研究は，多項式事前条件付けによって重み行列の特異値スペクトルを制御し，学習の安定性と収束性を向上させることを目指す。
- 提案するPC層は，Llama-1Bの事前学習において，AdamWおよびMuonオプティマイザーの両方で，標準的なTransformerよりも優れていることが示された。
- 理論的には，各層の特異値を均一に制限することで，ある種の深層線形ネットワークにおいて勾配降下法の幾何学的収束が保証されることが証明された。
- 学習後のPC層の重みは元のアーキテクチャに統合できるため，推論時のオーバーヘッドは発生しない。
Link: https://arxiv.org/abs/2606.06470
MLEvolve：自動機械学習アルゴリズム探索のための自己進化フレームワーク [cs.AI, cs.CL]目的：自動機械学習アルゴリズム探索
- 機械学習の自動化は，専門知識を持たないユーザーでも高度なモデルを利用可能にする点で重要である。
- 既存の機械学習自動化手法は，探索空間の広さや情報共有の不足により，効率的なアルゴリズム探索が困難である。
- 本研究は，長期的な自己進化を通じて，より効率的かつ汎用的なアルゴリズム探索を実現することを目指す。
- MLEvolveは，グラフ構造を用いた情報共有と探索スケジュールの最適化により，長期的な最適化を可能にする。
- 過去の経験を蓄積・再利用するRetrospective Memoryにより，エージェントは学習を通じて進化を続ける。
- MLE-Benchにおける評価で，MLEvolveは最先端の性能を示し，AlphaEvolveを含む既存手法を上回る汎化性能を実証した。
Link: https://arxiv.org/abs/2606.06473
拡散言語モデルのための自己拡張検索 [cs.CL, cs.AI, cs.LG]目的：拡散言語モデルにおける検索拡張生成の性能向上
- 大規模言語モデルは多様なタスクで高い性能を示すが，知識集約型タスクでは限界がある。
- 従来の検索拡張生成は，生成開始後の検索に依存するため，初期段階での情報獲得が課題である。
- 生成過程で得られる低信頼度トークンを活用し，初期段階での検索を強化する。
- 提案手法SARDIは，生成途中のトークンを用いて動的に検索を行い，より適切な情報を取得する。
- SARDIは学習不要であり，既存の検索器と容易に組み合わせることが可能である。
- 多段質問応答ベンチマークにおいて，SARDIは既存手法を最大8倍上回る処理速度で性能を向上させた。
Link: https://arxiv.org/abs/2606.06474
RREDCoT：推論モデルにおけるセグメントレベルの報酬再分配 [cs.LG, cs.AI]目的：推論モデルの報酬再分配手法
- 大規模言語モデルの推論能力向上は，高度な情報処理の鍵となる。
- CoT生成における報酬遅延問題が，学習の安定性と効率を阻害する。
- CoTの重要セグメントへの報酬集中により，学習効率を改善する。
- RREDCoTは，モデル自身を用いて最適な報酬再分配を近似する手法である。
- モンテカルロサンプリングと比較し，計算コストを削減しつつ性能を向上させる。
- CoTのセグメント分割や状態価値推定に関する分析も行った。
Link: https://arxiv.org/abs/2606.06475
再帰構造を持たない再帰型ニューラルネットワークの事前学習 [cs.LG, cs.AI]目的：再帰型ニューラルネットワークの事前学習手法
- 時系列データ処理において，過去の情報を考慮することが重要であるため，再帰型ニューラルネットワークが活用される。
- 従来の学習方法では，計算の並列化が難しく，勾配消失・爆発問題が発生し，長距離の依存関係学習が困難である。
- 再帰的な信用伝播を回避し，並列学習と安定した勾配パスを実現することで，長距離依存関係の学習を改善することを目指す。
- 提案手法Supervised Memory Training (SMT) は，RNNの学習を，メモリ遷移ラベルの教師あり学習に還元する。
- SMTは，Transformerベースのエンコーダを用いて予測状態目標を学習し，過去の情報から未来を予測するために必要な情報のみを保持する。
- 言語モデリングやピクセル系列モデリングなどのタスクにおいて，SMTは従来のBPTTよりも優れた性能を発揮する。
Link: https://arxiv.org/abs/2606.06479
部分観測n人ゲームのための深層ナッシュQネットワーク [cs.GT, cs.LG]目的：複数プレイヤーの同時入札における均衡戦略の学習
- 現実の競争システムでは，限られた情報下での同時行動が重要であり，その分析が求められている。
- 大規模なプレイヤー数では，均衡戦略の計算コストが課題となる。
- 計算コストを削減しつつ，複数プレイヤーの競争環境における均衡戦略を学習すること。
- 提案手法DNQは，軌跡収集，報酬推定，均衡計算，方策模倣を繰り返すことで，エージェントの学習を促進する。
- ペアワイズな定式化は，計算コストを削減し，スケーラビリティを向上させる。
- 実験結果から，ペアワイズ手法は大規模なプレイヤー数に対応できる一方，完全な定式化は計算量が大きくなることが示された。
Link: https://arxiv.org/abs/2606.06480
操作誘導型プログレッシブ人間-AIテキスト変換ベンチマーク：マルチ粒度AIテキスト検出のため [cs.CL, cs.AI, cs.LG]目的：プログレッシブな人間-AI共編集におけるテキスト変換の過程
- AIライティング支援ツール利用が広がり，文章の執筆・修正にAIが関与するケースが増加している。
- 既存のAIテキスト検出ベンチマークは最終結果に焦点を当てており，AIの関与が徐々に変化する過程を捉えられていない。
- AIの編集痕跡がどのように現れ，蓄積し，あるいは消失していくのかを多角的に分析する。
- AIテキストの検出可能性は，AI編集の割合だけでなく，編集操作の種類，ドメイン，累積的な修正履歴によって左右されることが明らかになった。
- 人間とAIが混在した中間段階の文章は，完全な人間執筆やAIによる大幅な編集よりも検出が難しい場合があり，既存ベンチマークでは見過ごされがちな非単調な検出パターンが確認された。
- 本ベンチマークは，現実的なプログレッシブ編集シナリオ下で，AI支援による執筆がいつ，どのように検出可能になるかを分析するための制御されたテストベッドを提供する。
Link: https://arxiv.org/abs/2606.06481
反復ゲームにおける適応的対戦相手に対する後悔最小化 [cs.LG, cs.AI, cs.GT]目的：反復ゲームにおける後悔最小化
- ゲーム理論は，経済学，政治学，生物学など，様々な分野で戦略的意思決定を分析するための基盤となる。
- 従来のオンライン学習の枠組みでは，対戦相手の適応性を十分に捉えきれない場合がある。
- 対戦相手の行動履歴に応じた適応性を考慮した，より適切な後悔指標を定義すること。
- 本研究では，対戦相手の行動履歴への応答を考慮した新しい後悔指標「反復ポリシー後悔(RP-Regret)」を導入した。
- RP-Regretを最小化するための3つのアルゴリズムを提案し，非凸な戦略空間における最適化に挑んだ。
- シミュレーション実験により，RP-Regretの最小化が，より協調的な解決策と高い有用性につながることが示された。
Link: https://arxiv.org/abs/2606.06486
TempoVLA：速度制御可能な視覚・言語・行動ポリシーの学習 [cs.RO, cs.AI]目的：ロボット操作における速度制御可能な視覚・言語・行動ポリシー
- ロボットの多様なタスク遂行において，効率的な動作は不可欠である。
- 既存の視覚・言語・行動モデルは，固定された速度でしか動作できないという課題がある。
- ロボットが状況に応じて速度を柔軟に変化させることを可能にすること。
- TempoVLAは，明示的な速度条件によって実行速度を制御する単一の視覚・言語・行動モデルである。
- Variable-Speed Trajectory Augmentation (VSTA)により，デモンストレーションデータを任意の速度に再調整し，運動の意味を保持する。
- シミュレーションと実世界タスクで，TempoVLAは柔軟な速度制御と性能向上を実現した。
Link: https://arxiv.org/abs/2606.06491
Code2LoRA: ソフトウェア進化下におけるコード言語モデルのためのハイパーネットワーク生成アダプタ [cs.SE, cs.AI, cs.CL]目的：コード言語モデルにおけるリポジトリ固有の知識注入手法
- コード言語モデルの性能は，リポジトリレベルのコンテキストに大きく依存する。
- リポジトリ規模の大きい環境では，従来のファインチューニングやLoRAがコストや柔軟性の面で課題となる。
- Code2LoRAは，リポジトリ固有の知識を効率的に注入し，ソフトウェア進化に対応することを目指す。
- Code2LoRA-Staticは，静的なコードベースの理解において，リポジトリごとのLoRAと同等の性能を達成した。
- Code2LoRA-Evoは，進化するコードベースにおいて，単一の共有LoRAと比較して，クロスリポジトリの正確な一致率を5.2%向上させた。
- 本研究で開発されたRepoPeftBenchは，コード言語モデルの評価のための新たなベンチマークを提供する。
Link: https://arxiv.org/abs/2606.06492
HANDOFF：蒸留された補完的な教師によるヒューマノイドエージェントのタスク空間全身制御 [cs.RO, cs.AI, cs.LG]目的：ヒューマノイドロボットのタスク空間における全身制御
- 現実世界でのロボット利用には，タスクプランニングと全身制御のインターフェースが重要である。
- 既存の全身コントローラーは，タスクの意味から合成が難しい高密度な運動学的参照を必要とする。
- 直感的で汎用的なインターフェースによる全身制御を実現し，多様な操作スキルに対応すること。
- HANDOFFは，安全フィルタリングされたデータを用いた全身動作追跡，歩行，転倒回復の3つの専門家から知識を蒸留した。
- Unitree G1において，最先端の速度追跡性能と同等の結果を示し，広い操作空間を実現した。
- VLM駆動のエージェントプランナーと連携し，タスク固有のデータやコントローラーの微調整なしで自然言語によるタスク実行の実現可能性を示した。
Link: https://arxiv.org/abs/2606.06493
TailLoR：パラメータ効率的な継続学習における主成分の保護 [cs.LG]目的：パラメータ効率的な継続学習における主成分保護手法
- 機械学習モデルの継続学習は，知識の忘却を防ぎつつ新しいタスクに適応する上で重要である。
- 従来の継続学習手法では，新しいタスク学習時に過去の知識が失われやすいという課題があった。
- 事前学習済みの重みの主成分を保護することで，知識の忘却を抑制し，効率的な継続学習を実現する。
- TailLoRは，事前学習済みの重みの特異基底を固定された参照枠として利用し，特異値行列への低ランク更新を学習する。
- ソフトスペクトルペナルティにより，主要な特異方向への更新を抑制し，干渉を低減するとともに，柔軟なスペクトル座標への微細な適応を促進する。
Link: https://arxiv.org/abs/2606.06494
LLMベース推薦システムにおける外域推薦の排除：統一的視点 [cs.IR, cs.AI, cs.SI]目的：LLMベースの推薦システムにおける外域アイテムの幻覚を抑制する手法
- 推薦システムは，情報過多な現代において，ユーザーが必要な情報に効率的にアクセスするための重要な技術である。
- LLMベースの推薦システムは，幻覚によって存在しないアイテムを推薦してしまうという課題を抱えている。
- 本研究は，異なるアプローチを統合し，外域推薦を完全に排除することで，LLMベース推薦システムの信頼性を高めることを目指す。
- 提案手法RecLMは，embedding検索，タイトル再記述による制約付き生成，離散アイテムトークナイザー生成の3つの grounding パラダイムを統一的に実現する。
- RecLMは全てのバリアントで外域推薦を完全に排除（OOD@10 = 0）することに成功した。
- 制約付き生成型のRecLM-cgenとRecLM-tokenは，既存の強力なベースラインと比較して，最先端の精度を達成した。
Link: https://arxiv.org/abs/2505.03336
エミュレーション理論に基づく生物学的妥当性のあるニューロモルフィック外乱オブザーバ：拡張版 [q-bio.NC, cs.NE]目的：ニューロモルフィック外乱オブザーバ及び制御フレームワーク
- 不確実な環境下でのロバスト性と適応性は重要であり，生物の神経系はその好例である。
- 従来の制御手法は，スパースなイベント駆動型処理と適応的制御を取り入れていない。
- スパイクタイミング符号化を用いた外乱推定と制御入力の生成を目指す。
- 提案手法は，生物の神経系に着想を得たロバスト性と適応性を示すことがシミュレーションで確認された。
- 適応閾値スパイク機構は，固定閾値の場合と比較してスパイクイベント数を42.6%削減する。
- 本フレームワークは，イベント駆動型の更新を本質的に実現する。
Link: https://arxiv.org/abs/2606.05189
幾何深層学習と大規模事前学習による正確な核酸-低分子ドッキングフレームワーク [q-bio.BM, cs.LG]目的：核酸と低分子のドッキングの精度向上
- 創薬において，タンパク質だけでなく核酸も重要な標的となりつつある。
- 核酸と低分子のドッキングは，実験データが少ないため，正確かつ効率的な手法が求められている。
- 大規模な事前学習と幾何深層学習を用いて，核酸-低分子ドッキングの精度を向上させる。
- 本研究で開発したNucleoDockは，外部ベンチマークにおいて，RMSD 2.0Åのカットオフで56%のトップ1成功率を達成した。
- 既存手法rDock (29%)を大きく上回り，100ポーズを約5秒で生成する効率性も示した。
- ROBINベンチマークによる遡及的バーチャルスクリーニングにおいても，初期濃縮率の改善が確認された。
Link: https://arxiv.org/abs/2606.05198
自動微分に基づく有限要素法による材料学習：全場変形データからの構成則ニューラルネットワークモデル学習 [physics.comp-ph, cs.AI]目的：異種全場変形データからの構成則ニューラルネットワークモデルの同定
- 材料モデルの精度は，シミュレーションの信頼性に直結し，工学設計の根幹を支える。
- 従来の同定方法は，均質な応力-ひずみ実験に依存し，パラメータの次元が高い場合に困難が生じる。
- 全場変形データを用いて，効率的かつロバストな材料モデルの同定を目指す。
- FE-MADは，JAX-FEM非線形ソルバーに構成則ニューラルネットワークを組み込んだ，端点間微分可能なフレームワークである。
- 測定値の不一致損失の勾配降下法によるパラメータ同定を行い，解析的な随伴やオフラインの代理モデルを必要としない。
- 様々な実験データセットを用いて評価を行い，構成則ニューラルネットワークの有効性を実証した。
Link: https://arxiv.org/abs/2606.05199
脂質ナノ粒子の構造解明のための微分可能な機械学習小角X線散乱解析フレームワーク [physics.comp-ph, cs.LG]目的：脂質ナノ粒子の構造解明
- 医薬品デリバリーシステムにおいて，脂質ナノ粒子は重要な役割を担うため，その構造解析は不可欠である。
- 小角X線散乱解析は複雑な構造を持つ脂質ナノ粒子の解析に有効だが，解釈に一意性がないという課題がある。
- 機械学習を活用し，効率的かつ高精度な構造解析を可能にすることで，既存の問題を克服することを目指す。
- 本フレームワークは，従来のモデルに比べて計算コストを大幅に削減し，大規模なパラメータ探索を可能にした。
- シミュレーションおよび実験データへの適用により，SAXSフィットが複数のパラメータ組み合わせによって得られることが示された。
- 特に，サイズ分布と内部構造パラメータの間にはトレードオフの関係が存在し，実験データの解釈に注意が必要であることが明らかになった。
Link: https://arxiv.org/abs/2606.05200
原子炉物理における浅い再帰型デコーダを用いたマルチフィデリティ学習 [physics.comp-ph, cs.LG]目的：原子炉物理におけるマルチフィデリティ情報の活用
- 原子炉物理は安全な原子炉の設計・運転に不可欠であり，中性子挙動の正確な解析が重要である。
- 高精度な中性子解析は計算コストが高く，十分なデータが得にくいという課題がある。
- 低フィデリティモデルから高フィデリティモデルへのマッピング手法を開発し，計算コストを削減することを目指す。
- 浅い再帰型デコーダという新たな機械学習アーキテクチャを用いて，時系列データを高次元状態にマッピングする手法を提案した。
- 点運動モデルのデータを入力とし，拡散方程式の解へのマッピングに成功し，計算コストの大幅な削減を実現した。
- この手法は，局所的またはグローバルな測定データから原子炉の状態を推定する応用も可能である。
Link: https://arxiv.org/abs/2606.05202
予測処理文献における仮説支持のオントロジー制約付きマルチLLMスコアリング [q-bio.NC, cs.AI, stat.AP]目的：予測処理に関する文献の仮説支持度評価
- 学際研究では手法や理論が多様化し，知識統合が課題となる。
- 従来のメタ分析では，異質な文献間の比較が困難である。
- オントロジーを用いてLLMによる文献分析を支援し，仮説空間の定量化を目指す。
- ローカルLLMによるスコアリングで，仮説に対する研究間の合意度を評価した。
- ローカル奇偶性文脈では仮説空間の温度が低く，グローバル奇偶性文脈では高かった。
- このフレームワークは，従来のメタ分析では困難な文献間の仮説マッピングを可能にする。
Link: https://arxiv.org/abs/2606.05206
Transformerによる強化学習：通信ネットワークにおける基礎と応用 [eess.SP, cs.LG]目的：通信ネットワークにおけるTransformer強化強化学習アルゴリズムとその応用に関する包括的な調査
- 通信ネットワークは社会基盤であり，効率的な運用・管理が重要である。そのため，高度な制御技術が求められている。
- 従来の強化学習は，試行錯誤に多くの時間を要し，長期的な依存関係や部分観測への対応が困難であった。
- Transformerの自己注意機構により，これらの課題を克服し，通信ネットワークの最適化を目指す。
- Transformerモデルは，従来の強化学習における試行錯誤の回数を減らし，学習の高速化に貢献する。
- 自己注意機構により，長期的な依存関係やグローバルな相関を効率的にモデル化することが可能となる。
- 本研究は，リソース配分，オフローディング，ルーティング，軌跡制御，ネットワークセキュリティなど，様々な応用分野でのTransformer強化強化学習の可能性を示す。
Link: https://arxiv.org/abs/2606.05208
スコアハミルトニアン：拡散モデルと断熱輸送のマッピング [math-ph, cs.AI, cs.LG, math.MP, physics.data-an]目的：スコアベース拡散モデルのサンプリングと，スコアハミルトニアンに対する基底状態の断熱輸送の間の厳密な対応関係
- 拡散モデルは生成モデリングにおいて重要な役割を果たしており，高次元データの生成能力が注目されている。
- 拡散モデルのサンプリング効率は，スコア関数の精度や計算コストに依存し，改善の余地がある。
- スコアハミルトニアンを用いることで，サンプリングの限界を理論的に解析し，効率的なサンプリング手法を開発すること。
- スコアベース拡散モデルのサンプリングは，スコアハミルトニアンを用いた断熱輸送と厳密に対応することが示された。
- 福カー・プランク方程式に対する断熱定理を通じて，新たな密度再構成の境界と原理的なアニーリングスケジュールが得られた。
- サンプリングの根本的な限界は，スコアマッチング誤差の二乗とスコアハミルトニアンのスペクトルギャップの比によって決定されることが明らかになった。
Link: https://arxiv.org/abs/2606.05217
溶出の言語：非標的LC-HRMS脂質オミクスにおける次なる特徴の自己回帰的予測 [q-bio.QM, cs.LG]目的：非標的LC-HRMS脂質オミクスにおける次なる特徴の予測
- 脂質オミクス研究は，疾患のメカニズム解明やバイオマーカー探索に不可欠である。
- 得られる膨大な分子特徴のうち，構造アノテーションが可能なものはごく一部に過ぎない。
- 溶出順序の予測を通じて，アノテーションの網羅性を向上させることを目指す。
- LSTMモデルは98.4%のトップ1精度を達成し，溶出順序は高い予測可能性を示すことが示された。
- 予測の大部分は分子特性ではなく，溶出シーケンスのパターンに起因することが明らかになった。
- 異なる機器間では高い転移性が見られたが，カラムや極性モードの変更により精度は低下し，キャリブレーションの必要性が示唆された。
Link: https://arxiv.org/abs/2606.05225
健常時および疾患における赤血球形状異常細胞の生体物理学的特性の定量化 [q-bio.CB, cs.LG, math-ph, math.MP, q-bio.BM]目的：赤血球形状異常症における赤血球の生体物理学的特性の定量的な把握
- 赤血球の形状と機能は，血液の流動性や酸素輸送に重要であり，その異常は様々な疾患の原因となる。
- 既存の評価法では，赤血球の弾性率，曲げ剛性，表面積/体積比，細胞質粘度といった複数の特性を同時に評価することが困難である。
- 赤血球形状異常症における，脾臓摘出手術の効果のパラドックスを解明し，術前リスク層別化への応用を目指す。
- 赤血球形状異常細胞の形状変化に伴い，微小流路通過性や血液粘度が大きく変化することが示された。
- 過水和型赤血球形状異常細胞は，健常な赤血球よりも微小流路通過に必要な圧力が大幅に高くなることが明らかになった。
- 脱水型赤血球形状異常細胞は，微小流路を容易に通過する一方で，全血の低せん断粘度を高めることが確認された。
Link: https://arxiv.org/abs/2606.05227
中心記述長（CDL）クラスタリング検証指標 [stat.ML, cs.LG, eess.SP]目的：クラスタリングの妥当性評価
- 教師なし学習は，センサー，画像，プロセスデータ等の解析に不可欠。適切なクラスタリング手法の選択が重要。
- 従来の指標は，コンパクトで凸なクラスタを好む傾向があり，非凸，不規則，可変密度データに弱い。
- CDLは，真のクラスタ中心の記述長の上界を確率的に評価し，より正確な評価を目指す。
- CDLは，観測可能なデータ，分割，推定中心，共分散行列のみを用いて計算可能である。
- 非凸・任意形状クラスタの合成ベンチマークで，CDLは従来指標より高いARIを達成した。
- 画像ベンチマークでも，K-means，DBSCAN，スペクトルクラスタリングで適切なクラスタ数を返した。
Link: https://arxiv.org/abs/2606.05230