arXiv雑要約

AI - 2026/06/19 公開

  • FlowMaps:フローマッチングによる長期的なマルチモーダルオブジェクトダイナミクスのモデリング [cs.RO, cs.AI]目的:3D空間における動的オブジェクトの将来の位置のマルチモーダル分布推定
    • 家庭環境で活動するロボットには,空間の理解と時間経過に伴う変化の把握が不可欠である。
    • オブジェクトの位置は人間との相互作用により変化するため,ロボットは過去のオブジェクトとの関連付けが困難である。
    • 人間特有の習慣やルーチンを学習し,オブジェクトの動的変化を予測することで,ロボットのナビゲーションを改善する。
    • FlowMapsは,連続的な3D空間におけるオブジェクトの将来の位置のマルチモーダル分布を推定する潜在フローマッチングモデルである。
    • 過去の人間との相互作用に基づいてオブジェクトの位置の変化を予測し,類似したオブジェクトルーチンを持つ未知の環境への汎化を可能にする。
    • シミュレーションと実環境の両方で,動的オブジェクトナビゲーションタスクにおいて,最先端のアプローチよりも優れた性能を示した。

    Link: https://arxiv.org/abs/2606.20209

  • 深層強化学習によるゲームAIの拡張 [cs.AI]目的:ゲームAIにおける深層強化学習の応用可能性
    • ゲームの没入感向上には,グラフィックだけでなくAIの質が重要である。
    • 手動コーディングによる複雑なAI行動の実現には限界がある。
    • ゲームAIへの強化学習の導入を促進するための課題解決。
    • 本研究では,ゲームAIに適した強化学習モデルの訓練フレームワークを提案した。
    • 強化学習を組み込んだゲームの事例を紹介し,実用的な導入方法を検討した。
    • ゲームAIにおける機械学習の普及を加速させるための研究方向性を示唆した。

    Link: https://arxiv.org/abs/2606.20210

  • 学習者に基づいた概念ドリフト検出:分析と評価 [cs.LG, cs.AI]目的:概念ドリフト検出に関する分析と評価
    • 機械学習は実世界で広く利用されており,常に変化するデータへの対応が不可欠である。
    • データ分布の変化(概念ドリフト)は予測精度を低下させ,機械学習システムの信頼性を損なう。
    • 様々な概念ドリフト検出手法の特性を理解し,実用的な適用可能性を明らかにすること。
    • 理論的な分析により,概念ドリフトの特性と検出アルゴリズムの分類を明確にした。
    • 合成データと実データを用いた評価により,各アルゴリズムの性能と適応性を比較した。
    • 急激な変化や緩やかな変化など,多様なドリフトシナリオにおける検出能力を検証した。

    Link: https://arxiv.org/abs/2606.20216

  • QMFOL:定量的単項一階述語論理テストケース生成による大規模言語モデルの推論能力ベンチマーク [cs.CL, cs.AI, cs.SE]目的:大規模言語モデルの推論能力を評価するためのベンチマーク
    • 高ステークスな意思決定において,推論能力は不可欠であり,その評価手法の確立が重要である。
    • 既存のベンチマークは論理的複雑さの制御が難しく,意味的多様性と論理的一貫性のバランスが課題である。
    • 論理的複雑さを定量的に制御できるベンチマークを構築し,言語モデルの推論能力をより正確に評価すること。
    • QMFOLは,論理的構造を自動生成し,自然言語に翻訳するフレームワークであり,論理的一貫性を保証する。
    • QMFOLBenchは,多様な論理的・意味的次元を持つ2880件のインスタンスで構成されるベンチマークである。
    • 論理的複雑性の増加に伴い,モデルの性能が低下し,計算コストが増加することが示された。

    Link: https://arxiv.org/abs/2606.20227

  • 知性の熱力学的尺度 [cs.AI, cond-mat.stat-mech, cs.IT, math-ph, math.IT, math.MP, nlin.AO]目的:稀有だが有効な未来の法則的な増幅
    • 知性の定量化は,AI研究や認知科学において重要な課題である。普遍的な知性の定義が求められている。
    • 従来の知能評価は,特定のタスクに依存し,汎用性や本質的な知性を捉えきれていない。
    • 法則的な増幅という熱力学的な尺度を用いて,知性を普遍的に測定可能なものとすることを目指す。
    • 知性は,受動的なダイナミクス下では起こりにくいが,ドメインの制約下では許容される結果の確率を高めるものと定義される。
    • 内部シミュレーションによる稀有だが有効な未来の識別精度が高い場合,達成可能な増幅は,駆動に制限される最適値に近づく。
    • 再帰的な自己シミュレーションは,知性の単なる特徴ではなく,高熱力学的な知性にとって必要かつほぼ十分な条件となる。

    Link: https://arxiv.org/abs/2606.20231

  • ScholarQuest:オープン文献環境における能動的な学術論文検索のための分類に基づいたベンチマーク [cs.IR, cs.AI]目的:学術論文検索のベンチマーク
    • 科学研究において学術論文検索は不可欠であり,その効率化は研究活動の加速に繋がる。
    • 既存のベンチマークは,現実的な環境下での能動的な学術検索を体系的に評価するには不十分である。
    • オープン文献環境下における能動的な学術論文検索の評価を可能にするベンチマークを構築し,性能向上を目指す。
    • ScholarQuestは,1000以上のコンピュータサイエンスのトピックと4つの代表的な研究意図に基づいて構築された大規模ベンチマークである。
    • 能動的な検索手法は,単発検索のベースラインよりも優れていることが示された。
    • 最良の能動的検索手法でもRecall@100は0.314,Recall@Allは0.355であり,改善の余地が大きいことが示唆された。

    Link: https://arxiv.org/abs/2606.20235

  • 多目的制約付き最適化のためのマルチエージェントシステム [cs.AI, cs.LG, cs.MA]目的:多目的制約付き最適化問題に対する解決策
    • 計算機やネットワークシステムにおける意思決定問題は,コスト最小化と性能制約として自然に定式化される。
    • 重み付けペナルティ項を用いた強化学習では,適切な重みの選択が難しく,トレードオフの特定が困難である。
    • 報酬重みの選択を学習問題として定式化し,より自律的でロバストな強化学習ソリューションを目指す。
    • 本研究では,マルチエージェント強化学習を用いて報酬重みの調整を自動化するMAMOを提案した。
    • MAMOは,タスク実行と目的設計を分離することで,動的な環境下での最適化と制約違反のバランスを改善する。
    • 実験結果から,MAMOが手動調整と比較して,より効率的に制約を満たしつつ目的関数を最適化できることが示唆された。

    Link: https://arxiv.org/abs/2606.20236

  • SPOT-E:凍結済みVLMに対する視覚的スポットライトを用いたテスト時エントロピー整形 [cs.CV, cs.AI]目的:視覚的証拠に焦点を当てるテスト時エントロピー整形手法
    • 大規模言語モデルと画像認識の融合が進み,画像とテキストを組み合わせた推論が重要になっている。
    • VLMは,決定的な視覚的証拠が局所的で見落としやすく,証拠の読み取りに失敗することがある。
    • エントロピー整形により,不確実性を低減しつつ,モデルの信頼性を維持することを目指す。
    • SPOT-Eは,質問に応じて視覚的スポットライトを生成し,推論時のエントロピーを最適化する。
    • 様々なベンチマークとVLMファミリーで,SPOT-Eは一貫した性能向上とロバスト性の向上を示す。
    • 軽量なチューニングにより,インスタンスごとにスポットライトを最適化する。

    Link: https://arxiv.org/abs/2606.20244

  • LLMにおける知識の信頼性に応じた矛盾解決:パラメトリック知識と文脈知識の統合 [cs.AI]目的:大規模言語モデルにおける知識の矛盾解決の枠組み
    • 言語モデルは膨大な知識と文脈学習能力を持つが,知識の矛盾は性能低下の要因となる。
    • 従来の矛盾解決法は,知識源の信頼性を仮定しており,両者に誤りが含まれる場合に有効でない。
    • モデルと文脈知識の信頼性を評価し,矛盾を能動的に解決する手法を開発する。
    • 提案手法MACRは,知識の信頼度評価と多エージェント推論により,矛盾を明示的に解決する。
    • MACRは,モデル内部知識と外部知識の信頼度に応じて,知識の外部化または検索を行う。
    • 実験結果から,MACRは既存手法を上回り,矛盾解決の根拠を明確に示すことが示された。

    Link: https://arxiv.org/abs/2606.20245

  • ビジョン-言語-行動モデルのファインチューニングには,予想以上に少ない層で十分である [cs.RO, cs.AI]目的:ビジョン-言語-行動モデルの層削減による効率化
    • ロボット制御において,大規模なデータセットで事前学習されたVLAモデルは性能向上に不可欠である。
    • VLAモデルはパラメータ数が多く,ファインチューニングやリアルタイム推論に莫大な計算コストがかかるという課題がある。
    • 本研究は,VLAモデルの層構造に着目し,冗長な層を削減することで計算コストを削減し,効率的なロボット学習を目指す。
    • VLAモデルは多様な物理的軌跡で学習されるものの,層間の表現に高い冗長性が見られることが明らかになった。
    • 学習を必要としない構造圧縮パイプラインにより,モデルの深さを最大50%削減することに成功した。
    • 削減されたモデルでファインチューニングを行った結果,学習時間とリアルタイム推論時間をそれぞれ40-50%,最大30%短縮しつつ,ベースモデルと同等以上の性能を達成した。

    Link: https://arxiv.org/abs/2606.20246

  • レジスターの乖離:ナイジェリアの公共 discourse 向け意味知能フレームワーク [cs.CL, cs.AI]目的:ナイジェリアの公共 discourse における意味知能の評価と分析
    • ナイジェリアにおける言語的多様性は大きく,効果的なコミュニケーションには文脈理解が不可欠である。
    • 既存の感情分析モデルは,ナイジェリアの discourse における文脈的ニュアンスを捉えきれていない。
    • 本研究は,文脈を考慮した意味知能フレームワークを通じて,AIシステムの精度向上を目指す。
    • 意味知能フレームワーク (MIF) は,表面的な感情だけでなく,真の意図を評価するための九次元の枠組みである。
    • MIFスキーマを用いたプロンプトは,レジスター分類の精度を33.3%から73.3%に向上させた。
    • 意味知能スコアは,スキーマ提示により5.4ポイント向上し,特にレジスター認識,暗号的サブテキスト検出,戦略的行動推奨で大きな改善が見られた。

    Link: https://arxiv.org/abs/2606.20255

  • エディトリアルアライメント:LLMによる知識伝達における編集専門知識の活用に向けた参加型アプローチ [cs.HC, cs.AI]目的:LLMによる知識伝達における編集専門知識の活用
    • 公共知識機関は,社会における知識の信頼性と質の維持に不可欠である。
    • LLMの普及により,編集機能が脅かされ,商業開発者の価値観が優先される可能性がある。
    • LLMインターフェースを編集基準に適合させ,編集者の主体性を確立することを目指す。
    • 編集アライメントを参加型AIにおける設計実践として確立した。
    • 編集基準を技術実装のための整合性目標に変換する設計成果物と位置づけた。
    • LLMによる知識伝達における編集者の継続的な参加と主体性を促進する可能性を示唆した。

    Link: https://arxiv.org/abs/2606.20258

  • 学生が描いた科学モデルの信頼度を考慮した自動評価 [cs.AI]目的:学生が描いた科学モデルの自動評価手法
    • 次世代科学教育基準(NGSS)では,モデリングに基づいたタスクが重視され,生徒の理解度評価に図が活用されている。
    • 図の評価には専門家の判断が必要であり,大規模な評価の実施や維持にコストがかかるという課題がある。
    • 信頼度を考慮した自動評価により,高信頼度の回答を自動化し,不確実なものを専門家によるレビューに回すことで,効率化を図る。
    • 提案手法は,Vision Transformer(ViT)を用いて生徒の科学図を評価し,予測分布から信頼度を算出する。
    • 信頼度に基づき,自動評価と人間によるレビューを組み合わせることで,評価の信頼性と効率性を両立している。
    • 中学生のNGSS準拠問題6件の実験結果から,本手法が評価の信頼性を向上させ,自動化率とリスクのトレードオフを可能にすることが示された。

    Link: https://arxiv.org/abs/2606.20264

  • Lagrange:オープンボキャブラリ,エネルギーベースの疎な汎用エンドツーエンド運転フレームワーク [cs.AI]目的:複雑なオープンワールド環境におけるエンドツーエンド自動運転のスケーラビリティ向上
    • 自動運転は,人手を介さずに移動を実現する基盤技術であり,社会に大きな変革をもたらすと期待されている。
    • 既存の手法は,表現効率と汎化性能のトレードオフに悩んでおり,未知の状況への対応が課題となっている。
    • 本研究は,オープンボキャブラリと疎な表現に基づき,ロバストかつ解釈可能な自動運転を実現することを目指す。
    • Lagrangeは,マスクされた潜在場(MLF)に基づいており,Vision-Language Models(VLM)を用いて視覚情報を連続的なセマンティックトークンに変換する。
    • 意図駆動型のマスクされたクロスアテンションモジュールにより,無関係な情報をフィルタリングし,エネルギー場を生成することで,車両の運動学に厳密に準拠した衝突回避を実現する。
    • nuScenesおよびCODAベンチマークにおける評価により,Lagrangeが堅牢で解釈可能,かつ運動学的に実行可能な自律運転のための有望なフレームワークであることが示された。

    Link: https://arxiv.org/abs/2606.20274

  • ELVA:ランキング駆動型汎用マルチモーダル検索の探求 [cs.IR, cs.AI]目的:マルチモーダル大規模言語モデルを用いたランキング駆動型学習による,汎用マルチモーダル検索における粒度盲目の軽減
    • マルチモーダル検索は,画像とテキストを統合して情報検索を行うため,多様な応用が期待されている。
    • 従来の対照学習では,クエリに含まれる細かな情報を無視し,検索精度が低下する「粒度盲目」という問題が存在する。
    • 本研究では,負例の類似度に応じた異なる扱いにより,モデルが粒度レベルの情報を効果的に学習することを目指す。
    • 提案手法ELVAは,ランキング駆動型強化学習フレームワークを通じて,粒度盲目の軽減を実現した。
    • ELVAは,明示的なランキングラベルを用いず,検証可能な報酬を用いてランキング挙動を探索する。
    • 新しいベンチマークMRBenchにおいて13.1%の改善が見られ,ELVAの有効性が実証された。

    Link: https://arxiv.org/abs/2606.20280

  • グラフ構造の解明のための適応的コントラスト学習による境界埋め込みの形成 [cs.LG, cs.AI]目的:グラフ構造の解明
    • グラフ構造データは複雑な関係性を表現可能であり,様々な分野で活用が期待されている。
    • ノード埋め込みにおいて,意味的に無関係な近傍ノードからの影響により,性能が低下する問題がある。
    • 境界領域における構造的ノイズを抑制し,識別能力を向上させることを目指す。
    • 本研究では,適応的コントラスト学習を用いた境界埋め込みの形成(BES)を提案し,ノード分類性能の向上を実現した。
    • BESは,特にクラス境界付近のノードにおいて,構造的ノイズを効果的に抑制し,識別境界を明確化する。
    • 実験の結果,BESはGCNのノード分類精度を平均3.3%向上させ,WikiCSでは最大5.0%の改善が見られた。

    Link: https://arxiv.org/abs/2606.20283

  • 国家森林調査,航空機搭載LiDAR,衛星画像を用いたコンピュータビジョンによる森林構造の全面マッピング [cs.RO, cs.CL, cs.LG, cs.CV]目的:森林構造の全面マッピング
    • 森林管理や山火事リスク管理において,広範囲なリモートセンシング技術の重要性が高まっている。
    • 既存のデータ収集は,目的や精度が異なる複数のデータソースを組み合わせるため,計画システムに混乱が生じる。
    • 管理に有用な森林属性を,年間を通して10m解像度で推定する一貫したフレームワークを提供する。
    • VibrantForestsフレームワークは,LiDARデータで学習された衛星ベースの森林構造モデルを用いて,森林属性を推定する。
    • このモデルは,疎林から密林まで,多様な森林条件に対応可能であり,既存のモデルよりも飽和範囲を拡大する。
    • 回帰平均化の抑制により,小規模/疎林における過大評価や,大規模/密林における過小評価といった問題を軽減する。

    Link: https://arxiv.org/abs/2606.20291

  • 汎用活性化関数に対するシフトに基づく最適化可能な線形緩和 [cs.LG, cs.LO]目的:活性化関数に対する最適化可能な線形緩和手法
    • 近年,ニューラルネットワークの利用が拡大しており,安全性・セキュリティが求められる分野でも活用が進んでいる。
    • 既存の検証手法は,活性化関数ごとに手動で緩和関数を設計する必要があり,最新の関数への対応に労力がかかる。
    • 本研究は,リプシッツ定数または臨界点のみを用いて,幅広い活性化関数に対応可能な緩和手法を提案する。
    • 提案手法SLiRは,入力領域において健全な上限と下限を保証するシフト手順により,効率的な最適化を可能にする。
    • 実験の結果,SLiRは様々な実用的な活性化関数に対して,既存手法よりも最大7.8倍多くのプロパティ検証を可能にすることが示された。
    • SLiRは,既存手法と比較して,よりタイトな緩和関数を生成することが確認された。

    Link: https://arxiv.org/abs/2606.20292

  • システムの非線形性を活用した,インテリジェント故障診断システム設計におけるデータ不足への対処 [cs.DB, cs.RO, cs.AI]目的:インテリジェント故障診断システムの設計におけるデータ不足の解決
    • 機械システムの信頼性確保は重要であり,故障診断技術はその鍵となる。
    • 故障データの収集は困難であり,特に異常事例のデータ不足が課題である。
    • システムの非線形性を利用し,少ないデータで高精度な故障診断を目指す。
    • 提案手法では,周期的な多励振レベル手順を用いて,故障診断に適した画像を生成する。
    • 生成された画像は,事前学習済みのCNNによって解析され,効率的な故障診断を実現する。
    • 鉄道架線構造での実験により,提案手法の有効性が確認された。

    Link: https://arxiv.org/abs/2606.20323

  • 強化学習環境ファミリ開発のためのモデル駆動アプローチ [cs.SE, cs.LG]目的:強化学習環境ファミリの自動生成手法
    • 現実世界での学習はコストと危険を伴うため,仮想環境での学習が重要である。
    • 環境ファミリの手動開発は,労力がかかり,エラーが発生しやすく,拡張性に乏しい。
    • モデル駆動アプローチにより,環境ファミリの効率的かつ自動的な生成を目指す。
    • 本研究では,遺伝的アルゴリズムとモデル変換エンジンを組み合わせた環境ファミリ生成手法を提案した。
    • 提案手法は,モデル変換を介して環境の変異と制約を表現し,環境ファミリを生成する。
    • 山火事対策シミュレーションとカリキュラム学習において,本手法の有効性を実証した。

    Link: https://arxiv.org/abs/2606.20324

  • 再帰型ニューラルネットワークによる連続関数の近似 [cs.LG, cs.SC, math.DS]目的:連続関数に対する近似精度向上策
    • 機械学習における関数近似は,様々な応用分野で重要な役割を担う。
    • 従来のニューラルネットワークは,精度向上に伴いネットワークの再構築が必要となる。
    • 固定されたネットワークで,計算時間の増加によって精度を向上させる手法を確立する。
    • 任意の連続関数は,固定された重みと隠れ層次元を持つReLU再帰型ニューラルネットワークの時間発展によって一様近似可能である。
    • この構成の根底には,チューリングマシンとニューラルユニットを組み合わせた新しい中間モデル(TMNU)が存在する。
    • 固定ネットワーク近似パラダイムにおける計算時間の重要性を示すミニマックス下界も確立された。

    Link: https://arxiv.org/abs/2606.20325

  • 偏微分方程式のための量子古典物理情報に基づいたコルモゴロフ・アルノルドネットワーク [cs.LG, physics.comp-ph]目的:偏微分方程式の解法のための量子古典物理情報に基づいたコルモゴロフ・アルノルドネットワーク
    • 物理現象のシミュレーションは,科学技術の発展に不可欠である。
    • 従来の数値解法は,高精度な計算に大きな計算コストを要する。
    • 量子計算と古典計算を組み合わせることで,計算効率の向上を目指す。
    • 本研究で開発されたQCPIKANは,既存の量子古典ネットワークと比較して,予測精度,局所誤差制御,動的進化追跡において優れた性能を示す。
    • 理論的解析により,本設計が高周波誤差収束を指数関数的に加速し,数値分散を効果的に軽減することが示された。
    • 多孔質媒体における単相流,成分輸送,二相流の3つの浸透シナリオで有効性が検証された。

    Link: https://arxiv.org/abs/2606.20326

  • 土壌システムにおける微生物動態と有機物分解の予測に向けた制約付きハイブリッドモデリング [cs.LG, physics.geo-ph]目的:土壌における微生物動態と有機物分解の予測
    • 土壌微生物は有機物循環を制御し,気候変動への対応能力を左右する。予測精度向上は喫緊の課題である。
    • ゲノムデータ統合は有望だが,ゲノムと微生物機能の複雑な関係性のモデル化が困難である。
    • メタゲノム情報に基づき,生態学的制約を組み込んだハイブリッドモデリングによる予測を目指す。
    • 本研究で開発したハイブリッドモデリングフレームワークは,DNAシーケンスデータからバイオキネティックパラメータを導出する。
    • 合成データと実データを用いた評価の結果,既存手法と比較して性能が向上し,観測不能な要素の動態も効果的に学習できることが示された。
    • 小規模な学習データセットでも,現実的な振る舞いを保証するために生態学的理論や文献からの制約を組み込んだ。

    Link: https://arxiv.org/abs/2606.20329

  • SoftSkill:文脈適応のための行動圧縮 [cs.AI]目的:文脈適応のための行動圧縮手法
    • 大規模言語モデルの活用において,タスク遂行能力の向上が不可欠である。
    • 既存手法では,自然言語で記述されたスキルを解釈する必要があり,計算コストが高い。
    • 言語モデルの能力を維持しつつ,効率的なスキル表現を学習することを目指す。
    • SoftSkillは,凍結された言語モデルに短い仮想トークン列(長さ32)を追加することで,スキルを導入する。
    • SearchQA,LiveMath,DocVQAの各タスクにおいて,既存手法(SkillOptなど)を上回る精度を達成した。
    • 数百から数千のMarkdownスキル用トークンを,少数の仮想トークンに置き換えることで,計算効率を改善した。

    Link: https://arxiv.org/abs/2606.20333

  • 解釈可能性のための合成データモデルとしての臨界パーコレーション [cs.RO, cs.LG, cond-mat.dis-nn]目的:解釈可能性評価用の合成データセット
    • ニューラルネットワークは自然データの構造を学習する。その解釈は重要である。
    • 既存の合成データセットは自然データの構造を欠き,評価の限界がある。
    • 自然データ構造を持つ合成データセットを提供し,解釈可能性研究を支援する。
    • 臨界平均場パーコレーションクラスターを用いた階層関数からなる合成データセットを提案した。
    • 提案データは疎なフラクタルクラスターを持ち,潜在変数で階層構造をモデル化している。
    • ニューラルネットワークの活性化から潜在変数を線形的に復号できることを実証した。

    Link: https://arxiv.org/abs/2606.20347

  • 時間差学習の分散とその制御変量を用いた低減について [cs.LG]目的:時間差学習の分散とその低減手法に関する研究
    • 強化学習において,効率的な学習は重要な課題である。分散の大きい学習は,学習時間の増加を招くため。
    • 時間差学習は分散が大きく,安定した学習が難しい場合がある。特にサンプル効率が課題となる。
    • 制御変量を用いることで,時間差学習の分散を低減し,より効率的な学習を可能にすることを目指す。
    • 時間差学習は,多数の独立した軌跡を集約することで分散を低減する効果があることが示された。
    • 時間差学習の分散は,モンテカルロ推定量の分散の上限に漸近的に一致することが理論的に証明された。
    • Direct Advantage Estimation (DAE)は,時間差学習よりも分散の上限をより厳密に抑えることが示された。

    Link: https://arxiv.org/abs/2606.20357

  • 訓練,検索,または両方か?オンタリオ州居住用賃貸法における正確な法令引用のための四者対決 [cs.LG]目的:オンタリオ州居住用賃貸法(2006年)に関する正確な法令引用の性能評価
    • 法的問題に直面した人々が正しい法令を参照する必要があるため,正確な引用は重要である。
    • 大規模言語モデルは誤った情報を生成する可能性があり,正確な引用が困難である。
    • ファインチューニングと検索の組み合わせが,正確な法令引用に有効か検証する。
    • ベースモデルやファインチューニング単体では正確な引用が難しく,検索が不可欠であることが示された。
    • ファインチューニングと検索のハイブリッド手法が最高の性能(正解率0.481)を示し,幻覚をゼロに抑えた。
    • 大規模な検索モデルや追加データは性能向上に寄与せず,低コストなハイブリッド手法でも十分な結果が得られることが分かった。

    Link: https://arxiv.org/abs/2606.20359

  • 対話軌跡マイニングによるSKILL.md自動生成 [eess.SY, cs.SY, cs.AI]目的:コンピュータ利用エージェントのためのスキルライブラリのマイニング
    • エージェントの行動理解やデバッグには,明示的なスキルライブラリが不可欠である。
    • 既存手法では,対話データから有用なスキルライブラリを自動的に抽出することが困難である。
    • 対話軌跡マイニングを用いて,検査可能なスキル構造を抽出し,汎化性能の向上を目指す。
    • GUI操作の軌跡をセグメント化し,類似度に基づいてスキル候補をクラスタリングすることに成功した。
    • 抽出されたスキルクラスタの多くは,既存のInteraSkill Workflowsラベルに対して高い純度を示した。
    • しかし,抽出されたスキルは必ずしも下流タスクの性能向上には繋がらず,課題が残る。

    Link: https://arxiv.org/abs/2606.20363

  • 改善のための判断:単一画像3D生成のためのVLMを3D判断器として利用する偏りのないプロトコル [cs.LG]目的:単一画像から3Dモデルを生成する際の品質評価と最適化
    • 3D生成の分野は,現実世界の再現や新たなコンテンツ制作に不可欠であり,その重要性は増している。
    • 既存の評価手法では,高品質な3Dモデルを自動的に評価することが難しく,人手による評価に頼る部分が多い。
    • VLM (Vision-Language Model) を活用し,安価かつラベルなしで3D生成モデルを改善することを目指す。
    • 提案手法では,学習用と評価用のVLMを分離し,評価の循環性を回避するとともに,VLMの判断における偏りを修正した。
    • 実験の結果,提案手法はベースラインモデルと同程度の性能に達したものの,それを上回るためには,より大規模な学習やデータが必要であることが示唆された。
    • このプロトコルは,高品質な3Dモデルを評価するための汎用的なツールとして活用できる可能性があり,今後の研究に貢献すると考えられる。

    Link: https://arxiv.org/abs/2606.20364

  • AutoPass:コンパイラ性能調整のための証拠に基づくLLMエージェント [cs.RO, cs.MA, cs.CL, cs.SE, cs.AI]目的:コンパイラ性能調整のためのLLMエージェントフレームワーク
    • 現代のプロセッサは複雑であり,性能を最大限に引き出すには高度なコンパイラ最適化が不可欠である。
    • 従来の自動調整手法は,コンパイラの内部構造を考慮せず,性能改善が限定的である。
    • LLMを活用し,コンパイラの内部状態を分析することで,より効果的な性能調整を実現する。
    • AutoPassは,コンパイラと実行時の証拠を用いてLLMによる最適化決定を導くマルチエージェントフレームワークである。
    • x86-64およびARM64システムにおいて,LLVM -O3と比較してそれぞれ1.043倍,1.117倍の幾何平均スピードアップを達成した。
    • AutoPassは学習を必要とせず,新しいベンチマークやプラットフォームへの適用が容易である。

    Link: https://arxiv.org/abs/2606.20373

  • CRAX:高速安全強化学習ベンチマーク [cs.DC, cs.HC, cs.CY, cs.LG, cs.AI]目的:強化学習の安全性評価におけるベンチマーク
    • ロボティクスや自動運転など,実世界への応用において安全性は不可欠である。
    • 既存の安全性ベンチマークは計算速度が遅く,大規模な実験や迅速なプロトタイピングの妨げとなっている。
    • 計算速度の向上により,安全性評価の効率化と,より迅速なアルゴリズム開発を目指す。
    • CRAXは,MuJoCo XLAエンジンを活用し,最大100倍の高速化を実現した。
    • 6つの環境と3つのタスクで評価した結果,単一の手法が全てのタスクで優位性を示すことはなかった。
    • 難易度に応じたカリキュラム学習や安全性転移が,より困難な設定での性能向上に貢献することが示された。

    Link: https://arxiv.org/abs/2606.20376

  • LLM FP4事前学習における収縮バイアスの再考:幾何学的起源,体系的影響,およびUFP4レシピ [cs.AI]目的:LLMのFP4事前学習における収縮バイアスの原因解明と,それに対処するUFP4レシピの提案
    • LLMの学習には膨大な計算資源が必要であり,メモリと計算コストの削減が重要課題となっている。
    • 既存のFP4ハードウェアとレシピはE2M1データ要素に偏っており,学習の不安定性や性能劣化を引き起こす可能性がある。
    • E2M1形式に内在する収縮バイアスを特定し,より安定した学習を可能にするUFP4レシピを開発すること。
    • E2M1のような非一様形式は,幾何学的非対称性から収縮バイアスを生じさせ,層を重ねるごとに誤差が累積することが示された。
    • 提案するUFP4レシピは,E1M2/INT4のような一様グリッドを用いることで,収縮バイアスを回避し,量子化品質を向上させる。
    • Dense 1.5B,MoE 7.9B,MoE 124Bの事前学習において,UFP4は既存のE2M1ベースラインよりも低い損失劣化を実現した。

    Link: https://arxiv.org/abs/2606.20381

  • モダリティ不均衡な連合グラフ学習に向けたデータ合成に基づくアプローチ [cs.LG]目的:モダリティ不均衡な連合グラフ学習における潜在的意味表現の合成
    • グラフ構造データは現実世界の複雑な関係性を表現可能であり,様々な応用分野で重要性が増している。
    • 連合学習では,クライアント間でデータ分布の偏りが生じやすく,特にモダリティ欠損による不均衡は課題となっている。
    • 欠損するモダリティの意味を補完し,各クライアントのデータ分布のずれを軽減することで学習精度を向上させる。
    • 提案手法FedMGSは,モダリティ欠損が局所的な構造伝播に悪影響を及ぼさないように,利用可能性を考慮したグラフエンコーダを導入した。
    • FedMGSは,クライアント間で利用できないモダリティの意味的アンカーを確立するため,プロトタイプ誘導型潜在的意味合成器を活用した。
    • 実験の結果,FedMGSは既存手法と比較して最大17.41%の性能向上を示し,効率と性能のバランスに優れていることが確認された。

    Link: https://arxiv.org/abs/2606.20382

  • DataMagic:表形式データをデータインサイト動画へ [cs.HC, cs.AI, cs.DB]目的:表形式データと自然言語クエリから,データインサイト動画を生成するインタラクティブシステム
    • データ量の増大に伴い,効率的なデータ理解が重要視されている。
    • 既存の可視化ツールはナラティブやアニメーションに乏しく,動画作成には専門知識が必要。
    • 生データから高品質なデータインサイト動画を自動生成し,データ理解を支援する。
    • DataMagicは,データと視覚要素を紐付けるDVSpecを導入し,データの忠実性を保証する。
    • マルチエージェントアーキテクチャにより,候補シーンを生成し,ナラティブの一貫性を最適化する。
    • DVSpecにより,ロジックとレンダリングを分離し,インタラクティブなデータ探索を可能にする。

    Link: https://arxiv.org/abs/2606.20388

  • アノテーション不要合成データ生成におけるスタイル多様性の重要性 [cs.RO, math.OC, cs.CC, cs.LG]目的:意図分類のための合成データ生成手法
    • 産業界では,迅速な対応が求められ,アノテーション付きデータ収集が困難な場合が多い。
    • 既存の手法は,多くの場合,アノテーション付きの種データに依存しており,汎用性に欠ける。
    • 人間によるアノテーションなしで,多様かつ高品質な合成データを生成すること。
    • 本研究では,意図定義のみを用いて合成対話データを生成するフレームワークを提案した。
    • スタイル多様性は,トピック多様性よりも合成データの有用性に重要であることが示された。
    • 生成時のスタイル属性の組み込みが,後処理でのスタイル適応よりも効果的である。

    Link: https://arxiv.org/abs/2606.20400

  • LLMエージェントの安全性:多段階の敵対的テストと安全性が求められるシステム [cs.CR, cs.AI]目的:LLMエージェントをオペレーターとする安全性が求められるシステムの多段階敵対的テストのベンチマーク
    • LLMエージェントは安全性が求められるシステムでの利用が期待されるが,その安全性評価は不可欠である。
    • 持続的かつ適応的な敵対的圧力下でのLLMエージェントの堅牢性は十分に評価されていない。
    • 多段階の敵対的テストを通じて,LLMエージェントの脆弱性を明らかにし,安全性を向上させる。
    • シミュレーション環境において,4つのLLMオペレーターモデルを対象に敵対的テストを実施した結果,いずれのモデルも安全限界を超過する攻撃セッションが確認された。
    • 攻撃セッションにおける安全機能喪失率はモデル間で8.7%から12.1%であったが,失敗パターンはモデル間でほとんど重複しなかった。
    • 防御策の効果はモデルに依存し,あるモデルで有効な防御策が別のモデルでは逆効果となる場合もあった。

    Link: https://arxiv.org/abs/2606.20408

  • スケーラブルでサンプル効率の良い深層強化学習のための直接的アドバンテージ推定 [cs.MS, cs.LG]目的:深層強化学習アルゴリズムのサンプル効率向上
    • 強化学習は,複雑な問題を自律的に解決できる可能性を秘めているため重要である。
    • 従来の強化学習はサンプル効率が悪く,実用的な環境への適用が難しい場合がある。
    • 部分観測環境下でのサンプル効率を維持しつつ,計算コストを削減することを目指す。
    • 直接的アドバンテージ推定(DAE)の理論的枠組みを部分観測環境に拡張した。
    • 離散潜在ダイナミクスモデルを導入することで,DAEの計算複雑さを軽減した。
    • アケード学習環境での評価により,DAEが関数近似器の容量のスケーリングと高いサンプル効率を両立することが示された。

    Link: https://arxiv.org/abs/2606.20411

  • 擬似特徴量パディング:電力系統における不正データ注入攻撃に対する軽量防御 [cs.AR, cs.LG]目的:不正データ注入攻撃に対する電力系統におけるディープニューラルネットワークの堅牢性向上
    • 電力系統は社会基盤であり,安定稼働が不可欠である。サイバー攻撃からの防御が重要視されている。
    • ディープニューラルネットワークは攻撃に脆弱であり,特にサイバーフィジカルシステム特有の性質が課題となる。
    • 統計的分布に基づく擬似特徴量パディングにより,攻撃の計算コストを増加させ,DNNの堅牢性を高める。
    • 提案手法は,モデル構造を変更することなく,電力系統のステート推定において高い防御性能を発揮する。
    • 擬似特徴量パディングは,従来の防御策を回避する攻撃を効果的に軽減し,性能への影響は軽微である。
    • IEEEの様々な規模のバスシステムを用いた実験により,本手法の有効性が確認された。

    Link: https://arxiv.org/abs/2606.20415

  • 拡散モデルにおけるタイムステップ埋め込みの冗長性について [cs.LG, cs.CV]目的:拡散モデルにおけるタイムステップ埋め込みの必要性に関する検討
    • 拡散モデルは画像生成において高い性能を示すが,計算コストが大きい。
    • タイムステップ埋め込みはモデルの性能に不可欠と考えられてきたが,その役割は十分に解明されていない。
    • タイムステップ埋め込みがなくても高精度な生成が可能になる可能性を探る。
    • タイムステップ埋め込みを除去しても,U-NetやDiffusion Transformerの性能が大きく低下しないことが示された。
    • CelebAおよびCIFAR-10データセットにおいて,タイムステップ埋め込みを用いないモデルが,FIDなどの評価指標で条件付きモデルを上回る結果が得られた。
    • モデルは,入力画像から暗黙的にノイズレベルを推定できる可能性が示唆され,タイムステップ埋め込みの冗長性が明らかになった。

    Link: https://arxiv.org/abs/2606.20416

  • 偏微分方程式における逆問題に対する不確か量評価付きニューラルネットワーク代理モデル [cs.LG]目的:偏微分方程式における逆問題の効率的なベイズ推定
    • 科学技術計算において,逆問題は未知パラメータの推定に不可欠であり,様々な分野で応用が拡大している。
    • 従来の数値解法は計算コストが高く,特に高次元パラメータ空間でのベイズ推定は困難を伴う。
    • 不確か量評価を伴うニューラルネットワーク代理モデルを用いて,計算コストを削減し,信頼性の高い推定を実現する。
    • 提案手法DeepGaLAは,従来のガウス過程代理モデルと同等の精度で順問題近似を行い,高次元パラメータ空間においても効率性を維持する。
    • DeepGaLAは,非線形設定を含む微分方程式の制約を組み込むことが可能であり,汎用性の高いモデルである。
    • 遅延受容マルコフ連鎖モンテカルロ法による診断により,代理モデルによる事後分布近似の信頼性が確認された。

    Link: https://arxiv.org/abs/2606.20417

  • 疎性,重ね合わせ,忘却:継続学習における表現保持のメカニズム研究 [cs.RO, cs.RO, cs.RO, cs.LG]目的:継続学習における表現保持メカニズムの解明
    • 継続学習は,AIの柔軟性と適応性を高める上で不可欠な研究分野である。
    • 継続学習システムは,過去の知識を忘却しやすく,そのメカニズムの特定が困難である。
    • 制御された環境下で忘却メカニズムを可視化し,検証可能な仮説を構築すること。
    • 重ね合わせは時間とともに増加する傾向があり,タスク境界で一時的な低下が見られる。これは,安定的なドリフトではなく,境界特有の干渉を示唆する。
    • 特徴の疎性は重ね合わせを増加させるが,必ずしも忘却を引き起こすわけではない。表現が強ければ,重なりがあっても忘却を抑制できる。
    • 疎な状態ではタスクレベルの有効ランクが増加し,より広範な容量が使用されることが示された。これにより,重ね合わせと忘却の関係がより複雑になる。

    Link: https://arxiv.org/abs/2606.20431

  • LLMベースのマルウェア分類のためのマルチビュー逆コンパイル [cs.CR, cs.AI]目的:LLMを用いたマルウェア分類におけるマルチビュー逆コンパイルの有効性
    • マルウェア分析は情報セキュリティにおいて不可欠であり,迅速かつ正確な分類が求められる。
    • 単一の逆コンパイラ出力に依存する既存手法は,逆コンパイラの特性に左右されやすく,誤分類のリスクがある。
    • 複数の逆コンパイラ出力を活用することで,マルウェア分類の精度向上と誤検知の低減を目指す。
    • 複数の逆コンパイラ(GhidraとRetDec)からの出力をLLMに提供することで,マルウェアのF1スコアが向上した。
    • F1スコアの向上は主に,マルウェアの検出率(リコール)の増加によるものである。
    • GhidraとRetDecは異なる誤りを生じる傾向があり,出力が補完的な証拠となることが示唆された。

    Link: https://arxiv.org/abs/2606.20436

  • 注意誘導型深層学習による解釈可能な精子形態分類 [cs.AI]目的:精子形態の分類
    • 不妊症の主な原因は男性側であり,精子形態異常が重要視される。
    • 深層学習モデルは自動分析に役立つが,解釈性が低く臨床応用が難しい。
    • 精子頭部の重要領域に注目するモデルを開発し,精度と解釈性の向上を目指す。
    • 本研究では,注意機構を組み込んだ深層学習モデルがSMIDSおよびHuSHemデータセットで高い精度(90.2%および93.9%)を達成した。
    • SimpleCNNや標準的なEfficientNet-B0と比較して,マクロF1スコアも向上し,性能の優位性が示された。
    • Grad-CAM++による可視化により,モデルの判断根拠となる特徴が明確になり,透明性の高い分析が可能となった。

    Link: https://arxiv.org/abs/2606.20438

  • 物理情報ニューラルネットワークに対する二段階進化型ハイパーパラメータ最適化戦略 [cs.LG, cs.NA, cs.NE, math.NA]目的:物理情報ニューラルネットワークのハイパーパラメータ最適化
    • 物理現象のシミュレーションにおいて,ニューラルネットワークを活用する重要性が高まっている。
    • 物理情報ニューラルネットワークは,ハイパーパラメータに強く依存し,最適化が困難である。
    • 本研究は,進化アルゴリズムを用いて,効率的かつロバストなハイパーパラメータ最適化を実現する。
    • 提案手法では,まず低精度な学習を繰り返し候補を絞り込み,次により精度の高い学習を行う二段階アプローチを採用した。
    • Advection,Klein-Gordon,Helmholtz方程式の3つの問題で,提案手法は標準的な学習方法よりも優れた性能を発揮した。
    • 限られた計算資源内で,有意に低い平均誤差を達成し,解の精度とロバスト性を向上させた。

    Link: https://arxiv.org/abs/2606.20442

  • 高次元動的過程監視のためのトポロジーデータ解析 [eess.SY, cs.LG, cs.SY, math.AT]目的:高次元時系列データからの有用情報抽出
    • 製造プロセス等のリアルタイム監視は,品質管理や異常検知において不可欠である。
    • 高次元データの場合,データの構造を把握し,特徴を抽出することが困難である。
    • トポロジーデータ解析と機械学習を組み合わせ,動的過程の構造変化を捉える。
    • 提案手法は,多変量時系列データを多様体として表現し,トポロジー記述子を用いて構造を要約する。
    • ニューラル常微分方程式により,システムのトポロジー構造の時間変化を学習する。
    • 実プロセスデータを用いた実験により,本手法が多様なイベント検出に有効であることが示された。

    Link: https://arxiv.org/abs/2606.20443

  • IVFラボ環境条件の文脈を考慮した階層ベイズモデリング [cs.RO, cs.AI]目的:IVFラボ環境条件と妊娠率の関係性の解析
    • 生殖補助医療の成功率向上は重要な課題であり,その改善には様々な要因の分析が不可欠である。
    • 従来の分析では,患者情報に焦点を当てがちで,ラボ環境データの潜在的な影響が十分に考慮されていない。
    • ラボ環境データの詳細な分析とモデリングにより,妊娠率向上に貢献できる要因を特定すること。
    • 高解像度なラボ環境データから55の文脈を考慮した時間的特徴量を抽出し,予測誤差を1.27%に低減することに成功した。
    • 階層ベイズモデルを用いて,アジアと北欧のIVFクリニック間での環境効果の共有と,施設固有のベースラインの維持を実現した。
    • 北欧クリニックのデータでR2=0.86,35-39歳群で64%の誤差削減を達成し,環境モニタリングの臨床的意義を示した。

    Link: https://arxiv.org/abs/2606.20459

  • カバレッジ制約下におけるデータバイアス軽減と公平性の代償 [cs.LG, cs.CY, cs.DB]目的:データバイアス軽減策の開発
    • 機械学習の公平性は,倫理的観点から重要であり,差別や偏りのない社会実現に不可欠である。
    • 複数の属性の交差部分において,データ不足によるバイアスが発生しやすく,公平性を損なう可能性がある。
    • バイアスの軽減とデータ効率の向上を両立させ,現実的なデータ利用コストを考慮した手法を確立することを目指す。
    • 提案手法は,予測精度を維持しつつ,複数の分類器においてバイアス軽減の効果が確認された。
    • カバレッジ制約は,統計的考察に基づき,機械学習の性能維持に不可欠であることが示された。
    • 公平性の代償は,公平性の許容度に応じてデータ修正コストが変化することを示し,データガバナンスへの応用が期待される。

    Link: https://arxiv.org/abs/2606.20461

  • エージェントによる記号探索:手作り表現,メッシュ,ニューラルネットワークを超えて偏微分方程式を特徴づける [cs.CY, cs.SI, cs.LG, cs.NA, math.NA, physics.comp-ph]目的:偏微分方程式の解を特徴づける手法の開発
    • 偏微分方程式は自然現象を記述する基礎であり,科学技術の発展に不可欠である。
    • 従来の数値シミュレーションやニューラルネットワークは解の構造を直接提供せず,解釈が困難な場合がある。
    • この研究は,偏微分方程式の解を記号的に探索し,解釈可能な表現を得ることを目指す。
    • 提案手法ASYSは,偏微分方程式の理論と制約,過去の探索経験を基に,微分可能な記号プログラムを生成・進化させる。
    • 既知の解析解を持つ問題に対しては解析解を復元し,未知の問題に対しては解析的な近似解を構築する。
    • 実験結果から,ASYSはこれまで閉じた形の記述が存在しなかった問題に対しても解釈可能な表現を提供できることが示された。

    Link: https://arxiv.org/abs/2606.20467

  • フィッシャー幾何学的なシャープネスとSGDにおける平坦な最小値への暗黙的なバイアス [cs.LG, cs.CG]目的:平坦な最小値に対するSGDの暗黙的なバイアスに関する理論的根拠の確立
    • 深層学習において,汎化性能の指標として平坦な最小値が重要視されている。
    • 従来の平坦性の指標は,再パラメーター化に対して不変ではなく,理論的な矛盾が生じていた。
    • フィッシャー情報行列を用いた新たな平坦性指標を定義し,再パラメーター化不変性を保証する。
    • 本研究では,フィッシャー幾何学に基づいたシャープネス(SR)を定義し,それが再パラメーター化に対して不変であることを数学的に証明した。
    • ミニバッチSGDの勾配ノイズの共分散構造を形式化し,SRが真のFIMに依存することを示した。
    • MNISTとCIFAR-10での実験により,SRが汎化性能をより正確にトラッキングし,理論予測と一致することが確認された。

    Link: https://arxiv.org/abs/2606.20469

  • エージェント型AIシステムに対するモデル誘導型自動攻撃に対する防御的欺瞞の分析 [cs.CR, cs.AI]目的:エージェント型AIシステムに対するモデル誘導型自動攻撃における防御的欺瞞の効果
    • AIエージェントの能力向上に伴い,指示解釈やツール利用におけるセキュリティ重要性が増している。
    • プロンプトインジェクション攻撃が高度化し,自動化された攻撃によりその規模が拡大している。
    • 従来の防御策の限界を克服し,攻撃者の判断を誤らせる欺瞞戦略の有効性を検証する。
    • 従来の検知・遮断防御では,攻撃者がクエリ予算を増やすにつれて成功率が上昇する傾向がある。
    • 検知・欺瞞戦略は,攻撃者の選定候補の予測精度を低下させ,攻撃成功率の上限を抑える効果が示された。
    • 文脈的欺瞞による段階的関与(CMPE)は,攻撃成功率の上限を大幅に低減し,実証実験で攻撃成功をほぼ排除した。

    Link: https://arxiv.org/abs/2606.20470