arXiv雑要約

AI - 2026/06/18 公開

  • 関係データにおける異常検知への取り組み [cs.LG]目的:関係データの異常検出
    • 現実世界のシステムでは構造化データを管理するためにリレーショナルデータベースが広く利用されている。
    • 高次元かつ異質な多表属性により,わずかな異常な手がかりが通常の情報に埋もれてしまう点が課題である。
    • 属性と関係性の両面から異常を捉え,既存手法が苦手とする関係性に着目して異常を検出する。
    • 提案手法RelADは,属性と関係エッジの再構成に基づいて異常を捉えるフレームワークである。
    • RelADは,冗長な属性を抑制し,異常な意味ブロックを強調する条件付きスパースゲート属性再構成と,エンティティプロファイルから関係固有の異常な接続を検出するデュアルビュー多関係エッジ再構成の2つのモジュールから構成される。
    • 6つのベンチマークデータセットを用いた実験により,RelADが他のベースラインよりも一貫して優れた性能を発揮することが示された。

    Link: https://arxiv.org/abs/2606.18621

  • PACT:タスクベクトルにおけるアンカーコアを保存し,モデルを結合する [cs.CL, cs.RO, cs.LG]目的:モデル結合における性能向上
    • 多言語モデルの効率的な知識統合が,様々な応用で重要視されている。
    • 既存手法では,事前学習済みモデルの知識を十分に活用できていない場合がある。
    • 事前学習済みモデルに埋め込まれた重要な知識を保持しつつ,タスクを結合することを目指す。
    • 本研究では,タスクベクトルベースの手法が,事前学習済みモデルの知識を無視することが問題点であることを指摘した。
    • 提案手法PACTは,タスクベクトルの直交補空間を事前学習済みモデルの重み空間に整合させることで,アンカーコアを保存する。
    • 実験結果から,PACTは既存のモデル結合手法を改善し,最先端の性能を達成することが示された。

    Link: https://arxiv.org/abs/2606.18627

  • EffiNav:効率的な物体目標ナビゲーションのための深度と視覚言語の融合 [cs.RO, cs.RO, cs.RO, cs.MA, cs.RO, cs.AI]目的:効率的な物体目標ナビゲーションのための手法
    • 自律エージェントの基本的な能力であり,探索・救助やフィールドロボットなどへの応用が期待される。
    • 既存手法は,汎化性能や効率に課題があり,既訪問領域の過剰な探索や無駄な往復運動が発生する。
    • 未知環境における効率的な探索を可能にし,無駄な探索を抑制することを目指す。
    • EffiNavは,Habitat Matterport 3D (HM3D)とOpen-Vocabulary Object goal Navigation (OVON)の2つのベンチマークにおいて,既存手法と同等またはそれ以上の性能を示す。
    • 実世界のロボットによる検証においても,その有効性が確認された。効率性,頑健性,実用性の高さが示唆される。
    • GOAT-BENCHデータセットへの拡張により,標準的なObjNav設定を超えた適応性も実証された。

    Link: https://arxiv.org/abs/2606.18634

  • PEC-Home:スマートホームにおける漸進的な省略命令の解釈 [cs.CL, cs.AI]目的:スマートホームにおける漸進的な省略命令の解釈
    • 対話型AIの発展は,スマートホームの利便性向上に不可欠である。
    • 既存のAIアシスタントは,文脈の蓄積による人間の省略表現に対応できない。
    • 本研究は,省略命令における曖昧性を解消し,より自然な対話を可能とする。
    • 大規模言語モデルを用いた実験で,既存のアシスタントが省略命令の解釈に苦戦することが示された。
    • 対話履歴を活用しても,完全な命令文と同等の精度は達成できないことが明らかになった。
    • PEC-Homeデータセットは,スマートホームにおける省略命令の研究を促進する。

    Link: https://arxiv.org/abs/2606.18636

  • MetaboNet-Bench:1型糖尿病におけるグルコース予測のマルチモーダルベンチマーク [cs.LG, q-bio.QM]目的:1型糖尿病患者のグルコース予測のためのマルチモーダルベンチマーク
    • 1型糖尿病の血糖管理において,グルコース予測は重要な役割を担う。
    • 既存研究の評価基準の標準化が不十分で,公平な比較が困難になっている。
    • グルコース,インスリン,炭水化物摂取データを用いた予測アルゴリズムの比較検証を可能にする。
    • MetaboNet-Benchは,グルコース予測アルゴリズムを評価するための拡張可能なオープンソースのフレームワークを提供する。
    • モデルの複雑さに応じて,追加のデータモダリティが有益であることが示された。
    • 臨床指標の組み込みにより,今後の研究課題を特定するのに役立つ。

    Link: https://arxiv.org/abs/2606.18640

  • BLADE:LLMトレーニングのためのスケーラブルな二段階適応的データ選択 [cs.RO, cs.MA, cs.LG]目的:LLMトレーニングにおけるデータ選択手法
    • 大規模言語モデルの性能はデータに大きく依存するため,効率的なデータ選択が重要である。
    • 既存手法は計算コストが高いか,モデルの進化に追従できないという課題がある。
    • 高効率かつモデルの進化に対応可能なデータ選択手法を開発し,LLMのトレーニングを改善する。
    • BLADEは,影響度ベース手法の二段階最適化問題を,ヘッセ行列の逆計算を必要としないペナルティ付き単一レベルの目的関数として再定式化する。
    • これにより,過剰損失に基づくデータ選択との原理的なつながりが明らかになり,静的な参照モデルを動的なものに置き換えることが可能になる。
    • 実験結果から,BLADEが最先端のデータ選択手法を凌駕し,実用的なLLMトレーニングレシピを提供することが示された。

    Link: https://arxiv.org/abs/2606.18650

  • マルチモーダルLandslideBenchを用いたランドスライドエージェント:自律的なランドスライド識別と解析のためのドメインルール拡張エージェント [cs.CV, cs.AI]目的:ランドスライドの自律的な識別と解析
    • 災害予防において,知的なランドスライドハザード解釈は極めて重要である。
    • 既存の手法では,視覚的特徴と高レベルな地質学的意味論を同時に抽出することが困難である。
    • 複雑な地質シナリオにおける汎用VLモデルの認識限界とドメインホールシネーションを解決する。
    • LandslideBenchは,微細分類と意味的セグメンテーションにおいて,5つの主流モデルに対して有効なベースラインを提供する。
    • LandslideVLMは,ランドスライド識別,微細分類,意味記述の品質において,それぞれ10.96%,32.87%,15.91%の精度向上を達成した。
    • LandslideAgentは,マルチソース空間データの自律的な推論を可能にし,ランドスライドの識別と解析の全プロセスにおける知能を実現した。

    Link: https://arxiv.org/abs/2606.18661

  • ニューラルMUSIC:ロボット音源定位のためのハイブリッドニューラル・サブ空間フレームワーク [cs.CL, cs.SD, cs.AI]目的:ロボット音源定位の精度向上
    • ロボットが自律的に環境を認識し行動するために,音源定位は不可欠な技術である。
    • 従来のMUSIC法は,低S/N比環境下で性能が低下しやすいという課題がある。
    • 深層学習の汎化性能の限界を克服し,ロバストかつ汎用的な音源定位を実現する。
    • ニューラルMUSICは,空間共分散行列をニューラルネットワークで推定し,MUSIC法に統合することで,定位精度を向上させた。
    • 周波数注意融合モジュール(FAF)を用いることで,最終的なDOA推定値の精度を高めている。
    • 自己教師あり空間相関学習(SSCL)により,ラベルなしデータからも空間構造を学習し,データ効率を改善した。

    Link: https://arxiv.org/abs/2606.18664

  • scGTN:シングルセルRNAシーケンスクラスタリングのための深層SiameseグラフTransformerネットワーク [cs.MA, cs.CL, cs.HC, cs.LG, cs.AI, q-bio.GN]目的:シングルセルRNAシーケンスデータのクラスタリング
    • 細胞レベルでの遺伝子発現解析は,細胞種の特定や細胞の多様性理解に不可欠である。
    • 既存手法は,scRNA-seqデータのスパース性やノイズ,複雑な細胞間構造情報を無視している。
    • scRNA-seqデータの遺伝子発現プロファイルと細胞間構造依存性を統合し,クラスタリング精度向上を目指す。
    • 提案手法scGTNは,scRNA-seqデータをグラフとして表現し,相補的な細胞間情報を捉える二つの拡張グラフビューを構築する。
    • SiameseグラフTransformerネットワークを用いて,最短経路情報とノード間の距離を明示的に組み込み,細胞間のより豊富な構造的関係を捉える。
    • 最適輸送戦略を用いて,自己教師あり学習方式で細胞クラスタリングを誘導し,既存手法を上回る性能を示す。

    Link: https://arxiv.org/abs/2606.18672

  • InTrain:ゼロコストニューラルアーキテクチャ探索のための内在的訓練可能性 [cs.LG, cs.CV]目的:ニューラルアーキテクチャの訓練可能性の評価
    • ニューラルネットワークの効率的な設計は,機械学習の性能向上に不可欠である。
    • 既存のゼロコストプロキシは,訓練可能性の本質を捉えきれていない。
    • アーキテクチャの幾何学的容量と最適化耐性を統合的に評価する手法を確立する。
    • 本研究では,内在的訓練可能性(InTrain)という統一的な理論的プロキシを提案した。
    • InTrainは,活性化の共分散固有スペクトルの参加比と,勾配の健全性の累積を通じて訓練可能性を定量化する。
    • 実験の結果,InTrainは最先端のアンサンブルベースの手法と同等のランキング相関を示し,単一指標の手法を上回った。

    Link: https://arxiv.org/abs/2606.18676

  • ストリーム学習における表形式ファウンデーションモデルのための境界コンテキスト管理 [cs.LG, cs.AI]目的:表形式データに対するストリーム学習におけるコンテキスト管理
    • 機械学習において,データ分布が時間とともに変化するストリーム学習は重要な課題である。
    • 表形式データに対する従来のストリーム学習手法はモデル更新に依存し,変化への対応が遅れる場合がある。
    • ファウンデーションモデルを活用し,コンテキスト管理によってストリーム学習の性能向上を目指す。
    • 提案手法CUREは,不確実性の高いサンプルを保持し,冗長なサンプルを削除することでコンテキストを効果的に管理する。
    • 7つのストリームデータセットにおいて,CUREは従来のストリーム学習手法と比較して最大27.0%の性能向上を示した。
    • CUREは様々なファウンデーションモデルで堅牢性を維持し,他のコンテキスト管理手法よりも優れた性能を発揮する。

    Link: https://arxiv.org/abs/2606.18677

  • 公平なオンライン資源配分 [cs.DS, cs.GT, cs.LG, math.OC]目的:公平性と資源制約を考慮したオンライン資源配分問題の最適化
    • 難民移住や航空機スケジュールなど,資源配分は社会的重要課題であり,効率性と公平性の両立が求められる。
    • 従来の資源配分では,公平性が十分に考慮されておらず,類似するエージェント間で結果に差が生じやすい。
    • 本研究は,資源制約下で公平性を確保しつつ,全体的な厚生を最大化する配分アルゴリズムを開発する。
    • 本研究で提案するアルゴリズムは,バッチ内での公平性制約を満たしつつ,最適な双対変数を推定する。
    • オンライン環境において,最適なオフライン流体ベンチマークに対して亜線形後悔を達成することが証明された。
    • 難民経済プログラムの現実データを用いた検証により,アルゴリズムの性能と厚生最大化と公平性確保のトレードオフが示された。

    Link: https://arxiv.org/abs/2606.18679

  • ForecastBench-Sim:シミュレーション環境における予測ベンチマーク [cs.AI, cs.CL, cs.LG]目的:汎用AIシステムの予測能力評価
    • AIの予測能力は,現実世界での意思決定や計画立案に不可欠である。
    • 現実世界の予測ベンチマークは,結果の解決に時間がかかり,稀な事象の評価が困難である。
    • シミュレーション環境を用いて,迅速かつ多様な予測タスクを提供し,AIの予測能力を評価する。
    • 本ベンチマークは,ターン制戦略ゲームFreecivのゲームロールアウトに基づき,シミュレーションされた世界で予測を行う。
    • 予測者は現在のゲーム状態のレポートを受け取り,未来の状態を予測し,その精度がシミュレーションによって評価される。
    • 現実世界のベンチマークの制約を克服し,動的な世界状態下での確率的推論の研究を促進する。

    Link: https://arxiv.org/abs/2606.18686

  • 二重チャネルに基づく世界モデル:異質外部グラウンディングと内向き勾配フローによる目的干渉崩壊の構造的防止 [cs.LG, cs.AI]目的:目的干渉崩壊の構造的防止
    • 世界モデルは,エージェントの効率的な学習や行動計画に不可欠であり,汎用的な知能開発の基盤となる。
    • 既存の世界モデルは,複数の目的を同時に学習する際に,目的間の干渉によって性能が低下する課題がある。
    • 二重チャネル構造と内向き勾配フローにより,目的間の干渉を構造的に防止し,安定した学習を実現することを目指す。
    • 提案手法では,物理的ダイナミクスと社会的行動ダイナミクスをそれぞれ異なる潜在空間に分割し,勾配の干渉経路を遮断する。
    • 物理空間と行動空間は,それぞれに対応するグラウンディング目標に基づいて学習され,崩壊に対する保証が得られる。
    • 生成モデルは潜在世界モデルから分離されており,特定の生成目標の幾何学的な仮定の下で安定性が確保される。

    Link: https://arxiv.org/abs/2606.18688

  • スパース性促進ファインチューニングによる等変材料基盤モデルのロバストかつ解釈可能な適応 [cs.LG, cond-mat.mtrl-sci]目的:等変材料基盤モデルのドメイン特化
    • 材料科学において,物質の特性予測は重要な課題であり,計算コスト削減に繋がる。
    • 事前学習済みモデルは汎用性が高い一方,特定の物質系や計算条件への適応が課題となる。
    • モデルのパラメータ更新を抑制しつつ,高い予測精度と解釈可能性を両立することを目指す。
    • 提案手法は,従来のファインチューニングや低ランク適応と同等以上の性能を,わずか3%程度のパラメータ更新で達成した。
    • 磁気モーメント予測や磁性考慮エネルギーモデリングといった異なるタスクへの応用にも成功し,汎用性を示した。
    • スパース性のパターン分析から,遷移金属系におけるd軌道の寄与増大など,物理的に解釈可能な特徴が明らかになった。

    Link: https://arxiv.org/abs/2606.18691

  • 同期の欲求不満としての注意 [cs.CY, cs.HC, cs.LG, cond-mat.dis-nn, cs.CL, cs.NE, nlin.AO]目的:同期からの逸脱に着目した注意機構の計算原理
    • 近年,大規模言語モデルの性能向上に伴い,その基盤となる注意機構の理論的理解が重要になっている。
    • 既存の注意機構は,計算資源の消費が大きいことや,原理的な説明が不足しているという課題がある。
    • 同期の概念に基づき,計算を効率的に行う新たな注意機構を提案し,その有効性を検証すること。
    • 提案する Frustrated Synchronization Network (FSN) は,既存の RoPE-SwiGLU transformer を上回る性能を示した。
    • 特に,long-range copy イベントにおいて,FSN は transformer の性能を逆転させることが確認された。
    • モデル規模を拡大しても,FSN の優位性は持続しており,今後の更なる性能向上が期待される。

    Link: https://arxiv.org/abs/2606.18694

  • データポイズニングによる隠蔽的なワールドモデル操作 [cs.LG, cs.CR, cs.RO]目的:学習されたワールドモデルの操作
    • モデルベース学習は,環境への適応に重要である。しかし,学習データへの攻撃に脆弱である。
    • ワールドモデルの更新過程は,悪意のあるデータによって改ざんされやすい。
    • ワールドモデルの学習データを操作し,計画能力を低下させることを目指す。
    • 提案手法SWAAPは,ワールドモデルのダイナミクスを操作し,計画時のパフォーマンスを低下させる。
    • SWAAPは,わずかな改ざん量で攻撃を隠蔽し,既存の防御策を回避する。
    • ワールドモデル適応パイプラインにおける脆弱性が明らかになり,ロバスト性の向上が必要である。

    Link: https://arxiv.org/abs/2606.18697

  • 深層学習を用いた表面分類におけるエネルギー特徴の活用:3つの独立データセットにおける比較分析 [cs.RO, cs.AI, cs.LG]目的:表面分類のためのエネルギー特徴の有効性
    • モバイルロボティクスにおいて,環境認識は自律動作の根幹をなす重要な課題である。
    • 表面分類において,エネルギーに基づく手法は十分に検討されてこなかった。
    • エネルギー特徴が単独または他のデータと組み合わせて,分類精度向上に貢献するか検証する。
    • 本研究で評価したモデルは,すべてのデータセットにおいて既存研究を上回る精度を達成した。
    • エネルギー特徴のみを用いた場合,85-90%程度の分類精度が得られた。
    • 慣性データと組み合わせることで,精度は96-99%に向上し,平均1-2%の改善が見られた。

    Link: https://arxiv.org/abs/2606.18698

  • TW-LegalBench:台湾の法的理解の測定 [cs.CL, cs.AI, cs.IR]目的:台湾法におけるLLMの法的推論能力の評価
    • 法的判断は社会の安定に不可欠であり,正確性が求められる。
    • LLMの法的推論能力評価は,特に特定の法域において遅れている。
    • 台湾法に特化した評価基準を確立し,LLMの能力を測る。
    • 提示されたTW-LegalBenchは,台湾の公開された法的文書を用いて構築された。
    • 評価の結果,トップモデルは弁護士の合格基準を超えたものの,裁判官や検察官の基準には及ばなかった。
    • 判例予測においては,正確な条文引用が課題であることが示された。

    Link: https://arxiv.org/abs/2606.18699

  • ロジット空間における対照的アラインメントによるマルチモーダルな生物学的言語モデルの文脈化 [cs.LG, q-bio.QM]目的:生物学的言語モデルの文脈依存予測性能の向上
    • 生物学的配列の機能予測や設計において,言語モデルが重要な役割を担う。
    • 既存のモデルは,特定の生物学的文脈を考慮した学習が不十分である。
    • ロジット空間における対照学習により,文脈情報を効率的に組み込むことを目指す。
    • LOGICAは,既存の事前学習済みモデルの確率的インターフェースを維持しつつ,文脈情報を統合する。
    • 特に,変異局所的なバリアントランキングにおいて高い性能を発揮し,文脈依存的な対数尤度を比較する。
    • タンパク質-リガンド結合,TCR-ペプチド活性,薬物耐性予測など,様々なタスクで最先端手法を上回る結果が得られた。

    Link: https://arxiv.org/abs/2606.18703

  • 物理情報PDE学習のための学習可能なフォトニック測定 [cs.LG, physics.comp-ph]目的:物理情報PDE学習における学習可能なフォトニック表現
    • 科学技術計算において,物理法則を組み込んだ機械学習の重要性が高まっている。
    • 既存のニューラルネットワークでは,位相や周波数といった物理的構造の保持が課題である。
    • フォトニック量子ニューラル場により,位相情報を効率的に学習し,精度向上を目指す。
    • フォトニック測定を学習可能な表現として利用することで,従来のニューラルネットワークよりも高い精度が得られた。
    • 特に,微分残差が増幅される複雑な問題において,フォトニック表現の優位性が顕著に現れた。
    • 学習された干渉効果と安定したフォック確率読み出しが,性能向上に貢献していることが示された。

    Link: https://arxiv.org/abs/2606.18713

  • モルフェウス:トルコ語のための形態素を意識したニューラルトークナイザーおよび単語埋め込み [cs.HC, cs.CL, cs.AI]目的:トルコ語における形態素境界を考慮したニューラルモデルの開発
    • トルコ語は膠着語であり,形態素が意味を持つため,言語処理において形態素解析が重要である。
    • 既存のサブワードトークナイザーは統計に基づいて単語を分割するため,意味を持つ接尾辞を断片化する問題がある。
    • 本研究は,可逆的かつ形態素を意識したトークナイザーと単語埋め込みを同時に実現し,元のテキストを正確に復元することを目指す。
    • モルフェウスは,他のサブワードモデルと比較して,文字あたりのビット数が低く,形態素アライメントの精度が高い。
    • 凍結されたモルフェウスベクトルは,語彙検索や語根検証において,既存のモデルを上回る性能を示した。
    • 文脈依存タスクでは既存のモデルに劣るものの,モルフェウスの語根中心的な構造がその原因と考えられる。

    Link: https://arxiv.org/abs/2606.18717

  • 臨床的に整合した幾何学的制約によるロバストなIVUS血管境界セグメンテーション [cs.CV, cs.LG]目的:IVUS血管境界の正確なセグメンテーション
    • 冠動脈疾患の診断と治療において,血管構造の正確な定量評価が重要である。
    • 従来のセグメンテーション手法では,境界のずれやトポロジーエラーが発生し,臨床測定の精度が低下する。
    • 臨床的に重要な幾何学的特徴量を直接的に制約することで,より正確なセグメンテーションを実現する。
    • GeoCatは,Dice係数0.93を達成し,95HDを0.14mmに低減,トポロジーエラーを1.0%まで抑制した。
    • 直径誤差を0.13-0.16mm,角度誤差を約8度に抑え,信頼性の高いプラーク容積の定量化を支援する。
    • 二つの商用IVUSシステムで取得した146人の患者の12,242フレームのデータを用いて検証した結果,幾何学的忠実性が大幅に向上した。

    Link: https://arxiv.org/abs/2606.18723

  • 予測プロセス監視における構造制約を満たす完全イベントシーケンス生成のためのグラフに基づいたクロスアテンションTransformerニューラルネットワーク [cs.LG, cs.AI]目的:予測プロセス監視における完全イベントシーケンス生成
    • プロセス監視は,システムの異常検知や将来予測に不可欠であり,産業界での応用が期待されている。
    • 既存手法は部分的なタスクに焦点を当てており,イベントシーケンス全体を構造的に制約を満たしつつ生成することが困難である。
    • イベントシーケンスの遷移可能性,時間順序,終端,属性の一貫性を維持しつつ,完全なイベントシーケンスを生成することを目指す。
    • 提案手法GGATNは,プロセスグラフを活用し,Transformerの自己注意機構とグラフに基づくクロスアテンションを組み合わせることで,高品質なイベントシーケンス生成を実現した。
    • GGATNは,ベンチマークイベントログを用いた実験において,LLMベースラインよりも高いシーケンス類似度,制御フロー類似度,期間分布の再現性を示した。
    • また,幻覚的なイベントやシーケンスレベルの属性不整合をゼロに抑え,構造的制約を満たす安定した生成が可能であることを確認した。

    Link: https://arxiv.org/abs/2606.18726

  • 移動障害物のある移動目標セールスマン問題に対する二段階二層探索 [cs.CL, cs.RO, cs.AI, math.CO, math.OC]目的:移動障害物回避を考慮した移動目標セールスマン問題の最適解探索
    • 経路最適化問題は,物流やロボット工学など,様々な分野で重要な課題である。
    • 現実的な環境では,目標や障害物が時間とともに移動するため,従来のTSPでは対応が困難である。
    • 移動目標と障害物の存在下で効率的に経路を計画し,最適なセールスマン巡回路を求める。
    • 提案手法である二段階二層探索(TPBS)は,既存手法と比較して高い成功率を示した。
    • TPBSは,解のコストと計算時間の両面で既存手法を大幅に上回る性能を発揮した。
    • 提示した混合整数二次錐計画(MICP)モデルも,オフザシェルフソルバーで解くことが可能である。

    Link: https://arxiv.org/abs/2606.18730

  • 合成イベントデータとハイブリッドSNNを用いた低コスト脳型転倒検知 [cs.LG, cs.CV]目的:脳型ニューラルネットワークと畳み込みニューラルネットワークを組み合わせたハイブリッドモデルの開発
    • 高齢化社会において,転倒は深刻な問題であり,早期発見と迅速な対応が重要である。
    • 従来の転倒検知システムは,計算コストが高く,エネルギー消費が大きいという課題があった。
    • エネルギー効率の高い脳型ニューラルネットワークを用いて,低コストな転倒検知システムの実現を目指す。
    • シミュレーションの結果,従来の機械学習モデルと同等の精度を維持しつつ,大幅な効率向上が確認された。
    • 動画フレームをイベントベースデータに変換することで,脳型ニューラルネットワークの省エネルギー性と時空間処理能力を活用した。
    • 本研究は,現実環境における複雑なタスクにSNNとDVS技術を組み合わせる可能性を示唆している。

    Link: https://arxiv.org/abs/2606.18732

  • SWE-Future:将来志向型ソフトウェア工学エージェントのための予測条件付きデータ合成 [cs.SE, cs.AI]目的:将来のコーディングタスクのためのデータ合成手法
    • ソフトウェア開発エージェントの性能向上は,開発効率と品質の向上に不可欠である。
    • 既存のベンチマークは過去のデータに依存しており,モデルの過学習や評価の偏りを招く可能性がある。
    • 過去のデータに依存せず,将来のソフトウェア開発ニーズに対応したデータセットを生成すること。
    • 提案手法SWE-Futureは,リポジトリの進化予測に基づき,将来のタスクを合成する。
    • 予測ステップの検証により,58.1%の将来の作業との関連性が確認された。
    • SWE-Futureは,過去のプルリクエストへの依存度を軽減し,現実的で将来志向型のコーディングタスク合成を可能にする。

    Link: https://arxiv.org/abs/2606.18733

  • 汎用エージェントは何を記憶すべきか [cs.DC, cs.AI]目的:複数環境と目標における最適行動のための記憶内容
    • 多様なタスクに対応する汎用AI実現には,効率的な記憶メカニズムが不可欠である。
    • 環境特有の情報と汎用的な情報の適切な保持・利用が課題である。
    • 異なる環境で矛盾する最適行動を記憶に保持することの必要性を示す。
    • 異なる環境で観察ボトルネックを共有する場合,最適な行動が衝突すると,エージェントは異なる記憶分布を持つ必要が生じる。
    • ある程度の成功を収めるエージェントは,現在の状態観測のみに頼らず,ドメイン固有の情報を記憶する必要がある。
    • 記憶は,ドメインの識別,遷移モデルの再構築,汎用エージェントの計画を支える基盤となる。

    Link: https://arxiv.org/abs/2606.18746

  • 大規模言語モデルと人間のフィードバックを用いた反復強化学習による,自然で表現豊かなロボットジェスチャー生成 [cs.RO, cs.AI]目的:自然で表現豊かなロボットジェスチャーの生成
    • 人間とロボットの自然なコミュニケーションには,言葉だけでなくジェスチャーが不可欠であるため。
    • 既存のジェスチャー生成手法は,専門家によるアニメーションに依存し,柔軟性に欠けるという課題がある。
    • 大規模言語モデルと人間のフィードバックを活用し,より自然で表現豊かなロボットジェスチャー生成を目指す。
    • ChatGPTをPepperに統合することで,会話内容に合わせたジェスチャー生成が可能となった。
    • 人間のフィードバックを用いた反復強化学習(RLHF)により,生成されるジェスチャーの表現力,関連性,流暢性が向上した。
    • RLHFは,大規模言語モデルの会話時ジェスチャー生成能力を改善し,より自然な動きを実現した。

    Link: https://arxiv.org/abs/2606.18747

  • パラメータ曲面上での測地線様曲線の計算のためのニューラルネットワークフレームワーク [cs.CG, cs.LG, cs.NA, math.NA]目的:パラメータ曲面上の測地線様曲線の計算手法
    • 測地線は,曲面上での最短経路を求める上で重要であり,様々な応用分野で利用されている。
    • 既存手法では,複雑なパラメータ曲面に対して効率的な数値計算フレームワークが確立されていない。
    • 深層学習とPINNを活用し,複雑なパラメータ曲面上の測地線様曲線を効率的に計算することを目指す。
    • 本研究では,深層学習とPINNに基づく,効率的かつ洗練された測地線様曲線計算フレームワークを提案した。
    • 提案手法は,単一のパラメータ曲面だけでなく,$C^0$以上の連続性を持つ多面体システムや回転曲面など,広範な複雑なパラメータ曲面にも適用可能である。
    • 理論的な収束性が確立された測地線様曲線の実用的な計算手法を確立した。

    Link: https://arxiv.org/abs/2606.18759

  • 公開特徴量条件付けによるプライベート学習 [cs.RO, cs.LG, cs.AI]目的:差分プライバシーを考慮した回帰分析手法
    • 推薦システム等で活用されるプライバシー保護技術の重要性が増している。
    • 回帰分析におけるプライバシー保護手法は,分類問題に比べて研究が進んでいない。
    • 公開特徴量の構造を活用し,プライバシー制約下での最適化を改善する。
    • 提案手法Cond-DPは,公開特徴量のスペクトル減衰に着目し,データ駆動型条件付け行列を用いることで,最適化の風景を再構築し,収束を加速する。
    • Cond-DPは,凸,強凸,非凸設定において収束性を保証し,条件付け行列が単位行列の場合には標準的なDPSGDと一致する。
    • 実験的に,Cond-DPはラベルDP下で,広範なデータセットとモデルアーキテクチャにおいて,最新のベースラインよりも優れた性能を示す。

    Link: https://arxiv.org/abs/2606.18773

  • RouteJudge:再現性と嗜好性を考慮したLLMルーティングのためのオープンプラットフォーム [cs.LG]目的:LLMルーティングシステムのペアワイズ比較による評価
    • 大規模言語モデルの活用範囲拡大に伴い,適切なモデル選択が重要になっている。
    • ルーティング手法の評価基準が統一されておらず,再現性のある比較が困難である。
    • ユーザの嗜好やコストを考慮した,より効率的なルーティング手法の開発を促進する。
    • RouteJudgeは,ルーティング手法の決定品質を評価するためのオンラインプラットフォームである。
    • ORBITというツールボックスを公開し,LLMルーティングのワークフローを標準化することで,研究開発を支援する。
    • 研究者はORBITを用いてルーティング手法を実装し,RouteJudgeを通じてオンライン評価に参加できる。

    Link: https://arxiv.org/abs/2606.18774

  • ドリフトと破損下における潜在クラスタ幾何を用いたオンライン分布予測 [cs.LG, stat.ML]目的:非定常ストリームにおけるオンライン分布予測
    • データ生成分布の予測は,単なる点推定の追跡を超え,多くの応用において重要である。
    • 変動するデータストリームにおいて,分布予測の精度を維持することが課題である。
    • ドリフトと悪意のある破損に対するロバストなオンライン分布予測手法を開発する。
    • 潜在クラスタ幾何を用いることで,パラメータモデルに依存せず,不確実性を構造化された潜在空間で表現できる。
    • 再起動型変種により,ドリフトの影響を軽減し,時間的に局所化された準ベイズ更新を実現した。
    • 理論的保証として,累積Wasserstein-1後悔に対する上限が導出され,PAC-Bayesian複雑度項,破損感受性項,動的最適輸送項で構成される。

    Link: https://arxiv.org/abs/2606.18778

  • RedactionBench:プライバシー保護のためのベンチマーク [cs.CL, cs.CL, cs.AI]目的:個人情報(PII)の秘匿に関する評価基準と指標
    • 機密データを扱う場面で,個人情報保護は不可欠であり,その重要性はますます高まっている。
    • 既存の評価基準は,情報抽出の技術とプライバシーの文脈を混同しており,十分ではない。
    • 文脈に依存するプライバシー保護の難しさを明確にし,より適切な評価方法を提案すること。
    • RedactionBenchは,11の分野から収集された200件の多様な文書から構成される,手動で注釈を付けたベンチマークである。
    • R-Scoreは,意味的に類似する秘匿処理を等価に扱い,電話番号などの書式設定の変更を考慮しない新しい文字レベルの指標である。
    • 人間による評価の結果,文脈的秘匿については意見の一致が見られなかったことが,文脈的プライバシーの主観的な性質を示している。

    Link: https://arxiv.org/abs/2606.18782

  • 多目的多腕バンディット問題に対するベイジアン随時パレート最適解探索 [cs.LG, cs.AI]目的:多目的意思決定を支援するためのパレート最適解の特定
    • 複雑な状況下での意思決定において,複数の目的を同時に最適化することが重要である。
    • 既存手法では,限られた試行回数で効率的にパレート最適解を特定することが困難である。
    • 本研究は,少ない試行回数でもパレート最適解を効率的に探索する手法を提案する。
    • 提案手法Top-Two Pareto Front Thompson Sampling (TTPFTS) は,合成環境において既存手法を凌駕する性能を示した。
    • 大規模分子ライブラリを用いた実用的な分子探索においても,TTPFTSは効率的な探索を実現した。
    • 予測パレート集合に対する信頼度を定量化する新たな指標を導入し,その有効性を実証した。

    Link: https://arxiv.org/abs/2606.18785

  • R2D-RL:マルチエージェント強化学習のためのRoboCup 2Dサッカー環境 [cs.AI]目的:マルチエージェント強化学習のためのRoboCup 2Dサッカー環境
    • ロボットサッカーは,部分観測性,協調と競争,希薄な報酬,長期的な戦術行動などを含むため,マルチエージェント強化学習の検証に有用である。
    • 既存のRCSS2Dは競技向けアーキテクチャであり,現代のPythonベースのMARLワークフローとの直接的な連携が困難である。
    • RCSS2DとHELIOSベースのプレイヤーをPython MARLインターフェースで接続し,MARL学習を容易にすること。
    • R2D-RLは,共有メモリとサイクルレベル同期により,RCSS2DとPython MARLインターフェースを接続する環境を提供する。
    • R2D-RLは,フルフィールドとシナリオベースの学習,設定可能な対戦相手,行動空間,行動マスク,EPV報酬などをサポートする。
    • フロントゴールシナリオと11対11のフルフィールドベンチマークを提供し,ベースライン結果を示した。

    Link: https://arxiv.org/abs/2606.18786

  • 閉ループ:記号音楽生成における解釈可能な活性化ベクトル操舵のためのPIDフィードバック制御 [eess.SY, cs.SY, cs.SD, cs.AI, cs.LG]目的:記号音楽生成における解釈可能な活性化ベクトル操舵
    • 音楽生成の分野は,創造性と技術の融合であり,新たな表現手段の可能性を秘めている。
    • Transformerモデルは強力だが,離散的な信号属性の微調整や解釈可能性に課題がある。
    • 推論時の活性化ベクトル操舵により,モデルの再学習なしに属性をdeterministicに制御する。
    • DiffMean法を用いて,MMT内のピッチと音価の潜在的な方向性を特定し,線形表現仮説を検証した。
    • 多属性操舵における特徴量の絡み合いに対処するため,グラム・シュミットの直交化を利用したDual Steeringフレームワークを導入した。
    • 幾何学的なデカップリングが概念的な干渉と信号劣化を軽減し,強い自己回帰的条件付け下でも独立した制御を可能にした。

    Link: https://arxiv.org/abs/2606.18790

  • SHIFT:多言語情報検索のためのインデックス側特徴変換による意味的調和 [cs.SI, cs.CL, eess.SY, cs.SY, math.OC, cs.IR, cs.AI]目的:多言語情報検索における言語バイアス軽減と性能向上
    • グローバルな情報アクセスが不可欠となり,多言語情報を横断した検索技術の重要性が増している。
    • 既存の多言語密集型検索モデルは,クエリ言語と同じ言語の文書を優先する言語バイアスが問題である。
    • インデックス作成段階で言語オフセットを修正し,言語バイアスを軽減することで検索精度を向上させる。
    • SHIFTは,並行翻訳ペアを用いて各言語に対する相対的な言語ベクトルを推定する。
    • 文書埋め込みからこの言語ベクトルを減算することで,言語特有のオフセットを補正する。
    • 複数のベンチマークとモデルで,SHIFTが言語バイアスを効果的に軽減し,検索性能を向上させることが確認された。

    Link: https://arxiv.org/abs/2606.18801

  • ProfiLLM:産業配車における有用性重視のエージェント型ユーザープロファイリング [cs.AI, cs.CY]目的:産業配車におけるユーザープロファイリングの有用性向上
    • 配車プラットフォームでは,ユーザー行動の理解が効率的な配車に不可欠である。
    • 従来の配車システムは数値データに偏り,ユーザー行動の文脈的な理解が不十分である。
    • 大規模言語モデルを活用し,ユーザーの隠れた嗜好を効率的に把握し,配車精度向上を目指す。
    • ProfiLLMは,大規模データから有用な情報を抽出し,ユーザーをクラスタリングする。
    • 生成されたユーザープロファイルは,配車予測の精度を最大6.14%相対的に向上させた。
    • オンラインA/Bテストでは,GMVが0.47%増加,完了率が0.33%向上,キャンセル率が0.82%減少した。

    Link: https://arxiv.org/abs/2606.18803

  • 学習増強型厳密指数時間アルゴリズム [cs.DS, cs.LG]目的:学習による予測を用いた厳密指数時間アルゴリズムの効率化
    • NP困難問題に対し,現実的な時間で最適解を求めることは重要である。
    • 既存の厳密アルゴリズムは最悪計算時間が指数時間であり,問題規模に限界がある。
    • 機械学習による予測を用いて探索空間を削減し,計算時間を短縮することを目指す。
    • 機械学習による予測が,ランダムよりもわずかに優れているだけでも,探索空間を削減できることが示された。
    • 予測精度と計算時間の短縮が滑らかにスケールすることが確認された。
    • 予測の独立性や精度に関する強い仮定を必要とせず,現実的な設定でも有効であることが示された。

    Link: https://arxiv.org/abs/2606.18807

  • 自身の解から学ぶ:検証可能な報酬を持つ強化学習のための自己条件付き信用割り当て [cs.LG, cs.AI]目的:強化学習における信用割り当て手法の改善
    • 大規模言語モデルの推論能力向上には,強化学習が不可欠である。
    • 従来の信用割り当ては,重要なステップへの評価が不十分である。
    • 自己生成データを用いて,外部リソースに依存しない手法を開発する。
    • SC-GRPOは,既存手法(GRPO,DAPO)と比較して,5つのベンチマークで一貫して高い性能を示した。
    • 特に,外挿性能において,GRPOに対して8.1%,DAPOに対して5.9%の改善が見られた。
    • SC-GRPOは,教師あり蒸留手法(OPD)よりも優れていることが示された。

    Link: https://arxiv.org/abs/2606.18810

  • ニューラルスパース検索のためのMLMヘッドの再スケーリング [cs.IR, cs.AI]目的:ニューラルスパース検索におけるMLMヘッドの再スケーリング手法
    • 情報検索の効率化において,学習型スパース検索は重要性を増しており,その性能向上が求められている。
    • 大規模な事前学習済みエンコーダーを導入した場合,MLMヘッドのL2ノルムが大きすぎると,性能劣化や学習の不安定化が生じる場合がある。
    • MLMヘッドのスケーリングを調整することで,学習の安定性を高め,性能を改善することを目指す。
    • MLMヘッドの初期化時に定数倍で再スケーリングするだけで,学習の安定性が向上し,性能が大幅に改善される。
    • ModernBERTやEttinといった大規模なバックボーンモデルにおいて,再スケーリングにより,BERT-SPLADEと同等またはそれ以上の性能が実現された。
    • 事前学習済みエンコーダーをLSRに適合させる際のボトルネックは,エンコーダーの容量だけでなく,MLMヘッドのスケールの調整にあることが示唆された。

    Link: https://arxiv.org/abs/2606.18811

  • 強化学習の基礎モデルは既に存在するべきである [cs.LG, cs.AI]目的:強化学習における基礎モデルの構築
    • 言語や画像処理における基礎モデルの成功から,構造化されたデータ領域への応用が期待される。
    • 構造化データ領域では,大規模データの収集が困難なため,合成データに頼る傾向がある。
    • 強化学習における事前知識の設計を重視し,基礎モデルの構築を目指す。
    • 合成MDPで学習したモデルが,タスク固有の調整なしで,オンラインおよびオフラインのベンチマークで良好な性能を示した。
    • オンライン学習では,UCB-VIやtabular Q-learningよりも少ないエピソード数で問題を解決した。
    • オフライン学習では,VI-LCBと同程度の性能を示した。

    Link: https://arxiv.org/abs/2606.18812

  • SwitchBraidNet:ハイブリッド脳コンピュータインタフェースのための量子化を意識した軽量アーキテクチャ [cs.HC, cs.AI, cs.ET]目的:ハイブリッド脳コンピュータインタフェースにおける効率的な脳波分類
    • 脳波を用いたインタフェースは,麻痺患者の生活の質を向上させる可能性を秘めている。
    • 既存の高性能なモデルは,計算資源に制約のある組み込みハードウェアでは動作が困難である。
    • 低消費電力で動作する軽量な脳波分類モデルの開発が求められている。
    • 提案手法SwitchBraidNetは,多スケールな振動特徴抽出と電極ゲーティングを実現し,高い計算効率を達成した。
    • OpenBMIデータセットを用いた実験により,FP16でMI精度69.49%,SSVEP精度93.48%を達成した。
    • INT8でのモデルサイズはわずか3.03KBであり,精度を維持しつつ低消費電力な組み込みシステムへの応用が可能である。

    Link: https://arxiv.org/abs/2606.18816

  • 成熟マルコフ決定過程:情報増加と行動選択肢縮小下での意思決定 [cs.LG, cs.AI]目的:情報と行動選択肢の変化を考慮した意思決定問題の構造化
    • 現実の意思決定問題は,時間と共に情報が増加し,選択肢が減少する非対称な構造を持つ。
    • 従来のMDPでは,この構造を捉えきれず,緊急度の高い意思決定と遅延可能な意思決定を区別できない。
    • 情報と行動の非対称性を明示的にモデル化することで,効率的な学習と意思決定を目指す。
    • 成熟マルコフ決定過程(MMDP)を導入し,行動の期限切れを考慮した優先順位付けの原理を明らかにした。
    • 段階に応じた方策設計,行動抽象化,そして知識蒸留を用いた探索学習を含む,構造を意識した強化学習フレームワークを開発した。
    • 実験の結果,MMDPは問題規模が大きくなるほど学習効率を向上させ,その有用性が高まることが示された。

    Link: https://arxiv.org/abs/2606.18820

  • 歩行者の進路はどこへ? エゴセントリック動画からの多様性のある歩行者行動予測モデル [eess.SY, cs.SY, cs.CV, cs.LG]目的:歩行者の多岐にわたる行動予測
    • 自動運転や歩行者支援システムの安全性向上に不可欠な研究分野である。
    • 従来の予測モデルは,歩行者の意図や周囲の状況を十分に考慮できていない。
    • 歩行者の行動モードを分離し,より自然で信頼性の高い予測を実現すること。
    • 提案手法MMPMは,歩行者の視線,頭部,手の動きを考慮し,車両や環境との相互作用を捉える。
    • MMPMは,道路横断と非横断という2つのモードで将来の軌跡分布をモデル化することで,より現実的な予測を可能にする。
    • PIEおよびJAADデータセットにおいて,既存の最先端手法を上回る性能を実証した。

    Link: https://arxiv.org/abs/2606.18824

  • 空間は知性である:リーマン計量の生成のためのニューラル半群重ね合わせ [cs.RO, cs.AI]目的:リーマン計量生成のためのニューラル半群重ね合わせ
    • ロボット工学において,環境認識と経路計画は重要な課題であり,効率的な手法が求められている。
    • 従来の経路計画は計算コストが高く,複雑な環境下でのリアルタイム性が課題となっている。
    • 環境自体に知性を付与することで,効率的な経路計画を可能にすることを目指している。
    • 本研究では,エンコーダー・ルーターネットワークを用いて,環境の形状に応じてリーマン計量を生成する。
    • 生成されたリーマン計量場上で最短経路を探索することで,衝突回避と経路計画を同時に実現する。
    • 単一の障害物シーンで学習したモデルは,未知の障害物配置に対しても頑健なゼロショット汎化能力を示す。

    Link: https://arxiv.org/abs/2606.18828

  • GateMem: 多主体共有メモリエージェントにおけるメモリガバナンスのベンチマーク [cs.LG, cs.CL]目的:多主体共有メモリエージェントにおけるメモリガバナンスの評価
    • LLMエージェントの活用が広がる中で,複数主体による共有メモリ環境の重要性が増している。
    • 既存のメモリベンチマークは単一ユーザーを想定しており,多主体環境におけるメモリ品質の保証が課題である。
    • 本研究は,共有環境下での有用性,アクセス制御,能動的忘却の総合的な評価を目指す。
    • GateMemベンチマークは,医療,オフィス,教育,家庭のドメインを網羅した多主体環境を再現。
    • 既存手法では,有用性,アクセス制御,忘却の全てで高い性能を同時に達成することは困難である。
    • 長文プロンプトはガバナンススコアは高いもののコストも高く,検索ベースや外部メモリ手法は情報漏洩のリスクがある。

    Link: https://arxiv.org/abs/2606.18829

  • 報酬工学を超えて:長文脈強化学習のためのデータレシピ [cs.CL, cs.AI]目的:長文脈推論能力の向上
    • 大規模言語モデルの自律エージェントとしての活用において,長文脈推論は不可欠である。
    • 既存研究は報酬設計に集中し,多様な訓練データが不足している。
    • データ中心のアプローチにより,長文脈推論能力を向上させる。
    • 提案レシピは,検索,多証拠統合,推論の3つのタスクファミリーに対して構築されたデータセットで有効性を示す。
    • Qwen3モデル(4B/8B/30B-A3B)を用いた実験で,7つの長文脈ベンチマークにおいて平均+7.2/+3.2/+6.4ポイントの改善を達成した。
    • エージェントタスク(GAIA, BrowseComp)においても,追加訓練によりそれぞれ+4.8/+7.0ポイントの改善が確認された。

    Link: https://arxiv.org/abs/2606.18831

  • ターゲット確信度リコース: TRUST [cs.LG, cs.AI]目的:ターゲット確信度に基づいたリコースの生成
    • 高度な意思決定システムにおいて,アルゴリズムによる説明可能性が重要視されている。
    • 従来のカウンターファクチュアルは,わずかな変更で決定を覆すことに重点を置き,安定性に課題がある。
    • 確信度を明示的に制御し,より堅牢で解釈可能なリコースを提供することを目的とする。
    • TRUSTは,ユーザーが求める確信度を直接満たす最小限の変更を探索することで,リコースオプションを比較可能にする。
    • Probabilistic Tsetlin Machine (PTM) とベイズ最適化の組み合わせにより,安定した決定ルールに基づくリコースを実現する。
    • 実験の結果,ターゲット確信度リコースは,従来の境界ベースのアプローチよりも堅牢かつ解釈可能性が高いことが示された。

    Link: https://arxiv.org/abs/2606.18832