arXiv雑要約

AI - 2026/06/17 公開

  • 深層学習を用いたマルチスペクトル画像におけるリモートセンシングデータ補完 [cs.CV, cs.AI, stat.AP]目的:深層学習によるリモートセンシングデータ補完手法の評価
    • 水質管理において,光学衛星データの利用が不可欠である。雲の影響によるデータ欠損が課題となっている。
    • 雲などの影響でデータに欠損が生じ,藻類ブルームなどの重要な現象の検出が困難になる場合がある。
    • 深層学習モデルを用いて,光学衛星データの欠損値を効果的に補完し,水質モニタリングの精度向上を目指す。
    • 深層学習モデルは,線形補間法と比較して,スペクトルバンド値の補完において大幅に優れた性能を示した。
    • 特にCNNモデルは,対象湖沼の多くにおいて最も良い性能を発揮した。
    • 補完された画像から算出された藻類ブルーム指標は,観測データと比較して信頼性が高いことが示された。

    Link: https://arxiv.org/abs/2605.24003

  • CyberEvolver:セキュリティエージェントの動的構造自己進化 [cs.CL, cs.CY, cs.CR, cs.AI]目的:セキュリティエージェントの構造的自己進化
    • サイバーセキュリティは重要性が増しており,高度な防御と攻撃技術が求められている。
    • 既存のLLMベースエージェントは,多様な環境への適応性に課題がある。
    • 本研究は,自己進化によってエージェントの適応能力を高めることを目指す。
    • CyberEvolverは,失敗事例からの学習を通じて,エージェントの構造を反復的に改善する。
    • CTFチャレンジ,脆弱性攻撃,侵入テストにおいて,平均して13.6%の成功率向上を達成した。
    • 人間が設計したエージェントや他の自己改善手法と比較しても優れた性能を示した。

    Link: https://arxiv.org/abs/2605.26195

  • 知識グラフ基盤モデルの強化:改善された負例サンプリングによる [cs.AI]目的:知識グラフ基盤モデルの性能向上
    • 知識グラフは,質問応答やレコメンダーシステムなど,多様な応用分野の基盤技術である。
    • 知識グラフは不完全であることが多く,未知の知識グラフに対する汎化性能が課題である。
    • 既存の負例サンプリング手法の質の低さを改善し,知識グラフ基盤モデルの学習を強化すること。
    • 提案手法KMASは,既存の知識グラフ基盤モデルの関係埋め込みを用いて質の高い負例を生成する。
    • KMASは学習の進行に合わせて,ハードネガティブサンプルの比率を動的に調整することで,モデルの性能を最適化する。
    • 44のデータセットでの実験により,KMASが多くの最先端の知識グラフ基盤モデルの性能を向上させることが示された。

    Link: https://arxiv.org/abs/2605.27023

  • 時間的モチーフを考慮したグラフテスト時適応によるOODブロックチェーン異常検知 [cs.CR, cs.AI, cs.LG]目的:ブロックチェーンにおける異常検知の性能向上
    • ブロックチェーン技術は金融やサプライチェーン等,多様な分野で利用が拡大しており,セキュリティ確保は重要である。
    • ブロックチェーン上の取引パターンは常に変化するため,既存の異常検知手法では新たな異常に対応が困難である。
    • 訓練データとテストデータの分布のずれ(OOD問題)を解消し,変化する取引パターンへの適応を可能にすること。
    • 提案手法TEMG-TTAは,5つの実データセットにおいて最先端のグラフ異常検知手法を平均54.88%上回る性能を示した。
    • TEMG-TTAは,各アクティブアドレスの時間的モチーフ分布を効率的に捉え,グラフ学習に活用することで,異常アドレスの複雑な取引パターンを明確に特徴づける。
    • ケーススタディにより,解釈可能なモチーフパターンを通じて,提案手法が技術的な設計の有効性を検証していることが示された。

    Link: https://arxiv.org/abs/2605.29526

  • 視点計画 [cs.AI, cs.CV, cs.RO]目的:視点計画の能力
    • ロボットやAIが環境を理解し,効率的に行動するための基盤技術。
    • 視覚言語モデル(VLM)は視点と行動の関係を理解するものの,複数ステップの計画に苦戦している。
    • VLMにおける多段階視点計画のギャップを埋め,3次元空間での推論・計画能力向上を目指す。
    • 提案手法である反復的フレームワークにより,Qwen2.5-VL-7Bの性能が大幅に向上し,GPT-5.4 ProやGemini 3.1 Proを上回った。
    • 自己探索と視点グラフ蒸留を組み合わせることで,VLMは効果的に視点間の関係を学習し,計画能力を高めることが示された。
    • この研究は,3次元空間で能動的に推論し計画できるVLMの開発に向けた有望な道筋を示す。

    Link: https://arxiv.org/abs/2605.29563

  • 機械への価値観の教示:LLMにおける人間らしい行動のシミュレーション [cs.AI, cs.CL]目的:LLMにおける人間らしい価値構造の顕在化
    • AIの発展に伴い,人間との協調が重要となる場面が増加している。
    • LLMは多様な役割を担えるが,一貫した価値観に基づいた行動は課題である。
    • 心理学的な価値理論に基づき,LLMに人間らしい価値観を付与し検証する。
    • 価値観をプロンプトに組み込んだLLMと人間の間には,強い一致が見られた。
    • 人間における価値観分布を取り入れることで,価値観に基づくLLMによるシミュレーションの精度が向上した。
    • 価値観を誘導したLLMは,心理学的に妥当な人間行動シミュレーションツールとしての可能性を示す。

    Link: https://arxiv.org/abs/2605.30036

  • 汎用的な変形可能マニピュレーションのためのVision-Language-Action基盤モデル DeMaVLA [cs.RO, cs.AI]目的:変形可能オブジェクトの汎用的なマニピュレーション
    • 家庭用ロボットの普及には,多様な状況に対応できる汎用的な基盤モデルが必要である。
    • 既存のVLAシステムは,オブジェクトの種類ごとにポリシーを個別に学習することが多く,タスク間の干渉が課題である。
    • DeMaVLAは,カテゴリーに依存しない変形可能オブジェクトのフォールディングポリシーを実現する。
    • DeMaVLAは,大量の現実世界データで事前学習し,人間による修正学習パイプラインを通じて性能を向上させている。
    • RoboTwin 2.0における性能評価と家庭用フォールディングベンチマークにおける現実世界での実験により,その有効性が示された。
    • スケーラブルなデータ,効率的な行動生成,修正学習が,汎用的なVLAポリシーに不可欠であることが強調された。

    Link: https://arxiv.org/abs/2605.31286

  • 憲法に基づくオンポリシー安全蒸留 [cs.LG, cs.AI]目的:安全性を高めつつ有用性を維持する蒸留手法
    • 安全性と有用性の両立は,大規模言語モデルの社会実装において不可欠である。
    • 既存の安全性重視の蒸留手法は,表現力の低下を引き起こしやすい。
    • 安全性を損なわずに表現力を維持する蒸留手法の開発を目指す。
    • 提案手法COPSDは,教師モデルの事前調整により,蒸留時の表現力低下を抑制する。
    • COPSDは,12のベンチマークにおいて,既存手法よりも安全性と有用性のトレードオフを改善した。
    • COPSDは,安全性確保のために一般推論能力が低下する「安全税」を大幅に削減した。

    Link: https://arxiv.org/abs/2606.03089

  • 3Dアイソビスト世界モデル:都市の隠れた幾何学と創発的な都市間シグネチャの解明 [cs.RO, cs.RO, cs.LG]目的:都市空間におけるナビゲーションを可能にする,3次元アイソビストを用いた世界モデルの構築
    • 都市における自律的な移動体にとって,周囲環境の予測は不可欠であり,その中でも移動可能な空間の理解が重要である。
    • 既存の世界モデルは外観予測に偏っており,移動可能な空間の幾何学的な構造を十分に捉えられていない。
    • ナビゲーションに必要な,移動可能な空間の幾何学的構造を捉え,都市間の特徴を学習するモデルを開発すること。
    • 提案手法では,建物間の開口空間を3次元アイソビストとしてモデル化し,移動体の過去のアイソビストと行動履歴から次のアイソビストを予測する。
    • マンハッタンとパリで学習したモデルは,都市間の空間的なシグネチャを創発的に獲得し,その識別子は外観情報ではなく,学習されたダイナミクスに存在する。
    • この表現は軽量で解釈可能であり,ロボティクスや都市分析における空間推論のための基盤となりうる。

    Link: https://arxiv.org/abs/2606.03609

  • 市規模レーンレベル地図生成のための工業グレードなエージェントフレームワークMapAgent [cs.AI]目的:市規模のレーンレベル地図の自動生成
    • 自動運転やレーンレベルナビゲーションにおいて,高精度な地図は不可欠な基盤技術である。
    • 数百都市規模での標準化されたレーンネットワークの構築・維持には,膨大な労力が必要とされている。
    • 仕様遵守と高精度な地図生成を両立させ,自動編集の効率化を図る。
    • MapAgentは,ベクター化バックボーンと仕様検証,制約に基づいた推論,決定論的な地図編集を組み合わせたエージェントアーキテクチャである。
    • ビジョン言語モデルが視覚的証拠とドラフトベクトルを検査し,プランナーが最小限の修正を生成する。
    • 実世界のデータセットで既存手法を上回り,Baidu Mapsで360以上の都市で利用され,自動化率95%以上を達成した。

    Link: https://arxiv.org/abs/2606.04513

  • エージェントの痕跡から信頼へ:LLMエージェントにおける証拠追跡と実行系統の調査 [cs.CR, cs.AI]目的:LLMエージェントにおける証拠追跡と実行系統
    • LLMエージェントの自律性が高まる中,その振る舞いの検証・デバッグ・監査の重要性が増している。
    • 最終的な回答の正確性だけでは,出力の根拠やツールの利用正当性,記憶の影響が不明確である。
    • LLMエージェントのプロセスレベルでの説明責任を確立し,信頼性を高めるための手法を整理・分析する。
    • 証拠追跡と実行系統は,検索根拠,主張のサポート,ツールの安全性,記憶の系統,可視化,デバッグ,監査,復旧を統一的に扱うための基盤となる。
    • 本調査では,痕跡のソース,証拠と実行の単位,系統関係,追跡の粒度とタイミング,表現形式,信頼性関数を網羅する分類体系を提示する。
    • 系統表現,証拠帰属,ツール利用系統,実行時ガードレール,系統を伴う記憶,可視化,障害診断などの主要な方法論的動向をレビューする。

    Link: https://arxiv.org/abs/2606.04990

  • LLMCodec:大規模言語モデルの効率的な重み圧縮のためのビデオコーデックの適応 [cs.MM, cs.AI]目的:大規模言語モデルの重み圧縮手法
    • 近年,大規模言語モデルは自然言語処理を大きく発展させているが,モデルサイズの増大が課題となっている。
    • 既存のモデル圧縮手法は,汎用性に欠け,様々なテンソル型への対応が困難である。
    • ビデオコーデックの特性を利用し,汎用性の高い重み圧縮手法を開発すること。
    • LLMCodecは,VVC/H.266ビデオコーデックとアフィン量子化を統合した重み圧縮手法である。
    • LLaMA-3-8Bの2ビット精度において,既存手法と比較してパープレキシティを1.5倍以上削減し,ダウンストリームタスクの精度を21%向上させた。
    • 様々なビデオコーデックとエンコードプロファイルを比較し,圧縮性能への影響を評価した結果,LLMCodecの堅牢性と汎用性が確認された。

    Link: https://arxiv.org/abs/2606.05861

  • Lean4Agent:エージェントのワークフローと軌跡の形式モデリングと検証 [cs.AI, cs.LG, cs.LO, cs.SE]目的:エージェントのワークフローと軌跡の形式モデリングおよび検証
    • 大規模言語モデルの活用が進む中,信頼性の高い多段階ワークフローの実行が重要課題となっている。
    • 既存のエージェントシステムは,ワークフローや実行軌跡の仕様,検証,デバッグのための形式手法が不足している。
    • Lean4を用いた形式手法により,エージェントのワークフローの一貫性を検証し,実行時エラーの特定を可能にすること。
    • Lean4Agentは,Lean4という依存型形式言語を用いてエージェントの振る舞いをモデル化・検証する初のフレームワークである。
    • 検証に合格したワークフローは,不合格のものと比較して平均11.94%高い性能を示すことが実験で確認された。
    • LeanEvolveは,SWEベンチマークにおいて平均7.47%の性能向上を実現し,ワークフローの改善に貢献する。

    Link: https://arxiv.org/abs/2606.06523

  • 抑制下でも残存する事前知識:語彙的オーバーライドに関するStroopパラダイム [cs.CL, cs.LG]目的:言語モデルにおける事前知識の残存とその影響
    • 大規模言語モデルの性能向上には,事前学習された知識の活用が不可欠である。
    • 新しい指示によって語彙の意味を上書きした場合,元の意味が完全に消去されない場合がある。
    • 語彙的優先順位が,新しい指示に対する干渉として現れるメカニズムを解明する。
    • 11のオープンウェイトモデルにおいて,語彙的優先順位の強さが干渉の程度と相関することが示された。
    • 活性化パッチングにより,定義主体,定義対象,クエリ語の位置に対応するトリプレットが干渉効果のほぼ全量を再現した。
    • 定義対象の位置を破壊すると,干渉が抑制される一方,ターゲットロジットの崩壊が起こることが確認された。

    Link: https://arxiv.org/abs/2606.07555

  • SceneConductor:単一画像からのマルチエージェントオーケストレーションによる3Dシーン生成 [cs.CV, cs.AI, cs.MA]目的:単一画像からの3Dシーン生成
    • 3Dシーン生成は,メタバースやAR/VRなどの応用において不可欠であり,現実世界の再現度向上が求められる。
    • 既存手法は,シーン全体の情報を一度に処理するため,複雑な環境への汎化が難しいという課題がある。
    • 本研究は,複数のエージェントによる段階的な処理を通じて,複雑なシーンの生成を可能にすることを目的とする。
    • 提案手法は,シーンの初期化,環境構築,マルチエージェントによる洗練という3つの段階で3Dシーンを生成する。
    • 初期化段階では,画像からオブジェクトマスクを抽出し,空間レイアウトを予測することで粗い3Dシーンを構築する。
    • 実験結果から,提案手法が既存手法よりも幾何学的精度,空間的一貫性,および視覚的リアリズムにおいて優れていることが示された。

    Link: https://arxiv.org/abs/2606.08402

  • 連続言語拡散:デコーダー・インターフェース問題 [cs.CL, cs.LG]目的:言語拡散モデルにおけるデコーダーと表現の相互作用
    • 言語モデルの性能向上は,自然言語処理の基盤技術であり,多様な応用を可能にする。
    • 拡散言語モデルの内部状態がどのように言語的情報を保持しているのか,解釈が困難である。
    • 拡散過程におけるデコーダーの役割を明らかにし,モデルの評価方法を改善する。
    • ガウスノイズで破壊された埋め込み表現から,拡散言語モデルは流暢なテキストを生成できる。デコーダーが安定したトークンを読み取れる領域に到達することで,ノイズ除去が信頼できる。
    • デコーダーマージンと呼ばれる指標が,トークン復元の精度を左右する。マージンとローカルデコーダーの感度が重要であり,潜在空間のエラーだけでは説明できない。
    • 様々な拡散言語モデルにおいて,デコーダー・インターフェースの構造が共通して確認された。モデルの評価は,表現とデコーダーのシステムとして行うべきである。

    Link: https://arxiv.org/abs/2606.08810

  • LATTEArena:LLMを活用した表形式データの特徴量エンジニアリング評価フレームワーク [cs.AI]目的:LLMを活用した表形式データの特徴量エンジニアリング手法の評価
    • 表形式データ分析において特徴量エンジニアリングは不可欠であり,その自動化が求められている。
    • 既存の研究では,標準化された評価プラットフォームやコストを考慮した評価が不足している。
    • 多様な手法の性能を公平に比較し,実用的な展開のための指針を示すことを目指す。
    • LATTEArenaは,15種類の手法を6次元で分類し,標準化された評価環境を提供する。
    • 24種類の構成で7つの研究課題を検証し,予測精度,トークン効率,実行の安定性を定量化した。
    • その結果,コスト効率に関する17の知見と,実用展開のための3つの提言が得られた。

    Link: https://arxiv.org/abs/2606.09004

  • 個別化がん治療のための信念空間制御:能動推論によるアプローチ [cs.RO, cs.CL, cs.AI, cs.IT, math.IT]目的:個別化がん治療における最適な治療方針の決定
    • がん治療は患者の状態や反応が多様であり,個別化された治療計画が不可欠である。
    • 従来の強化学習は状態遷移の制御に重点を置いており,治療による患者の状態変化を考慮しにくい。
    • 能動推論を用いて,測定予算と治療効果を同時に最適化する治療計画を策定すること。
    • 実際の臨床データを用いて,患者の分類と高い治療効果を両立できることを示した。
    • 提案手法は,測定予算や治療の制約下においても有効であることが確認された。
    • 能動推論に基づく信念空間制御が,個別化がん治療の新たな道を示す可能性が示唆された。

    Link: https://arxiv.org/abs/2606.10376

  • 長期的な言語エージェントのための制約付き最適化による安全な記憶保持学習 [cs.AI]目的:長期的な言語エージェントにおける記憶保持戦略
    • 長期的なタスク遂行には,過去の情報保持が不可欠である。コンテキストウィンドウの制限下,どの情報を保持・破棄・再取得するかは重要課題。
    • 既存手法は,鮮度や関連性といった局所的な基準に依存し,将来的な情報取得失敗や陳腐化といった遅延コストを考慮していない。
    • 将来の情報要求を考慮した,効率的な記憶保持戦略を構築し,長期的なエージェントの性能を向上させる。
    • 本研究では,記憶保持を制約付き確率的最適化問題として定式化し,オンライン観測可能な信号のみを用いた学習による近似解法OSL-MRを開発した。
    • OSL-MRは,LoCoMoとLongMemEvalにおいて,既存のヒューリスティックや模倣学習ベースラインを凌駕し,特に厳しい予算制約下で優れた性能を示した。
    • 最適化と学習を組み合わせることで,長期的なエージェントの記憶機構の構築に向けたスケーラブルな基盤を提供することを示した。

    Link: https://arxiv.org/abs/2606.10616

  • 観察から介入へ:Mixture-of-Expertsモデルにおける専門家重要度の因果的監査 [cs.LG, cs.CL]目的:Mixture-of-Expertsモデルにおける専門家重要度の予測精度の評価
    • モデルの解釈可能性は,AIの信頼性と安全性を高める上で不可欠である。
    • 解釈手法では,観察されたモデルの挙動から介入効果を推測することが多いが,その妥当性は検証されていない。
    • 本研究は,MoEモデルにおける専門家重要度の予測精度を介入的な監査を通じて検証し,解釈手法の信頼性を評価する。
    • MoEモデルのプルーニングにおいて,利用率などの観察指標は,専門家の重要度を予測できないことが判明した。
    • 効果量はCohenのd=0.23以下であり,どの指標も信頼性のある正の相関を示さなかった。
    • トークンレベルでの介入実験では,特定の層で有意な信号が検出されたが,既存のプルーニング手法の成功は専門家選定の精度によるものではない可能性が示唆された。

    Link: https://arxiv.org/abs/2606.10703

  • 損失のある無線リンク上の受信および鮮度を考慮した集約による非同期分散型連合学習 [cs.IR, cs.LG, cs.DC]目的:損失のある無線リンクにおける分散型連合学習の効率化
    • IoTデバイス等の無線エッジノードを活用した連合学習は,データプライバシー保護と効率的なモデル学習を両立する手段として重要である。
    • 無線リンクの損失により,モデルパラメータの伝送が不完全になり,選択バイアスや更新の遅延が発生する。
    • オンラインチャネル推定と鮮度に基づいた重み付け集約により,選択バイアスを修正し,更新の遅延を緩和する。
    • 提案手法DFL-AAは,従来のゴシップ集約における選択バイアスを理論的に解消し,期待されるリンク品質の歪みを低減する。
    • DFL-AAは,様々な損失率やチャネル条件下で,最先端のベースライン手法と比較して一貫して高い性能を示す。
    • 鮮度に基づいた重み付け集約により,グローバルクロックを必要とせず,更新の遅延を効果的に抑制する。

    Link: https://arxiv.org/abs/2606.10774

  • DeMix:影響ベクトルによる多様なデータ誤り型の訓練データデバッグ [cs.LG, cs.IR]目的:訓練データの誤りサンプルと誤り型同時診断
    • 機械学習の性能は訓練データ品質に依存。実データは誤りを含み,性能低下の原因となる。
    • 既存手法では,誤り検出と誤り型特定が不十分。的確なデータ修正が困難。
    • 影響ベクトルを用いて誤りパターンを捉え,誤り型を正確に分類することを目指す。
    • DeMixは,様々なタスクにおいて最先端手法を大きく上回り,データデバッグF1スコアを22.61%向上。
    • データ修正後のタスクモデル性能も9.32%向上。実用的な効果が確認された。
    • モデル予測への訓練データの影響を分析し,誤り型固有のパターンを捉える点が特徴。

    Link: https://arxiv.org/abs/2606.11616

  • 時系列基盤モデル埋め込みによる剩余有用寿命推定 [cs.LG, cs.AI]目的:剩余有用寿命推定のための時系列基盤モデル埋め込み
    • 産業設備の予防保全は,ダウンタイム削減とコスト最適化に不可欠であるため重要性が高い。
    • 従来の機械学習手法は,特徴量エンジニアリングや大量のラベル付きデータが必要となる場合が多い。
    • 本研究は,データ効率の良いRUL推定手法を提供し,特徴量エンジニアリングの負担を軽減することを目指す。
    • 凍結された事前学習済み時系列基盤モデルChronos-2を活用することで,既存のRNN,CNN,Transformer等の性能を上回った。
    • 文脈長を長くすることで性能が向上し,TSFM表現が工業環境における実用的でデータ効率の良い選択肢となり得ることを示した。
    • 多変量センサーデータを用いた実験により,Chronos-2の特徴量がRUL推定において一貫して有効であることが確認された。

    Link: https://arxiv.org/abs/2606.11990

  • CAPED:コンテキスト認識型プライバシー露出防御システム - モバイルGUIエージェント向け [eess.SY, cs.SY, math.OC, cs.DC, cs.CR, cs.AI]目的:モバイルGUIエージェントにおける偶発的な視覚的プライバシー露出の軽減
    • スマートフォン利用が普及し,GUIエージェントによる自動操作が増加する中で,プライバシー保護が重要となっている。
    • 既存のプライバシー保護手法では,タスク遂行に必要な情報までマスキングしてしまうか,十分な情報マスキングができていない。
    • タスクに必要な情報のみを選択的に公開し,プライバシー漏洩を抑制する仕組みの開発を目指す。
    • CAPEDは,タスク要件と画面コンテキストを解析し,必要な情報のみを公開することで,プライバシー露出を抑制する。
    • AndroidWorldを用いた評価により,CAPEDはプライバシー漏洩を0.766から0.268に低減し,高いタスク遂行能力を維持することが示された。
    • タスク駆動型の選択的露出により,モバイルGUIエージェントへのスクリーンショット送信前の偶発的な視覚的漏洩を削減できることが確認された。

    Link: https://arxiv.org/abs/2606.12666

  • ウェアラブルデバイス向け脳波解析における深層学習モデルの複雑性削減 [cs.AI, cs.AR]目的:深層学習モデルの複雑性削減
    • ウェアラブルヘルスケアデバイス市場の急速な成長に伴い,脳波解析の重要性が増している。
    • 深層学習モデルは計算資源を多く必要とするため,ウェアラブルデバイスへの実装が困難である。
    • 脳波解析における深層学習モデルの複雑性を削減し,ウェアラブルデバイスでの利用を可能にすること。
    • パラメータ量子化と電極削減により,深層学習モデルの複雑性を大幅に削減できることが示された。
    • 削減手法を適切に適用することで,精度への悪影響を最小限に抑えつつ複雑性を軽減できる。
    • 本研究は,ウェアラブルデバイス向けオンライン脳波解析に深層学習を適応させる際の精度と複雑性のトレードオフを明確にする。

    Link: https://arxiv.org/abs/2606.12742

  • マルチモーダルグラフ負学習 [cs.LG]目的:マルチモーダル属性グラフにおけるノード表現の学習
    • 複雑な関係システムをより豊かにモデル化するため,グラフ構造と多様な属性を統合する研究が重要である。
    • 各モーダリティの質や構造的文脈によるバイアスにより,ノードごとに意味情報と信頼性が異なるという課題がある。
    • モーダリティ間の信頼性の低い合意によるバイアスの伝播を抑制し,正確なノード分類を可能にすることを目的とする。
    • 提案手法GraphMNLは,負学習をモーダリティ間ガイダンスとして活用するグラフ対応のマルチモーダル負学習フレームワークである。
    • GraphMNLは,信頼性仲裁による優勢/劣勢モーダリティの識別と,標的を保持した負学習により,高い性能を実現した。
    • Groceryデータセットで72.47%の精度,Reddit Mデータセットで76.60のF1スコアを達成し,最先端の結果を示した。

    Link: https://arxiv.org/abs/2606.12863

  • SMGFM:マルチモーダル属性グラフのスペクトルマルチモーダルグラフ事前学習 [cs.LG]目的:マルチモーダル属性グラフにおけるセマンティック役割の識別
    • グラフ構造とノードの意味的情報を組み合わせる研究は,様々な応用で重要性が増している。
    • マルチモーダル属性グラフでは,構造とモダリティ固有の意味が異なる影響を持つため,単純な結合が困難である。
    • グラフ周波数分解によるセマンティック役割の特定と,バンドレベルでの相互作用を通じて性能向上を目指す。
    • SMGFMは,各モダリティのノード信号をグラフ周波数帯域に分解し,セマンティック役割を割り当てる。
    • 周波数ルーティングに基づく目的関数は,スムーズな合意経路を維持しつつ,モダリティ固有の経路を保存する。
    • 実験結果から,SMGFMがグラフレベルおよびモダリティレベルのタスクで最先端の性能を達成することが示された。

    Link: https://arxiv.org/abs/2606.12867

  • 機械はどのような条件で真に創造的と言えるか [cs.AI, cs.CY]目的:機械の真の創造性の条件と,共有認知・創造的環境における人間の主体性の維持
    • AI技術の発展は,社会の様々な分野に革新をもたらす可能性を秘めている。
    • 現在のAIは生成能力が高いが,真の創造性とみなせるかどうかの明確な基準がない。
    • デザイン科学に基づき,機械の創造性を定義するための要件を提示し,真の創造性を探求する。
    • 機械の創造性は,出力の新規性や一時的なアーキテクチャのみでは定義できない。
    • 不完全な状況の構造的変換と,再帰的な介入ダイナミクスによって創造性が実現される。
    • 価値に基づいた範囲設定と人間とAIの共存が,創造的機械の知覚,衝突の特定,介入選択を形成する。

    Link: https://arxiv.org/abs/2606.13196

  • パーキンソン病歩行評価におけるインクリメンタル継続学習のためのモダリティ固有適応:MOSAIC [cs.AI]目的:パーキンソン病歩行評価における,モダリティ固有の適応手法
    • 歩行データに基づくパーキンソン病の評価は重要であり,異種センサーの活用が進んでいる。
    • 臨床システムでは,すべてのモダリティを同時に収集することは稀であり,過去のデータはプライバシーや保存容量の問題で利用困難な場合が多い。
    • 新たなセンサーへの適応や,過去の知識の維持,モダリティ固有の能力回復が課題である。
    • MOSAICは,新しいモダリティを学習する際の不安定性を緩和する「モダリティ固有のウォームアップ」を導入した。
    • センサーの統計情報を分離し,共通のセマンティックバックボーンを維持するMSBNアーキテクチャを提案した。
    • 過去の知識を維持しつつ,モダリティ固有の能力を回復させるための,カリキュラムに基づいた反発目的関数を設計した。

    Link: https://arxiv.org/abs/2606.13258

  • リーマン多様体上のウェルセンター化された三角形分割におけるガウス・ウィッテル・マターン場の近似 [math.NA, cs.LG, cs.NA, stat.ML]目的:ガウス・ウィッテル・マターン場の離散ガウスマルコフ確率場による収束的近似
    • 確率場は,空間統計学や機械学習など幅広い分野で重要な役割を果たす。
    • 高次元空間における確率場の効率的な計算が課題となっている。
    • リーマン多様体上の確率場を,汎用的な近似手法で効率的に計算することを目指す。
    • 本研究では,離散外微分計算(DEC)の発展に基づき,ガウス・ウィッテル・マターン場を近似する新しい手法を提案した。
    • 提案手法は,パラメータαとκに依存せず,精度行列と共分散行列を普遍的に近似できる。
    • また,点ごとの測定や区分的に平滑化された測定を等しく良く近似し,計算コストも低い。

    Link: https://arxiv.org/abs/2606.13827

  • クレイ-CNNハイブリッド:地形空間基礎モデルを補助コンテキストとして活用した地すべり検出 [cs.CV, cs.AI, cs.LG, eess.IV]目的:地すべり検出における精度向上
    • 災害対応において迅速な地すべりマッピングは不可欠であり,その自動化が求められている。
    • 地すべりデータはクラス間の不均衡が極めて大きく,自動化を困難にする要因となっている。
    • 地形空間基礎モデルをCNNに組み込むことで,地すべり検出の精度を向上させることを目指す。
    • クレイとU-Netを組み合わせたハイブリッドモデルが,テストF1スコア64.5±1.8%を達成し,クレイ単独(55.2±3.6%)やU-Netベースライン(59.9%)を上回った。
    • クレイを単独エンコーダーとして使用した場合,U-Netに劣る性能を示したが,補助コンテキストとして注入することで一貫して性能が向上した。
    • 地形空間基礎モデルは,空間的に詳細な畳み込みアーキテクチャを補完することで,地すべり検出において最も効果的であることが示唆された。

    Link: https://arxiv.org/abs/2606.14081

  • Zeta:座標適応事前条件付けによる行列最適化のための二重ホワイトニング [cs.LG]目的:行列最適化における二重ホワイトニング手法
    • 深層学習の規模拡大に伴い,行列構造を活用した最適化手法が重要性を増している。
    • 既存の行列対応型最適化手法は,入力条件に依存するが,モーメンタム行列の座標ごとのスケールに不均衡が生じる。
    • 本研究は,スケール不均衡を解消することで,より効率的な最適化と汎化性能の向上を目指す。
    • 提案手法Zetaは,座標ホワイトニングとスペクトルホワイトニングを組み合わせたパイプライン構造を持つ。
    • Zetaは,既存手法と比較して,言語モデリング,MoE,画像認識タスクにおいて同等またはそれ以上の性能を示す。
    • 座標ホワイトニングは,スペクトルホワイトニングが機能するために必要な統計的等方性を確立する。

    Link: https://arxiv.org/abs/2606.14187

  • AgentCyberRange:現実的なサイバー射程における最先端AIシステムのベンチマーク [cs.CR, cs.AI, cs.LG]目的:最先端AIシステムの自律的なサイバー攻撃能力の測定
    • サイバーセキュリティ分野において,AIの活用は急速に進んでおり,その性能評価が不可欠である。
    • 既存の評価手法では,現実的な侵入ワークフローを再現できず,AIの潜在的なリスクを把握することが困難である。
    • 現実的なサイバー射程環境下でのAIシステムの攻撃能力を評価し,新たなリスクを早期に発見することを目的とする。
    • AgentCyberRangeは,110の脆弱性を持つ15のWebアプリケーションと8つの企業環境を模したサイバー射程で構成された初の公開基盤である。
    • GPT-5.5 with Codexは,Webアプリケーションの脆弱性攻撃で16.1%,事後攻撃で31.7%のタスクを解決し,具体的なヒントを与えるとそれぞれ33.0%と46.3%に向上した。
    • 評価の結果,既知の脆弱性だけでなく,一般的なプロジェクトの未知の脆弱性やホスト防御を回避するペイロードの変異も観察された。

    Link: https://arxiv.org/abs/2606.14295

  • CADET:物理に基づいた因果監査と,学習不要なエンドツーエンド運転プランナーの交絡解消 [cs.RO, cs.AI]目的:エンドツーエンド運転プランナーにおける見かけ上の相関関係の監査,ベンチマーク,修復
    • 自動運転技術の安全性向上は重要であり,特に長尾のシナリオにおける信頼性が求められる。
    • 模倣学習に基づくプランナーは,因果関係のない要素に依存しやすく,それが信頼性を損なう可能性がある。
    • 既存のプランナーを再学習することなく,その誤った依存関係を特定し,改善することを目指す。
    • CADETは,既存のE2Eプランナーを再学習することなく,パラメータ更新なしで監査,ベンチマーク,修復を行うフレームワークである。
    • CADETは,従来の評価指標では検出が困難な,見かけの相関関係への依存を明らかにする。
    • 物理に基づいた因果監査により,プランナーが真に因果関係のある変数に基づいているか検証する。

    Link: https://arxiv.org/abs/2606.14438

  • シールドから標的に:LLMベースのエージェントガードレールのサービス拒否攻撃 [cs.CR, cs.AI]目的:LLMベースのガードレールの脆弱性とそのDoS攻撃の可能性
    • LLMエージェントの安全性確保は重要であり,特にプロンプトインジェクション攻撃からの防御が不可欠である。
    • 既存のガードレールは推論能力を利用するが,その能力が攻撃の起点となる可能性が認識されていなかった。
    • ガードレールの推論能力を悪用したDoS攻撃を明らかにし,可用性の問題を解決する必要がある。
    • 本研究では,自然言語で作成された攻撃Payloadを用いてガードレールの推論時間を大幅に増幅させる攻撃を実証した。
    • 攻撃は様々なガードレールアーキテクチャ,安全テンプレート,および主要なLLMバックボーンで有効であることが示された。
    • 単一の悪意のあるドキュメントで共有ガードレールインフラを飽和させ,他のエージェントを停止させることが可能である。

    Link: https://arxiv.org/abs/2606.14517

  • 軌道ルーティングによる因果的記憶:遅延エビデンスに基づく視覚運動模倣 [cs.RO, cs.AI]目的:遅延エビデンス課題における視覚運動模倣のための記憶フレームワーク
    • 自律動作ロボットの意思決定において,過去の情報が不可欠となる場面が増加している。
    • 視覚的情報が消失した後でも適切な行動を選択するためには,過去の情報を保持する必要がある。
    • 視覚的曖昧さを持つ分岐点での選択を改善し,タスク成功率を高めることを目指す。
    • TRACEは,ロボットの状態軌跡の特徴量を用いて,過去の視覚情報を効率的に記憶・検索する。
    • 従来の短期記憶や再帰型記憶と比較して,視覚的に曖昧な分岐点での選択精度が向上した。
    • TRACEは既存のポリシーアーキテクチャに容易に組み込むことができ,学習の安定性を損なわない。

    Link: https://arxiv.org/abs/2606.14551

  • いつ記述し,いつ抑制するか:経路特化型デュアルアダプターによるメモリ支援知識編集 [cs.LG]目的:知識編集における事実更新と周辺行動の維持
    • 大規模言語モデルの知識を効率的に更新する技術は,その実用性を高める上で不可欠である。
    • 既存の知識編集手法では,関連性の低い情報への影響を最小限に抑えることが課題となっている。
    • 経路特化型デュアルアダプターにより,編集の適用範囲を制御し,不要な影響を抑制することを試みる。
    • 提案手法は,CF,ZSRE,MQuAKEの3つのベンチマークにおいて,高い確率的選好精度を達成した。
    • Llama-3.1-8B-Instructでは,CFで0.8180,ZSREで0.8946,MQuAKEで0.9922の精度を記録した。
    • ルーターの性能評価から,適切なメモリ境界はデータセットによって異なることが示唆された。

    Link: https://arxiv.org/abs/2606.14668

  • Rational Sparse Autoencoder [cs.LG, cs.AI]目的:スパースオートエンコーダの解釈可能性向上
    • 機械学習モデルの内部動作を理解する上で,解釈可能性は重要である。
    • 既存のスパースオートエンコーダは,活性化関数の制約により柔軟性に欠ける。
    • Rational Sparse Autoencoderは,学習可能な活性化関数により,解釈性と性能を向上させる。
    • Rational Sparse Autoencoder (RSAE) は,既存のスパースオートエンコーダよりも再構成性能と下流タスクの性能が向上した。
    • RSAEは,ReLU,JumpReLU,TopKといった既存の活性化関数を均一に近似可能である。
    • RSAEは,わずかなパラメータ増加で,高速に学習可能である。

    Link: https://arxiv.org/abs/2606.14990

  • MimicIK:遠隔操作とFK整合性に基づくリアルタイム生成逆運動学 [cs.CL, cs.RO, cs.AI]目的:リアルタイムロボット操作のための,滑らかかつロバストな関節空間運動の事前分布学習
    • ロボットのリアルタイム操作において,逆運動学は重要な課題である。高精度な操作を実現するためには不可欠。
    • 従来の数値ソルバーは,特異点近傍で不安定になりやすい。学習に基づくアプローチは,精度と効率のバランスが難しい。
    • 遠隔操作データから学習することで,精度と安定性を両立し,リアルタイム性を実現することを目指す。
    • MimicIKは,6自由度ロボットデータセットにおいて,平均位置誤差4.65mm,10mm成功率92.01%を達成した。
    • UNet拡散ベースラインと比較して,空間精度と運動の滑らかさが向上し,推論速度が21.66msから6.74msに短縮された。
    • 分布外の配置に対しても安定しており,20Hzのリアルタイム制御を可能にした。

    Link: https://arxiv.org/abs/2606.15148

  • 大規模言語モデル駆動型協調オペレーターアンサンブル進化による並び替えフローショップスケジューリング [cs.NE]目的:並び替えフローショップスケジューリング問題に対するオペレーターアンサンブルの進化
    • インテリジェント製造における重要な最適化問題であり,生産効率向上に貢献する。
    • 従来の反復貪欲法は単一の破壊オペレーターに依存し,大規模問題で探索が停滞しやすい。
    • 大規模言語モデルを用いて高品質なオペレーターアンサンブルを自動構築し,探索性能を向上させる。
    • 提案手法IG-DOEは,既存の最先端IGアルゴリズムQIGよりも優れた平均性能を示した。
    • 小さい問題インスタンスで進化させたオペレーターアンサンブルは,より大規模な未知の問題にも汎化する。
    • 実世界の工業データからも,異なるデータ分布への有効な汎化能力が確認された。

    Link: https://arxiv.org/abs/2606.15334

  • 開放的知能のための構成的フレームワーク [cs.LG]目的:開放的知能の数学的定式化と,無限適応応答を可能にする構成的閉包の特性
    • 人工知能の発展において,未知の問題や環境への適応能力は重要な課題である。
    • 従来のAIは,学習データに依存し,汎化性能に限界があるという問題点を抱えている。
    • 本研究は,限られた要素の組み合わせによる無限の適応能力を実現するフレームワークを提示する。
    • 開放的知能を,限られた原始集合と構成演算子によって誘導される構成的閉包として形式化している。
    • この閉包の特性は,タスクや環境の多様性にわたる無限の構成的生成を可能にすると示されている。
    • 次の原始予測(NPP)を新たなアーキテクチャ目標として提案し,再利用可能なアルゴリズム原始と文法の獲得を促す。

    Link: https://arxiv.org/abs/2606.15386

  • 貪欲座標拡散:拡散ガイダンスによる効果的かつ意味的に一貫した敵対的攻撃 [cs.DC, cs.LG, cs.CR]目的:大規模言語モデルに対する敵対的攻撃の生成
    • 言語モデルの安全性評価において,敵対的攻撃は脆弱性を明らかにする重要な手法である。
    • 既存の最適化ベースの攻撃は,意味的に不自然な出力を生成しやすく,防御機構に容易に検出される。
    • 意味の一貫性を保ちつつ,目的とする応答を引き出す敵対的攻撃手法の開発。
    • 提案手法GCDは,勾配への直接アクセスを必要とせず,グレーボックス環境で動作可能である。
    • GCDは,高い攻撃成功率(ASR)を達成しつつ,応答品質においても競争力のある結果を示した。
    • 生成された敵対的プロンプトは,Perplexityベースやガードモデルによる検出率が低いことが示された。

    Link: https://arxiv.org/abs/2606.15531

  • QoSを考慮したトークンスケジューリングとマルチモーダルエージェントネットワークにおけるプライベートデータ評価 [cs.AI, cs.CR]目的:マルチモーダルエージェントネットワークにおける公平なトークン配分およびプライベートデータ評価
    • AIサービスの価値は人間生成データに依存する。分散型システムでのデータ管理が重要視されている。
    • クラウド集中型処理は,データ主権を低下させ,QoSを悪化させる可能性がある。
    • 分散・制約のある環境で,データの質と貢献度に応じた公平な評価を目指す。
    • 提案手法は,マルチモーダルデータを共有セマンティック空間に埋め込み,差分プライバシーを適用したプロトタイプを生成する。
    • 公平なトークン配分スキームは,効果的な貢献を報酬化し,データ異質性やAIリソース不足に強い。
    • シミュレーションにより,貢献度に基づく公平性とQoSが向上し,画像再構成攻撃への耐性も強化された。

    Link: https://arxiv.org/abs/2606.15573

  • EHRNote-ChatQA:縦断的な退院サマリーを用いた根拠に基づいた複数回の臨床質問応答のためのベンチマーク [cs.CL, cs.AI]目的:縦断的な退院サマリーを用いた,根拠に基づいた複数回の臨床質問応答に関するベンチマーク
    • 患者の入院全体の経過を記録する退院サマリーは,再入院防止や診断に不可欠である。
    • 既存のベンチマークは,臨床的な知識の試験形式や,単一ターンでの質問応答に偏っている。
    • 複数回のサマリーを跨いだ,根拠に基づいた臨床質問応答を評価できるベンチマークの必要性。
    • EHRNote-ChatQAは,967例の患者データと16,072件の医療専門家による検証済みQAペアを含む。
    • LLMは,内容回答よりも根拠の提示に苦労しており,複数ターンのエラーが累積する傾向にある。
    • 単一ターンの臨床QAの性能は,この設定では必ずしも信頼できるものではないことが示された。

    Link: https://arxiv.org/abs/2606.15735

  • カシミール語ダイアクリティカー:カシミール語ダイアクリティック復元のためのバイトレベルのシーケンス・ツー・シーケンスモデル [cs.CL, cs.AI]目的:カシミール語テキストにおけるダイアクリティック復元
    • カシミール語はデジタルテキストでダイアクリティック記号が省略されがちであり,NLP処理に支障をきたす。
    • デジタル化されたカシミール語テキストには,ダイアクリティック記号の欠如による曖昧性が存在する。
    • カシミール語のダイアクリティック復元を自動化し,NLPタスクの精度向上を目指す。
    • 提案モデルKoshur Diacritizerは,バイトレベルのシーケンス・ツー・シーケンスモデルであり,高い復元性能を示す。
    • テストセットにおけるDERmは0.2012,WERは0.2159を達成し,カシミール語話者による評価では平均精度77.5%となった。
    • データセット,モデル,およびソースコードを公開し,今後の研究の基盤を提供する。

    Link: https://arxiv.org/abs/2606.15883

  • 制御平面の配置が忘却を形成する:13種類のシステム構成におけるエージェントメモリのアーキテクチャ研究 [cs.CL, cs.AI]目的:エージェントメモリにおける忘却失敗モードの回復特性
    • 大規模言語モデル(LLM)を活用したエージェントシステムが発展している。
    • 既存のベンチマークは検索性能に偏っており,忘却に関する評価が不十分である。
    • 忘却のメカニズムを理解し,システム構成の最適化を目指す。
    • LLMの配置場所によって,回復可能な忘却失敗モードが異なることが示された。
    • 決定論的プリミティブは,語彙・時間的なカテゴリには有効だが,正準化には課題がある。
    • 挿入時および変異時のLLMを活用することで,正準化と意図に基づいた削除の両方を改善できる。

    Link: https://arxiv.org/abs/2606.15903

  • Mind-Studio:先読み評価による部分観測ゲームのための実行可能世界モデル [cs.CL, cs.HC, cs.AI]目的:部分観測ゲームにおける実行可能世界モデルの合成
    • ゲームAIの発展には,環境を理解し予測する能力が不可欠である。
    • 既存手法では,完全なプログラムとしての実行が困難な場合が多い。
    • LLMを用いて,環境のダイナミクスを記述する実行可能な世界モデルを構築する。
    • Mind-Studioは,状態・行動・次の状態の軌跡から,pygame形式で実行可能な世界モデルを合成する。
    • モンテズマの復讐において,次の状態の予測精度をPoE-Worldの0.3%から48.7%に向上させた。
    • Alien,Assault,Skiingにおいても,既存の手法より高い分岐レベルの忠実性を実現した。

    Link: https://arxiv.org/abs/2606.16070

  • MASCOT-Android:Androidマルウェアのソースコード標本のキュレーション済みデータセットと自動収集パイプライン [cs.CR, cs.AI]目的:Androidマルウェアのソースコード標本データセットおよび自動収集フレームワーク
    • マルウェア解析において,攻撃者の意図を直接的に把握できるソースコードは重要である。
    • マルウェアのソースコードは入手が困難であり,手動レビューのコストが高いという課題がある。
    • GitHubにおけるマルウェアソースコードの効率的な収集を可能にする。
    • リポジトリレベルのドキュメントが,マルウェアソースコード収集の強力な指標となることが判明した。
    • READMEファイルのみを用いたモデルは,96.28%の精度と1.06%のFPRを達成した。
    • モデルが出力する信頼度スコアにより,誤検知率と網羅性のバランスを調整できる。

    Link: https://arxiv.org/abs/2606.16072

  • 医療ヒューリスティック学習:解釈可能かつ監査可能な臨床的意思決定ルールを構築するためのLLM駆動型フレームワーク [cs.AI, cs.HC, cs.LG]目的:臨床テーブルデータの予測モデリングにおける,解釈可能な意思決定ルールの構築
    • 臨床意思決定支援は医療の質向上に不可欠であり,高い予測性能と透明な意思決定ロジックが求められる。
    • 深層学習や木構造アンサンブル法は高精度だが,そのブラックボックス性が臨床現場への導入を阻害する要因となっている。
    • 限られたデータサイズ,クラス不均衡,診断基準の変化といった医療データ特有の問題に対応し,透明性と適応性を両立する。
    • MHLは,勾配降下法に頼らず,LLMを活用して統計的プローブ,医療知識プローブ,ルール合成,コードレベルでの反復改善を組み合わせる。
    • その結果,不透明なパラメータではなく,バージョン管理された純粋なPythonの決定ルールとして表現され,解釈性と監査可能性を確保する。
    • 実験により,MHLは最先端の手法と同等の性能を維持しつつ,小規模データや不均衡データにも強いことが示された。

    Link: https://arxiv.org/abs/2606.16337

  • 順序類似度を用いたスケーラブルで解釈可能な表現アラインメント [cs.LG, stat.ML]目的:表現アラインメントの評価
    • 表現学習において,表現の類似性評価は不可欠な要素である。
    • 既存の評価指標は,解釈性の欠如,外れ値への脆弱性,大規模データへの適用困難といった課題を抱えている。
    • 本研究は,これらの課題を解決し,スケーラブルなアラインメント評価手法を提案する。
    • 順序類似度フレームワーク(TSIとQSI)を開発し,順序関係の一貫性を定量化することでアラインメントを測定する。
    • この定式化が,解釈可能性,外れ値へのロバスト性,計算効率において優れていることを理論的に証明した。
    • TSIと最近傍探索によるアラインメント(Mutual Nearest Neighbors)の形式的な等価性を示すことで,検証を行った。

    Link: https://arxiv.org/abs/2606.16379