arXiv雑要約

AI - 2026/06/17 公開

  • ペアで正しく,分割すると誤り:MLLMにおけるモダリティ固有ニューロンの分離と編集 [cs.LG, cs.AI, cs.CL]目的:MLLMの知識編集におけるデカップリング失敗の軽減
    • MLLMはマルチモーダルな情報を扱えるため,多様な応用が期待されている。
    • 知識編集は有効だが,ペア入力で更新しても,単一モダリティ入力で知識が元に戻る問題がある。
    • モダリティ固有のニューロンを分離し,ターゲットとなる知識編集を可能にすることを目指す。
    • 本研究では,MLLM内の知識が統一された表現ではなく,モダリティ固有の経路に分散して保存されていることを明らかにした。
    • 提案手法DECODEは,モダリティ固有のニューロン群を明示的に分離し,知識編集のデカップリング失敗を軽減する。
    • DECODEは,異なるモダリティのトリガー下でも効果的な知識更新を可能にし,一貫した結果を示す。

    Link: https://arxiv.org/abs/2606.17057

  • P2PネットワークにおけるLLM分散推論に向けた試み [cs.DC, cs.DC, cs.AI]目的:LLM推論の低遅延化
    • LLMの高性能化と普及に伴い,効率的な推論手法が求められている
    • 大規模なキャッシュ再利用は,ノード間での分散が課題となっている
    • P2Pネットワークにおけるキャッシュを考慮したルーティングで解決を目指す
    • 分散ルーティングは,低通信遅延かつ偏ったプレフィックス分布下でレイテンシを改善する
    • 高ネットワーク遅延やアフィニティによるホットスポットは,効果を限定する
    • 一貫性の弱さによる影響は,キャッシュミスに留まり,正当性を損なわない

    Link: https://arxiv.org/abs/2606.17059

  • 意味抽出:URDFからのロボットオントロジーのLLM誘導自動入力 [cs.RO, cs.AI]目的:ロボットオントロジーの自動生成
    • 人間とインタラクトするロボットには,環境と自身の構造を意味的に理解する表現が不可欠である。
    • ロボットオントロジーの作成は有効だが,手動での構築に多大な労力が必要となる。
    • URDFモデルから意味のある情報を抽出し,オントロジーを自動的に生成することで,この課題を解決する。
    • 提案手法では,LLMを活用してURDFの識別子から意味を推論し,既存のオントロジーとの整合性を保つ。
    • 複数のLLMのクエリ結果に多数決を用いると共に,構文およびスキーマレベルの検証を行うことで,信頼性を向上させている。
    • 実験結果から,本手法がロボットの低レベルな記述と人間とロボットのインタラクションに必要な構造化された知識表現との間のギャップを埋めることが示された。

    Link: https://arxiv.org/abs/2606.17073

  • プリント基板の設計とテストにおけるGenAIベースの自動化に関する調査 [cs.AR, cs.AI]目的:プリント基板の設計とテストにおけるGenAIベースの自動化の現状と課題
    • 複雑なシステムの開発効率化が求められており,ハードウェア設計の自動化にGenAIの応用が期待されている。
    • GenAIの応用は集積回路設計に集中しており,プリント基板設計への適用は十分ではない。
    • プリント基板設計ライフサイクル全体におけるGenAIの活用状況を把握し,課題と将来の研究方向性を示す。
    • 本調査では,プリント基板設計のサプライチェーンからテストまで,GenAIの活用事例を分類・整理した。
    • ドメイン固有のデータ不足や既存のPCBツールとの統合の困難さが,GenAIの課題として特定された。
    • プリント基板の設計とテストにおけるGenAIの更なる統合の機会が数多く残されていることが示唆された。

    Link: https://arxiv.org/abs/2606.17074

  • HRDX:大規模ベクトルHDマップデータセット [cs.RO, cs.AI, cs.CV]目的:大規模ベクトルHDマップ構築のためのデータセット
    • 自動運転の信頼性向上には,高精度でセマンティック情報が豊富なHDマップが不可欠である。
    • 既存の公開HDマップデータセットは規模が小さく,セマンティック属性も限定的である。
    • 大規模かつ多様なデータを用いて,HDマップ構築技術の進展を目指す。
    • HRDXは,約40時間の走行データ(1,400km)を含む大規模なベクトルHDマップデータセットである。
    • 航空画像とのアライメントにより,幾何学的精度とセマンティック情報の両方を向上させることが示された。
    • HRDXは,HDマップ学習やマルチモーダルBEV融合に関する研究を促進するための基盤となる。

    Link: https://arxiv.org/abs/2606.17080

  • 分散推論における無秩序の代償 [cs.AR, cs.AI, cs.DC, cs.GT, cs.PF]目的:分散推論アーキテクチャにおける無秩序の代償の定量化と改善策の提案
    • 大規模言語モデルの推論需要増大に伴い,GPUリソースの効率的な利用が重要となっている。
    • 分散推論アーキテクチャでは,prefillとdecode間のリソース競合がボトルネックとなりやすい。
    • GPU飽和度に応じてルーティングパラメータを調整し,無秩序の代償を低減する手法を開発する。
    • 分散推論を3つのゲームとしてモデル化し,GPU飽和度がゲームの特性に影響を与えることを示した。
    • 適応的なルーティングコントローラーを設計し,飽和度に応じてルーティングパラメータを調整することで性能向上を実現した。
    • 70B 1P/5D構成では,飽和相における無秩序の代償を3.1倍に低減し,スループットの低下を13%に抑えた。

    Link: https://arxiv.org/abs/2606.17081

  • ParkingTransformer:LLMを活用した自律駐車のためのエンドツーエンド軌道計画 [cs.RO, cs.AI]目的:自律駐車のためのエンドツーエンド軌道計画手法
    • 自動運転技術において,自律駐車は重要な課題であり,その実現が求められている。
    • 既存手法はブラックボックス的であり,高レベルな意味理解や解釈性が不足している。
    • 道路から目標駐車スペースまでのシームレスな長距離自律駐車を可能とする。
    • 提案手法ParkingTransformerは,マルチビュー知覚とLLMのシーン理解能力を活用することで,高精度な軌道計画を実現した。
    • CARLAシミュレーター上では61.32のドライビングスコア,実車実験では88.70%の成功率を達成し,有効性が確認された。
    • 3D位置エンコーディングや固定ウィンドウストリーミング機構により,空間認識能力の向上と処理効率の改善に貢献した。

    Link: https://arxiv.org/abs/2606.17082

  • ZIVARI-TLBO:教示学習型最適化におけるゼロコストのグループ間評価エリートリレー機構 [cs.NE, cs.AI]目的:教示学習型最適化のグループ間エリートリレー機構の性能評価
    • 最適化問題は科学技術の発展に不可欠であり,効率的な解法が求められている。
    • 既存の最適化手法では,計算コストや局所解への陥りが課題となる場合がある。
    • 本研究は,計算コストを抑えつつ,探索性能を向上させるリレー機構を提案する。
    • 提案手法ZIVARI-TLBOは,既存のグループ化手法と比較して,728勝/11分/221敗という結果を示した。
    • 多次元比較では,WOAに次いで2位の成績であり,TLBOやDE,PSO,GWOなどの手法を統計的に有意に上回った。
    • 制約付き工学問題における結果は混在しており,ペナルティ項の定式化に依存する傾向が見られた。

    Link: https://arxiv.org/abs/2606.17087

  • ANEForge:Apple Neural Engine の直接計算のためのPython [cs.PL, cs.AI, cs.MS]目的:Apple Neural Engine の直接制御と計算処理
    • モバイルデバイスにおけるAI処理の高速化が重要視されている。
    • CoreML 経由では ANE の潜在能力を最大限に引き出せていない。
    • CoreML を介さずに ANE を直接制御し,パフォーマンスを向上させる。
    • ANEForge は,CoreML を使用せずに ANE を直接プログラムする Python パッケージである。
    • ANEForge は 58 個の融合演算子と 19 個のネイティブブリッジ演算子からなる遅延テンソルグラフを ANE プログラムにコンパイルする。
    • ResNet-18 の推論処理を 0.33ms で実行可能であり,フレームワーク参照と同等の性能を示す。

    Link: https://arxiv.org/abs/2606.17090

  • 人工生命における多規模パスダイバージェンスによる開放的進化の誘導 [cs.NE, cond-mat.stat-mech, nlin.CG]目的:人工生命における開放的進化の方向性
    • 複雑系の理解は,生命現象の根源的な理解に不可欠である。
    • 従来の開放的進化指標は解釈が難しく,物理理論との繋がりが希薄である。
    • 多規模パスダイバージェンスを用いて,複雑性と進化の物理的基盤を明らかにする。
    • 多規模パスダイバージェンス(MSPD)は,局所遷移規則における多規模組織化を定量化するスカラーである。
    • MSPDは,ランダムパラメータと比較して,より高い複雑性スコアを示すパラメータを生成した。
    • MSPDは,スケール依存的なフラストレーションを捉え,生物学的複雑性の物理学との繋がりを提供する。

    Link: https://arxiv.org/abs/2606.17091

  • 長距離シングルショットフリンジ投影プロファイロメトリにおける形状事前知識のショートカットの診断と修復 [cs.LG, eess.IV]目的:長距離における形状事前知識による誤りを診断し,それを修正する手法の開発
    • フリンジ投影プロファイロメトリは,非接触三次元計測技術として広く利用されており,産業界等での応用が期待される。
    • 長距離計測では,信号の減衰やノイズの影響が大きく,単一画像からの正確な形状復元が困難である。
    • 形状事前知識に依存した推定を回避し,正確なフリンジ位相デコードに基づく計測を実現することを目指す。
    • メカニスティック解釈性と不確実性定量化により,既存モデルが形状事前知識によってタスクを解決していることを特定した。
    • 形状事前知識による解を排除するため,位相マップを直接出力するPhiCalNetを提案し,アーキテクチャを修正した。
    • PhiCalNetは,既存モデルと比較して計測誤差を大幅に低減し,不確実性定量化の結果も診断と一致した。

    Link: https://arxiv.org/abs/2606.17093

  • ソフトウェア委任契約:AIコーディングエージェントの作業におけるレビュー可能性の測定 [cs.SE, cs.AI]目的:AIコーディングエージェント作業におけるソフトウェア委任契約の効果測定
    • AIによるソフトウェア開発が普及し,コード品質の保証が重要な課題となっている。
    • 委任されたコーディング作業において,レビューの効率性と正確性が課題となっている。
    • ソフトウェア委任契約がレビュー可能性に与える影響を定量的に評価すること。
    • 明示的な委任契約は,客観的なタスクの成果を改善しなかった。全ての実行が非公開の受容テストに合格した。
    • しかし,レビュー可能性は向上した。証拠の十分性が22/30のペア比較で改善し,曖昧さは減少した。
    • 契約によってレビューに必要な情報(変更ファイルリスト等)が明確化され,エージェントのトークン消費量は13%増加,実行時間は38%増加した。

    Link: https://arxiv.org/abs/2606.17099

  • LLM推論におけるAIアクセラレータのPrefill/Decode認識評価 [cs.HC, cs.AR, cs.AI, cs.DC]目的:LLM推論の効率性に関する評価
    • LLMの利用拡大に伴い,低遅延かつ低コストな推論が重要課題となっている。
    • GPUが主流だが,AIアクセラレータの優位性は状況によって異なり明確ではない。
    • Prefill/Decodeフェーズごとの性能を評価し,アクセラレータの特性を明らかにする。
    • GPUは計算負荷の高いPrefillフェーズで優位性を示す。
    • GroqRackはDecodeフェーズにおいて,特にバッチ処理を伴わない場合にTPOTが大幅に低い。
    • バッチサイズが増加すると,GPUはDecodeスループットで優位性を回復する。

    Link: https://arxiv.org/abs/2606.17104

  • 臨床時系列データの不規則性生成のための情報欠損 [cs.LG, cs.CY]目的:臨床時系列データにおける情報欠損の生成
    • 電子健康記録の活用は医療の質向上に不可欠。検査データはその重要な要素である。
    • 検査データの欠損は無作為ではなく,臨床的意思決定や患者の状態を反映する。
    • 欠損情報を考慮したデータ生成により,より現実的な臨床データの合成を目指す。
    • 拡散モデルを用いて,検査値と観察パターンの同時モデリングを実現した。
    • 生成されたデータは,実際の患者データと類似した検査値分布と欠損パターンを示す。
    • 本研究は,臨床基盤モデル開発の初期段階として有用である可能性を示唆する。

    Link: https://arxiv.org/abs/2606.17106

  • 事前計算時のモデルはメモを取る:KVキャッシュは編集可能であり,合成可能である [cs.LG, cs.AI]目的:事前計算時のKVキャッシュの編集と合成の可能性
    • 大規模言語モデルの効率的な推論が重要視されており,計算コストの削減が課題となっている。
    • 従来のprefix cachingは,わずかな変更でキャッシュ全体が無効になるという課題があった。
    • KVキャッシュの編集と合成により,キャッシュの再利用性を高め,推論速度を向上させることを目指す。
    • モデルは事前計算時にフィールドの状態に基づいて結論をKVキャッシュに記録しており,その後の処理に影響を与えていることが明らかになった。
    • KVキャッシュの特定フィールドを編集することで,Chain-of-Thoughtを用いると,高い精度で推論結果を修正できることが示された。
    • KVキャッシュを合成することで,事前計算済みのスキルを任意の文脈に組み込むことが可能となり,計算コストを大幅に削減できることが示された。

    Link: https://arxiv.org/abs/2606.17107

  • タイムスタンプを考慮した時空間グラフ対照学習によるネットワーク侵入検知 [cs.CR, cs.AI, cs.LG]目的:ネットワーク侵入検知のための時空間グラフ対照学習手法
    • ネットワークセキュリティの重要性が高まる中で,異常な通信パターンを検知する技術は不可欠である。
    • 既存手法は時間的な依存関係を無視し,未知の攻撃への対応が困難な場合がある。
    • 本研究は,時間情報を活用し,未知の攻撃に対する汎化性能を高めることを目指す。
    • 提案手法は,ネットワークトラフィックの時系列グラフを構築し,E-GraphSAGEとLSTMエンコーダを用いて時間情報と空間依存性を抽出する。
    • マルチビューグラフ対照学習により,時間的連続性,構造的一貫性を維持し,表現学習の汎化性能とロバスト性を向上させる。
    • 実験結果から,提案手法は既存の自己教師あり学習手法を凌駕し,教師あり学習の最先端手法に匹敵する性能を示す。

    Link: https://arxiv.org/abs/2606.17109

  • LLMの損失地形汚染:LLMからの未学習データの標的抽出 [cs.CR, cs.LG]目的:LLMからの未学習データの抽出
    • LLMは機密データで学習されることが多く,情報漏洩対策は重要である。
    • LLMの学習データからの機密情報の抽出攻撃が懸念されている。
    • 学習データへの汚染によって標的データの抽出を可能にすること。
    • 学習データの一部を汚染することで,アクセス不能な標的レコードの漏洩を誘発できる。
    • 損失地形を操作し,標的データ周辺に鋭い損失最小値を生成することで,モデルは標的を記憶する。
    • 差分プライバシーによる防御を回避する損失地形の直接的な探索攻撃も存在する。

    Link: https://arxiv.org/abs/2606.17110

  • 因果推論におけるモデル選択の重要性:薬物安全性監視のためのInferBERTフレームワーク内における分類モデルの比較分析 [cs.LG, cs.CL]目的:薬物安全性監視における因果推論の精度向上
    • 薬物安全性監視は,医薬品の副作用を早期に検出し,患者の安全を守る上で不可欠である。
    • 副作用と因果関係のない相関関係を見分けることが困難であり,誤った判断につながる可能性がある。
    • InferBERTフレームワークにおけるモデル選択が,因果推論の精度に与える影響を明らかにすること。
    • BioBERTが両データセットにおいて最も高い精度を達成し,ドメイン固有の事前学習の有効性が示された。
    • 大規模言語モデルであるMed-LLaMAは,サイズにもかかわらず期待通りの性能を発揮しなかった。
    • ドメインを意識した管理可能なモデルへの投資が,単にモデルサイズを拡大するよりも効果的であることが示唆された。

    Link: https://arxiv.org/abs/2606.17113

  • 現実的なシナリオにおけるツール使用LLMエージェントのデータ漏洩リスク評価 [cs.CR, cs.AI]目的:ツール使用型LLMエージェントにおけるデータ漏洩リスク
    • 企業や個人利用でLLMエージェントが増加しており,機密情報へのアクセス管理が重要になっている。
    • 既存研究は悪意のあるデータ抽出に焦点を当てており,通常の利用におけるデータ漏洩リスクは未解明である。
    • 現実的な非悪意的なタスクでのデータ漏洩リスクを評価し,安全な運用方法を確立することを目指す。
    • 3つのエージェント全てで,全てのシナリオにおいて完全な正解と安全な実行は確認されなかった。
    • タスクの成功とデータ処理の失敗(不必要な情報アクセスや不適切な開示)が同時に発生し,能力と安全性の評価分離の必要性が示唆された。
    • 本研究は,敵対的抽出とは異なる,運用上のデータ漏洩が重要な安全上の懸念事項であることを示している。

    Link: https://arxiv.org/abs/2606.17114

  • プロービング,融合,信頼性:マルチモーダルがん解析のための基盤モデル表現の体系的な評価 [cs.LG, cs.AI, q-bio.QM]目的:マルチモーダルがん解析のための基盤モデル表現の性能評価
    • 医療分野におけるAI活用は,診断精度向上や個別化医療の実現に不可欠である。
    • 基盤モデルの汎化性能,特に分布シフト下における性能は,臨床応用において課題となる。
    • 異なるモダリティの情報を融合することで,よりロバストで信頼性の高い解析を目指す。
    • 基盤モデル表現は,分布外データに対しても競争力のある性能を発揮することが示された。
    • マルチモーダル融合は,単一モダリティが支配的でない場合に特に有効である。
    • 確証的予測により,予測が失敗した場合でも真の診断を回復できる場合が多いことが確認された。

    Link: https://arxiv.org/abs/2606.17115

  • MoEマルチモーダルLLMのためのモダリティ分解エキスパートレベル混合精度量子化 [cs.LG, cs.AI]目的:MoEマルチモーダルLLMの圧縮によるGPUメモリコスト削減
    • MoEマルチモーダルLLMは高性能だが,GPUメモリ消費量が非常に大きい。
    • 既存のエキスパートレベル混合精度量子化はMoE-MLLMで性能劣化を起こしやすい。
    • モダリティ分解によるエキスパート選択頻度のバイアス解消と量子化感度評価。
    • MODEはMoE-MLLMに特化しており,W3A16設定で平均性能損失を2.9%以内に抑制。
    • 2ビットという極端な設定下でも,より大きな性能向上を実現。
    • モダリティごとのエキスパート選択頻度分解と冗長な視覚トークンのフィルタリングが有効。

    Link: https://arxiv.org/abs/2606.17118

  • グラフニューラルネットワークによるサイバーセキュリティとドローンインテリジェンスの統合:イスラエル・イラン紛争における応用 [cs.CR, cs.AI]目的:サイバーセキュリティとドローン管理の支援
    • 物理サイバーシステムは新たな脅威をもたらすため,その検知と迅速な対応が重要である。
    • サイバー攻撃とUAVの連携は複雑化しており,既存の手法では対応が困難である。
    • グラフニューラルネットワークを用いて,状況認識と迅速な対応能力の向上を目指す。
    • グラフニューラルネットワークが侵入検知システムの精度向上に貢献することが示された。
    • 提案手法は,従来のGCNやGATと比較して高い性能を示すことが実証された。
    • 本研究は,動的なサイバー物理システムのセキュリティ強化に貢献する可能性を示す。

    Link: https://arxiv.org/abs/2606.17119

  • ノイズ駆動による準安定相からの脱出が深層ニューラルネットワークにおけるグロッキングを説明する [cs.LG, physics.chem-ph]目的:深層ニューラルネットワークにおけるグロッキング現象のメカニズム解明
    • 深層学習は強力な汎化能力を持つが,その学習過程には未解明な点が多い。
    • ネットワークが準安定状態に陥りやすく,学習が進まない場合がある。
    • ノイズ駆動による脱出が,グロッキングの遅延した汎化開始を説明することを示す。
    • 線形DNNにおいて,L2正則化による準安定状態へのトラップと,ノイズ駆動による脱出がグロッキングを再現した。
    • 脱出時間とエネルギー障壁の高さが,Arrhenius則に従うことが示された。
    • メタ安定状態の数は,学習可能な特徴量の数と等しい可能性が示唆された。

    Link: https://arxiv.org/abs/2606.17120

  • TrustErase:パスポート埋め込み表現を用いた検証可能な即時機械アンラーニング [cs.CR, cs.AI, cs.LG]目的:検証可能でデータ不要な機械アンラーニングフレームワーク
    • AIのプライバシー保護需要が高まり,機械アンラーニングの必要性が増している。
    • 既存手法は検証が難しく,計算コストが高いという課題がある。
    • パスポート埋め込み表現により,高速かつ検証可能なアンラーニングを実現する。
    • TrustEraseは,モデルのパラメータ効率的な適応層内でパスポートを暗号鍵として扱い,再学習や微調整なしに特定のクラスやデータセットを削除可能である。
    • 特異値分解によりパスポートをモデルの重みに隠蔽し,アンラーニング操作の透明性と証明可能性を確保している。
    • MNIST,CIFAR10,CIFAR100での評価において,既存の最先端手法と同等またはそれ以上の性能を示し,データ不要な環境下で動作する。

    Link: https://arxiv.org/abs/2606.17122

  • モデル派生チェーンにおける貢献追跡のためのマルチユーザーホワイトボックス透かし [cs.CR, cs.AI]目的:モデル派生チェーンにおける貢献の追跡と検証
    • 大規模言語モデルの利用拡大に伴い,モデルの来歴管理と知的財産の保護が重要になっている。
    • 既存の透かし技術は単一ユーザー向けであり,モデルの反復的な派生や段階的な更新に耐性がない。
    • マルチユーザー環境におけるモデル派生チェーンに対応し,貢献者の透かしを保護することを目的とする。
    • LineageMarkは,モデルパラメータに投影ベースのアプローチを用いて透かしを埋め込む。
    • マルチ段階のモデル派生においても貢献者の透かしを維持し,複数ユーザーによる透かし挿入をサポートする。
    • 再透かし,ファインチューニング,量子化,プルーニングといった摂動に対しても堅牢性を示す。

    Link: https://arxiv.org/abs/2606.17123

  • 歌声変換におけるビブラート表現制御:独立制御の改善 [cs.SD, cs.AI]目的:歌声変換のためのビブラート表現制御手法
    • 歌声表現において,歌い方は重要な要素であり,感情やニュアンスを伝える上で不可欠である。
    • 既存手法では,ピッチとエネルギーが混在し,歌い方の制御が困難な場合がある。
    • ピッチとエネルギーの分離,およびビブラートの独立制御を実現し,より自然な歌声変換を目指す。
    • 提案手法VibE-SVC2は,ピッチスタイルとティンバースタイルという2種類の歌い方を制御可能である。
    • エネルギー変換器とゼロショットピッチスタイル変換器により,ピッチとエネルギーの絡み合い問題を解決し,より自然な変換を実現した。
    • 副次波形補正アルゴリズムにより,サブハーモニクスを含む音声のF0推定精度を向上させ,変換品質を高めた。

    Link: https://arxiv.org/abs/2606.17126

  • PromptMN:疑似プロンプト言語 [cs.CL, cs.HC, cs.MA, cs.CL, cs.AI, cs.HC, cs.PL, cs.SE]目的:生成AIへの指示方法の明確化
    • 生成AIの利用拡大に伴い,人間とAI間のインターフェースとしてのプロンプトの重要性が増している。
    • 自然言語によるプロンプトは曖昧になりやすく,AIの誤動作の原因となることがある。
    • PromptMNは,プロンプトの曖昧さを解消し,AIとの連携を円滑にすることを目的とする。
    • PromptMNは,役割,目標,制約などを%記号で始まる型付き指示子で自然言語に注釈する疑似プロンプト言語である。
    • 複数の最先端モデル(Claude, Gemini, GPT)において,PromptMNの指示子が正確に解釈され,ファインチューニングなしで複雑な構造も処理可能であることが確認された。
    • PromptMNは,コードベースの変更や保守,再設計など,ソフトウェア開発ライフサイクル全体で再利用可能な成果物となりうる。

    Link: https://arxiv.org/abs/2606.17164

  • 複雑な地質構造におけるCO2移行のための高速GNNサロゲート [cs.CL, cs.CL, cs.CY, cs.MA, cs.CL, cs.LG]目的:複雑な地質構造におけるCO2移行予測のためのグラフニューラルネットワークサロゲートモデル
    • 地球温暖化対策としてCO2の地中貯留が重要視されており,貯留シナリオの評価が不可欠である。
    • 地質構造における多相流のシミュレーションは計算コストが高く,効率的な予測手法が求められている。
    • 物理現象を捉えたグラフ構造と,それを学習するモデルにより,CO2移行の効率的な予測を目指す。
    • 提案モデルは,CO2移行予測において,ガスの飽和度と液相密度を高精度に予測できることが示された。
    • 特に,鋭いガス-水界面や,フィンガリング現象といった複雑な現象を捉えることが可能である。
    • 時間発展は潜在空間でモデル化され,多段階教師あり学習により,長期的な予測においても誤差が抑制されている。

    Link: https://arxiv.org/abs/2606.17180

  • マルチエージェント大規模言語モデルシステムにおける並行性異常の検証による検出と防止 [cs.LG, cs.DC, cs.LO, cs.MA, cs.PL]目的:マルチエージェント大規模言語モデルシステムの並行性異常の検出と防止
    • 大規模言語モデルの利用拡大に伴い,複数のエージェントが連携するシステムの構築が重要になっている。
    • 共有メモリやツール登録において,並行実行によるデータ競合などの異常が発生しやすい。
    • 形式手法を用いて並行性異常を厳密に検証し,安全なシステム構築を目指す。
    • マルチエージェントLLMシステムに発生する4つの並行性異常(陳腐化生成,ファントムツール,因果的カスケード,ツール効果の再順序化)をTLA+で形式化し,TLCで反例を作成した。
    • これらの異常に対する検出器の健全性と完全性を,274のVerus義務を用いて機械的に検証した。
    • Rustで実装された3つの実行環境(L0-L1)を検証し,L2-L4については実行モード検証と依存性なしの防止ツインを用いて実証した。

    Link: https://arxiv.org/abs/2606.17182

  • フィンズラー幾何学,グラフニューラルネットワーク,そしてあなた [cs.RO, cs.LG, eess.SP, math.DG, stat.ML]目的:フィンズラー幾何学を表現するグラフニューラルネットワークの設計
    • グラフ構造データ解析は,様々な分野で重要性を増しており,その理論的基盤の確立が求められている。
    • 従来のグラフニューラルネットワークは等方的な演算子に限定され,複雑な幾何学構造の表現が困難である。
    • フィンズラー幾何学を基盤とする新たなグラフニューラルネットワークを構築し,非線形拡散方程式の幾何学的な構造を捉える。
    • 点群データからの離散的なフィンズラーラプラシアンの推定値が,点数の増加に伴い真の演算子に収束することを証明した。
    • この演算子をグラフニューラルネットワーク層として表現することで,フィンズラー幾何学を制約するネットワークの定義を可能とした。
    • 実験的に,フィンズラーグラフニューラルネットワークが非線形拡散方程式の背後にある幾何学を再現することを示した。

    Link: https://arxiv.org/abs/2606.17185

  • 制約付き拡散モデルと双対推論 [cs.LG]目的:エントロピー正則化最適化問題における平均制約下での最適分布からのサンプリング
    • 最適化問題への応用が期待される拡散モデル。その制約条件への対応は重要課題である。
    • 従来の拡散モデルでは,制約条件を満たすサンプリングが困難であった。
    • 双対推論を用いて,制約条件を満たしつつ最適分布からのサンプリングを可能にすること。
    • 本研究では,双対推論を用いた制約付き拡散モデル(PDI)を提案し,理論的な収束性を示した。
    • PDIは,ガウス混合分布,無線リソース配分,ポートフォリオ管理といったタスクで有効性を示すことができた。
    • 推論過程で生成される双対変数の時間平均が,双対最適解の近傍に収束することが証明された。

    Link: https://arxiv.org/abs/2606.17192

  • 大規模自動車ソフトウェア要件に対するクラスタ認識型二段階テスト仕様生成 [cs.SE, cs.AI]目的:自動車SPICE SWE.6要件を満たすテスト仕様の生成
    • 自動車ソフトウェア開発において,品質保証は安全性に直結するため重要である。
    • 要件数が増大すると,手動でのテスト仕様作成に膨大な時間と労力がかかる。
    • 大規模要件群におけるテスト効率と網羅性を向上させることを目指す。
    • 提案手法は,要件間の依存関係を考慮しつつ,大規模な要件群に対応可能である。
    • クラスタリングと要約を組み合わせることで,統合テストの網羅性と要約の忠実性を向上させた。
    • ISO 26262やASPICE等の規格に準拠したテスト仕様を生成することが可能となった。

    Link: https://arxiv.org/abs/2606.17197

  • PowerOPD:有界のべき乗変換によるオンポリシー蒸留の安定化 [cs.LG, cs.AI]目的:大規模言語モデルにおけるオンポリシー蒸留の安定化手法
    • 言語モデルの性能向上は,自然言語処理の発展に不可欠である。
    • オンポリシー蒸留は計算効率が良いが,学習の不安定性や性能低下が課題である。
    • 勾配の分散を抑制し,学習の安定化と性能向上を目指す。
    • PowerOPDは,Box-Cox変換を用いることで,報酬の範囲を制限し,勾配の分散を大幅に削減する。
    • 6つの数学的推論ベンチマークで,PowerOPDはバニラOPDよりも最大6.37/5.71%高いAvg@8/Pass@8を達成した。
    • また,PowerOPDは計算時間とGPUメモリ使用量をそれぞれ59.2%/23.1%削減することに成功した。

    Link: https://arxiv.org/abs/2606.17199

  • 信頼性に基づいたマルチエージェント追跡可能性:一貫性のあるソフトウェア成果物管理のための信頼度較正ナレッジグラフ [cs.RO, cs.SE, cs.AI]目的:ソフトウェア成果物管理における一貫性確保
    • 安全性確保が重要な分野において,ソフトウェア開発の自動化が不可欠である。
    • エージェント間の連携不足により,誤りや不確実な情報が伝播し,矛盾や欠落が生じやすい。
    • エージェント間の信頼度を考慮し,一貫性のある追跡可能性を確保することで,これらの問題を解決する。
    • 提案手法では,ナレッジグラフを用いてエージェント間の信頼度を評価し,連携を促進することで,より正確な追跡可能性を実現する。
    • 提示された二段階のトレーサビリティリンク予測パイプラインは,埋め込みベースの検索とLLMベースの多基準分析を組み合わせることで,高い精度を示す。
    • 自動車ソフトウェア工学のケーススタディにおいて,信頼度較正の有効性が確認された。

    Link: https://arxiv.org/abs/2606.17203

  • 並列サンプリングを超えて:エージェント探索のための多様なクエリ初期化 [cs.AI, cs.IR]目的:エージェント探索における多様なクエリ初期化手法
    • エージェント探索は複雑な質問応答や推論において重要な役割を担う。
    • 並列サンプリングでは,初期クエリの冗長性がボトルネックとなる。
    • 初期クエリの多様性を確保し,探索効率を高めることを目指す。
    • DivInitは,標準的な並列サンプリングと比較して,複数のモデルとベンチマークで一貫して性能を向上させる。
    • 特に,複数段階の質問応答において,計算量を変えずに5〜7ポイントの平均的な改善が見られた。
    • DivInitは,学習を必要としない介入手法であり,実装が容易である。

    Link: https://arxiv.org/abs/2606.17209

  • ロバスト半空間学習における重み付きヒンジ法の二乗和次数障壁:クリストフェル関数の特徴づけ [cs.LG, cs.DS, stat.ML]目的:ロバストな半空間学習における外れ値除去の限界とその特徴付け
    • 機械学習におけるロバスト性は,ノイズの多いデータからの信頼性のある学習に不可欠である。
    • 外れ値の存在は,学習アルゴリズムの性能を著しく低下させる主要な課題である。
    • クリストフェル関数を利用し,外れ値除去の限界を明確化し,ロバスト学習の改善を目指す。
    • 外れ値除去証明書は低次のモーメントのみを用いるため,敵対者はその特性を利用して外れ値を隠蔽する。
    • 外れ値が隠蔽可能な領域の大きさは,クリーンドデータのクリストフェル関数によって正確に決定される。
    • 二乗和次数のトレードオフや次数2の外れ値障壁など,証明書法に対する限界が示唆された。

    Link: https://arxiv.org/abs/2606.17215

  • ルールが学習する:法的判例検索のための自己進化型エージェント [eess.SY, cs.SY, cs.AI]目的:法的判例検索のための自己進化型ルール生成フレームワーク
    • 法的文書は専門性が高く,検索の精度が求められるため,効率的な検索手法が重要である。
    • 従来の検索手法では,複雑な法的言語への対応やクエリと判例の厳密な一致が課題となっていた。
    • 大規模言語モデルを活用し,自動評価とルール進化によりBM25の性能を向上させることを目指す。
    • 提案手法は,LeCaRD-v2データセットにおいて,人間が作成したルールや貪欲なルール選択よりも優れた性能を示した。
    • 特に,高性能な大規模言語モデルを基盤とした場合に,その効果が顕著に現れた。
    • 実験結果の活用や不要なルール排除能力が,ルールセットの洗練に重要な役割を果たしていることが示された。

    Link: https://arxiv.org/abs/2606.17220

  • Rift:言語モデルにおける欺瞞の兆候 [cs.LG, cs.AI, cs.CL]目的:言語モデルにおける欺瞞の内部的兆候の特定
    • 大規模言語モデルの信頼性は重要であり,その挙動の理解が不可欠である。
    • 言語モデルが意図的に虚偽を生成した場合,その欺瞞を検出することが困難である。
    • 正直な誤りとの区別を可能にする,欺瞞の内部的兆候を明らかにすること。
    • 欺瞞的な応答は,単純な誤りよりも高い残差ランクを示すことが判明した。
    • この「Rift」と呼ばれる兆候は,モデルの種類や言語に依存せず,高い精度で欺瞞を特定できる。
    • 欺瞞の兆候は読み取り専用であり,意図的に付与することはできないことが示された。

    Link: https://arxiv.org/abs/2606.17229

  • 多項式カオス展開と多変量アクティブ学習による工学的構造物の不確実性定量化 [cs.LG, stat.ML]目的:工学的構造物の不確実性定量化手法
    • 工学的構造物の信頼性評価において,数値シミュレーションは不可欠である。
    • 高精度なシミュレーションは計算コストが高く,効率的な近似手法が求められる。
    • 多出力問題において,効率的かつ正確な代理モデルの構築を可能とする手法を開発する。
    • 提案手法は,既存のラテンハイパーキューブサンプリングと比較して,代理モデルの精度と安定性を向上させる。
    • 特に,複数の出力間の相関を考慮することで,より信頼性の高い統計量の推定が可能となる。
    • 本手法は,工学的問題に対する不確実性定量化の効率化に貢献する。

    Link: https://arxiv.org/abs/2606.17233

  • 圧縮から展開へ:超制約型マイクロコントローラ上のリアルタイムかつ省エネルギーなFastGRNN [cs.AR, cs.LG, cs.NE, eess.SP]目的:超制約型マイクロコントローラ上でのFastGRNNの実装と性能評価
    • AI/MLの普及が進む中で,省電力・低コストなデバイスへの搭載が重要視されている。
    • 大規模モデルが主流だが,半導体不足や消費電力の増大が課題となっている。
    • 既存のAI/MLアルゴリズムを小型マイクロコントローラに適合させることを目指す。
    • FastGRNNを8ビットArduinoと16ビットMSP430に実装し,リアルタイム(50Hz)ストリーミング推論を達成した。
    • 重みの圧縮パイプラインにより,モデルサイズを566バイトに抑え,HAPTテストセットでF1スコア0.918を達成した。
    • 乗算器を持たないMSP430では,ルックアップテーブルを活用することで,30.5倍の高速化を実現し,消費電力を大幅に削減した。

    Link: https://arxiv.org/abs/2606.17249

  • 批判なしRLVRにおけるグループの再考 [cs.LG, cs.CL]目的:批判なしRLVRにおけるグループの役割の再評価と,その代替戦略の提案
    • 大規模言語モデルの性能向上には,強化学習が不可欠である。特に,後学習による調整が重要視されている。
    • 既存手法では,価値ベースライン推定に多数のロールアウトが必要であり,計算効率が課題となっている。
    • 単一ロールアウトで安定した学習を可能にする,効率的な代替戦略を開発することを目指す。
    • 本研究では,グループの主要な機能が,負のサンプルの誤ったペナルティを防ぐことにあることを示した。
    • 提案手法である負のトークンフィルタリングは,単一ロールアウトでの学習を安定化させる効果があることが確認された。
    • 推論タスクおよびエージェントタスクにおいて,グループベースの手法と同等またはそれ以上の性能が達成された。

    Link: https://arxiv.org/abs/2606.17250

  • IWSLT 2026同時通訳タスクに向けたMLLP-VRAIN UPVシステム [cs.AR, cs.CL, cs.AI]目的:IWSLT 2026同時通訳タスクへの参加
    • 国際的なコミュニケーションの円滑化に貢献する同時通訳技術の重要性は高い。
    • 長時間の音声に対する同時通訳は,低遅延性と高精度が課題である。
    • アダプティブなポリシーと文脈情報を活用し,同時通訳の品質と効率を向上させる。
    • ParakeetとQwen 3.5モデルを用いた堅牢なカスケードシステムを構築した。
    • MCIF En$\rightarrow$Deテストセットにおいて,XCOMET-XLで+5.82の品質改善が確認された。
    • 文脈トラックの導入により,更なる性能向上(+1.03)が認められた。

    Link: https://arxiv.org/abs/2606.17255

  • 表現誘導による動画拡散モデルの訓練不要な安全性調整:REINS [cs.CV, cs.AI]目的:動画拡散モデルにおける安全性確保のメカニズム
    • 動画生成AIの進化に伴い,悪用や有害コンテンツ生成のリスクが高まっている。
    • 既存の安全性対策は,性能低下や回避可能性といった課題を抱えている。
    • モデルの内部表現を操作し,訓練データなしに安全性を確保する手法の開発。
    • 提案手法REINSは,動画拡散モデルの内部表現空間において,安全な生成を誘導する。
    • 安全性に関する情報は,動画拡散Transformerの隠れ層活性化に線形的にエンコードされていることが示された。
    • 中間層における表現の誘導が最も効果的であり,安全性と情報伝播のトレードオフが明らかになった。

    Link: https://arxiv.org/abs/2606.17257

  • SkillChain-Gym:混乱下におけるリスキリング対応型生産・在庫管理のためのベンチマーク [cs.AI, cs.SY, eess.SY]目的:リスキリングを考慮した生産・在庫管理のためのベンチマーク仕様
    • 生産計画において,労働力の能力が重要な決定変数となりつつあるため。
    • 既存の運用ベンチマークは労働力を外生変数として扱い,スキルと学習を組み込んだ労働力計画モデルは再利用可能なテスト環境として公開されることが少ない。
    • 労働者のスキル状態の変化,資格の有効期限,リスキリングに要する時間を考慮したベンチマークを提供し,効果的な生産・在庫管理手法を評価すること。
    • リスキリング対応型のポリシーは,生産のみのベースライン戦略を上回る性能を示した。
    • 資格維持のための継続的なリスキリングは,スキル忘却がある条件下では,混乱の有無にかかわらず必要となる。
    • 予測可能なボトルネックに対しては適応的なリスキリングが有効であり,予期せぬ事態には静的なクロス研修計画が強い保険となり得る。

    Link: https://arxiv.org/abs/2606.17266

  • スキル制約付きモデル予測制御:強靭な製造サプライチェーン [cs.AI, cs.SY, eess.SY]目的:スキル制約下の生産・在庫システムの制御
    • 製造業において,労働力不足は深刻な問題であり,熟練労働者の確保が不可欠である。
    • 熟練労働者のスキル維持には継続的な訓練が必要だが,訓練リソースは限られている。
    • 需要変動や予期せぬ事態に対応できる,スキル制約を考慮した生産計画の最適化を目指す。
    • モデル予測制御は,スキルや労働力のボトルネックが事前に予測可能な場合に有効であることが示された。
    • サプライチェーンの状況に応じて最適な戦略は異なり,単一の戦略が常に優位とは限らない。
    • 予期せぬショックや需要・供給の限界付近では,静的なクロス・トレーニング保険が依然として有効である。

    Link: https://arxiv.org/abs/2606.17269

  • 生成推薦におけるLLMの記憶行動:観察,示唆,および学習戦略 [cs.IR, cs.LG]目的:生成推薦におけるLLMの記憶傾向とその影響の解明
    • 推薦システムは,情報過多な現代において,ユーザーに最適なアイテムを提示する上で不可欠である。
    • 従来の推薦システムは,ユーザーの行動履歴の記憶に依存し,多様な推薦が困難である。
    • LLMの記憶傾向を抑制し,事前学習知識を有効活用することで,より高度な推薦を実現する。
    • LLMベースの生成推薦モデルは,従来のモデルよりも記憶に依存する傾向が強いことが示された。
    • LLMの性能向上は,主に訓練データ中の直接的なアイテム推移(one-hop memorization)によって説明できることが判明した。
    • IIRGという新しい学習戦略により,LLMはより複雑なアイテム間の関係を学習し,性能が大幅に向上した。

    Link: https://arxiv.org/abs/2606.17276

  • オープンソースソフトウェアの再現可能な脆弱性の地図 [cs.CR, cs.AI, cs.LG]目的:オープンソースソフトウェアの脆弱性に関する大規模で再現可能なデータセットの構築
    • ソフトウェアのセキュリティ確保は重要であり,脆弱性データの活用が不可欠である。
    • 既存の脆弱性データセットは,再現性の低さから有効活用が難しい場合が多い。
    • 再現性を重視することで,脆弱性分析の精度向上と新たなセキュリティ研究の促進を目指す。
    • 本研究では,オープンソースソフトウェアの脆弱性データセット(OSS-Fuzz)に対して,再現性を確保する手法を適用した。
    • その結果,6,100件を超える脆弱性を収録したARVOデータセットを構築し,81%の脆弱性を再現することに成功した。
    • また,対応する修正パッチの特定精度は89.4%に達し,脆弱性研究の新たな可能性を示唆した。

    Link: https://arxiv.org/abs/2606.17283

  • 民主主義から権威主義へ:AIシステムがいかに権威主義を意図的に可能にするか [cs.CY, cs.AI]目的:AIシステムによる権威主義化のメカニズム解明
    • AI技術の発展は社会に大きな変革をもたらすが,その負の側面にも注意が必要である。
    • AIシステムの設計・運用において,人権や自由を侵害するリスクが看過されている。
    • AIシステムが権威主義体制を強化する要因を特定し,対策を検討すること。
    • AIシステムが権威主義を可能にする特徴として,行政データの集中管理と法執行への利用,規制の不備,ユーザーの監視機能の弱体化,脆弱な集団の識別などが挙げられる。
    • これらの特徴は,権威主義体制だけでなく,民主主義体制においても認められ,その構成は様々である。
    • AIシステムは,集中型であっても分散型であっても,ガバナンスの隙間を突いて権威主義に貢献しうる。

    Link: https://arxiv.org/abs/2606.17286

  • 無から有へ:言語モデルは0を発見できるか [cs.AI, cs.CL]目的:言語モデルにおけるゼロの概念の自律的な発見
    • AIの数学的知識追求は,人間の能力拡張に貢献しうる。
    • 既存のAIモデルは,訓練データ外の数学概念を一般化するのが困難である。
    • 言語能力がAIモデルの数学的発見を支援できるか検証する。
    • GPT-2程度の言語モデルは,ゼロの概念をテスト時に一般化できないことが示された。
    • ゼロの例を数十~数百個訓練することで,モデルは大幅に改善される。
    • 言語による事前学習は,必要な事例数を約50%削減し,数学的発見を促進する。

    Link: https://arxiv.org/abs/2606.17289

  • VISTA:行動履歴条件付けによるスケールを意識した視覚ナビゲーション [cs.CE, eess.SY, cs.SY, cs.RO, cs.LG]目的:スケールを意識した視覚ナビゲーション手法
    • ロボットナビゲーションは,自動運転やサービスロボットの実現に不可欠な技術である。
    • 汎用的なナビゲーションモデルは,様々な環境に対応する必要があるが,スケール変化に弱いという課題がある。
    • ロボットの物理的な移動距離とモデルの予測を一致させ,環境の反復性の問題を解決する。
    • モデルに行動履歴を条件付けすることで,予測と実際の移動距離の関係を明示的に考慮できるようになった。
    • DINOv3エンコーダを統合することで,視覚的に反復的な環境でも空間的・幾何学的情報を捉えることが可能になった。
    • 実環境でのゼロショット展開において,100%の目標予測精度と平均95%のチェックポイント通過率を達成し,優れた汎化性能を示した。

    Link: https://arxiv.org/abs/2606.17294