arXiv雑要約

AI - 2026/06/15 公開

  • 時間系列予測のための適応振動状態アラインメント [cs.LG, cs.DB]目的:時間系列予測における振動状態のアラインメント
    • 長期的な時間系列予測において,反復する時間構造を捉えることが重要である。
    • 既存手法は固定された周期やテンプレートに依存しており,柔軟性に欠ける。
    • 非剛性周期性を持つ時間構造に対して,適応的なアラインメントを行うことで予測精度向上を目指す。
    • 提案手法AOSNetは,観測系列と学習可能な振動事前知識から特徴量を抽出し,状態アラインメントを行う。
    • AOSNetは,8つの公開ベンチマークと2つのクラウドワークロードデータセットで高い予測精度を達成した。
    • 特に,非剛性周期性が強まるほど,状態アラインメントの効果が増大することが示された。

    Link: https://arxiv.org/abs/2606.06010

  • StainFlow:GUIエージェントにおけるプロセス報酬のためのエンティティ-染色追跡と証拠のリンク [cs.AR, cs.CL, cs.IR, cs.AI]目的:GUIエージェントのプロセス報酬におけるエンティティと染色を追跡し,証拠をリンクすること
    • GUI自動化は,反復的なタスクを効率化する上で不可欠であり,RLはその性能向上に貢献する。
    • 従来のRLでは,報酬のスパース性が課題であり,中間ステップにおける適切な評価が困難である。
    • タスクの有効な実行パスに対応し,重要な証拠を見落とすことなく,報酬の精度向上を目指す。
    • StainFlowは,グローバルなエンティティ染色追跡モジュールにより,タスクの段階を客観的に分離する。
    • ローカル染色証拠リンクモジュールは,キーノードの検証のための高密度な証拠ウィンドウを動的に構築する。
    • AndroidWorldとOGRBenchでの実験により,オンラインRLの成功率が3.2%向上し,軌跡完了の判断精度が1.8%向上した。

    Link: https://arxiv.org/abs/2606.07027

  • 最速思考:最先端AIモデルのCoTタスク完了時間予測 [cs.CL, cs.AI]目的:最先端AIモデルにおけるCoTなしタスク完了時間予測
    • AIの安全性確保において,モデルの思考過程の監視が重要である。
    • 明示的な思考トークンなしで複雑な推論が可能になると,監視が困難になる。
    • モデルのCoTなしでの推論能力の進展状況を定量的に把握すること。
    • 最先端モデルのCoTなしタスク完了時間の中央値は,過去6年間でほぼ毎年倍増している。
    • GPT-5.5の完了時間予測は3分以上,推論トークン数は1,500トークンを超えている。
    • 予測では,2028年には7分,2030年には25分を超える可能性があるが,不確実性も大きい。

    Link: https://arxiv.org/abs/2606.07157

  • SO-101ベンチマークにおけるVision-Language-Actionモデルの性能評価:失敗と復旧の分析 [eess.SY, cs.SY, math.DS, math.OC, cs.RO, cs.AI]目的:Vision-Language-Actionモデルの性能評価と,その失敗・復旧メカニズムの分析
    • ロボットによる実世界でのタスク遂行は重要性が増しており,AIモデルの性能評価が不可欠である。
    • 既存の評価はシミュレーションか高価なロボットで行われており,安価なロボットでの頑健性が不明である。
    • 安価なロボットプラットフォームSO-101を用いた実世界ベンチマークにより,その頑健性を評価する。
    • 事前学習済みのVLAモデルは,一般的に模倣学習ベースラインよりも優れた性能を示す。
    • タスクの成功率は,ロボットの導入条件によって大きく左右されることが明らかになった。
    • 実行の不安定性が主要な失敗要因であり,モデルごとの復旧能力には大きな差が見られた。

    Link: https://arxiv.org/abs/2606.08881

  • 学習者の主体性と自律性に関する大規模意味空間マッピング:測定と生成AI研究が見落としている点 [cs.AI]目的:学習者の主体性と自律性の意味構造の解明
    • 学習者の主体性と自律性は,個人の成長に不可欠な要素であるため,教育研究において重要なテーマである。
    • 「同じ言葉が異なる意味を表す」「異なる言葉が同じ意味を表す」というジングル・ジャングル問題が,研究の蓄積を妨げている。
    • 学習者の主体性と自律性の多面的な構造を明らかにすることで,測定方法やAI研究の方向性を示唆することを目的とする。
    • 学習者の主体性と自律性は,「学習の制御」「内発的動機付け」「社会文化的行動」の3つの次元で構成されることが明らかになった。
    • 既存の測定尺度では,社会文化的次元が十分に反映されていないという課題が示された。
    • 現在の生成AI研究は学習の制御に偏っており,学習環境が育むべき行動範囲を狭めている可能性がある。

    Link: https://arxiv.org/abs/2606.10881

  • ロールプレイにおいて,モデルは自身の発言を信じているのか? [cs.HC, cs.CL, cs.AI]目的:言語モデルにおけるロールプレイが,モデルの内部的な真実の認識に与える影響の検証
    • 大規模言語モデルの発展は,自然言語処理の可能性を広げ,多様な応用への道を開いている。
    • 言語モデルがロールプレイを行う際,その発言と内部的な信念との整合性が不明確である。
    • ロールプレイがモデルの出力に及ぼす影響と,内部的な真実の認識の変化を明らかにすること。
    • ロールプレイはモデルの発言内容を変化させるが,内部的な真実の認識には大きな影響を与えない。
    • 歴史的人物になりきったモデルは,その時代に信じられていた誤った主張を,現代の知識に基づいた誤った主張よりも抑制的に示す傾向がある。
    • 有害なアドバイスを学習したモデルとは異なり,ロールプレイは誤った主張の内部表現を真実に近づける効果は限定的である。

    Link: https://arxiv.org/abs/2606.11502

  • FP8品質上限を8ビット重みと活性化で実現:Ideogram 4.0のINT8およびGGUFポストトレーニング量子化 [cs.AR, cs.AR, cs.LG]目的:Ideogram 4.0のポストトレーニング量子化による,消費型GPUでの性能評価
    • 大規模言語モデルの普及に伴い,計算資源の効率的な利用が重要となっている。
    • モデルの量子化はメモリ使用量を削減するが,精度低下が課題となる。
    • 低ビット量子化による画質劣化を最小限に抑え,実用的な性能を達成することを目指す。
    • INT8 W8A8量子化は,CLIPおよびPickScoreにおいてFP8と同等の性能を示す。
    • HPSv2スコアにおいても,FP8との差はわずかであり,高品質な画像生成を維持している。
    • GGUF Q4_K量子化は,NF4ベースラインと同等の画質を,同じディスクサイズで実現する。

    Link: https://arxiv.org/abs/2606.12280

  • ポストトレーニングの解剖:解釈可能性を用いたデータの特徴付けと学習シグナルの形成 [cs.RO, cs.SY, eess.SY, cs.LG]目的:モデルの学習シグナルを特徴付け,形成すること
    • 大規模言語モデルの性能向上には,ポストトレーニングが不可欠である。その質がモデルの挙動を大きく左右する。
    • ポストトレーニングではスカラー報酬の最適化が主流だが,データがモデルに何を教えているかの可視化が不足している。
    • 解釈可能性を活用し,データ内の概念レベルで学習を制御することで,望ましくない挙動を抑制し,好ましい特性を強化する。
    • 提案パイプラインは,既存のデータにおける望ましくないシグナルを診断し,オフターゲット学習を軽減できる。
    • 解釈可能性に基づく手法を統合することで,報酬の形成を特徴量またはデータ介入を通して行うことが可能になる。
    • 安全性の確保やモデルの個性強化といった望ましい特性を増幅・形成することも示唆された。

    Link: https://arxiv.org/abs/2606.12360

  • AIエージェントは私たちを無意味な仕事から解放するか?人間中心の分析 [cs.CY, cs.AI]目的:無意味だと認識されるタスクの自動化可能性
    • 労働の質の向上は,経済発展や個人の幸福に不可欠である。
    • 既存研究は職種レベルに焦点を当て,職務内のタスクごとの意味合いの違いを無視している。
    • AIによるタスク委譲の対象となりうる「無意味な仕事」を特定し,その妥当性を検証する。
    • 「無意味さ」を測る5項目尺度が妥当性を持つことが確認された。
    • タスクが「無意味」であると認識されるほど,AIへの委譲希望が強くなることが示された。
    • 「無意味」なタスクは,人間の監視が不要であると認識される傾向がある。

    Link: https://arxiv.org/abs/2606.12430

  • 幻覚発生の最速検出:遅延限界と学習されたCUSUM統計 [cs.LG, cs.AI, cs.CL]目的:幻覚発生の検出における遅延時間削減
    • 大規模言語モデルの信頼性向上が不可欠であり,幻覚検出はその重要な課題である。
    • 従来の幻覚検出評価は分類性能に偏重し,リアルタイム検出の遅延が無視されてきた。
    • 幻覚発生の迅速な検知を可能にする手法を確立し,遅延限界を理論的に評価すること。
    • 幻覚発生検出を最速変化検出問題として定式化し,遅延時間の下限を理論的に導出した。
    • 学習された因果再帰ラベル付け器はCUSUMとして機能し,従来の基線よりも高速に幻覚発生を検出した。
    • 特徴量の情報量の潜在的な活用不足が,遅延時間の改善を阻害していることが示唆された。

    Link: https://arxiv.org/abs/2606.12476

  • EquiDexFlow:接触に基づいたSE(3)不変な器用な把持生成フロー [cs.RO, cs.CV, cs.LG]目的:器用な把持の生成
    • ロボットハンドによる物体操作において,安定した把持は重要な課題である。
    • 従来の把持生成手法では,接触力と安定性の関係が十分に考慮されていない。
    • 接触力と安定性を同時に予測するモデルを構築し,現実的な把持を生成すること。
    • EquiDexFlowは,点群から手首姿勢,関節角度,指先接触,表面法線,接触力を同時に予測する。
    • SE(3)不変性を保証し,摩擦条件を満たす把持を生成できることを実験的に示した。
    • 実際のロボットで,全てのテスト対象物体に対して把持と保持に成功した。

    Link: https://arxiv.org/abs/2606.12728

  • ガウスに尋ねよう:改善されたワンランプライバシー監査 [cs.LG]目的:プライバシー漏洩量の推定
    • 機械学習モデルのプライバシー保護は重要であり,理論的保証と実際の挙動の一致確認が不可欠である。
    • 既存のワンラン監査手法は情報が失われる可能性があり,監査精度が低いという課題がある。
    • ガウス分布に基づく新たなアプローチで,より厳密なプライバシー下限を算出することを目指す。
    • DP-SGD設定において,カナリア信号の正規和が漸近的にガウス分布に従うことを示した。
    • この性質を利用し,単一のトレーニング実行からよりタイトなプライバシー下限を得るためのフレームワークを開発した。
    • 従来のワンラン手法と比較して,より正確なプライバシー監査が可能となる。

    Link: https://arxiv.org/abs/2606.12733

  • GUITrans2Act:ビジョン言語モデルによるモバイルGUI操作行動の理解 [cs.AI]目的:モバイルGUIインタラクションからのユーザー操作行動の理解
    • モバイルデバイス利用拡大に伴い,UIの静的な認識から動的な行動理解が重要になっている。
    • 既存のビジョン言語モデルは,アプリケーション間のUIデザインの多様性から正確な操作推論が困難である。
    • 多様なUIデザインに対応し,モバイル画面の軌跡から操作に関する知識を抽出・分析することを目指す。
    • 提案手法Teach VLMは,既存のビジョン言語モデルを大幅に上回り,操作意味の予測において最先端の性能を達成した。
    • 生成された操作知識は,後続の画面ベース実行エージェントを導く解釈可能な手続き的参照として機能する。
    • Android Worldでの実験により,提案パラダイムが下流エージェントのタスク成功率を改善することが示された。

    Link: https://arxiv.org/abs/2606.12817

  • チャットボットのファインチューニングのための直接選好最適化:実験的研究 [cs.CL, cs.LG]目的:チャットボットのファインチューニングにおける直接選好最適化の効果検証
    • 大規模言語モデルの性能向上が,自然言語処理の様々な応用において不可欠である。
    • 強化学習を用いたファインチューニングは複雑で計算コストが高いという課題がある。
    • 直接選好最適化を用いることで,この複雑性とコストを軽減し,効率的な学習を目指す。
    • 直接選好最適化は,従来の強化学習と比較して,学習パイプラインを簡素化し,計算効率を改善する。
    • BLEU,ROUGE,コサイン類似度といった評価指標において,有効な学習と収束が確認された。
    • ただし,学習の不安定性については,さらなる調査が必要である。

    Link: https://arxiv.org/abs/2606.12881

  • バウンディングボックスを目標とする:言語条件付きの把持のための神経記号計画 [cs.RO, cs.AI, cs.CV, cs.SY, eess.SY]目的:言語条件付きの把持タスクのための神経記号計画
    • ロボットを家庭や産業環境に導入するには,自然言語指示へのリアルタイム適応が不可欠である。
    • 既存のロボットタスク・モーション計画アプローチは,計算コストが高いか,大量の学習データを必要とする。
    • 抽象的な空間概念を理解し,追加の調整なしにタスクを実行できるロボットシステムの実現。
    • GRASPは,事前学習済みのVLMを利用し,自然言語クエリを物理世界に基づいたバウンディングボックス検出パイプラインで表現された神経記号的目標状態に変換する。
    • 固定色リストやハードコードされた座標に依存せず,「一番上の棚」などの抽象的な空間概念を解釈する。
    • 3段階の難易度を持つ90回の実機実験で73.3%の全体的な成功率を達成し,タスク固有の学習は不要であった。

    Link: https://arxiv.org/abs/2606.12910

  • MAStrike:多エージェントシステムにおけるShapley値に基づく共謀的な敵対的テスト [cs.CR, cs.AI]目的:階層型多エージェントシステムにおけるシステムの脆弱性評価と攻撃手法の開発
    • 金融やソフトウェア開発など,重要なワークフローに多エージェントシステムが活用され,安全性確保が不可欠である。
    • 既存手法では,標的エージェントの選択や単独メッセージの改ざんが中心で,エージェント間の共謀攻撃への対応が課題である。
    • Shapley値を活用し,エージェントのシステム堅牢性への貢献度を定量化し,脆弱なエージェントの連携攻撃を特定する。
    • MAStrikeは,エージェントレベルでのShapley値分析を初めて提案し,各エージェントのシステム堅牢性への寄与度を定量化した。
    • この分析に基づいて脆弱なエージェントの連合を特定し,役割を考慮した協調的な敵対的操作を生成する。
    • 多様な階層構造とドメインを含む包括的なベンチマーク環境を構築し,最先端モデルを用いた実験でMAStrikeの有効性を示した。

    Link: https://arxiv.org/abs/2606.12918

  • 秩序は制御ではない:人工および生物学的システムにおける駆動散逸応答法則 [cs.LG, cs.AI, cs.CL]目的:秩序誘導対象の応答法則
    • AIの安全性や解釈可能性向上は重要であり,神経摂動研究も進められている。
    • 秩序と制御は混同されがちであり,制御の本質的なメカニズムが不明確である。
    • 生物系,LLM,アダプター等の多様なシステムにおいて普遍的な応答法則を明らかにする。
    • 様々なシステムにおいて,状態,行動,環境,受容体に基づいた局所的な応答法則が確認された。
    • LLMの出力は,条件によって72.8-84.8%の成分符号精度で予測可能であり,システム効果やターゲットも高精度で予測された。
    • この研究は,駆動散逸応答システムにおける制御のメカニズムを,準備された媒体,環境,受容体を通して説明する。

    Link: https://arxiv.org/abs/2606.12923

  • DeepJEB++:2D潜在空間拡張による大規模3Dエンジニアリングデータセット [cs.CL, cs.LG, cs.CE]目的:大規模3Dエンジニアリングデータセットの生成
    • データ駆動型設計の発展には,形状と物理性能を結びつける大規模3Dデータが不可欠である。
    • 既存の3Dデータ拡張技術では,微細かつ多様な形状変化の保持が困難である。
    • 限られたリソースで大規模なシミュレーションラベル付き3Dデータセットを自動生成することを目指す。
    • 事前学習済みの2D潜在拡散モデルをファインチューニングし,潜在空間での補間により新たな視点を合成することで,製造可能な設計を維持する。
    • 検証済みの画像をドメイン適応型生成モデルを用いて3Dメッシュに変換し,負荷やボルト接合部の自動認識と有限要素ラベルの付与を実現した。
    • 400件未満のシード設計から15,360件のシミュレーションラベル付き3Dブラケットを生成し,40倍のデータ拡張を単一GPUで達成した。

    Link: https://arxiv.org/abs/2606.12994

  • TWLA:ポストトレーニング量子化によるLLMにおける3値重みと低ビット活性化の実現 [cs.LG, cs.AI]目的:LLMのモデルサイズと推論コスト削減のための量子化手法
    • LLMは高度な言語処理能力を持つが,メモリと計算コストが課題となっている
    • 既存の量子化手法は,活性化分布の偏りにより高精度な活性化が必要となり,推論加速が限定される
    • 活性化分布の偏りを抑制し,低ビットでの量子化による推論加速を目指す
    • TWLAは,ポストトレーニング量子化フレームワークとして,1.58ビットの重み圧縮と4ビットの活性化量子化を達成した。
    • E2M-ATQ,KOTMS,ILA-AMPという3つの要素により,高精度を維持しながら推論を高速化する。
    • 実験により,TWLAがW1.58A4設定下で高い精度を維持し,推論速度の大幅な向上に貢献することが示された。

    Link: https://arxiv.org/abs/2606.13054

  • 時空間予測のための多期間パターン事前学習(MP3) [cs.LG, cs.AI, cs.NE]目的:時空間予測における時間的錯覚の識別
    • 交通,気候,エネルギーなど多様な分野で時空間予測は不可欠である。
    • 既存の時空間グラフニューラルネットワークは,時間的錯覚を効果的に識別できない。
    • 短期間入力の不完全性,異質な空間相関,期間間重畳因果関係の課題を解決する。
    • 本研究で開発したMP3は,既存の時空間グラフニューラルネットワークに組み込み,予測性能を向上させる。
    • 5つの実世界データセット(大規模データセットCAを含む)を用いた実験で,MP3の有効性,拡張性,適応性が確認された。
    • 平均して,MP3はMAEを4.7%,RMSEを5.0%削減する。

    Link: https://arxiv.org/abs/2606.13119

  • 機械はどのような条件で真に創造的と言えるのか [cs.AI, cs.CY]目的:機械の真の創造性の条件
    • AI技術の発展に伴い,創造性の評価基準が問われている。
    • 既存のAIは出力の新規性のみで創造性と判断されがちである。
    • 構造的な変革を伴う創造性の本質的な条件を明らかにすること。
    • 本研究では,意味を持つ意図的な変化の科学であるDesignicsに基づき,真の機械の創造性には10の要件が必要であることを提唱している。
    • これらの要件は,環境表現,スコープ付き知覚,対立の特定,介入能力,結果の観察,知識と環境の更新などを含む。
    • また,価値に基づいたスコープ設定と人間とAIの共存が,創造的な機械の環境認識,対立特定,介入選択を形成する必要があることを主張している。

    Link: https://arxiv.org/abs/2606.13196

  • 不確実な評価から校正されたランキングへ:LLM評価のための共形Elo推定 [cs.LG]目的:LLM評価における校正されたElo推定法の開発
    • LLMの性能評価は,その進化を促す上で不可欠であり,信頼性の高い評価手法が求められている。
    • LLMを評価者として用いる手法は安価だが,評価結果には系統的な誤差が含まれる場合がある。
    • LLM評価者の誤差を考慮し,人間による評価に近い,信頼性の高いランキングを低コストで生成すること。
    • 提案手法は,LLM評価者のスコアの不確実性を考慮し,Bradley-Terry法に校正された勝率を導入することで,Elo推定の精度を大幅に向上させた。
    • LLMによって算出されたEloレーティングは,LMArenaにおける55個のモデルで平均17.9のMAEで人間による評価に近づいた。
    • さらに,共形予測を適用することで,LLMと人間評価の乖離を考慮した,分布に依存しない信頼区間を生成することに成功した。

    Link: https://arxiv.org/abs/2606.13221

  • 時系列モデルの量子化を力学系として捉える:軌道に基づく量子化感度スコア [cs.LG]目的:量子化感度スコアの算出
    • モデルの低精度化は,リソース制約のある環境での推論を可能にする上で重要である。
    • 従来の量子化手法では,感度分析と量子化手続きが密接に関連している場合が多い。
    • 本研究は,量子化による誤差伝播を評価し,効率的な低精度化戦略を確立することを目指す。
    • 本研究では,ネットワークの展開を離散時間力学系としてモデル化し,量子化誤差の伝播と増幅を特徴づける軌道に基づく量子化感度スコア(TQS)を提案した。
    • TQSは,量子化子選択やビット幅割り当てから独立した事前感度推定を可能にし,ブラックボックスモデルや融合演算を含むネットワークに対しても量子化予算計画を立てることが可能となる。
    • 提案手法TQS-PTQは,キャリブレーションデータや高コストな二階近似を必要としない柔軟な混合精度フレームワークであり,リソース制約環境下での高性能な低精度展開を可能にする。

    Link: https://arxiv.org/abs/2606.13300

  • ミニマックス疎注意機構 [cs.AI]目的:超長文脈処理の効率化
    • 大規模言語モデルの性能向上には,長文脈処理能力が不可欠である。
    • 従来のsoftmax attentionは計算コストが高く,長文脈処理のボトルネックとなっている。
    • MSAは,計算コストを抑えつつ,長文脈処理能力を向上させることを目指す。
    • MSAは,GQAを基盤としたブロック単位の疎注意機構であり,計算量を大幅に削減する。
    • 109Bパラメータモデルにおいて,MSAはGQAと同等の性能を維持しつつ,トークンあたりの計算量を28.4倍削減した。
    • H800上で,MSAと専用カーネルを組み合わせることで,prefill速度を14.2倍,デコーディング速度を7.6倍向上させた。

    Link: https://arxiv.org/abs/2606.13392

  • 長文テキスト・音声入り対話におけるオントロジーメモリ拡張型ASR補正 [cs.CL, cs.AI]目的:長文テキスト・音声入り対話における自動音声認識(ASR)補正の改善
    • 対話システムにおける音声認識の精度は,円滑なコミュニケーションに不可欠である。
    • 従来のASR補正は文脈が短く,長文対話における文脈情報を活用できていない。
    • 対話履歴をオントロジーメモリとして構造化し,文脈に基づいたASR補正を実現する。
    • 提案手法は,MAGIC-RAMCから構築したRAMC-Corrデータセットにおいて,ベースライン手法を上回る性能を示した。
    • 特に,文脈依存型ASRエラーに対する選択的かつ根拠に基づいた補正を促進することが確認された。
    • オントロジーメモリを用いることで,長文対話におけるスパースな補正証拠を効率的に活用できる。

    Link: https://arxiv.org/abs/2606.13464

  • あなた自身か,それとも環境か:ゲノムに基づいた個別生理学的解釈のためのベイジアン推論フレームワーク [cs.AI, cs.HC, q-bio.BM, q-bio.GN, q-bio.MN]目的:個別生理学的解釈のためのベイジアン推論フレームワーク
    • 健康状態の個人差は大きく,精密な健康管理への関心が高まっている。
    • 生理学的解釈モデルは,十分な個人の行動データがない初期段階で精度が低い。
    • ゲノム情報を活用し,初期段階での精度向上を目指す。
    • ゲノム情報を事前分布として用いることで,行動データが少ない初期段階でも個人の生理的特性を推定可能となる。
    • 観測された生理学的データとゲノム情報に基づいて,環境要因と個人の体質による変動を分離する。
    • 時間の経過とともに,ゲノム情報の重要度を減らし,経験的なデータに基づいて推定精度を向上させる。

    Link: https://arxiv.org/abs/2606.13556

  • バッハ様式による記号音楽の生成モデリング:自己回帰型,潜在変数型,敵対的アプローチの比較研究 [cs.SD, cs.LG]目的:バッハ様式の記号ピアノ音楽生成に関するモデル比較
    • 音楽生成分野は,作曲支援や新たな音楽表現の創出に貢献し,芸術・技術両面で重要である。
    • 既存の音楽生成モデルは,多声音楽の構造を捉えるのが難しく,自然な音楽生成が課題となっていた。
    • 本研究は,バッハ様式音楽の生成において,各アプローチの特性と限界を明らかにすることを目的とする。
    • 自己回帰型LSTMが最も音楽的に一貫性のあるサンプルを生成することが示された。
    • ベクトル量子化は,潜在変数モデルにおける後述崩壊を緩和し,より構造化された出力を実現した。
    • 敵対的アプローチは局所的な音程パターンを捉えるものの,学習が難しく,バッハの様式への汎化性能は低い。

    Link: https://arxiv.org/abs/2606.13626

  • 密な教師あり学習,疎な更新:方策勾配蒸留の疎性と幾何学について [cs.LG]目的:方策勾配蒸留におけるパラメータの変化のメカニズム解明
    • 強化学習におけるサンプル効率向上は重要であり,オフ方策学習の課題克服が求められている。
    • 方策勾配蒸留は有望だが,そのパラメータ更新の挙動が十分に理解されていない。
    • 密な教師あり学習が,パラメータ更新に与える影響を幾何学的に分析する。
    • 方策勾配蒸留における更新は小さく,座標が疎である。特にFFNモジュールで大きな変化が見られた。
    • 発見されたサブネットワークのみで学習しても,フル学習時の性能に匹敵する結果が得られた。
    • 教師あり学習は有用なモーメンタム構造を保持し,AdamWがSGDよりも優れていることが示された。

    Link: https://arxiv.org/abs/2606.13657

  • EurekAgent:自律的な科学的発見にはエージェント環境設計が全て [cs.AI, cs.CL]目的:自律科学的発見のためのエージェント環境設計
    • 科学的発見の加速化が求められており,AIによる自動化が期待されている。
    • エージェントの行動を制御するワークフロー設計がボトルネックになっている。
    • エージェントの生産性を高める環境設計によって,この問題を解決することを目指す。
    • EurekAgentは,権限,成果物,予算,人間との連携を考慮した環境設計を行う。
    • 数学,カーネルエンジニアリング,機械学習の複数のタスクで最先端の結果を達成した。
    • 26円の円形配置問題では,APIコスト11ドル以下で新たな最高記録を樹立した。

    Link: https://arxiv.org/abs/2606.13662

  • 観測データと秘匿化データからのレート最適分割分類について [stat.ME, cs.CG, stat.ML, cs.CR, cs.LG, math.ST, stat.TH]目的:分割分類における収束率の評価
    • 分類問題は機械学習の根幹であり,様々な応用分野で重要である。
    • 従来の分割分類器は強い密度仮定に依存しており,現実的なデータ分布への適用が難しい場合がある。
    • 本研究は,より緩やかな仮定の下で分割分類の収束率を解析し,その限界を克服することを目指す。
    • 絶対連続成分が$d_a$次元の部分空間に集中する混合分布を仮定することで,従来の強い密度仮定と同等の収束率を達成できる。
    • この収束率は,全体の次元$d$ではなく,絶対連続成分の固有次元$d_a$のみに依存することが示された。
    • 秘匿化されたデータに対しては,ラプラスノイズを加えることで,同様の収束率が保証されることが示された。

    Link: https://arxiv.org/abs/2312.14889

  • Leave-One-Out,Bootstrap,およびCross-Conformal異常検知器 [stat.ML, cs.LG]目的:異常検知における不確実性の定量化
    • 異常検知は,セキュリティ,製造,医療など,幅広い分野で重要である。
    • 誤検出によるコストを削減するため,Type Iエラー率の制御が課題である。
    • 少ないデータでも有効な異常検知手法の開発を目指す。
    • Leave-one-out,Bootstrap,Cross-Conformal法を形式的に定義・評価した。
    • 再標本化Conformal p値の計算手法が,データ効率と計算効率のバランスを提供する。
    • 様々なone-class分類器とデータセットで,提案手法の改善を検証した。

    Link: https://arxiv.org/abs/2402.16388

  • 機械学習のための多モード波伝搬の任意制御 [physics.optics, cs.ET, cs.LG]目的:多モード波伝搬の制御
    • 光コンピューティングの集積化が求められており,小型化・高性能化が重要である。
    • 従来の光回路は離散部品を使用するため,回路規模の拡大に限界がある。
    • 多モード干渉を利用した連続的な光回路による,効率的な計算処理を実現する。
    • 空間的に高速に再プログラム可能な屈折率を持つデバイスを設計・実証した。
    • 2次元プログラマブル導波路を用いて,デジタル処理なしでニューラルネットワーク推論を単一パスで実現した。
    • 回路面積は,$N^{1.5}$のオーダーで増加する可能性が理論的・数値的に示された。

    Link: https://arxiv.org/abs/2402.17750

  • 一般化された脱バイアスLassoの安定性とリサンプリングに基づく変数選択への応用 [math.ST, cs.IT, cs.LG, math.IT, stat.ME, stat.ML, stat.TH]目的:一般化された脱バイアスLasso推定量の安定性
    • 高次元データ解析において,変数選択は重要な課題である。モデルの解釈性向上や過学習防止に貢献する。
    • 従来の変数選択手法では,計算コストが高い場合がある。特にリサンプリングに基づく手法は課題が多い。
    • 本研究は,計算コストを削減しつつ,変数選択の精度を維持することを目指す。
    • 提案手法は,設計行列の一列を摂動した場合に,元の解から簡単に更新できるシンプルな公式を持つ。
    • サブガウス設計と良好な条件数を持つ共分散行列の下で,この近似はほぼ全ての座標に対して漸近的に正確である。
    • 本近似は,条件付きランダム化検定やローカルノックオフフィルタを含む,リサンプリングに基づく変数選択手法の計算コストを大幅に削減する。

    Link: https://arxiv.org/abs/2405.03063

  • 多施設観察データからのプロペンシティスコア集計を通じた連合因果推論 [stat.ME, cs.AI, math.ST, stat.AP, stat.TH]目的:多施設分散型観察データからの平均処置効果の推定
    • 因果推論は医療や社会科学において重要な課題であり,政策決定や介入効果の評価に不可欠である。
    • データが複数の施設に分散している場合,プライバシー等の制約から中央集権的な分析が困難となる場合がある。
    • 本研究は,データ中央集権化を回避しつつ,分散データから因果効果を推定する手法を提案する。
    • 提案手法では,サイトメンバーシップの確率に基づいた重み付け平均を用いてプロペンシティスコアを推定する。
    • このプロペンシティスコアを用いて,連合型逆確率重み付け(Fed-IPW)および拡張逆確率重み付け(Fed-AIPW)推定量を用いる。
    • シミュレーションおよび実データ分析の結果,提案手法は既存手法よりも優れた性能を示すことが示された。

    Link: https://arxiv.org/abs/2505.17961

  • 尤度最大化のための直接的なFisherスコア推定 [stat.ML, cs.LG]目的:尤度最大化問題に対する手法
    • 複雑なモデルにおいて,尤度関数の計算が困難な場合でも,パラメータ推定は重要である。
    • 尤度関数が解析的に扱えない場合,最適化が困難になり,局所解に陥りやすい。
    • シミュレーションを活用し,効率的にFisherスコアを推定することで,最適化問題を解決する。
    • 提案手法は,局所的なスコアマッチング技術を用いてFisherスコアを直接モデル化する逐次的な勾配法である。
    • 線形パラメータ化により,Fisherスコアの推定は閉形式の最小二乗解で求められる。
    • 実世界の様々な問題において,既存手法よりも優れた性能を示すことが確認された。

    Link: https://arxiv.org/abs/2506.06542

  • BRIC諸国の為替レート予測のためのニューラルARFIMAモデル [econ.EM, cs.LG, stat.AP, stat.ML]目的:BRIC諸国の為替レート予測
    • 新興国経済の安定的な成長には,正確な為替レート予測が不可欠である。
    • 従来のモデルでは,長期記憶性や非線形性を捉えきれない点が課題である。
    • 長期記憶性と非線形性を統合的にモデル化することで,予測精度向上を目指す。
    • 提案するニューラルARFIMAモデルは,複数の予測期間において既存モデルを上回る性能を示した。
    • 長期記憶性を明示的に考慮することが,為替レート変動の予測において重要であることが示された。
    • 本研究の成果は,Rパッケージ `narfima` として実装され公開されている。

    Link: https://arxiv.org/abs/2509.06697

  • 多様体吸引拡散 (MAD) [math.CO, cs.DM, stat.ML, cs.LG, cs.NA, math.NA]目的:ノイズのあるデータからの無ノイズサンプルの生成
    • 画像生成において,拡散モデルは高い性能を発揮する。実用的な応用範囲が広い。
    • 現実のデータはノイズを含んでいる場合が多く,高精度な生成が困難となる。
    • ノイズの影響を軽減し,より高品質なサンプルを生成することを目指す。
    • 本研究では,多様体仮説に基づき,ノイズをオフ多様体方向の小さな変動と捉え,効率的な推論手法を提案。
    • 拡張スコアの概念を導入し,小さな変動をゼロに,大きな変動を維持することで,無ノイズサンプルを生成。
    • 玩具問題,合成データ,実データにおいて,提案手法の有効性を検証した。

    Link: https://arxiv.org/abs/2509.24710

  • 素粒子物理における高精度測定のための解釈可能な教師なし表現学習 [quant-ph, cs.AR, eess.IV, cs.MM, hep-ex, cs.AI, physics.ins-det]目的:素粒子物理における高精度測定のための解釈可能な表現学習手法
    • 素粒子物理学では,高精度な測定が新たな発見に不可欠である。実験データの解析に機械学習の活用が期待されている。
    • 既存の教師なし学習モデルは,学習された表現の制御が難しく,物理的な解釈性と測定精度に課題がある。
    • 本研究は,物理構造を反映した潜在空間を学習し,高精度な測定を可能にする新たなモデルを提案する。
    • 提案手法HistoAEは,ヒストグラムに基づく損失関数を用いて,素粒子の電荷と衝突位置に対応する解釈可能な2次元潜在空間を学習した。
    • ビームテストデータを用いた評価で,電荷分解能0.25e,位置分解能3μmを達成し,従来の解析手法と同等の性能を示した。
    • HistoAEの生成能力は,高速検出器シミュレーションへの応用を可能にする。

    Link: https://arxiv.org/abs/2511.22246

  • 大規模言語モデルに基づく,イオントラップ型量子コンピュータのシャトルコンパイラ [quant-ph, cs.ET, cs.LG]目的:イオントラップ型量子コンピュータにおけるシャトルコンパイル戦略
    • 量子コンピュータの実現において,量子ビットの制御と情報処理が不可欠である。
    • 量子ビットの移動(シャトル)は複雑で,効率的なコンパイル手法が課題である。
    • 大規模言語モデルを用いて,より効率的なシャトルスケジュールを自動生成する。
    • 事前学習済みの言語モデルをファインチューニングすることで,様々なシャトルアーキテクチャに対応可能なコンパイル戦略を獲得した。
    • 16量子ビットまでのベンチマーク回路において,有効なシャトルスケジュールを生成し,未学習のレイアウトへの汎化能力も示した。
    • 言語モデルに基づくスケジュールは,既存のコンパイラよりもシャトル回数を最大15%削減する効果が確認された。

    Link: https://arxiv.org/abs/2512.18021

  • LLM予測における先読みバイアスの検出 [q-fin.GN, cs.LG, q-fin.TR]目的:LLMによる経済予測における先読みバイアスの検出手法
    • 経済予測は,政策決定や投資判断の根拠となり,社会経済活動において不可欠である。
    • LLM予測は学習データに未来の情報を含んでいる可能性があり,その妥当性が懸念されている。
    • LLM予測の信頼性を評価するため,先読みバイアスの有無を定量的に検証すること。
    • 提案手法「Lookahead Propensity (LAP)」により,LLMが将来情報を学習している確率を推定可能となった。
    • LAPとLLM予測の交互作用が,予測精度回帰において有意な正の相関を示した場合,先読みバイアスが混入していると判断できる。
    • 実証分析の結果,学習データ期間中はLAPが有意に高く,カットオフ以降はほぼゼロに低下することが確認された。

    Link: https://arxiv.org/abs/2512.23847

  • ロバストなニューラル事後推定のための最小距離サマリー [stat.ML, cs.LG]目的:ニューラル事後推定器のロバスト性向上
    • ベイズ推論は不確実性の定量化に不可欠であり,複雑なモデルでは計算が困難である。
    • ニューラル事後推定器は訓練データ分布外の観測に対して脆弱であるという問題がある。
    • 事前分布とシミュレータの間の不一致に対するロバスト性を改善することを目的とする。
    • 最小距離サマリーは,事前学習済みのニューラル事後推定器に依存せず,テスト時に観測データのサマリーを適応させる。
    • 最大平均不一致(MMD)を用いて,観測データとサマリー条件付き予測分布間の距離を測り,ロバスト性を付与する。
    • ランダムフーリエ特徴近似を用いることで,効率的な実装が可能であり,追加のオーバーヘッドを最小限に抑える。

    Link: https://arxiv.org/abs/2602.09161

  • ポアソン変分オートエンコーダにおける情報処理の代謝コスト [stat.ML, cs.AI, q-bio.NC]目的:ポアソン変分オートエンコーダにおける情報処理の代謝コストの評価
    • 生物学的システムにおける計算はエネルギー制約下にあるため,エネルギー効率の理論的理解が重要である。
    • 従来の計算理論ではエネルギーが自由に利用可能と仮定されており,生物学的現実との乖離がある。
    • ポアソン仮定に基づく変分自由エネルギー最小化を通して,エネルギーを考慮した計算理論の構築を目指す。
    • ポアソン変分オートエンコーダ (P-VAE) において,KLダイバージェンス項がモデルニューロンのベースライン発火率に比例し,代謝コスト項が出現することが示された。
    • P-VAEでは,符号化レートと発火率の間にトレードオフが生じ,高いベースライン活動が抑制されることが確認された。
    • ガウス変分オートエンコーダ (Grelu-VAE) との比較により,この代謝コスト構造がポアソン統計に特有のものであることが示された。

    Link: https://arxiv.org/abs/2602.13421

  • X-OPD:音声LLMにおける能力整合のためのクロスモーダルオンポリシー蒸留 [eess.AS, cs.AI, cs.CL]目的:音声LLMとテキストベースのLLMの能力整合
    • 音声LLMは低遅延性と非言語的モデリングに優れるが,テキストLLMと比較して性能が劣る。
    • 従来のSFTやRLでは,この性能格差を埋めることが困難である。
    • クロスモーダル蒸留により,テキストLLMの能力を音声LLMに効果的に移行させる。
    • X-OPDは,音声LLMが自身の分布を探索し,テキストLLMからのトークンレベルのフィードバックを受け取ることで,能力整合を実現する。
    • 複数のベンチマークにおいて,X-OPDは複雑なタスクにおける性能格差を大幅に縮小することを示した。
    • モデル本来の能力を維持しつつ,性能向上に貢献する。

    Link: https://arxiv.org/abs/2603.24596

  • 構造化フローモデリングのための統一的フレームワーク:表現,検証,モデル発見 [math.CO, cs.DM, math.NT, physics.data-an, cs.LG]目的:構造化フローシステムの表現,検証,およびモデル発見に関する統一的な視点
    • 物理,工学,データ駆動型システムなど,多様な分野で構造化フローが重要視されている
    • 既存の手法では,表現力,解釈可能性,計算複雑性,データ要件のバランスが課題であった
    • 観測されたダイナミクスの基盤となる支配的メカニズムを明らかにするためのモデリング手法を開発する
    • ヘルムホルツ-ホッジ分解とグラフベクトル場(GVF)フレームワークを基盤とした構造化フローモデルの階層を提案した
    • 勾配,カール,調和,トポロジー的寄与を系統的に評価するアブレーション研究に基づいた検証手法を確立した
    • 構造的検証,行動的検証,ドメイン固有の検証を分離し,複雑なダイナミクスシステムの拡張性と解釈可能性を向上させた

    Link: https://arxiv.org/abs/2605.18250

  • AIリスクの保険可能範囲:肯定的な補償,潜在的リスク,除外条項のマッピング [q-fin.RM, cs.AI, cs.CR, cs.CY, econ.GN, q-fin.EC]目的:AIリスクに対する保険の境界線
    • AI技術の急速な発展は,企業活動に不可欠となりつつあり,リスク管理の重要性が増している。
    • 既存の保険契約では,AIに関連する損失に対するカバー範囲が曖昧で,論争の余地がある。
    • AIリスクの保険可能性を明確化し,適切な保険商品設計に貢献すること。
    • AIによる損失は,肯定的に補償される場合,潜在的リスクとして存在する契約,除外条項の対象となる場合があることが明らかになった。
    • AI補償は,モデルの性能,幻覚,知的財産権侵害,自律システム,ディープフェイクなど,リスクの重点に応じて差別化され始めている。
    • 基盤モデルの集中化が,保険可能性の新たなフロンティアであり,モデルの失敗が複数の保険契約者に影響を及ぼす可能性がある。

    Link: https://arxiv.org/abs/2605.18784

  • 人工知能支援放射線療法における磁気共鳴画像異常値の検出:深層学習を用いた異常の教師なし検出と局在化 [physics.med-ph, cs.AI, cs.CV]目的:放射線療法ワークフローにおける磁気共鳴画像異常値の教師なし検出と局在化
    • 放射線療法に人工知能を導入する上で,画像データの品質管理は治療精度に直結するため重要である。
    • 放射線療法で使用される磁気共鳴画像において,分布外のデータによる異常が,AIの予測に悪影響を及ぼす可能性がある。
    • 本研究は,深層学習を用いて,放射線療法ワークフローにおける磁気共鳴画像の異常を自動的に検出し,その位置を特定することを目的とする。
    • 骨盤MRIにおいて,AUC 0.97 (95% CI, 0.95-0.98)という高い検出性能を示し,脳MRIでもAUC 0.81 (95% CI, 0.74-0.87)を達成した。
    • ヒートマップ分析により,検出された異常領域と正解データとの間で高い空間的一致性が確認され,局在化の正確性が支持された。
    • 本研究は,放射線療法におけるMRI品質管理層としての教師なし異常検出の可能性を示唆し,AIタスクへの影響が懸念される領域の可視化を可能にする。

    Link: https://arxiv.org/abs/2605.24609

  • ガウス混合分布エンドポイントに対するリフテッド・シュレーディンガーブリッジ:射影ギャップと経路空間の障害 [math.OC, cs.LG, cs.RO, cs.SY, eess.SY]目的:ガウス混合分布エンドポイント間の確率密度制御
    • 確率過程の制御は,統計物理や機械学習など幅広い分野で重要である。
    • ガウス混合分布間の直接的なシュレーディンガーブリッジは一般的に解析解を持たない。
    • 経路空間を拡張することで,ガウス混合分布間の制御問題を解決する。
    • 経路空間の拡張により,ガウス混合分布の各成分間のシュレーディンガーブリッジを明示的に計算可能となった。
    • 射影による情報損失が発生し,リフテッドな最適解と直接的なシュレーディンガーブリッジが一致しない場合があることが示された。
    • 特定の条件下では,射影ギャップが消失し,両者の最適解が一致することが確認された。

    Link: https://arxiv.org/abs/2605.24795

  • 即時効果と指数型分布を持つ識別可能なマルコフスイッチングモデル [stat.ML, cs.LG, stat.ME]目的:非定常時系列における潜在的な状態と状態依存因果構造の識別
    • 時間変化するシステムを理解するためには,隠れた状態変化を捉えるモデリングが不可欠である。
    • 状態変化が頻繁に起こり,非線形性や非ガウス性が存在する場合,状態の識別が困難となる。
    • 測定頻度の遅さから生じる即時効果の影響下においても,状態と因果構造を識別する手法を確立する。
    • 本研究では,指数型分布に従う独立なノイズ下での潜在状態と状態依存因果構造の識別可能性が示された。
    • 提案手法FlowMSMは,既存の因果探索手法と組み合わせることで,非定常時系列から状態依存因果構造を復元可能である。
    • 合成データおよび金融経済データを用いた実験により,提案手法の有効性が確認された。

    Link: https://arxiv.org/abs/2606.02231