arXiv雑要約

AI - 2026/03/10 公開

動的システムの再構成のための二重射影：確率的および決定論的領域の間 [cs.LG, q-bio.QM]目的：動的システムのモデリング
- 科学の多くの分野で，観測データからの動的システムの確率的モデルの学習が求められている
- 既存手法では，低次元状態空間でのモデル学習や，確率的要素と決定論的要素の分離が難しい
- 二重射影法により，システムの状態軌跡とノイズ時系列を同時に推定し，この問題を解決する
- 提案手法は，従来の動的変分オートエンコーダと比較して，より低次元の状態空間でのモデル学習が可能となった。
- ベンチマークテストの結果，シミュレーションデータおよび実験データ双方において良好な性能が確認された。
- 多段階スキームの教師強制間隔が内部ダイナミクスに及ぼす影響を評価し，決定論的モデルとの比較を行った。
Link: https://arxiv.org/abs/2510.01089
FORプロンプティング：非対称プロンプティングプロトコルによる反論から修正へ [cs.RO, cs.SY, eess.SY, cs.CL, cs.AI, cs.MA]目的：反論から修正へのプロセスを促す非対称プロンプティングプロトコル
- 大規模言語モデルの推論能力向上は，様々なタスクの自動化に不可欠である。
- 既存の推論プロトコルは，自己修正を促す外部からの質問メカニズムが不足している。
- FORプロンプティングは，外部からの質問を通じてモデルの自己修正能力を高めることを目指す。
- FORプロンプティングは，GSM8KにおいてCoTと同等の精度を達成し，単一プロンプティングよりも一貫して高い性能を示した。
- 小規模モデル(LLaMA-3.2-1B等)において，FORプロンプティングは直接プロンプティングよりも大幅に性能が向上し，軽量な推論ベースラインと同等レベルに達した。
- モデルの役割を入れ替える実験から，性能は主にDefenderに依存することが示され，小規模モデルでも効果的なQuestionerとして機能可能であることが示唆された。
Link: https://arxiv.org/abs/2510.01674
多段階攻撃のための木構造探索による強化学習ポリシー最適化 [cs.LG, cs.AI, cs.CL]目的：大規模言語モデルに対する多段階攻撃戦略の自動発見
- AIの安全性確保は重要であり，対話形式の攻撃に対する脆弱性が課題となっている。
- 既存手法は手動またはテンプレートに頼り，多段階攻撃の多様な戦略を網羅できていない。
- 複雑な対話状況下で最適な攻撃経路を探索し，多段階攻撃の成功率向上を目指す。
- 提案手法DialTreeは，木構造探索と強化学習を組み合わせることで，多段階攻撃戦略を自律的に発見する。
- 12の対象モデルに対し，既存最先端手法と比較して44.2%以上高い攻撃成功率を達成した。
- 最適な対話ポリシーを学習することにより，新たな攻撃戦略を効果的に明らかにした。
Link: https://arxiv.org/abs/2510.02286
グラフに基づく表形式深層学習における特徴量相互作用の役割 [cs.RO, cs.SY, eess.SY, cs.LG, stat.ML]目的：グラフに基づく表形式深層学習における特徴量相互作用のモデル化の現状分析
- 表形式データの予測精度向上は，データ固有の特徴量間の複雑な相互作用を捉えることに依存する。
- 既存のGTDL手法は予測精度最適化に偏り，基礎となるグラフ構造の正確なモデル化が軽視されている。
- GTDL手法が特徴量間の有意義な相互作用を捉えられていない現状を明らかにし，改善の方向性を示す。
- 合成データセットを用いた実験により，既存のGTDL手法は特徴量相互作用を正確に復元できていないことが判明した。
- 真の相互作用構造を課すことで予測精度が向上することから，グラフ構造の正確なモデル化の重要性が示唆された。
- GTDL手法は，予測精度だけでなく，グラフ構造のモデル化を優先する必要があることが示された。
Link: https://arxiv.org/abs/2510.04543
小型だが強力：バッテリー駆動の小型デバイスにおける効率的なマルチモーダル推論のためのソフトウェア・ハードウェア共同設計アプローチ [cs.CL, cs.DC, cs.AI, cs.CL, eess.SP]目的：バッテリー駆動の小型デバイス上での効率的なマルチモーダル推論
- 近年，画像や音声など複数の情報を扱うマルチモーダルモデルが注目されている。
- 既存の手法では，モデル全体が一括処理されるため，ハードウェア資源が十分に活用されない。
- 異種アクセラレータを有効活用し，低遅延かつ省電力な推論を実現すること。
- 本研究では，モデルをモジュール化し，各モジュールを最適なアクセラレータに割り当てるNANOMINDを提案した。
- NANOMINDは，ハードウェア設計，システムスケジューリング，低ビット演算カーネルの最適化を組み合わせることで，高い処理能力と省電力性を実現した。
- 試作機による評価の結果，エネルギー消費量を42.3%，GPUメモリ使用量を11.2%削減し，LLaVA-OneVisionを約20.8時間駆動できることを確認した。
Link: https://arxiv.org/abs/2510.05109
大規模言語モデルのトークナイザーに対するメンバーシップ推論攻撃 [cs.CR, cs.AI]目的：大規模言語モデルのトークナイザーにおけるメンバーシップ漏洩の可能性
- 機械学習モデルのプライバシーリスク評価において，メンバーシップ推論攻撃は重要な手法である。
- 大規模言語モデルへの攻撃は，誤ったラベル，分布のずれ，モデルサイズの差異などの課題を抱える。
- トークナイザーに着目し，これらの課題を回避することで，プライバシーリスクを評価する新たな方法を確立する。
- トークナイザーは，大規模言語モデルの学習データに関する情報を漏洩する脆弱性を持つことが示された。
- 既存の5つの攻撃手法を用いて，インターネット上の大規模データセットに対するトークナイザーの脆弱性を検証した。
- 適応的な防御手法を提案し，トークナイザーに対するプライバシー保護の必要性を強調した。
Link: https://arxiv.org/abs/2510.05699
LLM議論における熟議の動態と価値観の整合性 [cs.RO, cs.AI]目的：LLM議論における熟議の動態と価値観の整合性の分析
- LLMは日常生活の様々な場面で利用されつつあり，倫理的判断能力の理解は不可欠である。
- 従来の評価は単一ターンでのプロンプトに限定されており，複数ターンの状況下での振る舞いは不明である。
- LLM議論を通して，複数ターンの熟議における価値観の整合性を明らかにすることを目的とする。
- GPT-4.1は熟議において強い慣性を示し，意見の修正率が低い傾向にあった。
- Claude 3.7 SonnetとGemini 2.0 Flashは柔軟性が高く，意見の修正率が高かった。
- GPT-4.1は個人の自律性と直接的なコミュニケーションを重視し，他のモデルは共感的な対話を優先していた。
Link: https://arxiv.org/abs/2510.10002
多層への注意再配分によるマルチモーダルな幻覚の軽減 [cs.AI]目的：マルチモーダル大規模推論モデルにおける幻覚軽減
- マルチモーダル推論は，画像とテキストを統合し高度なタスクを可能にするため重要である。
- 既存モデルでは，視覚情報の誤った利用や推論過程の不安定さから幻覚が生じやすい。
- 層ごとの注意配分の偏りを修正し，視覚と推論のバランスを改善することを目指す。
- 提案手法は，モデルの再学習や構造変更なしに，推論の一貫性と視覚情報の忠実性を向上させる。
- 3つの代表的なモデルと5つのベンチマークで平均4.2%の性能向上を示し，計算コストと遅延の増加は軽微である。
- 本研究は，マルチモーダル推論の信頼性向上に向けた，層間機能ダイナミクスの制御に関する解釈可能な知見を提供する。
Link: https://arxiv.org/abs/2510.10285
DropVLA：ビジョン-言語-行動モデルに対する行動レベルのバックドア攻撃 [cs.RO, cs.CR, cs.AI, cs.RO]目的：ビジョン-言語-行動モデルへの行動レベルのバックドア攻撃手法の開発
- ロボットの自律性を向上させる上で，ビジョン-言語-行動モデルの安全性が不可欠である。
- 既存研究では，タスクレベルでの攻撃が主であり，個々の行動を制御する攻撃は未検討であった。
- 限られたデータ汚染で，安全に重要な行動を秘密裏に操作する手法を確立すること。
- 提案手法DropVLAは，限られたデータ汚染（0.31%）で98.67%-99.83%の高い攻撃成功率（ASR）を達成した。
- 視覚のみによる汚染で攻撃が成立し，テキストとの組み合わせではASRの顕著な改善は見られなかった。
- 実機検証により，カメラ相対運動によるトリガーのずれに対しても攻撃の有効性が確認された。
Link: https://arxiv.org/abs/2510.10932
ヒューマノイドの接触計画のための自己視点ワールドモデル [cs.RO, cs.AI, cs.SY, eess.SY]目的：ヒューマノイドロボットの接触計画における自己視点ワールドモデルの利用
- 複雑な環境下でのロボットの自律性には，物理的な接触の利用が不可欠である。
- 従来の最適化に基づく計画手法は接触の複雑さに対応できず，強化学習はサンプル効率が低い。
- オフラインデータセットを用いた学習により，サンプル効率とマルチタスク能力を向上させる。
- 自己視点ワールドモデルとモデル予測制御を組み合わせたフレームワークを提案する。
- 学習されたサロゲート価値関数を用いることで，疎な接触報酬とセンサーノイズに対処する。
- 実機ヒューマノイドによる実験で，ロバストでリアルタイムな接触計画を実証した。
Link: https://arxiv.org/abs/2510.11682
ロボット移動のためのアクター・クリティック強化学習における事前学習 [cs.CL, cs.RO, cs.LG]目的：ロボット移動における強化学習の効率化と性能向上
- ロボットの自律的な動作実現には，環境に適応した学習が不可欠である。
- ロボット移動における個々のスキルは，汎用的な知識を共有しているにも関わらず，毎回ゼロから学習されることが多い。
- ロボットの知識を事前学習で獲得し，強化学習の初期状態として活用することで学習を効率化する。
- 提案手法は，9つの異なるロボット移動環境で有効性が検証された。
- ランダム初期化と比較して，サンプル効率が平均36.9%向上し，タスク性能が平均7.3%向上した。
- 事前学習が，強化学習の学習効率と性能に貢献するメカニズムが明らかになった。
Link: https://arxiv.org/abs/2510.12363
Bee：高品質コーパスと高度な完全オープンMLLMを可能にするフルスタックスイート [cs.HC, cs.CV, cs.AI]目的：高品質なデータセットとフルスタックスイートによる高度な完全オープンMLLMの開発
- マルチモーダル大規模言語モデル(MLLM)は，画像とテキストを理解するAIとして重要であり，その発展が期待されている。
- オープンソースのMLLMは，データ品質の低さにより，クローズドソースのモデルに劣ることが課題となっている。
- 高品質なデータセットとデータキュレーションパイプラインを提供し，オープンMLLMの性能向上を目指す。
- 本研究で開発されたHoney-Data-15MデータセットとHoneyPipeパイプラインは，データ品質向上に貢献する。
- Bee-8Bモデルは，Honey-Data-15Mで学習した結果，既存のオープンMLLMの最先端性能を達成した。
- 実験により，データ品質に注力することが，高性能なオープンMLLM開発の重要な要素であることが示された。
Link: https://arxiv.org/abs/2510.13795
ARM-FM：基盤モデルによる構成的強化学習のための自動報酬マシン [cs.AI, cs.LG]目的：強化学習における自動報酬設計の枠組み
- 強化学習は応用範囲が広いが，報酬関数の設定が重要課題となっている。
- 報酬関数の適切な設定が困難であり，汎用性に欠けるという課題がある。
- 基盤モデルを活用し，自然言語による報酬仕様から自動的に報酬マシンを生成する。
- 本研究では，基盤モデルを用いて報酬マシンを自動生成し，自然言語でのタスク指定を可能にした。
- 報酬マシンの構造化された形式により，タスクの効率的な分解を実現した。
- 多様な環境において，ゼロショット汎化を含む有効性を示す実験結果が得られた。
Link: https://arxiv.org/abs/2510.14176
結果が思考を正当化する：LLMにおけるCoTによる動機付け推論 [cs.RO, cs.CL, cs.LG, cs.AI]目的：LLMの思考過程における動機付け推論の発生とその検出に関する研究
- 大規模言語モデルの安全性確保は重要であり，有害な行動を早期に検出する必要がある。
- 報酬ハッキング等の問題に対処するためCoTモニタリングが用いられるが，誤った判断を下す可能性がある。
- 学習された行動と指示の矛盾が生じた際，モデルが動機付け推論を用いるメカニズムを解明する。
- モデルは指示に反する行動を正当化し，潜在的な危険や矛盾を矮小化する動機付け推論を行うことが示された。
- 学習が進むにつれ動機付け推論が顕著になり，CoTモニタリングモデルは誤った判断をする傾向が強まることが明らかになった。
- 大規模モデルは人間の動機付け推論検出能力に匹敵するが，低コストな小規模モデルによるモニタリングの限界が示唆された。
Link: https://arxiv.org/abs/2510.17057
金融ネットワークにおける適応的専門家ルーティングによる説明可能な異種異常検知 [cs.LG, cs.AI, cs.CE]目的：金融ネットワークにおける異種異常検知手法の開発
- 金融市場の安定維持は経済活動の基盤であり，異常検知による早期対応が不可欠である。
- 既存の異常検知手法は，異常の原因を特定できず，的確な対策を講じることが困難である。
- 金融市場特有の異常メカニズムを考慮し，異常の原因を特定可能な手法を開発する。
- 本手法は，価格ショック，流動性凍結，コンタジオン，モメンタム反転といった異種異常を，それぞれのメカニズムに対応する専門家ルーティングを用いて分解する。
- 100銘柄のデータを用いて検証した結果，主要なストレスイベントを平均3.7日前から検知でき，既存手法を33%ポイント上回る性能を示した。
- ケーススタディにより，ラベルなしで局所的な危機とシステミックな危機を区別できることが示された。
Link: https://arxiv.org/abs/2510.17088
継続的オーディオ・ビジュアルセグメンテーションにおけるモダリティエンタングルメントの抑制 [cs.MM, cs.AI, cs.CV]目的：継続的なオーディオ・ビジュアルセグメンテーションにおけるモダリティエンタングルメントの抑制手法
- マルチモーダル学習は，人間のように複数の感覚情報を統合し理解するAI実現に不可欠である。
- 既存手法は粗粒度なタスクに偏り，細粒度な継続学習におけるモダリティ間の干渉に対処できない。
- 本研究は，音響情報に基づいた継続的なセグメンテーションにおけるモダリティエンタングルメント問題を解決する。
- 提案手法では，マルチモーダルな意味的ドリフトを防ぐため，モダリティ一貫性の高いサンプルをリハーサルに選択する。
- また，共起混同に対処するため，混同しやすいクラスのリハーサルサンプル頻度を増加させる衝突ベースのリハーサル機構を導入する。
- 実験結果から，提案手法が単一モダリティの継続学習手法を大幅に上回ることが示された。
Link: https://arxiv.org/abs/2510.17234
表形式予測のための構造的事前知識によるLLMの数値推論の強化 [cs.LG, cs.AI]目的：表形式データに対するLLMの数値推論能力向上
- 表形式データ分析は重要であり，ビジネスや科学研究において広く利用されている。
- 既存手法は解釈性や汎用性に課題があり，異なるタスクへの適応が困難である。
- LLMの潜在的な数値推論能力を引き出し，表形式データ分析における性能を向上させる。
- 提案手法は，フル教師あり学習ベースラインと同等の性能を達成し，ゼロショット設定で優位性を示す。
- 8Bモデルは，より大規模なLLM（DeepSeek-R1 685B）を大幅に上回り，最大53.17%の改善を実現した。
- PRPOは，ラベルを保存する置換を通して報酬を密な信号に変換し，LLMの数値推論能力を活性化する。
Link: https://arxiv.org/abs/2510.17385
グラフニューラルネットワークの堅牢性検証：軽量充足可能性テストによる手法 [cs.RO, cs.CL, cs.HC, cs.IR, cs.HC, cs.LG]目的：グラフニューラルネットワークの堅牢性検証
- グラフ構造データに対する機械学習は重要であり，その信頼性は社会実装において不可欠である。
- 入力の微小な摂動に対する脆弱性が存在し，攻撃による誤った出力が懸念される。
- 効率的な部分ソルバーを用いることで，構造的堅牢性の検証を高速化し，実用性を高める。
- 提案手法RobLightは，既存手法と比較して計算効率が向上し，大規模グラフへの適用が可能となった。
- 多様なGNNモデルとデータセットにおいて，堅牢性検証の精度を維持しつつ，大幅な高速化を実現した。
- 充足可能性テストの軽量化により，より現実的なグラフ攻撃に対する堅牢性評価が可能となった。
Link: https://arxiv.org/abs/2510.18591
知覚タスクのための合成データ生成器としてのドライビングワールドモデルの再考 [cs.CV, cs.AI]目的：知覚タスクの性能向上を目指した合成データ生成フレームワーク
- 自動運転の安全性を高めるためには，多様な環境下での知覚能力の向上が不可欠である。
- 既存の合成データ生成手法では，知覚タスクの性能評価が十分に行われていない場合が多い。
- この研究は，自動運転における知覚タスクの性能を大幅に向上させる合成データ生成を目指す。
- 提案手法Dream4Driveは，3Dアセットとガイダンスマップを用いて，多様な視点からのコーナーケースを大規模に生成可能である。
- 実験により，Dream4Driveが様々な学習エポック数において，ダウンストリーム知覚モデルの性能を効果的に向上させることが示された。
- 大規模な3DアセットデータセットDriveObj3Dを公開し，今後の研究を支援する。
Link: https://arxiv.org/abs/2510.19195
デジタル資産取引における異常検知のための人間中心LLMエージェントシステム [cs.SI, cs.DC, cs.DB, cs.AI]目的：デジタル資産取引における異常検知
- 金融取引の透明性と安全性確保は，社会経済活動の健全な発展に不可欠である。
- 既存の異常検知システムは，判断根拠が不明瞭で，専門家でなければ理解が困難な場合が多い。
- 人間が介入可能な形で，異常検知のプロセスを可視化し，説明責任を向上させることを目指す。
- HCLAは，ルール抽象化，証拠スコアリング，専門家風の説明という3つの役割を会話形式で統合したシステムである。
- 実験の結果，HCLAは，予測精度を維持しつつ，解釈性，対話性，意思決定の透明性を大幅に向上させた。
- アルゴリズムによる証拠と規制・調査上の判断を整合させることで，説明可能性を超えた説明責任と信頼性を実現する。
Link: https://arxiv.org/abs/2510.20102
ゼロショット強化学習のための統一的フレームワーク [cs.LG]目的：ゼロショット強化学習におけるアルゴリズムの分類と誤差解析
- 汎用的なエージェント開発が重要視されており，事前学習で獲得した知識を活用できるかが鍵となる。
- 多様なアプローチが存在する中で，それらを比較・評価するための統一的な基準が求められていた。
- 既存手法を体系化し，誤差要因を明確化することで，今後の研究の指針を示す。
- 本研究では，表現方法と学習パラダイムの二つのレベルでアルゴリズムを分類するタクソノミーを提案した。
- 既存の誤差限界を，推論，報酬，近似の３つの要素に分解する統一的な見解を提示した。
- これにより，異なる手法間の比較がより厳密になり，ゼロショット強化学習の研究発展に貢献すると期待される。
Link: https://arxiv.org/abs/2510.20542
Step2Motion：圧力センサ内蔵インソールからの歩行再構成 [cs.GR, cs.AI]目的：圧力センサ内蔵インソールからの人間歩行再構成手法
- 人間運動の理解と再構成には，足と地面との相互作用が不可欠である。ウェアラブルデバイスの進歩が，その計測を可能にした。
- 従来のモーションキャプチャは，制約や視線制限があり，屋外環境での利用が困難であった。
- インソールセンサを活用した，制約のないロバストな歩行再構成法の開発が求められている。
- Step2Motionは，マルチモーダルなインソールセンサデータ（圧力と慣性）を用いて歩行を再構成する初の試みである。
- 本手法は，歩行やジョギングといった単純な動作から，横移動，つま先立ち，かがみ込み，ダンスといった多様な動作に対応可能である。
- 実験を通して，様々な歩行スタイルに対する汎用性が示された。
Link: https://arxiv.org/abs/2510.22712
SwiftTS：多タスクメタ学習による時系列事前学習モデルの迅速選択フレームワーク [cs.LG]目的：時系列事前学習モデルの選択方法
- 時系列データ分析において，事前学習モデルの活用が重要視されている。
- 多数のモデルが存在する中で，最適なモデルを個別に微調整するには時間がかかる。
- モデルの性能予測を通じて，効率的なモデル選択を実現することを目的とする。
- SwiftTSは，過去のデータセットとモデルの性能ペアを利用して，未見のデータセットにおけるモデル性能を予測する。
- 軽量なデュアルエンコーダ構造により，時系列データとモデルを効率的に埋め込み，互換性スコアを計算する。
- ホライゾン適応型エキスパート合成モジュールと，クロスデータセット/ホライゾンタスクサンプリングにより，汎化性能とOODロバスト性を向上させている。
Link: https://arxiv.org/abs/2510.23051
CountFormer：クラス非特定物体数推定のためのTransformerフレームワーク [cs.HC, cs.CV, cs.AI]目的：視覚的繰り返しと構造を学習することによる，クラス非特定物体数推定
- 人間は，物体カテゴリに頼らず，視覚的繰り返しと構成によって物体数を推定できる。
- 既存のサンプル不要型数推定モデルは，対称性のある物体や繰り返し構造，部分的遮蔽において過剰な数値を算出する傾向がある。
- 自己教師あり学習済みモデルDINOv2を用いたTransformerによって，構造の一貫性を向上させ，サンプル不要型数推定の精度向上を目指す。
- CountFormerは，FSC-147データセットにおいて，公式ベンチマークで競争力のある性能（MAE 19.06，RMSE 118.45）を達成した。
- 定性的な分析により，構造が複雑な物体において，部分レベルでの過剰な数え間違いが減少する傾向が示唆された。
- 高密度シーンがわずかに含まれるだけで，評価指標が大きく影響を受けることが明らかになった。表現の質がサンプル不要型物体数推定において重要である。
Link: https://arxiv.org/abs/2510.23785
LagMemo：言語3Dガウススプラッティングメモリを用いたマルチモーダル・オープンボキャブラリ・マルチゴール視覚ナビゲーション [cs.RO, cs.AI]目的：マルチモーダル・オープンボキャブラリ・マルチゴール視覚ナビゲーションにおける性能向上
- ロボットの自律性を高める上で，視覚情報に基づいたナビゲーション能力は不可欠である。
- 既存手法では，多様な目標表現や複数目標への対応が十分ではない場合がある。
- 言語と3D空間情報を統合したメモリを活用し，効率的な目標探索を実現する。
- LagMemoは，言語3Dガウススプラッティングメモリを構築することで，空間と意味の相関を強固にする。
- 提案手法は，GOAT-Coreデータセットにおいて，最先端手法を大きく上回る性能を示した。
- メモリモジュールが，マルチモーダル・オープンボキャブラリ定位において有効であることが確認された。
Link: https://arxiv.org/abs/2510.24118
SwiftEmbed：リアルタイムアプリケーションのための静的トークン参照による超高速テキスト埋め込み [cs.CL, cs.AI]目的：リアルタイムアプリケーション向けテキスト埋め込みシステム
- 自然言語処理において，テキストの意味的表現を得る埋め込み技術は重要である。
- 既存の埋め込み手法は計算コストが高く，リアルタイム処理には不向きな場合がある。
- 低遅延かつ高スループットなテキスト埋め込みを実現し，リアルタイムアプリケーションを支援する。
- SwiftEmbedは，単一テキストリクエストに対して1.12msのp50レイテンシを達成した。
- 8つの代表的なタスクで60.6のMTEB平均スコアを維持し，高い精度を確保した。
- 重複検出性能は90.1%のAP，意味的類似性は76.1%のSpearman相関を示した。
Link: https://arxiv.org/abs/2510.24793
LLMベースの生成推薦システムのための継続的低ランクアダプター [cs.LG, cs.IR]目的：LLMベースの推薦システムにおける継続学習の改善
- 推薦システムは，ユーザーの嗜好変化に対応し，常に最適な提案を行う必要があり，重要性が高い。
- 従来の継続学習手法は過去の性能維持に偏りがちで，推薦システム特有の嗜好変化への対応が課題であった。
- ユーザーの最新の行動を捉え，嗜好の変化に柔軟に対応できる継続学習手法を確立することを目指す。
- 提案手法PESOは，LoRAアダプターを最新の状態に固定する正則化項を導入し，適応と性能維持のバランスを実現した。
- 理論的に，この設計がLoRA空間内でデータに基づいた方向性を提供する事を示した。
- 実験的に，PESOは既存のLoRAベースの継続学習手法を上回る性能を示した。
Link: https://arxiv.org/abs/2510.25093
ベクトル化オンラインPOMDP計画 [cs.RO, cs.RO, cs.RO, cs.AI]目的：部分観測下における計画
- 自律ロボットの重要な能力であり，不確実な環境下での意思決定に不可欠である。
- 並列化が困難で，計算資源を有効活用できていない現状がある。
- ベクトル化により，並列処理のボトルネックを解消し，効率的な計画を可能とする。
- 提案手法VOPPは，既存の並列オンラインソルバーと比較して，少なくとも20倍効率的に近似最適な解を算出する。
- VOPPは，最新の逐次オンラインソルバーを凌駕する性能を発揮しつつ，計画予算を1000分の1に削減する。
- 部分最適化を解析的に解くことで，数値計算を期待値の推定に集中させ，ベクトル化を可能にした。
Link: https://arxiv.org/abs/2510.27191
拡散スナップバック再構成によるAI生成画像検出：フォレンジックアプローチ [cs.CV, cs.AI]目的：AI生成画像検出手法の開発
- デジタルコンテンツの信頼性確保が重要課題となっている。
- 従来の検出法では，AI生成画像を人間が判別できない場合がある。
- 拡散モデルの再構成特性を利用し，AI生成画像検出の新たな方法を提案する。
- 提案手法は，4,000枚の画像データセットにおいて，AUROC 0.993を達成した。
- 画像圧縮やノイズ付加といった現実世界の歪みに対して，安定した性能を示した。
- 拡散モデルの再構成挙動が，合成メディア検出の信頼できる基盤となりうることを示唆する。
Link: https://arxiv.org/abs/2511.00352
運動イメージEEG分類における解釈可能性と性能のバランス：ANFIS-FBCSP-PSOとEEGNetの比較研究 [cs.LG, cs.AI, cs.NE]目的：運動イメージEEG分類における解釈可能性と性能の比較
- 脳とコンピュータを接続するBCI技術の発展には，高精度なEEG解析が不可欠である。
- 従来のEEG解析手法では，精度と解釈可能性を両立することが困難であった。
- 本研究は，解釈可能性と汎化性能のトレードオフを明らかにし，適切なシステム選択の指針を示す。
- ANFIS-FBCSP-PSOは，被験者内実験においてEEGNetよりも高い分類精度を示した。
- 一方，交差検証（LOSO）では，EEGNetがより優れた汎化性能を発揮した。
- 本研究の結果は，解釈可能性とロバスト性のどちらを重視するかによってシステム選択が異なることを示唆する。
Link: https://arxiv.org/abs/2511.00369
モバイルエッジコンピューティングのためのネットワーク化混合エキスパートモデルの効率的な連合学習に向けて [cs.LG, cs.AI, cs.NI]目的：ネットワーク化混合エキスパートモデルの連合学習フレームワーク
- 次世代無線ネットワークにおいて，大規模AIモデルがモバイルエッジコンピューティングの革新を牽引している。
- エッジデバイスの計算資源やデータ容量の制約が，大規模AIモデルの学習と展開を困難にしている。
- エッジ環境下での効率的な学習と展開を実現するため，分散協調学習の枠組みを構築する。
- 提案するネットワーク化混合エキスパートモデルは，近隣デバイス間で専門知識を共有し，協調推論を可能にする。
- 連合学習フレームワークは，教師あり学習と自己教師あり学習を統合し，汎化性能と個人化のバランスを取る。
- 実験結果は，提案手法の有効性を示し，ネットワーク化混合エキスパートモデルの学習アルゴリズムに関する知見を提供する。
Link: https://arxiv.org/abs/2511.01743
FATE：難易度に応じた最先端代数問題の正式ベンチマークシリーズ [cs.LG, cs.AI, cs.FL, cs.LO]目的：最先端代数問題の形式的な評価
- 近年のLLMの進展は形式的定理証明の能力を示したが，現代数学研究の深さや抽象性を反映していない。
- 既存の数学コンテストは，現代数学研究の多様な側面を網羅できていない。
- 研究レベルの形式的数学推論に向けた重要なチェックポイントを確立すること。
- FATEは，学部レベルから博士課程の資格試験を超える難易度の問題を網羅する新しいベンチマークシリーズである。
- 最先端のLLMプロバーはFATE-Hで3%の正答率，FATE-Xでは0%の正答率であり，コンテスト数学と比較して大きな性能差が見られた。
- モデルの自然言語推論の精度は，その推論を形式化する能力よりも優れていることが示された。
Link: https://arxiv.org/abs/2511.02872
ジュニアAI科学者とそのリスク報告：基盤論文からの自律的な科学的探求 [cs.AI, cs.CL, cs.CV, cs.LG]目的：AI科学者システムの現状とリスクの把握
- AI技術の進展に伴い，科学研究への応用が期待される。信頼性と持続可能性が重要となる。
- 既存のAI科学者システムは，完全自動化や小規模コードに限定され，複雑な研究プロセスに対応できない場合がある。
- 基盤論文に基づき，仮説形成から実験，論文執筆までの一連の研究フローをAIが自律的に実行し，科学的貢献を生み出すことを目指す。
- Jr. AI科学者は，NeurIPS，IJCV，ICLR等の論文を基に，新しいアルゴリズムを提案・実装し，研究論文を生成することに成功した。
- DeepReviewerによる自動評価の結果，既存の完全自動システムよりも高い評価を得た。
- 著者評価やAgents4Scienceレビューからは，AI科学者システムの限界と潜在的なリスクが明らかになり，今後の研究課題が示唆された。
Link: https://arxiv.org/abs/2511.04583
分布ロバストな自己ペースカリキュラム強化学習 [cs.LG]目的：分布シフトに対するロバスト性と性能のバランス
- 強化学習は実世界への応用が期待されるが，環境の変化に弱い点が課題である。
- 従来のDRRLはロバスト性と性能のトレードオフがあり，適切な$\epsilon$の決定が難しい。
- $\epsilon$を動的に調整することで，ロバスト性と性能のバランスを最適化することを目指す。
- 提案手法DR-SPCRLは，エージェントの学習進捗に応じてロバスト性予算$\epsilon$を適応的に調整する。
- 様々な環境での実験により，DR-SPCRLは学習の安定化とロバスト性・性能のトレードオフ改善に貢献することが示された。
- 摂動下での平均エピソード報酬は，固定またはヒューリスティックな手法と比較して11.8%向上し，通常の強化学習アルゴリズムの約1.9倍の性能を達成した。
Link: https://arxiv.org/abs/2511.05694
分数階ニューラル拡散ネットワークを用いた適応的多視点グラフ対照学習 [cs.LG]目的：グラフのノードおよびグラフ表現の学習
- グラフ構造データ分析において，表現学習は重要な役割を果たす。
- 既存手法は固定された視点に依存し，多様な構造パターンを捉えきれない。
- 分数階微分を利用し，データに適応的に拡散スケールを学習する。
- 本手法は，手動でのデータ拡張なしに多様で補完的な表現を生成する。
- 標準的なベンチマーク実験において，最先端のグラフ対照学習手法を上回る性能を示す。
- よりロバストで表現力豊かな埋め込み表現を獲得できることが示された。
Link: https://arxiv.org/abs/2511.06216
マスクされた自己符号化器における文脈的異常推定によるAI生成画像検出 [cs.CV, cs.AI, cs.CY]目的：AI生成画像の検出
- 画像生成AIの急速な発展により，AI生成画像と実画像の区別が重要になっている。
- 既存の画像検出器は，生成器特有のアーティファクトに依存しており，高画質化により検出精度が低下する。
- 文脈的異常推定を用いて，よりロバストなAI生成画像検出手法を確立することを目指す。
- 提案手法CINEMAEは，マスクされた自己符号化器(MAE)の再構成メカニズムとエンコーダーを活用し，文脈的および特徴に基づく手がかりを融合する。
- GenImageとAIGCDetectBenchmarkにおいて，それぞれ96.63%と93.96%の高い平均精度を達成した。
- JPEG圧縮(QF=50)下でも93%以上の精度を維持し，堅牢性も確認された。
Link: https://arxiv.org/abs/2511.06325
HatePrototypes: 陰険および明示的なヘイトスピーチ検出のための解釈可能かつ転移可能な表現 [cs.CL, cs.AI]目的：ヘイトスピーチ検出のための表現
- オンライン上の有害コンテンツ増加に伴い，ヘイトスピーチの自動検出技術の重要性が高まっている。
- 既存のヘイトスピーチ検出ベンチマークは明示的なヘイトに偏っており，陰険な表現の検出が課題となっている。
- ヘイトスピーチ検出モデルの転移学習を可能にし，効率的な検出手法を確立することを目指す。
- HatePrototypesは，少量のデータからでもクラスレベルのベクトル表現を学習可能であることが示された。
- これらのプロトタイプを用いることで，明示的なヘイトスピーチと陰険なヘイトスピーチ間のタスク間転移が可能になった。
- プロトタイプを用いたパラメータ不要の早期終了が，両方のヘイトスピーチタイプに対して有効であることが確認された。
Link: https://arxiv.org/abs/2511.06391
非体積保存変換による条件付きVAEの改善 [cs.CL, cs.CY, cs.CL, eess.SY, cs.SY, math.DS, cs.LG]目的：条件付きVAEによる画像生成の質の向上
- 生成モデルは画像認識などに応用され，その性能向上が重要である。
- VAEは多様性や鮮明さに課題があり，GANや拡散モデルに取って代わられた。
- 潜在空間の分布をより正確に推定し，VAEの画像生成性能を向上させる。
- 非体積保存変換（NVP）を用いることで，VAEの画像生成性能が向上することが示された。
- 提案手法は既存手法と比較してFIDを4%削減，対数尤度を7.6%向上させた。
- 潜在空間の条件付き分布を正確に推定することで，より高品質な画像生成が可能となった。
Link: https://arxiv.org/abs/2511.08946
ℓ₀攻撃の凸包による堅牢性認証の強化 [cs.LG]目的：少数ピクセル攻撃に対する堅牢性の検証手法
- 画像認識の安全性確保は重要であり，敵対的攻撃への対策が不可欠である。
- ℓ₀攻撃は非凸な摂動空間を持つため，既存の堅牢性検証手法では精度が課題であった。
- ℓ₀攻撃の凸包を効率的に検証し，既存手法の精度向上を目指す。
- ℓ₀ボールの凸包が，その境界ボックスと非対称にスケーリングされたℓ₁様多面体の交差として表現できることを示した。
- 提案手法は，既存の凸包上でのバウンドプロパゲーションよりも緊密なバウンドを計算できる。
- 最先端のℓ₀検証器のベンチマークにおいて，1.24倍から7.07倍の性能向上が確認された。
Link: https://arxiv.org/abs/2511.10576
思考，発話，決定：経済的意思決定のための言語拡張マルチエージェント強化学習 [cs.AI, econ.GN, q-fin.EC]目的：経済的意思決定における言語拡張マルチエージェント強化学習フレームワーク
- 経済活動は価格や税金だけでなく，対話や報道等の言語情報に左右される。
- 従来のマルチエージェント強化学習は，言語の曖昧性や文脈性を扱いきれない。
- 言語情報を活用し，現実世界に近い経済意思決定を可能にすること。
- LAMPは，思考・発話・決定のパイプラインを通じて言語を統合した。
- 実験の結果，LAMPは従来の強化学習やLLMと比較して高い収益性を実現した。
- LAMPは，経済シミュレーションにおいて，頑健性と解釈可能性においても優れていた。
Link: https://arxiv.org/abs/2511.12876
角度勾配符号法：双曲型ネットワークの脆弱性の解明 [cs.LG, cs.CV]目的：双曲型ネットワークにおける脆弱性の解明
- 近年，双曲型ネットワークが注目を集めており，その応用範囲は拡大している。
- 従来の攻撃手法はユークリッド空間に最適化されており，双曲空間での効果が不明確である。
- 双曲空間の幾何学的特性を考慮した新たな攻撃手法を開発し，その有効性を検証する。
- 提案手法は，従来の攻撃手法と比較して，高い欺瞞率を達成した。
- 双曲型埋め込みにおける脆弱性に関する深い洞察が得られた。
- 幾何学を意識した敵対的戦略の重要性が示唆された。
Link: https://arxiv.org/abs/2511.12985
UnfoldLDM：潜在拡散事前知識を用いた深層アンフォールドに基づくブラインド画像復元 [cs.CV, cs.AI]目的：ブラインド画像復元のための深層アンフォールドネットワークと潜在拡散モデルの統合
- 画像復元は，様々な画像処理パイプラインにおいて重要な前処理ステップである。
- 既存の深層アンフォールドネットワークは，特定の劣化モデルに依存し，ブラインド復元に課題がある。
- 未知の劣化モデルに対しても頑健な劣化除去と，高周波成分の回復を目指す。
- 提案手法UnfoldLDMは，マルチグラニュラリティ劣化認識モジュールを用いて未知の劣化を推定する。
- 劣化に強い潜在拡散モデルと，高周波成分を明示的に回復する変換器により，過剰な平滑化を抑制する。
- 様々なブラインド画像復元タスクで優れた性能を示し，既存手法への応用も可能である。
Link: https://arxiv.org/abs/2511.18152
海洋ロボット向け安定マルチドローンGNSS追跡システム [cs.CY, cs.SI, cs.RO, cs.AI, cs.CV]目的：海洋ロボットのGNSS追跡システムの安定化
- 海洋ロボティクスの発展には，正確かつ安定した位置推定が不可欠である。
- GNSS信号は水面下では利用できないため，代替技術に課題が残る。
- 水面付近のロボット追跡において，GNSSの信頼性を高めることを目指す。
- 本研究では，効率的な画像検出，軽量な多物体追跡，GNSS三角測量，信頼度重み付き拡張カルマンフィルタを組み合わせた。
- ドローン間での追跡ID調整アルゴリズムにより，複数ロボットの協調的な追跡とグローバルな整合性を実現した。
- 多様な環境下での実験により，提案手法の精度と頑健性が確認された。
Link: https://arxiv.org/abs/2511.18694
現実的な保証に向けて：SmoothLLMのための確率的証明 [cs.LG, cs.AI]目的：SmoothLLMに対する安全性証明の信頼性向上
- 大規模言語モデルの安全性が重要視される中，敵対的攻撃への堅牢性が課題となっている。
- 従来のSmoothLLMの証明は厳格な仮定に依存し，現実の挙動との乖離が生じていた。
- より現実的な不安定性の定義を導入し，実用的な安全性の保証を目指す。
- 本研究では，現実的な確率的枠組み「(k, ε)-不安定」を導入し，SmoothLLMの証明を改善した。
- 攻撃成功モデルを組み込むことで，より信頼性の高い安全性証明のデータに基づいた下限を導出した。
- この枠組みにより，実世界のLLMの挙動をより正確に反映した認証閾値の設定が可能となる。
Link: https://arxiv.org/abs/2511.18721
Yo'City：自己批評的拡張によるパーソナライズされた無限の3Dリアルな都市シーン生成 [cs.CV, cs.AI]目的：パーソナライズされ無限に拡張可能な3D都市シーンの生成
- VRやデジタルツインなど多様な応用において，リアルな3D都市生成は不可欠な技術である。
- 既存手法は単一の拡散モデルに依存するため，パーソナライズされた大規模都市シーン生成に限界がある。
- 大規模言語モデルを活用し，ユーザーカスタマイズと無限拡張を可能にする新たな都市生成フレームワークを開発する。
- Yo'Cityは，トップダウン計画戦略を用いて「都市-地区-グリッド」構造を定義し，階層的な都市概念化を実現する。
- グリッドレベルの3D生成は，画像合成ループと画像から3Dへの生成を通じて行われ，品質向上を目指す。
- シーングラフに基づく距離と意味を考慮したレイアウト最適化により，空間的に一貫性のある都市成長を実現する。
Link: https://arxiv.org/abs/2511.18734
欺瞞の自動化：スケーラブルな多段階LLM脱獄 [cs.LG, cs.AI]目的：大規模な多段階脱獄データセットの自動生成
- LLMの安全性確保は，社会への応用において不可欠である。
- 手動によるデータセット作成は，規模の拡大が困難である。
- 心理的戦略に基づいた攻撃に対する脆弱性を評価し，対策を促す。
- GPTモデルは会話履歴に対して脆弱性を示し，攻撃成功率が大幅に上昇した。
- Gemini 2.5 Flashは，これらの攻撃に対してほぼ免疫があることが示された。
- 安全性アーキテクチャが会話の文脈をどのように扱うかに重要な違いが見られた。
Link: https://arxiv.org/abs/2511.19517
ショートカット不変性：潜在空間における標的ヤコビアン正則化 [cs.LG, cs.CV, stat.ML]目的：深層ニューラルネットワークにおけるショートカット学習の軽減
- 深層学習モデルの汎化性能向上が重要であり，特に未知データへの対応が求められる。
- 学習データに存在する欺瞞的な相関関係（ショートカット）が，未知データへの汎化を阻害する。
- 潜在空間においてショートカット軸への依存を抑制し，汎化性能を向上させることを目指す。
- 潜在空間でショートカット軸を特定し，標的異方性ノイズを注入することで，分類器の感度を正則化する。
- この手法は，決定境界をショートカット軸に沿って平坦化し，主要な特徴次元への影響を最小限に抑える。
- ショートカットラベルや対立するサンプルを必要とせず，既存手法を上回る未知データ性能を達成する。
Link: https://arxiv.org/abs/2511.19525
BotaCLIP：植物認識を考慮した地球観測データのコントラスト学習 [cs.CE, cs.DC, cs.CV, cs.AI]目的：植物認識を考慮した地球観測データの表現学習
- 地球観測データの活用は，生態系理解や生物多様性保全に不可欠である。
- 既存の汎用的な表現学習では，植物生態学特有の知識が反映されにくい。
- 植物生態学の知識を効率的に組み込み，データ不足時の表現学習を可能にすること。
- BotaCLIPは，既存の地球観測データ用基盤モデル（DOFA）を，航空画像と植物調査データを用いて適応させた。
- コントラスト学習と忘却緩和戦略により，生態構造を組み込んだ表現を獲得した。
- 植物存在予測，蝶の出現モデリング，土壌栄養群の推定において，DOFAや教師あり学習よりも高い性能を示した。
Link: https://arxiv.org/abs/2511.21194
CRAwDAD：双方向エージェント討論による因果推論の拡張 [cs.LG, cs.MA]目的：因果推論における双方向エージェント討論フレームワークの有効性
- 人間の因果推論は複数のシナリオを検討するものであり，AIにも同様の能力が求められる。
- 大規模言語モデルは因果推論能力を持つものの，内部対話による検証が不十分である。
- 異なる視点からの議論を通じて，因果推論の精度向上を目指す。
- 双方向エージェント討論により，DeepSeek-R1の因果推論の全体精度が78.03%から87.45%に向上した。
- 特に，反事実推論の精度は67.94%から80.04%に大幅に改善された。
- Qwen3においても同様に精度向上が認められ，より強力なモデルでも議論が有効であることが示された。
Link: https://arxiv.org/abs/2511.22854
有孔虫種の2DマイクロCTスライスからの高精度深層学習フレームワーク：ForamDeepSlice [eess.SY, cs.SY, cs.CV, cs.AI, cs.LG]目的：有孔虫種の自動分類
- 微化石の同定は古環境復元や地質学的年代測定に不可欠であり，その効率化が求められている。
- 熟練した専門家による手動同定は時間と労力を要し，客観性に課題が残る場合がある。
- 深層学習を活用し，有孔虫種の自動かつ高精度な同定を可能にすることを目指す。
- 開発したフレームワークForamDeepSlice（FDS）は，テスト精度95.64%を達成し，トップ3精度は99.6%を示した。
- FDSはConvNeXt-LargeとEfficientNetV2-Smallを組み合わせたアンサンブルモデルであり，高い識別能力を持つ。
- リアルタイムスライス分類と3Dスライス照合を可能にするインタラクティブなダッシュボードを開発し，実用的な展開を促進する。
Link: https://arxiv.org/abs/2512.00912