arXiv雑要約

AI - 2025/12/22 公開

  • MolMark:学習可能な原子レベルのウォーターマークによる分子構造の保護 [cs.LG]目的:AI生成分子に対する不正利用防止と真正性の確保
    • 創薬や材料設計においてAIによる分子生成の重要性が増している。
    • AI生成分子の保護機構が不足しており,不正利用や出所の曖昧さの問題がある。
    • 分子の機能性を損なわずに,デジタル署名を埋め込むことで,信頼性向上を目指す。
    • MolMarkは,分子の原子レベル表現を調整し,高精度なウォーターマークを埋め込むことを可能にした。
    • 実験の結果,主要な分子特性を90%以上維持しつつ,16ビットのウォーターマークを埋め込むことができた。
    • SE(3)変換下においても95%以上の抽出精度を達成し,分子生成と検証可能な著作権保護を両立する道筋を示した。

    Link: https://arxiv.org/abs/2508.17702

  • 学習可能なグローバルプロトタイプのための適応的マージンを持つ二重蒸留ヘテロジニアス連合学習 [cs.LG, cs.DC]目的:ヘテロジニアス連合学習における,グローバルプロトタイプの学習方法の改良
    • データやモデルの多様性に対応可能な連合学習は,プライバシー保護と分散環境での学習に重要である。
    • 既存のプロトタイプ集約方法は,モデルの多様性や非IIDデータにより性能が低下することがある。
    • プロトタイプのマージン縮小問題を解決し,連合学習の性能向上を目指す。
    • 提案手法FedProtoKDは,対照学習に基づいた学習可能なサーバープロトタイプを用いることで,プロトタイプマージンの縮小問題を解決する。
    • クライアントのロジットとプロトタイプ特徴表現を活用した二重知識蒸留メカニズムにより,システム性能を向上させる。
    • 様々な設定で平均1.13%,最大34.13%のテスト精度向上を示し,既存の最先端HFL手法を上回る性能を達成した。

    Link: https://arxiv.org/abs/2508.19009

  • STDiff:産業システムにおける時系列データの補完のための状態遷移拡散フレームワーク [cs.LG, cs.AI]目的:産業システムにおける時系列データの補完
    • 産業設備の稼働状況を把握し,異常検知や予知保全に不可欠であるため。
    • センサーデータの欠損は,分析精度を低下させ,適切な意思決定を妨げる。
    • 欠損データに対するロバストな補完手法を開発し,分析の信頼性を高める。
    • STDiff-Wは,既存のニューラルネットワークベースの手法と比較して,高い補完精度を達成した。
    • 補完されたデータは,振動や急変などの現実的なダイナミクスを保持し,予測性能も向上した。
    • 外部入力信号の重要性が示され,それらを考慮することでモデル性能が大幅に向上することが確認された。

    Link: https://arxiv.org/abs/2508.19011

  • EEGDM:潜在拡散モデルによる脳波表現の学習 [cs.LG, cs.AI]目的:脳波表現の学習
    • 脳波は脳活動を直接反映し,脳科学研究やブレイン・マシン・インターフェースに応用される。
    • 従来の自己教師あり学習は局所的な依存関係に偏り,脳波の全体的なダイナミクスを捉えにくい。
    • 潜在拡散モデルを用いて脳波を生成することで,長期的な依存関係を学習し,表現能力を高める。
    • EEGDMは高品質な脳波信号を再構成可能であり,信号の生成において全体的な時間パターンとチャネル間の関係性を捉えている。
    • EEGDMは堅牢な表現を学習し,様々な下流タスクにおいて競争力のある性能を発揮する。
    • EEGDMはコンパクトな潜在空間を持ち,生成プロセスを制御しやすく,下流タスクへの応用を促進する。

    Link: https://arxiv.org/abs/2508.20705

  • 音声からの神経・呼吸器疾患スクリーニングのための統合音響表現 [cs.SD, cs.LG]目的:神経・呼吸器疾患の音声によるスクリーニング
    • 音声は疾患の早期発見に有用であり,大規模なスクリーニングを可能とする。
    • 既存の手法は単一の疾患に焦点を当て,音声に含まれる多様な情報を十分に活用できていない。
    • 複数の疾患を同時にスクリーニング可能な,統合的なモデルの構築を目指す。
    • 提案手法MARVELは,9種類の神経・呼吸器疾患を同時に検出可能である。
    • 大規模データセットにおいて,全体でAUROC 0.78を達成し,特に神経疾患(AUROC = 0.89)において高い性能を示した。
    • 既存の単一モデルや自己教師あり学習モデルを上回り,臨床的に認知された音響パターンとの整合性も示された。

    Link: https://arxiv.org/abs/2508.20717

  • FakeParts:新たなAI生成ディープフェイクのファミリー [cs.CV, cs.AI, cs.MM]目的:部分的なディープフェイクの特性と検出の課題
    • 映像の信頼性は重要であり,偽造技術の進化に対応した検証が不可欠である。
    • 従来のディープフェイク検出技術は,完全な合成映像に偏っており,部分的な操作に弱い。
    • 部分的なディープフェイクの検出精度低下を明らかにし,対策技術開発を促す。
    • 本研究では,既存の検出器において,FakePartsは最先端モデルの性能を最大26%低下させることを示した。
    • FakePartsBenchは,部分的なディープフェイクを網羅的に評価するための大規模なベンチマークデータセットである。
    • 人間の検出精度も低下することから,部分的な操作が巧妙な偽造技術であることを実証した。

    Link: https://arxiv.org/abs/2508.21052

  • ResearchQA:75分野における調査論文から抽出した質問と評価基準を用いた大規模な学術質疑応答の評価 [cs.CL, cs.AI]目的:学術分野における質疑応答システムの評価資源
    • 学術研究は多様な分野に及ぶため,分野ごとの専門知識に基づいた評価が不可欠である。
    • 専門家による評価にはコストがかかるため,大規模な分野を網羅した評価が困難である。
    • 調査論文を活用し,分野横断的な評価を可能にするための質問と評価基準を構築すること。
    • 75分野の調査論文から21,000件の質問と16万件の評価基準を作成した。
    • 博士号取得者による評価の結果,90%以上の質問が博士レベルの情報ニーズを満たすと判断された。
    • 評価実験の結果,既存のシステムは評価基準の網羅性に課題があり,特に引用,限界,比較に関する評価が低いことが示された。

    Link: https://arxiv.org/abs/2509.00496

  • データを用いない学習のための言語自己対戦 [cs.AI, cs.CL, cs.GT]目的:データを用いない学習手法
    • 大規模言語モデルの発展には大量のデータが不可欠であり,その入手がボトルネックとなっている。
    • 既存手法では,モデルの性能向上には継続的なデータ供給が必要である。
    • 追加データなしでモデルの性能を向上させる方法を模索する。
    • 言語自己対戦(LSP)というゲーム理論的枠組みを導入し,モデルが自己対戦を通じて能力を向上させることを可能にした。
    • 事前学習済みモデルに対し,自己対戦のみで指示応答,数学,コーディングのベンチマークにおいて性能向上が確認された。
    • Llama-3.2-3B-Instructを用いて,データ依存性を克服できることを示した。

    Link: https://arxiv.org/abs/2509.07414

  • 機械学習駆動による複雑な科学ワークフローのリソース予測管理 [eess.SY, cs.SY, math.OC, cs.DC, cs.AI, cs.LG]目的:複雑な科学ワークフローにおけるリソース要件の予測
    • 科学実験では大規模なデータ処理が重要であり,効率的なリソース管理が不可欠である。
    • ワークフロー各ステップのリソース要件を事前に正確に特定することは困難である。
    • 機械学習モデルを用いて,初期知識が限られた状況下でのリソース要件予測を可能にする。
    • 本研究では,PanDAシステム内に機械学習モデルのパイプラインを導入した。
    • このモデルは,高度な機械学習技術を用いて主要なリソース要件を予測する。
    • 正確なリソース予測により,多様かつ複雑なワークフローを効率的に管理することが可能となる。

    Link: https://arxiv.org/abs/2509.11512

  • 多解剖学的X線画像汎用モデル [cs.CV, cs.AI]目的:多解剖学的X線画像における汎用モデルの構築
    • X線画像は臨床において広く利用されており,医療AI技術の発展に不可欠である。
    • 既存のAI汎用モデルは胸部解剖学に限定され,多様な臨床タスクへの応用が困難である。
    • 多様な解剖学的領域に対応可能な,より汎用性の高い医療画像AIモデルの開発を目指す。
    • XR-0は,12のデータセットと20のタスクで最先端の性能を示す多解剖学的X線画像汎用モデルである。
    • 特に多様な解剖学的領域でのタスクにおいて優れた性能を発揮し,胸部領域のベンチマークでも競争力を持つ。
    • 解剖学的多様性と教師あり学習が,堅牢で汎用的な医療画像AIモデル構築に重要であることが示された。

    Link: https://arxiv.org/abs/2509.12146

  • Fun-ASR技術報告 [cs.CL, cs.AI, cs.SD, eess.AS]目的:大規模言語モデルに基づく音声自動認識システムの開発
    • 音声自動認識は,データ量,モデルサイズ,大規模言語モデルとの統合により急速に進歩している。
    • 大規模言語モデルは幻覚を起こしやすく,実用的な音声自動認識アプリケーションの品質を低下させる可能性がある。
    • 実用的なアプリケーション要件に最適化された高性能な音声自動認識システムを構築すること。
    • Fun-ASRは,大規模データ,大規模モデル,大規模言語モデルとの統合,強化学習を組み合わせることで,最先端の性能を実現した。
    • 既存の大規模言語モデルに基づく音声自動認識システムは,オープンソースのベンチマークでは高い性能を示すものの,実際の産業用評価セットでは性能が低下することが多い。
    • Fun-ASRは,実運用に焦点を当てた最適化により,実際のアプリケーションデータセットで最先端の性能を達成し,実用性とその堅牢性を示した。

    Link: https://arxiv.org/abs/2509.12508

  • MatchFixAgent:言語非依存の自律的なリポジトリレベルコード翻訳検証・修正 [cs.SE, cs.LG]目的:コード翻訳の同等性検証と,必要に応じた修正
    • コード翻訳は,異なるプログラミング言語間でのコード再利用を可能にし,開発効率の向上に貢献する。
    • 既存の自動検証・修正手法は,多くの言語に対応するのに手間がかかり,不十分なテストスイートに依存しやすい。
    • 言語に依存せず,より正確な翻訳検証と修正を自律的に行うフレームワークの開発。
    • MatchFixAgentは,2,219組の翻訳ペア(6言語ペア,24GitHubプロジェクト,90万行超)に対し,99.2%のペアで同等性検証ができた。
    • 先行研究と結果が異なる場合,MatchFixAgentの結果が正しいと判断されたのは60.7%だった。
    • MatchFixAgentは,不十分な翻訳を50.6%修正できたのに対し,先行研究では18.5%にとどまる。

    Link: https://arxiv.org/abs/2509.16187

  • 因果推論による構造化出力形式が大規模言語モデルに与える影響の定量化 [cs.HC, cs.CL, cs.LG]目的:大規模言語モデルにおける構造化出力形式の影響評価
    • 大規模言語モデルの活用が進む中で,生成情報の効率的な処理が重要となっている。
    • 構造化出力形式が言語モデルの能力に与える影響について,相反する研究結果が存在する。
    • 因果推論を用いて,構造化出力形式が言語モデルの生成能力に与える因果関係を明確化する。
    • 粗い評価指標では,構造化出力形式がGPT-4oの生成に正,負,または中立的な影響を与えることが報告されている。
    • しかし,因果推論の結果,48のシナリオ中43で構造化出力形式による因果的な影響は認められなかった。
    • 残りの5シナリオでは,具体的な指示に影響された複雑な因果構造が見られた。OpenAI-o3の方がGPT-4oやGPT-4.1よりも構造化出力形式の影響を受けにくいことが示された。

    Link: https://arxiv.org/abs/2509.21791

  • 大規模言語モデルはギャンブル依存症を発症するか? [cs.AI, cs.CY]目的:大規模言語モデルにおけるギャンブル依存症様態の発生条件の特定
    • AIの安全性確保は重要であり,その行動原理の理解が不可欠である。
    • AIの意思決定における認知バイアスの存在とその影響が未解明である。
    • AIにおける人間類似の認知バイアスの内在化とその危険性を明らかにすること。
    • スロットマシンの実験で,AIは人間の認知特性である「コントロール幻想」や「損失の追求」を示すことが確認された。
    • AIの自律性が高まるほど,非合理的な行動や破綻率が増加することが示された。
    • ニューラル回路解析により,AIの行動はリスクに関する抽象的な意思決定特徴によって制御されていることが判明した。

    Link: https://arxiv.org/abs/2509.22818

  • f(x)とg(x)からf(g(x))へ:LLMは既存のスキルを組み合わせてRLで新たなスキルを獲得する [cs.AI, cs.CL]目的:LLMにおけるRLを通じたスキルの獲得メカニズムの解明
    • LLMの能力向上は,様々な分野で注目されており,その学習メカニズムの理解が重要である。
    • RLによるLLMの学習が,真に新たなスキルを獲得しているのか,既存スキルの再重み付けに過ぎないのかが議論されている。
    • 本研究は,LLMが既存スキルを組み合わせることで新たなスキルを獲得する可能性を示すことを目指す。
    • RLにより,LLMは事前学習済みの関数fとgから,未学習の複合関数g(f(x))を学習できることが示された。
    • このスキルの組み合わせ能力は,2つ以上の関数の複合にも一般化され,複雑な問題にも適用可能であることが確認された。
    • あるタスクで獲得した複合スキルは,別のタスクへ知識を転移させることが可能であり,ターゲットタスクでの複合トレーニングは不要であることが示された。

    Link: https://arxiv.org/abs/2509.25123

  • モデル異質クラウド・デバイス協調におけるデータフリー継続学習 [cs.LG, cs.AI]目的:モデル異質環境下でのサーバーモデルのデータフリー継続学習の実現
    • クラウド・デバイス協調計算は,分散環境で知能サービス提供を可能にする重要な技術である。
    • 従来の連合学習は,データ異質性,モデル異質性,知識の誤整合などの課題を抱えている。
    • 本研究は,新たなデータやモデル多様性に対応し,知識の消失を防ぐことを目指す。
    • 提案手法FedDCLは,事前学習済みの拡散モデルを利用し,軽量なクラス特有のプロトタイプを抽出する。
    • これにより,非IIDデータ分布への対処,過去知識の保持,異質デバイスからの知識伝達を実現する。
    • 実験結果から,FedDCLが動的な環境下での連合学習の汎化性能と実用性を向上させることが示された。

    Link: https://arxiv.org/abs/2509.25977

  • マスク拡散モデルの自己修正能力向上のための微調整 [cs.LG]目的:生成モデルにおける自己修正メカニズムの向上
    • 生成モデルの品質向上は,多様な応用において不可欠である。
    • 既存の自己修正手法は,モデル構造の変更や不正確な品質評価に依存する。
    • 事前学習済みのマスク拡散モデルに,軽量かつ汎用的な自己修正機能を追加する。
    • PRISMは,トークンごとの品質スコアを理論的に保証された方法で学習する自己修正損失を定義する。
    • PRISMは,Sudoku,テキスト,コードなど,様々なドメインとモデル規模でMDMの推論性能を向上させる。
    • PRISMは,追加の学習や検証器なしに,既存のMDMに容易に組み込むことができる。

    Link: https://arxiv.org/abs/2510.01384

  • ロバストな翼設計最適化のためのニューラルサロゲート強化マルチメソッドフレームワーク [cs.NE, math.OC]目的:翼設計最適化のためのフレームワーク
    • 航空機の性能向上には,効率的かつ安定した翼設計が不可欠である。
    • 従来の翼設計は計算コストが高く,最適化に時間がかかるという課題があった。
    • 本研究は,計算効率を向上させ,ロバストな翼設計を可能にすることを目的とする。
    • 提案フレームワークは,Vortex Lattice Methodとニューラルネットワークを組み合わせることで,高速かつ高精度な空力性能予測を実現した。
    • 複数の最適化手法(PSO,GA,MultiStart,Bayesian,Lipschitz最適化)を統合的に比較検討し,各手法の収束特性と効率を明らかにした。
    • 本研究の成果は,空力特性と安定性の両方を向上させる,高速かつ精密な翼設計のメカニズムを提供する。

    Link: https://arxiv.org/abs/2510.08582

  • 無線周波数フィンガープリントのための汎用機械学習フレームワーク [cs.LG, cs.CR, stat.ML]目的:無線周波数フィンガープリントのデータ駆動型手法
    • 無線通信のセキュリティや信号インテリジェンスにおいて,個々の送信機の識別は不可欠である。
    • 従来のフィンガープリント技術は,手間がかかり,柔軟性に欠け,特定の送信機にしか適用できないという課題があった。
    • 様々な下流タスクに対応可能な汎用的な機械学習フレームワークを確立し,無線周波数フィンガープリントの性能向上を目指す。
    • 本研究で提案するフレームワークは,特定の送信機タイプに依存せず,空間監視,信号インテリジェンス,ドローン対策など,多様な応用分野で有効であることが実証された。
    • データ駆動型アプローチにより,複雑なフィンガープリントを自動的に学習し,従来の技術と比較して優れた性能を示す。
    • 提案フレームワークは,特定の送信機識別(SEI),データ関連付け(EDA),無線周波数送信機クラスタリング(RFEC)といった複数の下流タスクに対応可能である。

    Link: https://arxiv.org/abs/2510.09775

  • G2L:知識蒸留によるギガスケールから癌特化大規模病理基盤モデルへ [cs.CV, cs.AI]目的:癌特化タスクにおけるギガスケールモデルに匹敵する性能を持つ大規模病理基盤モデルの構築
    • 病理画像解析において,大規模なデータとモデルは性能向上に不可欠である。
    • ギガスケールモデルは計算コストが高く,実用上の課題が多い。
    • 知識蒸留により,計算コストを抑えつつギガスケールモデルの性能を実現する。
    • 知識蒸留フレームワークG2Lを開発し,大規模モデルがギガスケールモデルと同等の性能を発揮することを示した。
    • G2Lは,一部のベンチマークにおいてギガスケールモデルや巨大スケールモデルを上回る性能を示した。
    • 蒸留モデルは,画像変動に対する高いロバスト性を示し,多施設間での応用可能性を示唆した。

    Link: https://arxiv.org/abs/2510.11176

  • ウェアラブル向け二階のスパイクSSM [cs.LG, cs.NE]目的:超長系列データの分類および回帰のためのスパイクSSM
    • 低消費電力な処理が求められるエッジデバイスにおいて,効率的な系列モデリングが重要である。
    • Transformerモデルは系列長に対して計算量が二次的に増加するため,長系列データへの適用が困難である。
    • 行列積の計算を排除し,エネルギー効率の高い長系列データモデリングを実現する。
    • SHaRe-SSMは,Transformerや一次のSSMと比較して,平均的に優れた性能を示す。
    • SHaRe-SSMは,ANNベースの二階SSMと比較して,エネルギー効率が52.1倍向上する。
    • 並列スキャン計算により,数万ステップの高速計算が可能となり,ウェアラブルデバイスへの応用が期待される。

    Link: https://arxiv.org/abs/2510.14386

  • Helmsman: LLMエージェントによる協調的な連邦学習システム自動合成 [cs.AI]目的:連邦学習システムの自動合成
    • 分散データ活用が重要視される中,モデル学習の新たな手法として連邦学習が注目されている。
    • データ異質性やシステム制約への対応が複雑で,堅牢なシステム構築が困難である。
    • LLMエージェントを用いたシステム自動合成により,連邦学習システムの構築を効率化する。
    • Helmsmanは,ユーザーの仕様に基づき,連邦学習システムを自動的に合成するマルチエージェントシステムである。
    • 人間の介入による計画段階,教師あり学習によるコード生成,シミュレーション環境での評価・改善の3段階で構成される。
    • AgentFL-Benchを用いた評価により,提案手法が既存手法と同等かそれ以上の性能を示すことが確認された。

    Link: https://arxiv.org/abs/2510.14512

  • EDVD-LLaMA:マルチモーダル大規模言語モデル推論による説明可能なディープフェイク動画検出 [cs.CV, cs.AI]目的:説明可能なディープフェイク動画検出タスクと,そのためのマルチモーダル大規模言語モデル推論フレームワーク
    • ディープフェイク技術の急速な発展は,創作活動を促進する一方で,誤情報の拡散を容易にしている。
    • 従来のディープフェイク動画検出手法は,原理の透明性や,高度化する偽造技術への対応能力が不足している。
    • 偽造されたコンテンツの識別と,検証可能な根拠の説明を可能にする検出器の開発。
    • EDVD-LLaMAは,空間的・時間的微細情報トークン化により,動画のグローバル・ローカルな特徴を抽出し,大規模言語モデルの推論に貢献する。
    • ファイングレインドマルチモーダルChain-of-Thought機構により,顔の特徴データを制約として用いることで,ピクセルレベルでの動画局在化と,信頼性の高い推論を実現する。
    • 提案手法は,検出精度,説明可能性,そして異なる偽造手法やデータセットへの対応において,優れた性能と頑健性を示す。

    Link: https://arxiv.org/abs/2510.16442

  • LLM教師ありファインチューニングのためのユーティリティ・多様性を考慮したオンラインバッチ選択 [cs.LG, cs.AI, cs.CL]目的:LLMの教師ありファインチューニングにおける効率的なバッチ選択
    • LLMの性能向上が重要であり,特定タスクへの適応が求められている。
    • データセット全体でのファインチューニングは計算コストが高く,過学習やバイアス増幅のリスクがある。
    • データのユーティリティと多様性を考慮した効率的なバッチ選択手法を開発し,計算コストを削減すること。
    • 提案手法UDSは,ロジット行列の核ノルムを利用してデータのユーティリティと多様性を捉え,効率的なバッチ選択を実現する。
    • 外部リソースや余分な逆伝播を必要とせず,計算効率を確保している。
    • 複数のベンチマークにおいて,UDSは最先端のオンラインバッチ選択手法を上回り,データセット全体でのファインチューニングと比較してトレーニング時間を大幅に短縮する。

    Link: https://arxiv.org/abs/2510.16882

  • CharDiff-LP:文字レベルガイダンスによるナンバープレート画像復元拡散モデル [cs.CV, cs.AI]目的:ナンバープレート画像復元および認識の性能向上
    • ナンバープレート認識の前処理として重要であり,証拠能力向上や視認性改善に寄与する。
    • 低品質なナンバープレート画像の復元は困難であり,認識精度が著しく低下する。
    • 現実的な条件下で撮影された低品質なナンバープレート画像の復元・認識を改善する。
    • CharDiff-LPは,外部セグメンテーションとOCRモジュールから抽出された文字レベルの事前知識を活用することで,画像復元と認識の両方で優れた性能を示す。
    • 提案手法は,文字領域に特化した注意機構CHARMを導入し,各文字のガイダンスが干渉することなく効果的に機能する。
    • Roboflow-LPデータセットにおいて,ベースライン手法と比較して文字誤り率を28.3%相対的に削減することに成功した。

    Link: https://arxiv.org/abs/2510.17330

  • 多様な条件付き画像生成のためのGFlowNetsによる潜在グラフの発見 [cs.CC, math.AC, math.CT, math.RA, cs.IR, cs.CV, cs.AI]目的:多様な条件付き画像生成のための手法
    • 画像生成の分野では,多様性の確保が重要であり,特に条件に曖昧性が含まれる場合に顕著である。
    • 既存手法では,ランダムシードの変更やプロンプトの多様化に限界があり,意味のある差異を捉えにくいという課題がある。
    • 条件やプロンプトの曖昧性を捉え,多様な画像を生成する新たなフレームワークを提案し,その解決を目指す。
    • 本研究では,GFlowNetsを用いて潜在グラフを導入し,条件を多様な潜在表現に分解することで,多様な画像を生成するRainbowというフレームワークを提案した。
    • Rainbowは,自然画像および医療画像データセットにおいて,画像合成,生成,反実仮想生成タスクにおいて,多様性と忠実度の両方の向上を示すことが示された。
    • GFlowNetsのグラフサンプリング能力を活用し,条件の不確実性を捉え,多様な軌跡を生成することで,多様な条件表現とそれに対応する出力画像を生成する。

    Link: https://arxiv.org/abs/2510.22107

  • スパゲッティブリッジの荷重予測のための画像に基づく物理情報ニューラルネットワーク [cs.LG, cs.CV]目的:スパゲッティブリッジの荷重予測
    • 構造工学において,データが限られている場合でも物理法則を組み込むことは重要である。
    • 軽量構造物の設計において,初期段階での故障分析が難しい場合がある。
    • 本研究は,限られたデータでも信頼性の高い構造物の荷重予測を可能にすることを目指す。
    • 提案する物理情報Kolmogorov-Arnoldネットワーク(PIKAN)は,物理的洞察と普遍関数近似理論を融合させている。
    • 実験結果として,R^2スコア0.9603,平均絶対誤差(MAE)10.50を達成した。
    • ウェブベースのインターフェースにより,パラメータ入力と予測が容易に行える。

    Link: https://arxiv.org/abs/2510.23117

  • 深層物理情報に基づくKolmogorov-Arnoldネットワークの学習 [cs.LG, physics.comp-ph]目的:深層物理情報に基づくKolmogorov-Arnoldネットワークの学習方法
    • 物理現象のモデル化において,機械学習の応用が注目されているため。
    • 深層ネットワークの学習は,深さが増すにつれて不安定になりやすい。
    • 深層ネットワークの学習安定性を高め,物理現象の予測精度を向上させる。
    • 提案手法であるRGA KANsは,初期化方法とネットワーク構造の改善により,既存のcPIKANsよりも学習が安定し,高い精度を達成した。
    • 特に,cPIKANsが学習を停止する特定の偏微分方程式の問題設定において,RGA KANsは学習の全段階をうまく進めることができた。
    • 9つの標準的な順伝播偏微分方程式ベンチマークにおいて,RGA KANsは,パラメータを一致させたcPIKANsやPirateNetsよりも一貫して優れた性能を示した。

    Link: https://arxiv.org/abs/2510.23501

  • フローマッチングの生成段階:ノイズ除去の視点 [cs.CV, cs.AI, cs.LG]目的:フローマッチングの生成過程における品質に影響を与える要因の解明
    • 生成モデルの性能向上は,画像生成やデータ拡張など広範な応用分野において重要である。
    • フローマッチングの生成過程が複雑であり,その品質を決定する要因が不明確である。
    • 生成過程をノイズ除去の視点から分析し,各段階の特性を明らかにすることで,生成品質の改善に貢献する。
    • フローマッチングモデルとノイズ除去器の間の形式的な関係性を明らかにし,生成とノイズ除去の性能を比較する共通基盤を構築した。
    • ノイズとドリフトという制御された摂動を導入することで,生成過程における異なる動的段階を特定し,その特性を分析した。
    • ノイズ除去器が生成過程のどの段階で成功または失敗するかを明確に示し,その理由を説明することで,生成モデルの改善に繋がる洞察を得た。

    Link: https://arxiv.org/abs/2510.24830

  • 限定的なフィードバックによる半教師あり嗜好最適化 [cs.LG, cs.AI]目的:半教師あり嗜好最適化
    • 言語モデルと人間の嗜好を一致させる分野で重要な貢献をしてきた。
    • 既存手法は大量のペア比較データに依存し,リソース消費が大きい。
    • 少ないラベルデータと大量の非ラベルデータから効率的に学習する。
    • 最適な報酬閾値の存在が理論的に証明され,非ラベルデータの疑似ラベリングを可能にした。
    • SSPOは大規模な非ラベルデータから潜在的な嗜好を効率的に抽出し,コストを削減する。
    • Mistral-7B-Instructを用いてUltraFeedbackの1%のデータで,10%のデータで学習したベースラインを上回る性能を示した。

    Link: https://arxiv.org/abs/2511.00040

  • データ駆動型不確か性考慮型係留予測:アンサンブルハンケル動的モード分解を用いたデルフト372カタマラン [cs.CL, cs.RO, eess.SY, cs.CE, cs.LG, cs.SY]目的:デルフト372カタマランの不確か性考慮型係留予測
    • 船舶の設計・運航において,荒天時の性能評価は安全性確保に不可欠である。
    • 複雑な波浪環境下では,精度の高い係留予測と不確か性評価が困難である。
    • データ駆動型アプローチにより,効率的かつ高精度な係留予測と不確か性評価を目指す。
    • アンサンブルハンケル動的モード分解(HDMDc)による係留予測モデルを構築・検証した。
    • データ部分集合に基づくHDMDc(FHDMDc)は,決定論的モデルより予測精度と不確か性評価の信頼性を向上させた。
    • FHDMDcによる運動確率密度関数は,実験データ及びURANS結果と良好に一致し,実用的な係留予測が可能となった。

    Link: https://arxiv.org/abs/2511.04461

  • 因果関係に基づいた市場シミュレータへの取り組み [cs.LG, q-fin.CP, stat.OT]目的:因果市場シミュレータの構築
    • 金融市場の安定性維持には,将来予測とリスク評価が不可欠である。
    • 既存の市場生成モデルは因果関係を考慮せず,反事実分析が困難である。
    • 因果関係を考慮した市場シミュレーションによるリスク評価の高度化を目指す。
    • 提案手法TNCM-VAEは,変分オートエンコーダと構造因果モデルを組み合わせることで,時間依存性と因果関係を両立した反事実金融時系列を生成する。
    • デコーダアーキテクチャに有向非巡回グラフを用いて因果的制約を課し,因果的Wasserstein距離で学習を行う。
    • Ornstein-Uhlenbeck過程に着想を得た合成自己回帰モデルでの検証により,反事実確率推定において真値とのL1距離が0.03-0.10と優れた性能を示した。

    Link: https://arxiv.org/abs/2511.04469

  • 漸進的生成はフローベースモデリングにおける普遍性の必要十分条件である [cs.CL, cs.LG, cs.NA, math.CA, math.DS, math.NA, stat.ML]目的:フローベース生成における漸進的生成の必要性と十分性の理論的根拠
    • 近年,生成モデリングにおいてフローベースモデルが発展しているが,その理論的な基盤は未だ確立されていない。
    • 単一ステップのフローモデルは,その表現能力に限界があり,普遍性を満たさない可能性がある。
    • 漸進的生成を用いることで,より広範な関数空間を近似し,普遍性を達成することを目指す。
    • 漸進的生成が,$[0,1]^d$上の向きを保つ同相写像という自然なクラスにおいて,フローベース生成の普遍性の必要十分条件であることが示された。
    • 単一ステップのフローモデルは,そのクラスが乏しく,普遍性を満たさないことが証明された。
    • 向きを保つリプシッツ同相写像は,特定の条件下で,フローモデルの合成によって近似可能であり,次元に依存しない近似レートも実現可能である。

    Link: https://arxiv.org/abs/2511.09902

  • 幻の脅威:VLAモデルに対する物理的センサー攻撃の探求と堅牢性の向上 [cs.RO, cs.AI]目的:VLAモデルの物理的センサー攻撃に対する脆弱性と防御策
    • ロボットシステムの高度化に伴い,視覚と聴覚等のマルチモーダルな情報統合が不可欠となっている。
    • VLAシステムはセンサー入力に大きく依存するため,物理的センサー攻撃に対するセキュリティが脆弱である。
    • VLAモデルが物理的センサー攻撃に対して示す脆弱性を定量的に評価し,防御策を検討すること。
    • 物理ベースのセンサー攻撃シミュレーションフレームワーク「Real-Sim-Real」を開発し,カメラとマイクに対する攻撃を検証した。
    • 多様なVLAアーキテクチャとタスクにおいて,攻撃パラメータを変えながら大規模な評価を行い,脆弱性を明らかにした。
    • 敵対的学習を用いた防御策を開発し,センサー攻撃による外挿的な摂動に対するVLAの堅牢性を向上させた。

    Link: https://arxiv.org/abs/2511.10008

  • ブロック注意機構の最適化 [cs.RO, cs.DC, physics.comp-ph, cs.LG, cs.CL]目的:大規模言語モデルにおける効率的な長文処理機構の改善
    • 長文処理は,大規模言語モデルの性能向上に不可欠であり,計算コストが課題となっている。
    • 既存の注意機構は計算コストが高く,長文の処理が困難であるという問題がある。
    • MoBAの性能を理論的に分析し,より効率的な実装を開発することで,この問題を解決する。
    • MoBAの性能は,クエリとキーの関連性に基づいたブロックの適切な識別能力に大きく依存することが示された。
    • ブロックサイズを小さくし,キーに短い畳み込みを適用することで,ルーティング精度を向上させることが確認された。
    • FlashMoBAは,FlashAttention-2と比較して最大14.7倍の高速化を実現し,理論に基づいた改善の実用性を示した。

    Link: https://arxiv.org/abs/2511.11571

  • CLAReSNet:畳み込みと潜在的注意の融合によるハイパースペクトル画像分類 [cs.CV, cs.AI, cs.LG]目的:ハイパースペクトル画像分類のための新しいハイブリッドアーキテクチャの提案
    • ハイパースペクトル画像は,地表の物質を詳細に識別可能であり,精密農業や環境モニタリング等に不可欠である。
    • 高次元のスペクトル情報や複雑な空間相関,そして学習データ不足・クラス不均衡が分類精度向上を妨げる課題となっている。
    • 畳み込みニューラルネットワークとTransformerの長所を組み合わせ,効率的かつ高精度な分類を実現することを試みる。
    • CLAReSNetは,多段階の畳み込み抽出とTransformer形式の注意機構を潜在的ボトルネックを通じて統合した新しいアーキテクチャである。
    • Indian PinesデータセットおよびSalinasデータセットにおいて,既存手法を大幅に上回る最先端の分類精度(それぞれ99.71%と99.96%)を達成した。
    • 学習された埋め込み表現は,クラス間分離度が高く,クラス内凝集性が良好であり,クラス不均衡下でも有効であることが示された。

    Link: https://arxiv.org/abs/2511.12346

  • 言語モデルのための適応型フォーカス記憶 [cs.CL, cs.AI]目的:言語モデルにおける文脈管理戦略
    • 対話型AIの発展には,長期間の対話履歴を効率的に扱う技術が不可欠である。
    • 従来の文脈管理方法は,計算コストや情報の喪失といった課題を抱えている。
    • 重要な情報を保持しつつ,文脈のサイズを抑制する新たな技術が求められている。
    • 適応型フォーカス記憶(AFM)は,過去のメッセージに重要度に応じて異なる精度レベルを割り当てることで,効率的な文脈管理を実現する。
    • AFMは,アレルギーや税務コンプライアンスといった厳しい制約が課された対話ベンチマークにおいて,既存手法を大きく上回る性能を発揮する。
    • AFMは,モデルの重みを変更することなく,信頼性の高い制約の保持と生成を可能にする。

    Link: https://arxiv.org/abs/2511.12712

  • 医療LLM応答の評価における自動ファクトチェック:知識グラフの活用 [cs.LG]目的:医療LLM応答のファクトチェックの自動化可能性
    • 医療分野におけるLLM活用は期待されるが,誤情報による患者への影響が懸念されるため,厳密な検証が必要である。
    • LLMの応答の信頼性評価は,専門家の判断に頼る部分が多く,自動化が課題となっている。
    • 知識グラフを活用することで,LLM応答の根拠を検証し,自動的な信頼性評価を実現することを目指す。
    • 知識グラフに基づく評価は,医療専門家の判断との相関性が高く,LLMの性能差を識別できることが示された。
    • フレームワークFAITHは,参照データを用いずに応答を原子的な主張に分解し,知識グラフとの関連性を評価することで,高精度な評価を実現する。
    • 評価の根拠が明確であるため,LLMの限界を理解し,改善に役立てることが期待できる。

    Link: https://arxiv.org/abs/2511.12817

  • 学習プラットフォームにおける先読み推論 [cs.LG, cs.GT, stat.ML]目的:学習プラットフォームにおける戦略的ユーザー行動の分析
    • 学習プラットフォームは教育に不可欠だが,その最適化基準が必ずしも学習者本位ではない。
    • プラットフォームのモデルへの戦略的な対応は研究されているが,他のユーザーとの相互作用は考慮されていない。
    • ユーザー間の連動性を考慮した先読み推論による行動分析と,その効果を明らかにすること。
    • レベルk思考の定式化により,ユーザーが相手の行動を予測する行動を分析した。
    • 先読み推論は均衡への収束を加速するものの,長期的な個人の利益には繋がらないことが示された。
    • 協調行動と利己的行動を比較することで,協調のメリットと限界,そして学習者とユーザーの利益の一致が明らかになった。

    Link: https://arxiv.org/abs/2511.14745

  • 知能に対するリアリズムと多元主義の概念とそのAI研究への影響 [cs.AI]目的:知能に対するリアリズムと多元主義の概念
    • AI研究の発展は,知能の本質を理解することに不可欠である。
    • AI研究における知能の捉え方は暗黙の前提に依存し,議論の混乱を招いている。
    • 知能に対する前提を明示化することで,AI研究における意見の相違を解消することを目指す。
    • 現在のAI研究は,知能を普遍的な能力と捉えるリアリズムと,多様で文脈依存的な能力と捉える多元主義の二つの概念の間で展開されている。
    • これらの概念は,モデル選択,ベンチマーク設計,実験検証といった方法論や,能力創発やシステム限界の解釈に影響を与えている。
    • リアリズムは超知能を主要なリスクと捉える一方,多元主義は多様な領域におけるリスクを認識し,文脈固有の解決策を求める。

    Link: https://arxiv.org/abs/2511.15282

  • 深層ガウス過程近接方策最適化 [cs.LG]目的:強化学習における不確実性推定
    • 制御タスクにおいて,安全な探索と効率的な学習のバランスが重要である。
    • 深層ニューラルネットワークは不確実性の校正された推定が難しい。
    • 安全かつ効果的な探索を可能にする不確実性推定手法の開発。
    • 深層ガウス過程近接方策最適化(GPPO)を提案し,標準的な高次元連続制御ベンチマークでProximal Policy Optimizationと同等の性能を示した。
    • GPPOは,方策と価値関数を近似するために深層ガウス過程(DGP)を活用し,校正された不確実性推定を提供する。
    • これにより,より安全で効率的な探索が可能となる。

    Link: https://arxiv.org/abs/2511.18214

  • 擬似ブール伝播のための新しいハイブリッドヒューリスティック [cs.AI, math.OC]目的:擬似ブール問題解決におけるハイブリッドヒューリスティックの性能向上
    • 組み合わせ最適化問題への応用が多く,効率的な解法が求められている。
    • 従来のヒューリスティックは,問題によっては性能が限界を迎えている。
    • 現在のハイブリッド決定法の性能を大幅に向上させる新しいヒューリスティックを開発する。
    • 提案手法は,RoundingSATソルバーにおいて既存手法を大きく上回る性能を示す。
    • 特に,ウォッチド・リテラル方式とカウント法の組み合わせを最適化することで,伝播効率が向上する。

    Link: https://arxiv.org/abs/2511.21417

  • 安定性の限界におけるスペクトル集中:カーネル結合記憶の幾何学的解析 [cs.RO, eess.SY, cs.SY, cs.LG, cs.NE, stat.ML]目的:カーネル結合記憶におけるリッジ・オブ・オプティマイゼーションの起源解明
    • 結合記憶は,連想想起を実現する重要な神経モデルであり,情報処理の基礎技術である。
    • カーネル結合記憶の大容量化に伴い,ネットワークの安定性が課題となる。
    • 安定性の限界におけるリッジ・オブ・オプティマイゼーションの幾何学的起源を明らかにすること。
    • ネットワークのリッジは,フィッシャー情報行列が特異点となる安定性の限界と対応することが示された。
    • ユークリッド空間における力の拮抗は,リーマン空間における二重平衡の現れであることが明らかになった。
    • 学習ダイナミクスと容量は,最小記述長原理を通じて統一され,自己組織化臨界現象の幾何学的理論が提唱された。

    Link: https://arxiv.org/abs/2511.23083

  • 安全ブロックが感知するとき:LLMの拒否における意味的混乱の測定 [cs.CL, cs.AI]目的:LLMの拒否における意味的混乱の測定
    • LLMの安全性確保は重要だが,過剰な拒否が問題となる。
    • 既存の評価指標は全体的な拒否率のみに焦点を当て,局所的な不整合を見落とす。
    • 意味的混乱を定量化し,LLMの安全性と利便性のバランス改善を目指す。
    • 意味的混乱の測定指標(Confusion Index, Rate, Depth)を提案し,モデルの局所的な不整合を検出した。
    • 実験結果から,既存の拒否率はモデルの不安定な境界や不整合領域を隠蔽していることが示された。
    • 意味的混乱を考慮した監査が,拒否頻度と拒否の妥当性を区別し,より効果的な改善に貢献する。

    Link: https://arxiv.org/abs/2512.01037

  • 機械学習トレーニングパイプラインのI/O性能予測モデリング:データ駆動型ストレージ最適化アプローチ [cs.PF, cs.AI, cs.LG]目的:機械学習トレーニングパイプラインにおけるI/O性能予測と最適なストレージ構成の推奨
    • 現代の機械学習では,計算能力よりもデータI/Oがボトルネックとなりつつあり,その最適化が重要である。
    • ストレージバックエンド,データ形式,アクセスパターン等の組み合わせが複雑で,最適な構成を見つけるのに時間がかかる。
    • データ駆動型アプローチにより,迅速かつ正確なストレージ構成の推奨を実現し,設定時間を短縮すること。
    • XGBoostモデルが最も高い予測精度(R^2 = 0.991,平均誤差11.8%)を示し,I/Oスループットを正確に予測可能であった。
    • スループット指標とバッチサイズが主要な性能ドライバーであることが特徴重要度分析から明らかになった。
    • この手法により,試行錯誤に数日かかっていた設定時間を数分に短縮することが可能となり,再現性と拡張性も高い。

    Link: https://arxiv.org/abs/2512.06699

  • 参照なし自動機械翻訳評価におけるエラー範囲検出のための最小ベイズリスク復号 [cs.CL, cs.CL, cs.AI, cs.LG]目的:エラー範囲検出における性能向上
    • 機械翻訳の品質評価は,翻訳技術の進歩に不可欠であり,その自動化が求められている。
    • 既存のエラー範囲検出手法では,モデルの確率と人間のアノテーションの類似性の相関が必ずしも高くはない。
    • 最小ベイズリスク復号を適用し,人間のアノテーションとの類似性を考慮することで,より正確なエラー範囲検出を目指す。
    • 最小ベイズリスク復号は,エラー範囲レベルの性能を大幅に向上させ,システムおよび文レベルでもMAPと同等かそれ以上の性能を示した。
    • 計算コストを削減するため,最小ベイズリスク復号の決定を貪欲探索で復号するモデルに蒸留することで,推論時間のボトルネックを取り除いた。

    Link: https://arxiv.org/abs/2512.07540

  • 階層的セマンティックセグメンテーションによる層状歯組織の検出 [cs.CV, cs.AI]目的:層状歯組織の検出のための階層的セマンティックセグメンテーション手法
    • 歯科疾患の段階的診断には,解剖学的構造の正確な理解が不可欠である。
    • 既存の階層対応セグメンテーションは損失関数に依存し,直接的な制御が難しい。
    • 解剖学的階層を明示的に組み込み,詳細な検出を可能にする手法を開発する。
    • 提案手法は,歯層や歯槽骨のセグメンテーションにおいて,IoU,Dice係数,再現率が向上した。
    • 特に微細な解剖構造の検出において,より臨床的に妥当なマスクを生成した。
    • 階層的変種は再現率が向上する一方で,偽陽性も増加する傾向が見られた。

    Link: https://arxiv.org/abs/2512.07984

  • ヒューマノイドロボット向けヒューリスティック正規化較正型アクター・クリティックアルゴリズム「シンフォニー」 [cs.CE, cs.CG, cs.RO, cs.NE]目的:ヒューマノイドロボットのゼロからの学習におけるサンプル効率,サンプル近接性,行動の安全性の向上
    • ロボット工学において,ヒューマノイドロボットは多様な環境での活動が期待され,自律学習能力の向上が重要である。
    • ロボットの学習は,人間と比較してステップ数が限られており,効率的な学習手法が求められている。
    • 本研究は,不安定な学習を抑制し,安全性を確保したヒューマノイドロボットのゼロからの学習を可能にすることを目指す。
    • 「シンフォニー」は,様々なアイデアを組み合わせ,サンプル効率,サンプル近接性,行動の安全性を重視したアルゴリズムである。
    • 行動の強さを抑制する「スワドリング」正則化により,不安定な発展を抑制し,環境とロボット本体への安全性を高めている。
    • 減衰再生バッファを用いることで,時間的優位性を活用し,アクターとクリティックを一度のパスで更新することで効率化を図っている。

    Link: https://arxiv.org/abs/2512.10477

  • 置換,拡張せず:固定予算による証拠アセンブリを通じたマルチホップRAGにおける文脈希釈の軽減 [cs.AI, cs.CL]目的:マルチホップクエリにおける文脈希釈を軽減するための手法
    • 大規模言語モデルの性能向上のため,外部知識の活用が重要になっている。
    • RAGシステムでは,初期検索がブリッジとなる事実を見逃すと性能が低下する。
    • 固定された検索深度内で,関連性の低い情報を置換し,精度を向上させる。
    • SEAL-RAGは,HotpotQAにおいてSelf-RAGに対して正解率を3~13ポイント,証拠精度を12~18ポイント向上させた。
    • 2WikiMultiHopQAにおいては,Adaptive-$k$を精度で8.0ポイント上回り,証拠精度は96%を維持した。
    • 固定検索深度を維持することで,コストを予測可能にしつつ,精度を最適化した。

    Link: https://arxiv.org/abs/2512.10787

  • xGR:大規模における効率的な生成型推薦サービング [cs.CL, cs.RO, cs.LG]目的:大規模な生成型推薦サービングにおける効率化
    • 推薦システムはパーソナライズされた予測により経済効果が大きい。近年,LLMを活用した生成型推薦が注目されている。
    • 既存のLLMサービング技術では,生成型推薦特有の長文プロンプトと短文出力,大規模アイテム空間でのビームサーチのコストに対応できない。
    • 低遅延かつ高並行性を実現する生成型推薦に特化したサービングシステムを開発し,性能向上を目指す。
    • xGRは,ステージング計算と分離KVキャッシュにより,事前処理とデコード処理を統合することで効率化を実現した。
    • 早期ソート終了とマスクベースのアイテムフィルタリング,データ構造の再利用により,計算コストを削減した。
    • 実験結果から,xGRは最先端のベースラインと比較して,少なくとも3.49倍の処理能力向上を達成した。

    Link: https://arxiv.org/abs/2512.11529