arXiv雑要約

AI - 2026/02/03 公開

  • MEG-XL:長文脈事前学習によるデータ効率的な脳-テキスト変換 [cs.LG, q-bio.NC]目的:麻痺患者向けの脳-テキストインターフェースにおける,データ効率的な一般化
    • 麻痺患者のコミュニケーション手段として,脳活動からのテキスト生成が重要視されている。
    • 既存手法では,十分な学習データが得られず,個人差への対応が課題となっていた。
    • 長文脈事前学習によって,脳活動の統計的性質を捉え,少ないデータでの性能向上を目指す。
    • MEG-XLは,従来のモデルよりも遥かに長い2.5分間の脳波文脈で事前学習を行う。
    • 単語復号のタスクにおいて,MEG-XLは少ないデータ(1時間)で,教師あり学習と同等の性能を達成した。
    • 長文脈での事前学習が,脳波データから単語を復号する際の表現学習を向上させることを示した。

    Link: https://arxiv.org/abs/2602.02494

  • 対立する目的関数に対する報酬不要のアライメント [cs.CL, cs.AI, cs.LG]目的:対立する複数の目的関数を持つ大規模言語モデルのアライメント手法
    • 大規模言語モデルの性能向上には,人間の選好との整合性が不可欠である。
    • 複数の目的関数が対立する場合,単純な選好の集約では学習が不安定になる。
    • 報酬モデルに頼らず,勾配の衝突を解決し,より良いトレードオフを実現する。
    • 本研究では,RACO(Reward-free Alignment for Conflicted Objectives)というフレームワークを提案した。
    • RACOは,ペアワイズな選好データを用いて,新しいクリップされたConflict-Averse Gradient Descentにより,勾配の衝突を解決する。
    • 多目的要約と安全性アライメントタスクにおいて,既存手法より優れたパレート最適解を得た。

    Link: https://arxiv.org/abs/2602.02495

  • 実践におけるプライバシー:X線画像におけるプライベートなCOVID-19検出(拡張版) [cs.LG, cs.AI, cs.CR, cs.CV]目的:X線画像におけるプライベートなCOVID-19検出モデルの構築
    • パンデミック対策において,画像解析による迅速なスクリーニングの重要性が高まっている。
    • 既存研究は小規模データセットに依存し,プライバシー保護の保証が不十分である場合がある。
    • 実用的なプライバシー保護を考慮したCOVID-19検出モデルを開発し,有用性とプライバシーのトレードオフを評価する。
    • 差分プライバシー(DP)を適用したモデルを構築し,メンバーシップ推論攻撃(MIA)によるプライバシー漏洩を評価した。
    • タスクに依存したMIAからの脅威に応じて,必要なプライバシーレベルが異なることが示唆された。
    • DPの強化が必ずしも実用的なMIA防御に大きな影響を与えない可能性が示され,攻撃特有のプライバシー評価の重要性が示唆された。

    Link: https://arxiv.org/abs/2211.11434

  • プライバシー保護ウェアラブルストレス検出のための合成ヘルスセンサーデータ生成 [cs.LG, cs.AI, cs.CR]目的:プライバシー保護されたウェアラブルストレス検出のための合成ヘルスセンサーデータの生成
    • ウェアラブルデバイスの普及により,健康状態のモニタリングが一般化し,医療分野での活用が期待されている。
    • 個人情報保護の観点から,実際の医療データの利用には制約があり,研究データの確保が課題となっている。
    • 本研究は,個人情報を保護しつつ,十分な量の研究データを確保するための合成データ生成手法を提案する。
    • GANと差分プライバシー(DP)を活用した合成データ生成により,患者情報の保護とデータ可用性の向上を両立した。
    • 合成データを用いたストレス検出タスクにおいて,モデル性能が大幅に向上し,DPを用いた学習ではF1スコアが11.90-15.48%向上した。
    • 合成データの品質評価により,データの信頼性と妥当性が確認された。ただし,プライバシー保護の要件を強化すると,データ品質が低下する傾向が見られた。

    Link: https://arxiv.org/abs/2401.13327

  • プライバシー保護機械学習における画像データセットの特徴の影響評価 [cs.LG, cs.AI, cs.CR, cs.CV, cs.DB]目的:画像データセットの特徴がプライバシー保護機械学習モデルの有用性と脆弱性に与える影響の特定
    • 機械学習は様々な分野で重要であり,特に画像認識技術は急速に発展している。
    • 機密データで学習された機械学習モデルは,情報漏洩のリスクを抱えている。
    • データセットの特徴に応じたプライバシー保護と有用性のトレードオフの最適化を目指す。
    • 不均衡なデータセットは少数クラスの脆弱性を高めるが,差分プライバシーはこの問題を緩和する。
    • クラス数が少ないデータセットは,モデルの有用性とプライバシーの両方を向上させる。
    • エントロピーが高い,またはFisher識別比率が低いデータセットは,有用性・プライバシーのトレードオフを悪化させる。

    Link: https://arxiv.org/abs/2409.01329

  • クライアントサンプリングによる個別プライバシーを考慮した連合学習 [cs.LG, cs.AI, cs.CR, cs.CV]目的:個別差分プライバシーを連合学習に適用するための手法
    • ユーザーデータの収集に対する懸念から,プライバシー保護と利便性の両立が重要視されている。
    • 従来の匿名化手法は,すべてのユーザーに対して均一な水準を適用するため,柔軟性に欠ける。
    • ユーザーのプライバシー設定に応じた学習を実現し,プライバシーと利便性のトレードオフを改善する。
    • 提案手法は,一様DPベースラインと比較して,プライバシーと利便性のトレードオフを明確に改善した。
    • 関連研究のSCALE法と比較して,より優れた性能を示した。
    • 非i.i.d.データや複雑なタスクにおいては,分散環境の制約から課題が残る。

    Link: https://arxiv.org/abs/2501.17634

  • ランダム遅延環境における保守的エージェントによる強化学習 [cs.LG, cs.AI]目的:ランダム遅延環境下での意思決定
    • 現実世界の強化学習応用では,環境からの遅延フィードバックが課題となる。
    • 遅延が一定の場合には対処法があるが,ランダム遅延は予測困難で未解決である。
    • ランダム遅延環境を,等価な一定遅延環境へ変換する手法を提案する。
    • 提案手法は,既存の一定遅延対応手法を直接拡張し,高い性能を維持する。
    • 連続制御タスクにおいて,提案手法は既存手法を上回り,良好な漸近性能を示す。
    • サンプル効率も向上し,より少ない試行回数で学習が完了する。

    Link: https://arxiv.org/abs/2507.18992

  • 料理の交差点:異文化レシピ適応のためのRAGフレームワーク [cs.CL, cs.AI, cs.CY, cs.IR, cs.LG]目的:異文化レシピ適応における多様性の向上
    • 食文化は多様性を反映し,社会の重要な一部である。レシピ適応はその多様性を維持しつつ,異なる文化圏で食を楽しめるようにする。
    • 既存のレシピ適応手法では,文化的適切性と多様な食のニーズへの対応が十分でない場合がある。
    • 多様なレシピ適応結果を生成できるRAGフレームワークを開発し,利用者の多様な嗜好に対応すること。
    • 提案手法CARRIAGEは,レシピ検索と文脈整理の両方で多様性を向上させ,既存のRAGフレームワークの限界を克服する。
    • CARRIAGEは,多様性と品質のバランスにおいて,従来のLLMと比較してパレート効率を達成した。
    • 本研究は,複数の有効な解答が存在する創造的なタスクにおいて,RAGが文脈の多様性を活用することの重要性を示す。

    Link: https://arxiv.org/abs/2507.21934

  • AutoBinder Agent: エンドツーエンドのタンパク質結合体設計のためのMCPベースエージェント [q-bio.BM, cs.AI]目的:タンパク質結合体設計の自動化
    • 創薬分野において,AI技術の活用が不可欠となっており,効率的な設計手法が求められている。
    • 既存の創薬AIツールは分散しており,連携が難しく,ワークフローの統合に手間がかかる。
    • LLMとMCPを用いて,創薬ワークフロー全体を自動化し,効率性と再現性を向上させる。
    • 本フレームワークは,MaSIF,Rosetta,ProteinMPNN,AlphaFold3などの最先端ツールを統合し,de novoの結合体生成を可能にする。
    • LLMによるプロトコル駆動型アーキテクチャは,従来のスクリプトベースのワークフローよりも再現性と拡張性に優れる。
    • 本システムは,創薬プロセスの自動化,人的資源の削減,監査可能性の向上に貢献する。

    Link: https://arxiv.org/abs/2602.00019

  • 自然言語を状態とルールとするセルオートマトン:LOGOS-CA [nlin.CG, cs.AI, cs.FL, cs.NE]目的:自然言語を用いたセルオートマトンの構築と可能性の検証
    • 言語は現実世界の知識や推論能力を反映し,豊かな表現力を持つため,シミュレーションの質を高める上で重要である。
    • 従来のセルオートマトンは数値や固定ルールに限定され,表現力に制約があった。
    • 言語の表現力をセルオートマトンに導入し,より複雑で豊かなシミュレーションを実現することを試みる。
    • LOGOS-CAは,セルオートマトンの状態とルールに自然言語を用いることで,従来の制約を超えたシミュレーションを可能にした。
    • 簡単な森林火災シミュレーションに成功し,人工生命研究の興味深い対象となる可能性を示した。
    • 本研究は,LOGOS-CAを用いた将来の研究方向性についても議論した。

    Link: https://arxiv.org/abs/2602.00036

  • 機械学習と組合せ融合分析によるビットコイン価格予測 [q-fin.ST, cs.AI, cs.CE, cs.LG]目的:ビットコイン価格予測のモデル構築
    • 金融市場において,価格予測は収益向上に不可欠な要素である。
    • 個々の機械学習モデルには弱点があり,汎用性に課題が残る。
    • モデルの多様性と認知的な多様性を活用し,予測精度向上を目指す。
    • 提案手法は,従来の個々のモデルや既存のビットコイン価格予測モデルを上回る性能を示した。
    • 評価指標であるMAPEは0.19%という良好な結果を得た。
    • スコアと順位の組み合わせ,および加重結合技術が有効であることが示された。

    Link: https://arxiv.org/abs/2602.00037

  • JSR-GFNet:次世代認知型グローバルナビゲーション衛星システムにおける干渉分類のためのJSR認識動的ゲート [eess.SP, cs.AI]目的:将来の認知型GNSS受信機における正確な干渉分類
    • GNSSは現代社会の基盤であり,その信頼性確保は極めて重要である。
    • 低JSR環境下での干渉分類性能低下と,位相情報損失による特徴の退化が課題である。
    • JSR-GFNetは,これらの課題を克服し,GNSSの安全性向上を目指す。
    • JSR-GFNetは,IQサンプルとSTFTスペクトログラムを組み合わせた多Modalアーキテクチャを採用。
    • 動的ゲート機構により,信号信頼度に応じて各ストリームの貢献度を自動的に調整。
    • CGI-21データセットを用いた実験で,JSR-GFNetは10-50dBのJSRスペクトル全域で高い精度を達成。

    Link: https://arxiv.org/abs/2602.00042

  • 量子回路に基づく学習モデル:量子計算と機械学習の架け橋 [quant-ph, cs.AI, cs.LG]目的:古典データ分析のための量子回路ベースの学習モデルに関する既存の研究のレビュー
    • 機械学習は様々な分野で活用され,データから有用なパターンを自動的に抽出できる。
    • 大規模データと高性能計算の要求増大が課題となっている。
    • 量子計算の可能性に着目し,機械学習の課題解決を目指す。
    • 本研究は,量子計算と機械学習の融合である量子機械学習の進展を概観する。
    • 特に,量子回路ベースのモデルと古典機械学習層を組み合わせたハイブリッドフレームワークに焦点を当てる。
    • 理論的分析と実証的知見に基づき,量子機械学習の実用性と適応性を評価する。

    Link: https://arxiv.org/abs/2602.00048

  • エネルギーバランス市場の予測モデルの解釈可能性の探求 [q-fin.ST, cs.LG, q-fin.GN]目的:エネルギーバランス市場の予測における,モデルの解釈可能性と精度のトレードオフの分析
    • エネルギー市場の安定供給と電力網の安全確保に不可欠な需給バランスを最適化するため
    • 高性能な機械学習モデルは解釈が難しく,予測の根拠が不明瞭になりがちである
    • 解釈可能なモデルを用いて,市場価格の変動要因や地域特性を明らかにすること
    • EBMはXGBoostと同程度の予測精度を持ちながら,高い解釈可能性を示すことが確認された
    • mFRR価格の予測は,スポット価格からの乖離が大きい場合に特に困難であることが示唆された
    • EBMの解釈可能性を活用することで,非線形な価格変動要因や地域市場のダイナミクスに関する知見が得られた

    Link: https://arxiv.org/abs/2602.00049

  • グラフ上の点連結のための脳に触発された機械知能:振動同期のホログラフィック青写真 [q-bio.NC, cs.AI, cs.LG]目的:グラフ上の点連結における脳に触発された機械知能の探求
    • 神経科学と人工知能において,神経結合は抽象概念を符号化する動的な振動パターンとして現れる。
    • 従来のグラフニューラルネットワークは,過剰平滑化の問題を抱え,複雑なグラフ構造の推論が困難である。
    • 脳のリズムを支配する神経メカニズムの理解に基づき,新たな機械学習アルゴリズムを設計する。
    • 提案するHoloGraphフレームワークは,グラフニューラルネットワークの過剰平滑化問題を効果的に軽減する。
    • HoloGraphは,振動同期のモデリングを通じて,グラフにおける推論能力を向上させる。
    • 複雑なグラフ上の課題解決において,高い可能性を示すことが示された。

    Link: https://arxiv.org/abs/2602.00057

  • ニューラル演算子に対する有限次元エンコーディング/デコーディング定理について [math.FA, cs.LG]目的:ニューラル演算子ネットワークの理論的基盤
    • 偏微分方程式の解法にニューラルネットワークを活用する上で重要。
    • 既存の結果では,適用可能な関数空間に制限があった。
    • より広範な関数空間における定理の成立を明らかにする。
    • 定理は,ノルム空間だけでなく,任意の局所凸空間においても成立する。
    • 関数空間の近似性質に関する条件は,$C^k$コンパクト開位相においては必要であることが示された。
    • 局所凸関数空間は偏微分方程式の理論で一般的であり,この結果はその応用範囲を広げる。

    Link: https://arxiv.org/abs/2602.00068

  • 非定常時系列データに対するテスト時適応:合成レジームシフトから金融市場へ [q-fin.ST, cs.LG, stat.ML]目的:非定常時系列の予測および方向分類における,小規模なテスト時適応フレームワーク
    • 実世界の時系列データは定常ではないことが多く,変化に対応した予測が重要である。
    • データ分布が変化すると,過去のデータで学習した予測モデルの精度が低下する。
    • 変化するデータ分布に適応し,予測モデルのロバスト性を向上させることを目指す。
    • 合成データ実験では,正規化に基づくテスト時適応が予測誤差を改善した。
    • 金融市場データでは,バッチ正規化統計量の更新が堅牢なデフォルト戦略となり,より積極的な適応は逆効果となる場合がある。
    • 本研究は,非定常時系列におけるテスト時適応の実用的な展開に関する指針を提供する。

    Link: https://arxiv.org/abs/2602.00073

  • GTスコア:データ駆動型トレーディング戦略における過学習を軽減するための堅牢な目的関数 [q-fin.ST, cs.LG]目的:データ駆動型トレーディング戦略における過学習軽減のためのGTスコアの有効性
    • 金融モデリングにおいて機械学習の利用が拡大する中で,過学習問題の克服は重要である。
    • 過去データに適合しすぎる過学習は,実運用での性能低下を招く大きな課題となっている。
    • 本研究は,過学習を抑制し,より堅牢なトレーディング戦略を開発するための手法を提供する。
    • GTスコアは,既存の目的関数と比較して,ウォークフォワード検証において一般化比率を98%改善した。
    • モンテカルロシミュレーションにおいて,GTスコアはSortinoやSimple関数と比較して統計的に有意な差を示した(p < 0.01)。
    • 目的関数に過学習防止の構造を組み込むことで,定量研究におけるバックテストの信頼性向上に繋がる可能性が示唆された。

    Link: https://arxiv.org/abs/2602.00080

  • 中国REITs向け大規模言語モデルベース複数エージェント投資システムの設計と実証研究 [q-fin.ST, cs.AI, q-fin.TR]目的:中国REITs市場における複数エージェント協調に基づく取引フレームワーク
    • 中国のREITs市場は成長著しく,投資機会の拡大が期待されている
    • 市場のボラティリティが低く,高度な分析と意思決定が求められる
    • LLMを活用し,リスク調整後リターンを向上させる取引戦略を開発する
    • 提案システムは,アナウンス,イベント,価格モメンタム,市場の4種類のエージェントを構築し,多角的な分析を実現した。
    • バックテストの結果,エージェントベース戦略は,買い持ち戦略を大きく上回る成績を示した。
    • ファインチューニングされた小規模モデルが,汎用大規模モデルと同等以上の性能を示す場合もあることが示された。

    Link: https://arxiv.org/abs/2602.00082

  • LLMによるニュースセンチメント分析が株価変動予測に与える影響 [q-fin.ST, cs.AI, cs.CE]目的:株価変動予測におけるLLMベースのニュースセンチメント分析の活用
    • 金融市場において,株価変動の正確な予測は投資戦略の最適化に不可欠である。
    • ニュースセンチメント分析と株価予測は別々に研究されてきたため,両者の統合的な効果が不明確である。
    • ニュースセンチメント分析が株価予測にどの程度貢献するか,様々なモデルアーキテクチャにおける効果を明らかにすること。
    • DeBERTaが他の2つのLLM (RoBERTa, FinBERT) よりも高い精度 (75%) を示した。
    • 3つのモデルを組み合わせたアンサンブルモデルは,約80%の精度を達成した。
    • ニュースセンチメントの活用は,LSTM,PatchTST,tPatchGNNなどの株価予測モデルにわずかな利点をもたらした。

    Link: https://arxiv.org/abs/2602.00086

  • 頻繁パターンマイニングによる画像圧縮 [eess.IV, cs.AI, cs.CV]目的:画像圧縮手法
    • 画像データは容量が大きく,効率的な圧縮が重要である。
    • 従来の圧縮手法では,計算量や圧縮率に課題が残る場合がある。
    • 頻繁パターンマイニングを用いて,より効率的な圧縮アルゴリズムを開発する。
    • 類似ピクセルをクラスタリングし,クラスタIDを用いて画像圧縮を行うことで,冗長データを削減した。
    • 従来のJPEGのDCT段階を,k-meansクラスタリングと閉頻出シーケンスマイニングの組み合わせで置き換えた。
    • 提案手法はベンチマークデータセットで45%の圧縮率向上を達成し,既存手法を上回る結果を示した。

    Link: https://arxiv.org/abs/2602.00100

  • 医用画像におけるラディオミクス:手法,応用,および課題 [eess.IV, cs.AI, cs.LG]目的:医用画像からの高次元特徴抽出による予測モデリング
    • 医療画像解析の定量化が,疾患の早期発見や治療効果の予測に不可欠である。
    • ラディオミクスの特徴量は不安定であり,再現性や汎用性に課題が残されている。
    • ラディオミクスパイプライン全体の設計選択が堅牢性や一般化可能性に及ぼす影響を分析する。
    • ラディオミクスは,画像データを高次元の特徴量に変換し,予測モデルを構築することで定量的な解析を可能にする。
    • 本調査では,ラディオミクスパイプラインにおける各段階の意思決定が,特徴量の安定性やモデルの信頼性,臨床的妥当性に与える影響を分析した。
    • 標準化,ドメインシフト,臨床展開における課題を特定し,今後の方向性としてハイブリッドモデルやフェデレーテッドラーニングを提案した。

    Link: https://arxiv.org/abs/2602.00102

  • 高スループットポリマーインフォマティクスにおける自律型マルチエージェントAI:合成ポリマーおよびバイオポリマーの特性予測から生成設計まで [cond-mat.soft, cond-mat.mtrl-sci, cs.AI]目的:ポリマー探索のための統合されたマルチエージェントAIエコシステムの開発
    • ポリマー材料の設計・開発は,様々な産業において重要であり,新素材創出への需要は高い。
    • 従来のポリマー材料開発は,実験と試行錯誤に依存しており,時間とコストがかかるという課題がある。
    • AIを活用することで,ポリマー材料の特性予測と生成設計を効率化し,開発期間の短縮とコスト削減を目指す。
    • 本研究では,ガラス転移温度(Tg)の予測において,R2=0.89という高い精度を達成した。
    • マルチエージェントによるコンセンサスに基づき,不確実性の推定も可能であり,1万ポリマー規模まで線形に拡張可能である。
    • 自己評価機能により,システムは自身の行動をモニタリング・最適化し,持続的な性能向上を実現する。

    Link: https://arxiv.org/abs/2602.00103

  • 予測市場ベンチマーク:取引エージェントのバックテストのためのSWE-bench様式フレームワーク [q-fin.ST, cs.AI]目的:予測市場における取引エージェント評価のためのフレームワーク
    • 予測市場は,バイナリペイオフ,確率としての価格解釈,市場構造への依存性から,取引エージェントのテストに適している。
    • 既存の評価手法では,歴史的データの再現性や取引手数料,決済リスクの考慮が不十分である。
    • 再現性のある環境で,アルゴリズムおよびLLMベースのエージェントの性能を客観的に評価することを目指す。
    • PredictionMarketBenchは,過去の板寄せ・取引データを用いた決定論的イベント駆動型のバックテストを可能にする。
    • 単純な取引エージェントは取引コストや決済損失により劣後することが示された。
    • 取引手数料を考慮した戦略は,ボラティリティの高い市場でも競争力を維持できることが確認された。

    Link: https://arxiv.org/abs/2602.00133

  • クォークグルーオンジェット分類における画像処理モデルの比較 [physics.data-an, cs.CV, cs.LG, hep-ex]目的:クォークおよびグルーオンジェットの識別
    • 高エネルギー物理学において,ジェット構造の理解は重要な課題である。
    • ジェット構造の分類は,バックグラウンドノイズの影響を受けやすく困難である。
    • ジェット画像から特徴を抽出し,高精度な分類を実現することを目指す。
    • Swin-Tinyモデルの最終2ブロックのファインチューニングが,効率と精度のバランスに優れる。
    • 識別精度は81.4%,AUCは88.9%を達成した。
    • MoCoによる自己教師あり学習により,特徴のロバスト性が向上し,学習パラメータ数を削減できる。

    Link: https://arxiv.org/abs/2602.00141

  • 早期警告予測:オンサーガー=マクループ対シュレーディンガー [q-bio.QM, cs.LG, stat.ML]目的:複雑系における臨界遷移の早期警告指標
    • 脳のてんかん発作など,複雑系の予測は科学研究における重要な課題である。
    • 高次元性や隠れた臨界信号が早期警告を困難にしている。
    • 高次元データからの早期警告信号抽出を可能とする理論的枠組みと方法論を構築する。
    • 本研究で定義した新たなスコア関数指標は,てんかん予測において高い感度と頑健性を示した。
    • 臨界点のより早期の識別を可能にし,発作前後の動的な特徴を明確に捉えることができた。
    • 多様な手法との比較から,提案手法の有効性が示された。

    Link: https://arxiv.org/abs/2602.00143

  • ProDCARL:新規抗菌ペプチド設計のための強化学習適合拡散モデル [q-bio.QM, cs.AI, q-bio.BM]目的:新規抗菌ペプチドの設計
    • 抗菌薬耐性菌の増加は医療を脅かす問題であり,低コストな計算機による抗菌ペプチドの探索が求められている。
    • 既存のペプチド生成モデルは,抗菌活性と安全性を明示的に最適化できていない。
    • 拡散モデルと強化学習を組み合わせ,抗菌活性と低毒性を両立するペプチド生成を目指す。
    • ProDCARLは,拡散モデルを強化学習によって調整し,抗菌ペプチドの予測スコアを有意に向上させた。
    • AMPスコアが0.081から0.178に向上し,pAMP>0.7かつpTox<0.3の高品質ヒット率は6.3%に達した。
    • 高い多様性を維持しており,1-平均ペアワイズアイデンティティは0.929である。構造と意味的特徴も有望なAMP候補を示唆する。

    Link: https://arxiv.org/abs/2602.00157

  • 材料科学のための自律型知能への道 [cond-mat.mtrl-sci, cs.AI]目的:材料科学における発見加速のための自律型システムのパイプライン
    • AIと材料科学の融合は,材料開発に革命をもたらす可能性を秘めている。
    • 既存の研究は,特定のタスクに特化したモデルに偏っており,発見プロセス全体を最適化できていない。
    • AIエージェントが計画,行動,学習を通じて材料発見を自律的に行うための指針を示す。
    • 本調査では,AIと材料科学の用語,評価,ワークフローを統合的に捉える視点を提供する。
    • LLMは,パターン認識,予測分析,文献マイニングなど,材料科学の様々な課題に活用できることが示された。
    • 自律性,記憶,ツール利用を備えたLLMエージェントによる,新規材料発見のロードマップを提示する。

    Link: https://arxiv.org/abs/2602.00169

  • 不確実性認識型マルチモーダル学習:Conformal Shapley Intervalsによるアプローチ [stat.ML, cs.LG]目的:マルチモーダル学習におけるモダリティ重要度と不確実性の定量化
    • データ分析において,複数の情報源を組み合わせることで予測精度向上に貢献する。
    • モダリティの貢献度にばらつきがあり,どのモダリティが重要か判断が難しい。
    • 各モダリティの重要度を不確実性とともに評価し,信頼性の高い学習を目指す。
    • Conformal Shapley Intervalsという手法を提案し,モダリティの重要度区間を構築した。
    • 提案手法に基づき,最適なモダリティ部分集合を選択する手続きを開発した。
    • 複数のデータセットで有効性を実証し,高い予測性能と意味のある不確実性定量化を実現した。

    Link: https://arxiv.org/abs/2602.00171

  • ゼロマージンにおけるXOR分類のためのニューロンブロックダイナミクス [stat.ML, cs.LG]目的:ニューロンブロックダイナミクスの解析
    • ニューラルネットワークの成功は,確率的勾配降下法による特徴学習に依拠する。
    • 既存研究は正のマージン分類に偏り,ゼロマージン分類の理論的解析は不足している。
    • ゼロマージン環境におけるニューロンの学習ダイナミクスを解明し,一般化性能を評価する。
    • ニューロンは4つの方向にクラスタ化し,ブロックレベルの信号が一貫して進化することが示された。
    • このブロックレベルの視点を用いることで,マージン仮定に頼らず,平均的なケースでの一般化性能分析が可能となった。
    • 数値実験により,予測される二相ブロックダイナミクスと,その汎用性が確認された。

    Link: https://arxiv.org/abs/2602.00172

  • 限定角度CT再構成のための可視特異点誘導相関ネットワーク [eess.IV, cs.AI, cs.CV]目的:限定角度CT再構成の精度向上
    • 被ばく線量低減と検査時間短縮が期待できるため,医療現場での応用が重要である。
    • 限定角度CTでは,投影角度の欠損によるアーチファクトや構造情報の方向性損失が課題となる。
    • 可視特異点の理論に基づき,アーチファクトの方向性を考慮した再構成を目指す。
    • 提案手法(VSGC)は,可視特異点エッジ特徴を抽出し,モデルの注意を集中させる。
    • VSGCは,エッジ特徴と他の領域との相関関係を確立することで,再構成精度を向上させる。
    • シミュレーションおよび実データによる評価で有効性が確認され,PSNRが2.45dB,SSIMが1.5%向上した。

    Link: https://arxiv.org/abs/2602.00184

  • QUASAR:原子レベルシミュレーションのための汎用自律システムとその性能評価 [cond-mat.mtrl-sci, cs.AI]目的:原子レベルシミュレーションのための汎用自律システム
    • マテリアルズサイエンス研究において,計算効率と自動化は重要な課題である。
    • 既存の自律システムは,ツール利用の柔軟性や適用範囲に限界がある。
    • 複雑な多段階シミュレーションを自律的に実行し,研究を加速させる。
    • QUASARは,密度汎関数理論,機械学習ポテンシャルなど,多様な手法を組み合わせた多段階ワークフローを自律的に実行可能である。
    • QUASARは,光触媒スクリーニングや新規材料評価といった最先端の研究課題に対しても有効であることが示された。
    • 本研究は,計算化学研究におけるエージェント型AIの導入可能性を示唆するとともに,今後の課題を提示する。

    Link: https://arxiv.org/abs/2602.00185

  • 競合リスクを持つ生存モデルの較正について [stat.ME, cs.AI, math.ST, stat.TH]目的:競合リスク下における生存モデルの較正
    • 生存分析は医療や信頼性工学等で重要であり,正確な確率予測が不可欠である。
    • 競合リスク下では,複数のイベントが同時発生し得るため,従来の較正手法では不十分である。
    • 本研究は,競合リスク下での生存モデルの確率予測精度を向上させることを目指す。
    • 既存の較正指標が競合リスク下では適切でないことを示した。
    • オラクル推定量に対して最適化される2つの新規較正指標を提案した。
    • 提案手法は,識別能力を維持しつつ,良好な確率予測を可能にする。

    Link: https://arxiv.org/abs/2602.00194

  • ランク付けと推論:マルチエージェント協調がゼロショットタンパク質変異予測を加速する [q-bio.QM, cs.AI, cs.CL]目的:低リソースのタンパク質工学におけるゼロショット変異予測の自動化と湿式実験での成功率向上
    • タンパク質工学は,創薬やバイオテクノロジーにおいて重要な役割を担う分野である。
    • 既存のタンパク質言語モデルは,生物物理学的な制約を無視した結果を出すことがあり,専門家による検証が不可欠である。
    • 本研究は,専門家の介入を減らし,湿式実験での成功率を高めるための自動化フレームワークを開発することを目指す。
    • 提案手法(VenusRAR)は,マルチエージェントによるランク付けと推論の二段階アプローチを採用し,ProteinGymにおいて高い相関関係を示した。
    • Reason-Stageにおける専門家パネルの検証により,ProteinGym-DMS99における上位5件のヒット率が最大367%向上した。
    • Cas12i3ヌクレアーゼを用いた湿式実験により,46.7%の陽性率と2つの新規変異体(活性が4.23倍と5.05倍に向上)が確認された。

    Link: https://arxiv.org/abs/2602.00197

  • SCALED:コーデックを意識したダウンサンプリング学習のための代理勾配 [eess.IV, cs.AI, cs.MM]目的:アダプティブビットレート(ABR)ストリーミングにおけるダウンサンプリングの最適化
    • 動画消費の急増により,現代のストリーミングアーキテクチャには大きな課題が生じている。効率的な動画配信が不可欠である。
    • 従来のダウンサンプリングは個別に最適化されており,エンドツーエンドのレート歪み性能が最適化されていないという課題がある。
    • 本研究は,実際の非微分可能なコーデックを用いたエンドツーエンドの学習を可能にし,性能向上を目指す。
    • 提案手法は,データ駆動型代理勾配を利用することで,非微分可能なコーデックを用いたエンドツーエンド学習を可能にした。
    • 従来のコーデック非依存型学習アプローチと比較して,BD-BR(PSNR)が平均5.19%向上した。
    • 複数のダウンサンプリング比率にわたって,一貫して改善が見られた。

    Link: https://arxiv.org/abs/2602.00198

  • 機械学習と凸型制限を用いた浅水方程式の亜格子規模パラメータ化 [physics.flu-dyn, cs.LG, physics.ao-ph, physics.comp-ph]目的:浅水方程式における亜格子規模過程のパラメータ化手法
    • 地球規模流体モデル等の数値予報において,亜格子規模過程の適切な表現は精度向上に不可欠である。
    • 従来のパラメータ化手法では,計算コストや複雑さ,あるいは汎用性の不足といった課題が存在する。
    • 機械学習を活用し,より効率的かつ高精度な亜格子規模パラメータ化を実現することを目的とする。
    • 提案手法は,局所的なパラメータ化を行うことで,全結合型のパラメータ化と比較して利点を示す。
    • 長期的な乱流シミュレーションにおいてエネルギーバランスが改善され,個々の解も高精度に再現されることが確認された。
    • ニューラルネットワークパラメータ化とフラックス制限を組み合わせることで,ショック波近傍の振動を抑制できる。

    Link: https://arxiv.org/abs/2602.00378

  • 特異なベイジアンニューラルネットワーク [stat.ML, cs.LG, stat.AP]目的:パラメータ効率の良い不確実性推定手法
    • 深層学習モデルの不確実性推定は,安全性が重要となる分野で不可欠である。
    • 従来のベイジアンニューラルネットワークは,パラメータ数が膨大になりがちである。
    • 低ランク近似を用いることで,パラメータ数を削減し,効率的な推定を実現する。
    • 提案手法は,標準的なDeep Ensembleと同等の予測性能を,より少ないパラメータで実現する。
    • 外挿分布検出能力が大幅に向上し,キャリブレーションも改善される。
    • パラメータ複雑度の上界が,従来の$\sqrt{mn}$から$\sqrt{r(m+n)}$へと縮小される。

    Link: https://arxiv.org/abs/2602.00387

  • 時間遅延のある制御システムに対する強化学習:包括的な調査 [stat.ML, cs.LG]目的:時間遅延のある制御システムにおける強化学習手法の分類と分析
    • サイバーフィジカルシステムの複雑化に伴い,制御や意思決定における強化学習の重要性が高まっている。
    • 現実のシステムには時間遅延が存在するが,従来の強化学習はマルコフ決定過程を前提としており,対応が困難である。
    • 時間遅延の影響を克服し,安定性と性能を両立する強化学習手法の指針を示す。
    • 本調査では,時間遅延の種類とマルコフ特性への影響を整理し,既存手法を5つのカテゴリに分類した。
    • 各手法の原理,利点,限界を比較分析し,時間遅延の特性と安全要件に応じた手法選択の指針を提示した。
    • 安定性検証,大規模遅延学習,マルチエージェント通信設計,標準化ベンチマークなどの課題と今後の研究方向性を示した。

    Link: https://arxiv.org/abs/2602.00399

  • テキストから画像生成のための拡散モデルとフローマッチングの整合 [stat.ML, cs.LG]目的:テキストから画像生成における拡散モデルとフローマッチングの整合方法
    • 画像生成技術は,創造性や表現の可能性を広げる上で不可欠である。
    • 既存の整合手法は計算コストが高く,異なる目的への汎化が難しい。
    • 報酬に基づいた分布からのサンプリングという整合問題の本質を利用し,効率的な整合を目指す。
    • 拡散モデルにおけるガイダンス項の敵対性を克服するため,報酬の条件付き期待値を推定するガイダンスネットワークを学習する。
    • ファインチューニングベースのモデルと同等の性能を,計算コストを60%以上削減して達成する。
    • フローマッチングにおいては,追加の計算コストなしに生成品質を向上させる,トレーニング不要なフレームワークを提案する。

    Link: https://arxiv.org/abs/2602.00413

  • 一般化線形文脈バンディットに対するシャッフルと同時差分プライバシー [stat.ML, cs.LG]目的:一般化線形文脈バンディットにおける差分プライバシー保護アルゴリズムの開発
    • データに基づいた意思決定において,プライバシー保護と有用性の両立が重要課題となっている。
    • 既存のプライバシー保護型文脈バンディットは線形報酬モデルに限定されており,より汎用的なモデルへの拡張が求められていた。
    • 一般化線形モデルにおけるプライバシー保護と後悔の最小化を両立するアルゴリズムを提案し,理論的な性能評価を行う。
    • 確率的文脈において,シャッフルDPアルゴリズムが $\tilde{O}(d^{3/2}\sqrt{T}/\sqrt{\varepsilon})$ の後悔を達成することを示した。
    • 敵対的文脈において,同時DPアルゴリズムが $\tilde{O}(d\sqrt{T}/\sqrt{\varepsilon})$ の後悔を達成し,非プライバシー保護型と同等の性能に近づいた。
    • 提案手法は,文脈分布に関するスペクトル的仮定を必要とせず,より幅広い適用が可能である。

    Link: https://arxiv.org/abs/2602.00417

  • 二変量因果方向推定のためのトポロジカル残差非対称性 [stat.ML, cs.LG, math.MG]目的:二変量データの因果方向の推定
    • 観測データのみからの因果推論は,社会科学や自然科学において重要な課題である。
    • 既存手法は,曖昧なデータや識別困難な状況で誤った因果方向を推定しやすい。
    • 本研究は,曖昧な状況下でも信頼性の高い因果方向推定を可能にすることを目指す。
    • トポロジカル残差非対称性(TRA)という幾何学に基づく新しい基準を提案した。
    • TRAは,正方向の因果関係において残差が約独立になるのに対し,逆方向では一次元チューブ状に集中する現象を利用する。
    • 合成データおよび実データを用いた実験により,TRAの優位性が示された。

    Link: https://arxiv.org/abs/2602.00427

  • 凸型経験リスク最小化における彩色洗練を通じた正確なインスタンス圧縮 [math.OC, cs.LG]目的:凸型経験リスク最小化の効率的な圧縮手法
    • 機械学習において,経験リスク最小化は重要な最適化問題であり,計算コストが課題となる。
    • 既存のソルバーは,凸最適化問題であってもスケーラビリティに限界がある。
    • 本研究は,彩色洗練を用いた新しい圧縮枠組みにより,計算コストの削減を目指す。
    • 提案手法は,線形回帰,多項式回帰,ロジスティック回帰など,幅広いモデルに適用可能である。
    • 彩色洗練に基づいた損失のない圧縮により,計算量を削減しつつ,高い精度を維持できる。
    • 実験結果は,提案手法が代表的なデータセットにおいて有効であることを示している。

    Link: https://arxiv.org/abs/2602.00437

  • 量子注意機構による量子相識別の実現 [quant-ph, cs.AI, cs.LG]目的:量子相転移の識別
    • 多体系における量子相転移は,物質の性質を決定する重要な現象である。
    • 大規模系では,複雑な相関構造により従来の計算手法が困難となる。
    • データ効率の高い量子相識別のスケーラブルな手法を開発すること。
    • 提案手法は,9量子ビットおよび15量子ビットのクラスター・イジングモデルで高い識別精度を示した。
    • 訓練データ数が100以下でもロバストな性能を維持する。
    • 相転移に敏感な特徴量や物理的な長さのスケールを捉え,量子相識別の有効性を示唆する。

    Link: https://arxiv.org/abs/2602.00473

  • マルコフ連鎖ポアソン方程式の固定点反復の安定化 [stat.ML, cs.LG, cs.NA, math.NA]目的:マルコフ連鎖ポアソン方程式の安定的な解法
    • 平均報酬強化学習の基礎であり,性能評価に不可欠な方程式である。
    • エルゴード性がない場合,解が一意に定まらず,反復計算が不安定になる問題がある。
    • 還元可能または周期的な連鎖における振動を抑え,安定した解を得ることを目指す。
    • 非減衰モードは実数周辺不変部分空間によって捉えられ,商空間上での演算子は厳密に収縮性を持つことが示された。
    • 連鎖構造の学習,ゲージ写像の推定,射影確率的近似による解の推定を行うパイプラインが開発された。
    • 射影推定誤差まで$\widetilde{O}(T^{-1/2})$の収束が証明され,エルゴード性がない状況下での応用が可能となった。

    Link: https://arxiv.org/abs/2602.00474

  • RAG-GNN:精密医療のための取得知識とグラフニューラルネットワークの統合 [quant-ph, cs.CC, q-bio.MN, cs.AI, cs.LG]目的:グラフニューラルネットワークと文献由来の知識の統合による,精密医療における予測性能の向上
    • ネットワーク構造は構造予測に優れるが,生物医学文献に埋め込まれた機能的な意味を捉えられない。
    • 既存手法では,ネットワーク構造と機能的意味の双方を捉えることが困難である。
    • 文献情報を活用することで,機能的解釈の精度を向上させる。
    • RAG-GNNは,機能的クラスタリングにおいて唯一正のシルエットスコアを獲得した(0.001)。
    • ネットワーク構造は予測情報の77.3%を,取得文献は8.6%のユニークな情報を提供する。
    • 癌シグナルネットワークにおいて,RAG-GNNはDDR1をKRAS変異との合成致死性を示す治療標的として特定した。

    Link: https://arxiv.org/abs/2602.00586

  • 異種分析システム統合のためのマルチモーダル機械学習 [cond-mat.mtrl-sci, cond-mat.soft, cs.AI, cs.LG, physics.data-an]目的:複雑材料における構造特性相関性の理解
    • 複雑材料の特性解明には,多岐にわたる測定手法の統合が不可欠である。
    • 異種分析システムのデータは,互いに解釈が難しく,統合が困難である。
    • 本研究は,異種データを統合し,材料特性を予測可能なモデルを構築する。
    • SEM画像,ラマン分光,ガス吸着,表面抵抗といった異種データを統合した。
    • XGBoost等の非線形回帰モデルが,高い予測精度を示した。
    • 表面抵抗は,接合間距離,結晶性,ネットワーク連結性によって支配されることが示唆された。

    Link: https://arxiv.org/abs/2602.00590

  • 行動なしオフライン-オンライン強化学習:離散化された状態ポリシーによるアプローチ [stat.ML, cs.AI, cs.LG]目的:行動ラベルのないデータセットからの学習とオンライン相互作用における知識の活用
    • 強化学習は,ロボット制御やゲームなど,様々な分野で応用が期待される重要な技術である。
    • 既存のオフライン強化学習は行動ラベルを必要とし,プライバシーやデータ制限により困難な場合がある。
    • 行動ラベルのないデータから効率的に学習し,オンラインでの学習を加速する手法を確立する。
    • 提案手法では,状態遷移を推奨する状態ポリシーを学習することで,行動ラベルが不要な状況に対応する。
    • 状態の離散化変換と,それを利用したオフライン学習アルゴリズムOffline State-Only DecQNを提案した。
    • 実験結果から,提案手法は収束速度と漸近的性能を向上させ,離散化と正則化が効果的であることが示された。

    Link: https://arxiv.org/abs/2602.00629

  • リーマン多様体上の多峰性分布からの訓練不要な確率的補間を用いたサンプリング [stat.ML, cs.LG, stat.CO]目的:リーマン多様体上での未正規化密度のサンプリング手法
    • 多様体上の確率モデルは,画像解析やロボティクスなど広範な分野で重要である。
    • 既存のサンプリング手法は,特に多峰性分布を持つ場合,効率的なサンプリングが困難である。
    • リーマン多様体上の多峰性分布からの効率的な訓練不要サンプリングを実現すること。
    • 本研究では,非平衡確定力学のシミュレーションに基づいたサンプリングアルゴリズムを提案した。
    • 提案手法は,ノイズ分布からターゲット分布へ,リーマン幾何学を尊重した確率的補間を用いる。
    • 機械学習を必要とせず,標準的なモンテカルロ法のみで多様体上のサンプリングを可能にした。

    Link: https://arxiv.org/abs/2602.00641

  • 高次元ガイド付き拡散モデルにおける歪みの発生 [stat.ML, cond-mat.dis-nn, cs.LG]目的:拡散モデルにおける歪み現象の定量的特徴付け
    • 生成モデルは多様なデータ生成に不可欠であり,その品質向上が求められている。
    • 条件付きサンプリングの標準手法であるClassifier-free guidanceが多様性を損なう問題がある。
    • 歪みの発生メカニズムを解明し,多様性を維持しつつ高品質な生成を目指す。
    • 歪みは,ガイド付き拡散モデルにおける有効ポテンシャル変化の相転移として捉えられる。
    • モード数が増加するにつれて歪みが生じ,次元数との関係が明らかになった。
    • 負のガイダンスウィンドウを導入した新しいガイダンススケジュールが,多様性損失の軽減に有効であることが示された。

    Link: https://arxiv.org/abs/2602.00716

  • 実験データベースとグラフニューラルネットワークを結びつける材料発見の新しいワークフロー [cond-mat.mtrl-sci, cs.LG]目的:実験データベースと結晶構造ファイルの対応付けによる材料物性予測の精度向上
    • 材料開発の加速には,計算科学とデータ科学の融合が不可欠である。機械学習はその鍵となる。
    • 実験データベースは存在するものの,原子座標情報が不足しており,高度な機械学習モデルの活用が制限されている。
    • 実験データベースに原子座標情報を補完し,グラフニューラルネットワーク等の高性能モデルの適用を可能とする。
    • NEMADとICSDの対応付けにより,磁性材料の転移温度および磁気状態の予測精度が大幅に向上した。
    • 平均絶対誤差(MAE)および正解分類率(CCR)の両方において,オリジナルのNEMADを用いた場合と比較して顕著な改善が見られた。
    • 転移学習の活用により,更なる予測精度の向上が期待できる。

    Link: https://arxiv.org/abs/2602.00756