arXiv雑要約

AI - 2026/04/02 公開

  • ゆえに私はいる。私は考える。 [cs.AI]目的:大規模言語推論モデルにおける意思決定と思考の順序の解明
    • 言語モデルの推論能力向上は,AIの汎用性向上に不可欠である。
    • 既存研究では,モデルの思考プロセスがどのように意思決定に影響するか不明確である。
    • モデルがテキスト生成前に意思決定をエンコードしている可能性の検証。
    • モデルの事前生成活性化から意思決定を高い精度で復号可能であることが示された。
    • 活性化の操作により,モデルの行動が変化し,思考プロセスがその変化を正当化する傾向があることが確認された。
    • これらの結果から,言語モデルはテキストによる熟考を開始する前に,行動選択をエンコードできる可能性が示唆される。

    Link: https://arxiv.org/abs/2604.01202

  • ニューラル調和テクスチャを用いた高品質プリミティブベースニューラル再構成 [cs.CV, cs.AI, cs.GR, cs.LG]目的:高品質なニューラル再構成の実現
    • 近年,新しい視点からの画像合成や再構成において,重要性が増している分野である。
    • 既存のプリミティブベースの手法では,高周波の詳細な表現が困難であるという課題がある。
    • プリミティブの表現力を高め,より詳細な再構成を可能にすることを目的としている。
    • ニューラル調和テクスチャは,既存のプリミティブベースのパイプラインに容易に統合可能である。
    • リアルタイムでの新規視点合成において,最先端の結果を達成している。
    • ニューラルフィールドベースとプリミティブベースの再構成間のギャップを埋めている。

    Link: https://arxiv.org/abs/2604.01204

  • 潜在的反復状態ヘッドによるLLM回帰 [cs.CL, cs.LG]目的:大規模言語モデルを用いたテキスト回帰のための新しい軽量なアーキテクチャ
    • 大規模言語モデルの活用範囲拡大のため,数値予測タスクへの応用が重要である。
    • 既存手法は,数値のテキストとしてのデコードや複数出力の集約に課題がある。
    • 凍結されたLLM表現から直接スカラー値を予測し,回帰精度とパラメータ効率を改善する。
    • RELISHは,5つのデータセット,4つのLLMバックボーン,2つの学習方法で既存手法を上回った。
    • RELISHは,3.4~3.7Mの学習可能なパラメータのみを必要とし,LoRAよりもパラメータ効率が良い。
    • 学習パラメータは,凍結されたLLMバックボーンの0.01~0.04%程度の追加オーバーヘッドで済む。

    Link: https://arxiv.org/abs/2604.01206

  • CliffSearch:科学的アルゴリズム発見のための理論とコードに基づく構造化されたエージェント的共同進化 [cs.LG, cs.AI]目的:科学的アルゴリズムの発見プロセス
    • 科学的発見は,仮説形成,実装,検証,修正の反復的なプロセスであり,研究開発の根幹をなす。
    • 既存のLLMを用いた探索システムは,コードのみを最適化しがちで,科学的構造の表現や正確性・新規性の評価が不十分である。
    • 理論とコードを構造化された科学的成果物として扱い,探索の過程で正確性と新規性を重視することで,より良いアルゴリズム発見を目指す。
    • CliffSearchは,LLMエージェントによる進化演算子(選択,交叉,突然変異,レビュー)を用いたフレームワークである。
    • このフレームワークは,ベンチマークテストにおける性能向上に加え,科学的な解釈可能性と正確性を重視したアルゴリズム発見を実現した。
    • 再現性のある探索,明示的な評価指標の設定,制御された条件下での発見比較を可能にする。

    Link: https://arxiv.org/abs/2604.01210

  • YC-Bench:長期計画と一貫した実行のためのAIエージェントのベンチマーク [eess.SY, cs.SY, cs.CL, cs.AI]目的:AIエージェントの長期的な計画と一貫性のある実行能力の評価
    • LLMエージェントの応用範囲拡大に伴い,複雑なタスク遂行能力が重要視されている。
    • LLMエージェントは,不確実性下での計画や遅延フィードバックへの対応に課題がある。
    • 本研究は,長期にわたる戦略的整合性を保つAIエージェントの能力向上を目指す。
    • YC-Benchベンチマークを導入し,シミュレーションされたスタートアップ経営を通じてエージェントの能力を評価した。
    • Claude Opus 4.6とGLM-5が,初期資本20万ドルを超える最終資金を達成し,特にGLM-5は推論コストが低い。
    • スクラッチパッドの使用が成功の最も強い予測因子であり,敵対的顧客の検出が主な失敗モードであった。

    Link: https://arxiv.org/abs/2604.01212

  • レシピが重要,キッチンより:AI天気予測パイプラインの数学的基盤 [cs.RO, cs.MA, cs.LG, cs.AI, physics.ao-ph]目的:AI天気予測パイプラインの予測精度を決定する要因の数学的枠組み
    • AI天気予測は飛躍的に進歩したが,予測精度を決定する要因を統一的に説明する理論は未だ存在しない。
    • 既存の研究は特定のアーキテクチャに焦点を当てており,学習パイプライン全体を考慮した体系的な分析が不足している。
    • 学習パイプライン全体を数学的に解析し,予測精度の向上に貢献する要素を特定すること。
    • 学習パイプラインにおける誤差分解を行い,推定誤差が近似誤差よりも支配的であることを示した。
    • MSE(平均二乗誤差)によるスペクトルブラーを形式化し,外挿分布における限界を導出した。
    • 多様なAI天気モデルを用いた実験により,スペクトルエネルギー損失と極端な現象における負のバイアスを確認した。

    Link: https://arxiv.org/abs/2604.01215

  • 短時間系列からの潜在的位相推論のための浅い再帰型デコーダ (LAPIS-SHRED) [cs.LG, cs.AI, cs.CV]目的:疎な時空間データの完全な時空間ダイナミクスの再構成と予測
    • 複雑なシステムの理解や予測には,時空間ダイナミクスの完全な把握が不可欠である。
    • 観測データが空間的にも時間的にも不完全である場合が多く,完全な軌跡の推定が困難である。
    • 短時間系列の観測データから,完全な時空間ダイナミクスを効率的に再構成・予測することを目指す。
    • LAPIS-SHREDは,シミュレーションデータで事前学習されたSHREDモデルと時間系列モデルを組み合わせることで,疎な観測データから完全な軌跡を再構成・予測する。
    • 本手法は,双方向推論,データ同化,多スケール再構成が可能であり,極端な観測制約下でも動作する。
    • 乱流,推進物理,燃焼遷移,衛星データなど,様々な複雑な物理現象に対する実験で有効性が確認された。

    Link: https://arxiv.org/abs/2604.01216

  • HippoCamp:個人用コンピューターにおける文脈的エージェントのベンチマーク [cs.CL, cs.AI, cs.CV]目的:マルチモーダルファイル管理におけるエージェントの能力評価
    • 個人のデジタル環境は情報量が増加し,効率的な管理が不可欠となっている。
    • 既存のベンチマークは汎用的な設定に偏り,実際の利用者の環境を十分に反映していない。
    • 個人のファイルシステムにおける文脈理解と高度な推論能力の評価を目指す。
    • HippoCampは,42.4GBを超える大規模な個人用ファイルシステムを構築し,エージェントの能力を評価する。
    • 最先端のマルチモーダル大規模言語モデル(MLLM)の評価の結果,ユーザープロファイリングの精度は48.3%にとどまった。
    • マルチモーダルな知覚と証拠の基盤作りが,現在のエージェントの主要なボトルネックであることが判明した。

    Link: https://arxiv.org/abs/2604.01221

  • エージェントAI -- 素粒子物理実験における物理学者との協調:LEP公開データを用いた概念実証的測定 [hep-ex, cs.AI, hep-ph]目的:素粒子物理実験におけるスラスト分布の測定
    • 素粒子物理学は,宇宙の根本的な構成要素と相互作用を理解するための基盤である。
    • 実験データの解析には,膨大な時間と専門知識が必要であり,ボトルネックとなっている。
    • AIを活用することで,データ解析の自動化と効率化を図り,発見サイクルを加速すること。
    • AIエージェントによる解析は,専門家の指示のもとで完全に自動的に行われた。
    • 反復ベイズアンフォールディングとモンテカルロ法に基づく補正により,完全に補正されたスペクトルが得られた。
    • 本研究は,AIが実験測定と理論計算を支援し,結果を比較することで洞察を深める,理論-実験ループへの一歩を示す。

    Link: https://arxiv.org/abs/2603.05735

  • 普遍的な音素認識のための経験的レシピ [math.ST, cs.CC, stat.TH, cs.CL, cs.LG, cs.SD, eess.AS]目的:音素認識の性能向上
    • 多言語・低リソース音声処理の鍵となる技術であり,グローバルなコミュニケーションを促進する。
    • 英語に特化したモデルは言語汎用性に乏しく,多言語モデルは事前学習の潜在能力を活かしきれていない。
    • 大規模多言語データを用いた訓練レシピを確立し,性能向上に貢献する。
    • PhoneticXEUSは,大規模多言語データで訓練され,多言語(PFER 17.7%)およびアクセント付き英語音声(PFER 10.6%)において最先端の性能を達成した。
    • 100以上の言語での評価により,自己教師あり学習表現,データ規模,損失関数の影響を定量的に明らかにした。
    • 言語ファミリー,アクセント,発音特徴におけるエラーパターンを分析し,より詳細な理解を深めた。

    Link: https://arxiv.org/abs/2603.29042

  • 強化学習ベースの外国為替取引のための分解可能な報酬モデリングと現実的な環境設計 [q-fin.GN, cs.LG]目的:強化学習を用いた外国為替取引の実現に向けた課題解決
    • 外国為替取引は,高い収益性が期待できる一方,市場の変動が激しく,高度な分析と迅速な意思決定が求められる。
    • 従来の強化学習の適用においては,簡略化されたシミュレーターや単一の報酬関数に依存し,現実的な市場環境への適応が困難であった。
    • 現実的な取引環境を構築し,詳細な報酬モデルを設計することで,強化学習の外国為替取引における実用性と解釈性を向上させる。
    • 摩擦を考慮した実行エンジンにより,厳密な前方参照回避と現実的な取引コストを組み込むことが可能となった。
    • 11要素からなる分解可能な報酬アーキテクチャにより,報酬要素の相互作用を詳細に分析し,最適な報酬設定を特定した。
    • 拡張された行動空間はリターンを増加させるものの,取引頻度も増加し,シャープレシオとのトレードオフが生じることが示された。

    Link: https://arxiv.org/abs/2604.00031

  • いつ,どこで:モデル海馬ネットワークが時間細胞と場所細胞の形成を統合する [physics.ed-ph, cs.CY, cs.RO, quant-ph, cs.ET, q-bio.NC, cs.AI, cs.LG, cs.NE, physics.bio-ph]目的:時間細胞と場所細胞の形成に関する統一的モデル
    • 空間と時間の認知は,記憶とナビゲーションに不可欠であり,脳の基本的な機能である。
    • 時間細胞と場所細胞は別個のメカニズムで機能するとされてきたため,その関係性は不明であった。
    • 時間細胞と場所細胞の共通の起源を解明し,その機能的差異を説明することを試みる。
    • 単一の再帰型ネットワーク(RNN)が,場所細胞様および時間細胞様の表現を生成することが示された。
    • RNNは,空間パターンの再現を通じて場所細胞様野を,時間パターンを通じて時間細胞様野を形成する。
    • 入力パターンの空間的・時間的変化によって,隠れユニットが時間細胞様表現と場所細胞様表現の間を滑らかに移行することが確認された。

    Link: https://arxiv.org/abs/2604.00036

  • 蟻のコロニーとアンサンブル学習の等機能性:第2部 - 弱い学習能力の強さとブースティング・パラダイムについて [stat.ML, cs.LG]目的:蟻のコロニーの意思決定とアンサンブル学習の間の数学的等価性
    • 複雑な問題解決において,生物学的および計算論的アプローチの共通原理理解は重要である。
    • アンサンブル学習における分散減少とバイアス減少のメカニズムの数学的関係が不明であった。
    • ブースティングの原理と蟻のコロニーの行動の類似性を数学的に証明し,共通の基盤を明らかにする。
    • 蟻のコロニーにおけるフェロモン媒介による動員は,ブースティングアルゴリズムの適応的重み付けと数学的に等価であることが示された。
    • ブースティングの周辺理論は,コロニーの意思決定の安定性と対応することが明らかになった。
    • 適応的動員を実装した蟻のコロニーは,ブースティングアルゴリズムと同等のバイアス減少効果を示すことがシミュレーションで確認された。

    Link: https://arxiv.org/abs/2604.00038

  • 衛星画像長期時系列補完のためのウィッティカー・ヘンダーソン平滑化法 [eess.IV, cs.AI]目的:衛星画像時系列の補完手法の改良
    • 地球観測において,衛星画像時系列データは環境変動のモニタリングに不可欠である。
    • 従来のウィッティカー平滑化法では,平滑化パラメータの調整が煩雑であり,ノイズの変動に対応できない。
    • ニューラルネットワークを用いて平滑化パラメータを推定し,時間変動するノイズに対応することで,より高精度な補完を目指す。
    • ウィッティカー平滑化法を微分可能なニューラル層として実装することで,ピクセル毎のパラメータ調整を自動化した。
    • 時間変動する正則化項を導入することで,時系列データにおけるノイズの変動に適応する平滑化を可能にした。
    • GPU上でのベンチマークテストにより,提案手法が従来の線形ソルバーよりも高速かつ省メモリであることが確認された。

    Link: https://arxiv.org/abs/2604.00048

  • GenoBERT:正確な遺伝型付加のための言語モデル [q-bio.GN, cs.AI, cs.LG]目的:遺伝子型付加の精度向上
    • ゲノムワイド関連解析やリスク予測研究において,緻密な遺伝子型情報が不可欠である。
    • 既存の参照パネル法は,祖先集団によるバイアスや希少変異の精度低下といった課題を抱えている。
    • 参照パネルに依存せず,高精度な遺伝子型付加を可能にする新しい手法の開発。
    • GenoBERTは,Beagle5.4,SCDA,BiU-Net,STICIを含む4つのベースライン手法と比較して,全体的な精度で最も優れた結果を示した。
    • 実用的なスパースレベル(最大25%欠損)において,GenoBERTは高い全体的な付加精度($r^2 \approx 0.98$)を達成し,50%の欠損下でも堅牢な性能($r^2 > 0.90$)を維持した。
    • 異なる祖先集団における実験結果は,データセット全体で一貫した改善を確認し,サンプルサイズが小さい場合やLDが弱い場合でも耐性があることを示した。

    Link: https://arxiv.org/abs/2604.00058

  • 病的な低ランク行列回復のためのスケーリング勾配降下法:最適なサンプリング複雑性 [stat.ML, cs.IT, cs.LG, math.IT]目的:病的な低ランク行列回復におけるスケーリング勾配降下法の最適なサンプリング複雑性の達成
    • 低ランク行列回復は,ビッグデータ解析など多くの分野で重要な役割を果たす。
    • 従来の勾配降下法は,病的な行列に対して収束が遅いという問題があった。
    • 本研究では,スケーリング勾配降下法の理論的性能を向上させ,実用的な高速化を目指す。
    • スケーリング勾配降下法が,最適なサンプリング複雑度O((n_1 + n_2)r)と,改善された反復複雑度O(log(1/ε))を両立することが示された。
    • この結果は,正定値半正定行列の設定に限定されず,一般的な低ランク行列回復問題に適用できる。
    • 数値実験により,病的な行列に対してスケーリング勾配降下法が収束を加速することが検証された。

    Link: https://arxiv.org/abs/2604.00060

  • 変圧器ベースモデルにおける金融時系列の二乗損失下での予測崩壊 [stat.ML, cs.LG, math.PR, math.ST, q-fin.CP, stat.TH]目的:金融時系列における二乗損失下での軌道予測
    • 金融市場の予測は,リスク管理や投資戦略において不可欠であるため,その精度向上は重要である。
    • 高度なモデルを用いても,金融時系列予測の性能が向上しない,または劣化することが課題となっている。
    • 変圧器ベースモデルにおける予測崩壊のメカニズムを理論的に解明し,その原因を特定すること。
    • 金融時系列において,変圧器ベースモデルは線形ベンチマークよりも大きな予測誤差を示すことが実験的に確認された。
    • モデルの表現力向上は,予測精度向上に繋がらず,むしろノイズの再利用による不要な軌道変動を引き起こす。
    • 条件付き期待値が退化する状況下では,モデルの表現力は予測分散を増加させるだけであり,バイアスを減少させる効果はない。

    Link: https://arxiv.org/abs/2604.00064

  • 多層オミクス特徴量選択のための遺伝的アルゴリズム:がん生存率解析における比較研究 [q-bio.GN, cs.LG]目的:がん研究におけるバイオマーカー探索の改善
    • がん研究において,より正確な診断や治療法の開発には,有効なバイオマーカーの発見が不可欠である。
    • 多層オミクスデータは高次元であり,サンプルサイズが限られているため,効果的なバイオマーカーパネルの特定が困難である。
    • 多層オミクスデータからコンパクトかつ効果的なバイオマーカーパネルを選択する手法を開発し,生存率予測の精度向上を目指す。
    • 提案手法Sweeping*は,単層と多層のオプティマイゼーションを交互に行うことで,多層オミクスデータの情報を有効活用する。
    • Sweeping*は,予測精度とバイオマーカーセットサイズのトレードオフを改善し,臨床データのみのモデルを上回る生存率予測性能を示した。
    • ただし,その効果はコホートに依存するため,データセットの特性に応じた戦略の選択が重要である。

    Link: https://arxiv.org/abs/2604.00065

  • マルチコントラスト自己注意GANによる脳MRI画像合成 [eess.IV, cs.AI, cs.CV]目的:マルチコントラストMRI画像の合成
    • 脳腫瘍の評価には様々なコントラストのMRI画像が不可欠である。各コントラストは補完的な情報を提供する。
    • 全てのコントラスト画像を撮影するには時間,コスト,患者への負担がかかり,十分な評価を妨げる場合がある。
    • 単一のT2画像から,高精度に不足するコントラスト画像を生成し,腫瘍の特徴を維持することを目的とする。
    • 提案手法3D-MC-SAGANは,高精度なマルチコントラスト画像をT2画像から合成できることが示された。
    • 腫瘍の形態を維持するためのセグメンテーション制約が組み込まれ,臨床的に意味のある情報が保持されることが確認された。
    • 実データを用いた評価により,最先端の性能と,現実的な解剖学的構造を持つコントラスト画像を生成できることが示された。

    Link: https://arxiv.org/abs/2604.00070

  • プロンプト誘導によるVLM画像圧縮のための事前フィルタリング [eess.IV, cs.AI]目的:VLM画像圧縮における効率改善
    • VLMの急速な発展により,画像理解やVQA等の応用が拡大している。
    • 従来の画像圧縮は人間視覚に最適化されており,VLMのような機械学習タスクには不向きである。
    • プロンプトに基づき,VLMに必要な画像領域を特定し,圧縮効率を向上させる。
    • 提案手法は,VQAベンチマークにおいて,タスク精度を維持しつつ,平均25-50%のビットレート削減を達成した。
    • 軽量でプラグアンドプレイ可能な事前フィルタリングモジュールにより,プロンプトに関連する画像領域を特定する。
    • このモジュールは,重要な詳細を保持しつつ,関連性の低い領域を平滑化することで,圧縮効率を改善する。

    Link: https://arxiv.org/abs/2604.00314

  • 特徴学習カーネルにおける一般化にはデータ対称性の破壊が必要である [stat.ML, cs.LG]目的:特徴学習カーネルにおける一般化のメカニズム
    • 機械学習において,学習データへの過剰適合を防ぎ,未知データへの汎化能力を高めることは重要である。
    • 学習初期には高い精度を達成するものの,テストデータへの汎化が遅れて起こる「グロッキング」現象が課題である。
    • データに内在する対称性を破壊することで,汎化性能を向上させる方法を解明すること。
    • 実験により,訓練データの特定の対称性が破壊された場合にのみ汎化が起こることが示された。
    • Recursive Feature Machine (RFM) は,データに固有の不変群作用を回復することによって汎化する。
    • 学習された特徴行列は不変群の特定の要素を符号化しており,対称性への依存性を説明する。

    Link: https://arxiv.org/abs/2604.00316

  • 体積障壁を超えるノイズ除去距離 [math.OC, cs.RO, stat.ML, cs.LG, math.PR]目的:高次元リーマン多様体の潜在的幾何構造の再構成
    • 多様体学習は,高次元データの構造を理解する上で重要である。
    • 従来の距離推定の精度は,体積障壁により制約されていた。
    • 体積障壁を超える距離推定精度を実現し,多様体復元を改善する。
    • 提案手法ORDERは,多項式時間で$n^{-2/(d+5)}$オーダーの点ごとの距離推定精度を達成する。
    • この精度は,次元$d>5$において体積障壁を厳密に克服する。
    • 再構成された計量測度空間と真の潜在多様体の間のグロモフ・ワッサースタイン距離は,$n^{-1/d}$オーダーとなる。

    Link: https://arxiv.org/abs/2604.00432

  • ニューラルODEにおける活性飽和とフロケスペクトルの崩壊 [math.MG, cs.RO, math.DG, math.DS, cs.LG]目的:ニューラルODEの活性飽和がダイナミクスに与える構造的な制限
    • 深層学習モデルのダイナミクス理解は,性能向上と信頼性確保に不可欠である。
    • 活性化関数の飽和が,学習済みモデルの表現能力を制限する可能性が指摘されている。
    • 活性飽和がフロケスペクトルに与える影響を解析し,モデルのダイナミクス制限を明らかにする。
    • 活性飽和は,ニューラルODEの入力ヤコビアンを減衰させ,フロケ指数を制限することが示された。
    • 飽和が深まるにつれ,すべてのフロケ指数はゼロに近づき,強い収縮とカオス的感度を抑制する。
    • この制限は構造的であり,学習の質に関わらず推論時にベクトル場を制約する。

    Link: https://arxiv.org/abs/2604.00543

  • 多基準データ駆動型意思決定のためのシナリオ理論 [stat.ML, cs.LG, cs.SY, eess.SY, math.OC]目的:多基準データ駆動型意思決定におけるロバスト性評価
    • 不確実性下での意思決定は,現実世界の多くの問題において不可欠である。
    • 従来のシナリオ理論は単一の基準に焦点を当てており,多基準問題への適用が困難である。
    • 複数の基準とデータセットを考慮した,ロバスト性をより正確に評価する手法の確立。
    • 本研究では,複数の基準に対するリスクを統合的に扱い,より正確なロバスト性証明を提供しうるシナリオ理論を開発した。
    • 提案手法は,各基準が同時に満たされるロバスト性のレベルをより明確に定量化することを可能にする。
    • このフレームワークは,不確実性下での設計のための,原理的でスケーラブルかつ理論的に裏付けられた方法論を提供する。

    Link: https://arxiv.org/abs/2604.00553

  • 社会経済ダイナミクスのモデリングにおけるニューラル常微分方程式 [math.DS, cs.LG]目的:貧困ダイナミクスの分析
    • 社会経済現象は複雑であり,その理解と予測は政策立案に不可欠である。
    • 従来の微分方程式では,貧困のような複雑な動的課題を捉えきれない場合がある。
    • ニューラル常微分方程式を用いて,貧困ダイナミクスをデータ駆動的にモデル化し,予測精度向上を目指す。
    • 訓練されたニューラル常微分方程式モデルは,観測された貧困指標データを高い精度で再現した。
    • ニューラル常微分方程式は,具体的な構造を持つ世帯の貧困指標のダイナミクスを捉える能力を示した。
    • この研究は,ニューラル常微分方程式のような機械学習手法が,社会経済的移行のモデリングに有効であることを示した。

    Link: https://arxiv.org/abs/2604.00632

  • Procela:構造的不確実性下におけるメカニズムシミュレーションにおける認識的ガバナンス [physics.soc-ph, cs.SY, eess.SY, physics.comp-ph, cs.AI, cs.CE]目的:メカニズムシミュレーションにおける認識的ガバナンスの実現
    • 複雑な現象の理解には,メカニズムシミュレーションが不可欠である。
    • 因果構造が不明確な状況下では,シミュレーションの精度が低下する。
    • 構造的不確実性下でも適応可能なシミュレーションのパラダイムを確立する。
    • Procelaは,変数自身が仮説を保持し,メカニズムが競合する因果構造を表現する,新しいフレームワークである。
    • 病院ネットワークにおける薬剤耐性(AMR)のシミュレーションで,エラーを20.4%削減し,累積後悔を69%改善した。
    • シミュレーションが自身の仮定を検証し,実行時にシステムトポロジーを変化させることで,適応性を実現する。

    Link: https://arxiv.org/abs/2604.00675

  • 逆行列を用いない疎変分ガウス過程 [stat.ML, cs.LG]目的:ガウス過程のスケーラビリティ向上
    • ガウス過程は強力だが,計算コストが高い。
    • 疎変分ガウス過程も,カーネル行列の分解にコストがかかる。
    • 行列積のみで最適化可能な手法による解決。
    • 提案手法は,既存の疎変分ガウス過程モデルに容易に組み込める。
    • 従来の数値結果と同等の性能を達成できる。
    • 適切な調整により,既存手法よりも高速に動作する可能性がある。

    Link: https://arxiv.org/abs/2604.00697

  • 因果効果推定におけるスコアと表現学習の混同因子除去:弱いオーバーラップへの対処 [stat.ML, cs.LG, stat.ME]目的:因果効果推定のためのスコアと表現学習
    • 因果推論は,政策評価や医療分野など,様々な分野で重要な役割を果たす。
    • 高次元データにおいては,十分なオーバーラップを確保することが困難である。
    • オーバーラップを改善するための表現学習手法を開発し,因果効果推定の精度向上を目指す。
    • 本研究では,識別と推定目標を両立する「混同因子除去スコア」という特徴表現を提案した。
    • オーバーラップを改善する問題は,混同因子除去スコア制約下でのオーバーラップダイバージェンス最小化として定式化された。
    • 特定の一般化線形モデルにおいて,プログノスティックスコアがオーバーラップ最適であることが示された。

    Link: https://arxiv.org/abs/2604.00811

  • 変分オートエンコーダにおける汎用ボルツマン事前分布のためのマルチモード量子アニーリング [quant-ph, cond-mat.stat-mech, cs.LG]目的:変分オートエンコーダの潜在表現学習における事前分布の活用
    • 複雑なデータから効率的な表現を学習する上で,潜在空間の事前分布の選択が重要である。
    • 従来の変分オートエンコーダでは,潜在変数の間の構造的相互作用を捉えることが困難であった。
    • エネルギーベースの事前分布を用いた学習を,量子アニーリングによって効率化し,生成能力の向上を目指す。
    • 本研究では,ボルトンマシン事前分布変分オートエンコーダ(BM-VAE)を,量子アニーリングの異なるモードで学習する手法を提案した。
    • D-Wave Advantage2プロセッサを用いて最大2000量子ビットで安定した学習を行い,ガウス事前分布VAEと比較して収束が速く,再構成損失が低いことを示した。
    • 学習されたボルツマン事前分布は,潜在分布からの直接サンプリングによる無条件生成と,潜在空間の偏りによる条件付き生成を可能にする。

    Link: https://arxiv.org/abs/2604.00919

  • 構造化知識とデータの架橋:金融応用を伴う統一的フレームワーク [math.ST, cs.CC, stat.TH, stat.ML, cs.AI, cs.LG]目的:構造化知識を組み込んだニューラルネットワークの推定フレームワーク
    • 経済学や金融工学では,理論モデルとデータに基づいた推定が不可欠である。
    • 理論モデルは現実との乖離や計算の困難さを抱え,データ駆動型アプローチは過学習のリスクがある。
    • 理論とデータを統合し,モデルの安定性と汎化性能を向上させることを目指す。
    • SKINNsは,理論的制約をニューラルネットワークに組み込むことで,データと理論の両方に対して一貫した推定を可能にする。
    • オプション価格決定への応用において,SKINNsは従来のキャリブレーションと比較して,市場価格の予測精度とヘッジ性能を向上させた。
    • 構造パラメータの推定安定性も改善され,経済的に解釈可能な結果が得られた。

    Link: https://arxiv.org/abs/2604.00987

  • モデルベース強化学習による焦点面波面制御 [astro-ph.IM, cs.LG, cs.RO]目的:焦点面における波面制御手法の開発
    • 巨大望遠鏡を用いた,居住可能な系外惑星の直接撮像は重要な科学目標である。
    • 大気擾乱や光学系の非対称収差が,系外惑星観測の妨げとなる。
    • 機械的な波面補正では性能劣化が避けられないため,自動補正手法が求められる。
    • 提案手法PO4NCPAは,焦点面画像を基に,動的・静的な非対称収差を自動的に補正する。
    • シミュレーションにより,PO4NCPAがコロナグラフ使用時・非使用時ともに,高い性能を発揮することが示された。
    • PO4NCPAは,ELTやベクトルボテックスコロナグラフにも適用可能であり,リアルタイムな大気擾乱補正にも利用できる。

    Link: https://arxiv.org/abs/2604.00993

  • ロバストなマスク拡散モデルを用いた光学多層薄膜の逆設計 [physics.optics, cs.LG]目的:光学多層薄膜の逆設計手法
    • 光学デバイスの高性能化には,光の波長を制御する多層薄膜設計が不可欠である。
    • 設計空間が広く,最適な解が一意に定まらないため,多層薄膜の逆設計は困難である。
    • 所望の光学特性を実現する薄膜構造を,効率的に探索することを目指す。
    • 提案手法OptoLlamaは,既存のテンプレートベースラインと比較して平均絶対スペクトル誤差を2.9倍低減した。
    • データ駆動型最先端手法OptoGPTと比較しても,3.45倍の誤差低減を達成した。
    • 設計されたターゲットおよび専門家定義のターゲットにおいて,特徴的なスペクトル特徴と物理的に意味のあるスタックモチーフを再現した。

    Link: https://arxiv.org/abs/2604.01106

  • AdaLoRA-QAT:適応低ランクと量子化認識セグメンテーション [eess.IV, cs.AI, cs.CV]目的:胸部X線画像セグメンテーションにおける効率性と精度向上
    • 医療診断支援において,胸部X線画像セグメンテーションは重要な役割を担う。
    • 大規模な基盤モデルの計算資源制約から臨床現場への導入が困難である。
    • モデルのパラメータ効率と圧縮率を高め,臨床的信頼性を損なわずにセグメンテーション精度を維持すること。
    • AdaLoRA-QATは,ダイス係数95.6%を達成し,フル精度SAMデコーダーのファインチューニングと同等の性能を示した。
    • 学習可能なパラメータ数を16.6倍,モデル圧縮率を2.24倍削減することに成功した。
    • Wilcoxonの符号順位検定により,量子化がセグメンテーション精度を著しく低下させないことが確認された。

    Link: https://arxiv.org/abs/2604.01167

  • 浅いチャネル回路で準備された混合状態の学習と生成 [quant-ph, cond-mat.stat-mech, cs.CC, cs.LG]目的:有限次元格子上の混合状態生成の学習
    • 量子情報科学において,状態学習は重要な課題であり,計算複雑性との関連も深い。
    • 混合状態の位相の研究が進む中で,効率的な学習アルゴリズムが課題となっていた。
    • 浅いチャネル回路で準備可能な混合状態の効率的な学習手法を確立することを目指す。
    • 浅い局所チャネル回路を用いて,未知の混合状態を近似的に生成するアルゴリズムを開発した。
    • サンプル複雑度と実行時間は,量子ビット数に対して多項式(または準多項式)である。
    • 古典極限においては,古典拡散モデルへの応用も示唆されており,効率的な学習が可能となる。

    Link: https://arxiv.org/abs/2604.01197

  • CHEEM:再利用,新規,適応,スキップによる継続学習 -- 階層的探索・利用アプローチ [cs.CV, cs.LG]目的:継続的な環境変化に対応するための知識獲得・更新・蓄積メカニズム
    • 現実世界の複雑な環境に適応するには,継続学習が不可欠である。
    • 既存の深層学習システムは,過去知識の忘却(破滅的忘却)が課題となる。
    • 安定性と可塑性の両立を目指し,タスクに応じた効率的なモデル構築を可能にする。
    • 提案手法CHEEMは,MTILおよびVDDベンチマークにおいて最先端のプロンプトベース手法を大幅に上回る性能を示した。
    • CHEEMは,タスクの複雑さに応じてモデル構造を適応的に学習し,意味的に有意な構造を獲得する。
    • HEE-NASという効率的なニューラルアーキテクチャ探索により,タスクストリーム全体を通して選択されたコンポーネントを動的に更新する。

    Link: https://arxiv.org/abs/2303.08250

  • グラフニューラルネットワーク高速化に関する調査:アルゴリズム,システム,カスタムハードウェア [cs.LG, cs.AR, cs.DC]目的:グラフニューラルネットワーク高速化手法の体系的な整理と将来の研究方向性の提案
    • グラフ構造データに対する機械学習において,高い性能を示すグラフニューラルネットワークの活用が広がっている。
    • 大規模データや低遅延性要件を持つ実世界アプリケーションにおいて,スケーラビリティが課題となっている。
    • 急速に増加するグラフニューラルネットワーク高速化に関する研究を体系化し,複雑さを解決することを目指す。
    • 本調査では,グラフニューラルネットワーク高速化の分類体系を提示し,既存のアプローチをレビューした。
    • この分類体系は,既存の研究を結びつけ,さらなる発展の基盤を築く。
    • 将来の研究方向性についても提案を行い,この分野の進展に貢献する。

    Link: https://arxiv.org/abs/2306.14052

  • 検索結果の破損に対する確証的な堅牢性を備えたRAG [cs.HC, cs.HC, cs.LG, cs.CL, cs.CR]目的:検索結果の破損攻撃に対する確証的な堅牢性
    • 情報検索と大規模言語モデルの組み合わせであるRAGは,知識集約型タスクにおいて重要な役割を担う。
    • RAGは,検索結果に悪意のある文章が混入する攻撃に対して脆弱であり,誤った応答を生成する可能性がある。
    • 本研究は,検索結果の破損攻撃に対して確証的な堅牢性を提供する防御フレームワークを開発することを目指す。
    • RobustRAGは,文章を分離し,グループごとにLLM応答を生成,安全に集約する「分離と集約」戦略を採用。
    • キーワードベースおよびデコーディングベースのアルゴリズムにより,非構造化テキスト応答の安全な集約を実現。
    • 評価データセットにおいて,特定のクエリに対して応答品質の非自明な下限を形式的に証明する確証的な堅牢性を達成。

    Link: https://arxiv.org/abs/2405.15556

  • 帰納的グローバル・ローカル多様体近似と射影 [cs.AR, cs.LG, stat.AP, stat.ME]目的:高次元データ解析のための多様体学習手法
    • 高次元データ解析において,データの構造を低次元で表現する技術の重要性が増している。
    • 既存手法では,データの局所構造とグローバル構造を同時に捉えることが困難である。
    • 未知データに対しても汎化性能を持つ,新たな次元削減手法を開発する。
    • GLoMAPは,局所的およびグローバルな距離情報を保持し,最適化の過程でグローバルからローカルへの構造形成を示す。
    • iGLoMAPは深層ニューラルネットワークを利用することで,再学習なしに未知データに対する低次元埋め込みを可能にする。
    • シミュレーションおよび実データを用いた実験で,最先端手法と同等の性能を示すことが確認された。

    Link: https://arxiv.org/abs/2406.08097

  • 概念が変化するタイミングの学習:交絡,不変性,次元削減 [cs.LG, stat.ME, stat.ML]目的:分布シフト下における概念変化の解消とターゲット予測の改善
    • 予測モデルの利用環境の変化に対応する必要性が高まっているため。
    • 観測データでは,分布シフトが交絡によって引き起こされる場合があり,最適なモデルが変化する。
    • 交絡を考慮し,不変な表現学習を通じて概念変化を抑制し予測精度を向上させる。
    • 提案手法は,予測可能性と安定性のバランスを取る非凸最適化問題を解く。
    • 十分な正則化により,分布シフトに強い不変な線形部分空間がほぼ全ての局所最適解で達成される。
    • 実データを用いた検証により,予測可能性と安定性のトレードオフが示された。

    Link: https://arxiv.org/abs/2406.15904

  • 自己予測:強化学習の改善に向けた自己認識表現の自己教師あり学習 [cs.RO, cs.AI]目的:エージェントの自己認識表現の学習
    • 深層強化学習は目覚ましい進歩を遂げているが,効果的な方策を学習するには膨大な訓練経験が必要である。
    • 従来の強化学習は,熟練のために教師信号を必要とする場合が多く,人間の学習効率に劣る。
    • エージェントの運動情報を用いて,自己と環境の区別を学習し,サンプル効率を向上させることを目指す。
    • 自己教師あり学習によるエージェントの自己認識表現(Ego-Foresight)を提案し,特徴学習の補助タスクとして活用した。
    • シミュレーションされた制御タスクにおいて,Ego-Foresightを組み込むことで,サンプル効率と性能が向上することを示した。
    • Ego-Foresightはエージェントの運動を予測し,エージェント情報を分離する能力を有していることが確認された。

    Link: https://arxiv.org/abs/2407.01570

  • コード理解と監査によるLLM評価の非教師あり評価 [cs.AI, cs.CL, cs.LG]目的:LLMを用いたコードの正誤評価手法の改善
    • コードの品質保証はソフトウェア開発において重要であり,自動化が求められている。
    • 既存手法はコード全体を直接評価するため,プログラムの理解と正誤判定が混同しやすい。
    • コードの理解と監査を分離することで,より正確な評価を実現することを目指す。
    • 提案手法CoCoAは,まずコードの機能を自然言語で説明する。
    • 次に,その説明に基づき,タスクとの整合性を評価する。
    • 複数のデータセットで,F1スコアが最大68%,精度が最大20%向上した。

    Link: https://arxiv.org/abs/2410.03131

  • トポロジカルアラインメントスペクトルによるニューラルネットワークの収束診断 [cs.LG]目的:ニューラルネットワークにおける表現類似性の多スケール診断
    • 深層学習モデルの理解と改善には,内部表現の構造解析が不可欠である。
    • 既存の類似性指標はグローバルなスカラー値しか提供せず,多スケール構造を捉えきれない。
    • 多スケールでの構造的関係性を明らかにし,収束や表現の安定性をより詳細に診断すること。
    • トポロジカルアラインメントスペクトル(TAS)は,異なる近傍サイズで正規化平均ジャカード類似度を計測する。
    • 合成データ実験により,TASは局所的なジッターとクラスター中心のシャッフルを区別できることが示された。
    • MultiBERTsの実験では,ファインチューニングが多スケールにわたるトポロジカルな再編成を引き起こすことが明らかになった。

    Link: https://arxiv.org/abs/2411.08687

  • 深層ニューラルネットワークに対するサイドチャネル攻撃によるハードラベル抽出のための分割統治戦略 [cs.CR, cs.AI]目的:深層ニューラルネットワークのハードラベル抽出
    • 深層学習の価値向上に伴い,知的財産の保護が重要課題となっている。
    • 従来の攻撃手法は,複雑なネットワーク構造への適用が困難であった。
    • 本研究は,複雑な構造のネットワークにおけるハードラベル抽出を可能にする。
    • 提案手法は,マイクロコントローラ上に実装された様々なアーキテクチャ(MLP,MobileNetv1等)に対して有効に機能した。
    • MobileNetv1では88.4%,MLPでは93.2%の高い抽出精度を達成した。
    • 抽出されたモデルを用いて生成された敵対的サンプルは,被害モデルに対して高い転送性能を示した(95.8%~96.7%)。

    Link: https://arxiv.org/abs/2411.10174

  • 特徴分離と対照学習によるクロスカメラ運転者注意散漫分類 [cs.CV, cs.AI, cs.CY]目的:運転者の注意散漫状態の分類
    • 安全運転確保のため,運転者の状態把握が不可欠であり,その中でも注意散漫の検出は重要である。
    • 既存モデルは,訓練データと異なる条件下で精度が低下する問題がある。
    • 車両内カメラ位置の変化にロバストな,汎化性能の高いモデルを開発する。
    • 提案手法DBMNetは,特徴からカメラ視点情報を除去し,対照学習で運転行動の符号化を強化する。
    • 100-Driverデータセットを用いたクロス検証で有効性が確認され,AUCDD-V1,EZZ2021,SFDのベンチマークデータセットでも優位性を示した。
    • 既存手法と比較して,Top-1精度が7%向上し,推論速度,省電力性にも優れる。

    Link: https://arxiv.org/abs/2411.13181

  • エージェントによる検索拡張生成:エージェントRAGに関する調査 [cs.AI, cs.CL, cs.IR]目的:エージェントRAGシステムの体系的な調査と分析
    • 大規模言語モデルの発展はAIを大きく進展させたが,知識の陳腐化が課題である。
    • 従来のRAGシステムは静的なワークフローに縛られ,複雑なタスクへの適応性が低い。
    • エージェントRAGは,自律的なAIエージェントを組み込み,RAGシステムの柔軟性と拡張性を向上させる。
    • 本調査は,RAGパラダイムの進化を辿り,エージェントRAGアーキテクチャの分類体系を提示する。
    • 既存のフレームワークにおける設計上のトレードオフを比較分析し,医療,金融,教育などへの応用事例を検討する。
    • 評価,協調,メモリ管理,効率性,ガバナンスに関する今後の研究課題を明らかにする。

    Link: https://arxiv.org/abs/2501.09136

  • BN-Pool:グラフに対するベイズ非パラメトリックプーリング [cs.LG, math.PR]目的:グラフの粗視化における超ノード数を適応的に決定する,クラスタリングに基づくプーリング手法
    • グラフニューラルネットワークの性能向上は,大規模グラフの処理において重要である。
    • 既存のプーリング手法は,適切な粗視化レベルの設定が困難であり,冗長性が生じやすい。
    • グラフ構造を維持しつつ,最適な粗視化レベルを自動的に学習することで,性能と効率を向上させる。
    • BN-Poolは,ベイズ非パラメトリックフレームワークに基づき,ノードを可変数のクラスタに分割する。
    • 教師ありタスクの損失と,グラフ構造の再構成を促す教師なし補助項を組み合わせることで,クラスタリングを学習する。
    • これにより,ソフトクラスタリングプーリングと同等の性能を維持しつつ,冗長性を回避し,コンパクトな粗視化グラフを実現する。

    Link: https://arxiv.org/abs/2501.09821

  • 広範囲ニューラルネットワークにおける観測ノイズと初期化に関するガウス過程的視点 [cs.LG, stat.ML]目的:広範囲ニューラルネットワークの観測ノイズと初期化に関する理論的考察
    • ニューラルネットワークの理論的理解を深めることは,性能向上や汎化能力の解明に不可欠である。
    • 既存のNTK-GPはノイズレスなターゲットを仮定しており,現実のノイズのあるデータへの適用が困難である。
    • ノイズのあるデータと任意の事前平均に対応可能なNTK-GPの拡張を目指す。
    • 観測ノイズを組み込むための正則化項を導入し,NTK-GPとの対応付けを示した。
    • 任意の事前平均を可能にする「シフトネットワーク」を提案し,アンサンブルやカーネル反転を回避した。
    • 実験により,提案手法がNTK-GPの等価性の実用的な応用における重要な障壁を取り除くことを確認した。

    Link: https://arxiv.org/abs/2502.01556

  • データ重視変分目的関数によるハイパーパラメータ学習 [cs.LG, stat.ML]目的:ハイパーパラメータ学習手法
    • 大規模モデルでは,限られたデータでの過学習防止が重要である。
    • 従来のハイパーパラメータ探索は計算コストが高く,学習データを削減する。
    • データ重視変分目的関数を用いて,効率的なハイパーパラメータ学習を目指す。
    • 提案手法は,検証セットを必要とせず,勾配ベースでハイパーパラメータを学習する。
    • 画像とテキストの分類器におけるベイジアン転移学習で,従来のグリッドサーチの時間を大幅に短縮した。
    • ガウス過程の学習長尺度カーネルも効率的に近似できることを示した。

    Link: https://arxiv.org/abs/2502.01861

  • 生成AIを用いたチーム多様性の向上:新たなプロジェクト管理フレームワーク [cs.CY, cs.AI, cs.LG]目的:チーム多様性向上のためのプロジェクト管理フレームワーク
    • 学術研究におけるチームの成功は,多様な人材の組み合わせに大きく依存する。
    • 既存のプロジェクトチームは,メンバー構成の均質化が進みやすく,多様性が不足している場合がある。
    • 生成AIを活用し,チームダイナミクスのギャップを埋め,多様性を促進する。
    • 生成AIエージェントが個々の性格特性を理解・処理する能力が向上していることが示された。
    • 性格特性データでファインチューニングされた生成AIが,特定のチームロールを効果的に担う可能性が示唆された。
    • 本フレームワークは,AIを活用したチーム多様性向上とプロジェクト管理の実用的な応用を探求する。

    Link: https://arxiv.org/abs/2502.05181

  • 視覚障碍者・弱視者が好む大規模視覚言語モデル生成のシーン記述 [cs.CV, cs.AI]目的:視覚障碍者・弱視者におけるシーン記述の好み
    • 複雑な環境での移動は,視覚障碍者・弱視者にとって危険を伴うため,支援技術が重要である。
    • 大規模視覚言語モデルのシーン記述は有望だが,視覚障碍者・弱視者にとっての有効性は未解明な点が多い。
    • 視覚障碍者・弱視者のニーズに合致した,より適切なシーン記述の生成を目指す。
    • ユーザー調査の結果,シーン記述は不安軽減や行動可能性の向上に貢献する一方で,十分性や簡潔性にばらつきが見られた。
    • GPT-4oは潜在能力が高いにも関わらず,必ずしも参加者から一貫して好まれるものではなかった。
    • 本研究の知見に基づき,視覚障碍者・弱視者の好みを捉える自動評価指標の構築に向けたトレーニングデータを作成した。

    Link: https://arxiv.org/abs/2502.14883