arXiv雑要約
AI - 2026/02/05 公開
群進化エージェント:経験共有による自己改善の継続 [cs.AI]目的:自己改善エージェントの構造設計の自律的変更
- 人工知能の進化において,人間の介入を減らし,自律的な能力向上を目指す重要性
- 既存手法では,探索的多様性が孤立し,効率的な活用が難しいという課題
- 集団進化を通じて,探索的多様性を効果的に活用し,持続的な進歩を実現
- 群進化エージェントは,SWE-bench Verifiedで71.0%と,最先端の自己進化手法(56.7%)を大幅に上回る性能を示した。
- Polyglotにおいても88.3%の正答率で,既存手法(68.3%)や人間が設計したエージェントフレームワーク(52.0%)を凌駕した。
- 初期段階の探索的多様性を,長期的な進歩へと効率的に転換し,より堅牢な性能を発揮することが示された。
推論モデルにおける流動的な表現 [cs.AI]目的:推論における表現のメカニズム
- 複雑な問題解決において,言語モデルの能力向上は不可欠である。
- 推論言語モデルの優れた性能は認められるが,その内部メカニズムは未解明である。
- 抽象的な構造情報の表現が,推論性能にどのように影響するかを解明する。
- QwQ-32Bモデルにおいて,推論の過程で行動と概念の内部表現が徐々に改善されることが示された。
- モデルは,特定の行動名ではなく,構造に焦点を当てた抽象的な符号化を発達させる。
- 成功事例から洗練された表現を注入することで問題解決の精度が向上し,象徴的な表現による置き換えも有効であることが確認された。
線形注意における状態削減の鍵:ランクに基づく視点 [cs.LG]目的:線形注意モデルの状態削減手法
- Transformerモデルの計算効率化が重要であり,線形注意はその有望な手法の一つである。
- 線形注意モデルは潜在能力を十分に活用できておらず,状態が低ランクになる傾向がある。
- モデルのランクを削減し,計算効率とメモリ効率を向上させることを目指す。
- 訓練済み線形注意モデルの状態が低ランクであることが理論的に分析された。
- クエリノイズの増幅が検索エラーに影響を与える可能性があることが示唆された。
- 量子化・剪定により,性能劣化を最小限に抑えつつ状態サイズを削減する手法が提案された。
評価から設計へ:ポテンシャルエネルギー曲面の滑らかさ指標を用いた機械学習原子間ポテンシャルアーキテクチャの誘導 [cs.CL, cs.CL, cs.LG, cond-mat.mtrl-sci, cs.AI, physics.chem-ph]目的:機械学習原子間ポテンシャルアーキテクチャの設計における誘導
- 分子動力学シミュレーションの精度向上は,材料設計や物性予測において不可欠である。
- 従来の機械学習原子間ポテンシャルは,量子力学的なポテンシャルエネルギー曲面の滑らかさを再現できない場合がある。
- ポテンシャルエネルギー曲面の滑らかさ指標に基づき,より安定で物理的に妥当な原子間ポテンシャルを設計すること。
- 新しいベンチマークテストであるBond Smoothness Characterization Test (BSCT) は,従来の分子動力学シミュレーションよりも効率的にポテンシャルエネルギー曲面の非滑らかさを検出する。
- BSCTは分子動力学シミュレーションの安定性と強い相関を示し,Transformerベースのモデル設計にBSCTを適用することで,エネルギーと力の回帰誤差を低減しつつ,安定したシミュレーションと正確な物性予測を達成した。
- BSCTは,従来のベンチマークでは評価が難しい物理的な課題を特定し,機械学習原子間ポテンシャルの開発者への有用な設計指標となる。
データに潜む潜在的影響:対数線形性による一般的なメカニズム [cs.LG, cs.AI, cs.CL, stat.ML]目的:大規模言語モデルのデータセットがモデル特性に与える影響の理解
- 大規模言語モデルの性能向上がデータセットに大きく依存するため,その影響評価は重要である。
- データセットに含まれる個々のデータポイントからは直接観察できないシグナルがモデルに伝達される。
- データセットの隠れた影響がどのように生じるかの根本的なメカニズムを解明すること。
- 提案手法Logit-Linear-Selection (LLS)を用いて,特定の行動を引き出すデータセット部分集合の選択が可能になった。
- LLSを実世界データセットに適用した結果,モデルは特定の嗜好を示す,異なる言語で応答する,異なるペルソナを模倣するなどの行動を示した。
- この効果は,様々なアーキテクチャを持つモデルで持続し,その普遍性と一般性を裏付けている。
CRoSS:スケーラブルな強化学習のための継続的なロボットシミュレーションスイート:高タスク多様性と現実的な物理シミュレーション [cs.LG, cs.AI]目的:継続的なロボットシミュレーションのためのベンチマークスイート
- ロボット工学は,人間の生活を豊かにする可能性を秘めており,その自動化は重要な課題である。
- 従来の強化学習では,タスクごとに学習し直しが必要であり,継続学習が課題となる。
- 現実的なロボットシミュレーション環境で,継続学習の性能を評価するためのベンチマークを提供する。
- CRoSSは,Gazeboシミュレータ上で現実的にシミュレートされた2つのロボットプラットフォームを用いる。
- これにより,多様なタスク環境における継続的な強化学習の実験が可能となり,スケーラビリティと再現性を確保した。
- DQNやPolicy Gradientなどの標準的な強化学習アルゴリズムの性能を評価し,ベンチマークとしての有用性を示した。
マルチヘッド潜在MoEとヘッド並列:通信効率と決定性のあるMoE並列化 [cs.LG]目的:大規模言語モデルの効率的な学習手法
- 大規模言語モデルは多くの応用分野を変革したが,学習コストが高いという課題がある。
- 既存のMoE並列化手法は,通信コストや負荷分散に課題があり,性能を制限している。
- 活性化される専門家数に依存しない,通信効率と負荷分散に優れたMoE並列化を実現する。
- マルチヘッド潜在MoEとヘッド並列により,通信コストを定数に抑え,負荷を完全にバランスさせることが可能となった。
- IO認識ルーティングと専門家計算を組み合わせることで,学習速度を最大1.61倍に向上させた。
- 粒度を粗くすることで,全体的な性能が向上しつつ,1.11倍の高速化を実現した。
LLM強化学習におけるトラスト領域の再考 [cs.LG, cs.AI, cs.CL]目的:LLMの強化学習における方策更新の制約方法
- LLMの性能向上には,強化学習によるファインチューニングが不可欠である。
- 従来のPPOは,LLMの巨大な語彙量に対して,更新制約が不適切である。
- 方策のダイバージェンスを直接推定することで,より安定した学習を目指す。
- DPPOは,PPOのヒューリスティックなクリッピングを,ダイバージェンスに基づく制約に置き換える。
- バイナリ近似とTop-K近似により,メモリ使用量を抑えつつ,重要なダイバージェンスを捉える。
- 実験結果から,DPPOは既存手法よりも高い安定性と効率を実現することが示された。
モノのインターネットにおけるモデル適応性のためのコントラスト対照継続学習 [cs.RO, cs.LG, cs.AI]目的:モノのインターネット環境におけるモデル適応性
- IoTは社会インフラを支える重要な技術であり,その安定運用が求められる。
- 環境変化への対応が難しく,モデルの性能劣化やプライバシー保護が課題となる。
- 継続学習とコントラスト学習を組み合わせ,IoT特有の制約下での適応性を高める。
- コントラスト対照継続学習(CCL)のIoTへの応用を検討し,アルゴリズム設計とシステム現実を結びつけた。
- CCLの統一的な問題設定と目的関数を導出し,TinyMLや断続的な接続といったIoT固有の制約を考慮した参照アーキテクチャを提案した。
- 表形式およびストリーミングデータ,概念ドリフト,連合学習,省エネ学習などのIoT特有の課題を提示した。
多段階構造生成によるタンパク質自己回帰モデリング [cs.LG, cs.AI, q-bio.BM, q-bio.QM]目的:タンパク質バックボーン生成のための多段階自己回帰的枠組み
- タンパク質構造予測は,生命現象の解明や創薬において不可欠な課題である。
- 既存の自己回帰モデルは,学習時と生成時の不一致により性能が低下しやすい。
- 本研究は,多段階構造生成により自己回帰モデルの性能向上を目指す。
- 提案手法PARは,粗から細への予測を繰り返すことで,タンパク質構造を段階的に生成する。
- ノイズ付きコンテキスト学習やスケジュールドサンプリングにより,生成時のバイアスを軽減することに成功した。
- PARは,ファインチューニングなしで高品質なタンパク質バックボーンを生成し,優れた汎化性能を示す。
強化学習による注意機構の学習 [cs.CL, cs.CV, cs.LG]目的:大規模言語モデルにおける推論能力向上
- LLMの性能向上は,自然言語処理の重要な課題であり,様々な応用を可能にする。
- マルチモーダルLLMへの強化学習適用は,視覚情報の活用に課題があり,性能低下を招く場合がある。
- 内部の注意機構を直接最適化することで,マルチモーダル入力における情報配分を改善し,性能向上を目指す。
- RALは,出力トークンではなく内部の注意分布を最適化することで,GRPO等の既存手法を上回る性能を示す。
- On-Policy Attention Distillationは,潜在的な注意行動の転移により,標準的な知識蒸留よりも強力なクロスモーダルアライメントを実現する。
- 本研究は,マルチモーダルLLMのポストトレーニングにおいて,注意機構の最適化が有効なアプローチであることを示す。
化学物質-遺伝子関係抽出のためのChemProt-DrugProt統合 [cs.CL, cs.AI, cs.IR, q-bio.MN]目的:バイオメディカル文献からの化学物質-遺伝子関係抽出
- 創薬や疾患理解に不可欠であり,生物医学研究の進展に大きく貢献する。
- 既存のデータセット規模が小さく,モデルの精度向上が課題となっていた。
- データセット統合によるモデル性能向上と,グローバルな文脈の活用を目指す。
- ChemProtとDrugProtを統合したデータセットを作成し,モデル性能の向上を示した。
- BioBERTにGCNを組み込むことで,一部のCPRグループにおいて精度と再現率が向上した。
- データセットの統合は,両データセットで共有されるCPRグループにおいて特に有効であった。
パズルを解く:オフラインマルチエージェント強化学習のためのローカル・トゥ・グローバルな世界モデル [cs.AI, cs.GT, cs.LG]目的:オフラインマルチエージェント強化学習における協調的意思決定問題の解決
- マルチエージェントシステムは現実世界の複雑な問題を解決する上で重要であり,協調的な行動を学習する必要がある。
- 既存手法はデータ分布内に制約され,汎化性能が低く,データ範囲外の状況に対応できないという課題がある。
- 学習した世界モデルを用いてデータ拡張を行い,より汎化性能の高い方策を学習することを目指す。
- 提案手法では,推定が容易な局所予測を活用し,グローバルな状態遷移を推論するローカル・トゥ・グローバル(LOGO)世界モデルを提案した。
- 不確実性を考慮したサンプリング機構を導入することで,合成データの信頼性を高め,方策学習における近似誤差の伝播を抑制した。
- 8つのシナリオにおける実験結果から,提案手法が既存の最先端手法を凌駕し,汎化性能の高いオフラインマルチエージェント学習を実現できることが示された。
深層フォトニックニューロモルフィックネットワークにおけるオンライン非教師型ヘブ学習 [physics.optics, cond-mat.dis-nn, cs.ET, cs.LG]目的:深層フォトニックニューロモルフィックネットワークにおけるオンライン非教師型ヘブ学習の実現
- ニューラルネットワークは計算能力を向上させてきたが,従来のアーキテクチャには速度とエネルギー効率の限界がある。
- 既存のフォトニックニューロモルフィックネットワークは,デバイスレベルや教師あり学習に焦点を当てており,効率が低い。
- 本研究は,光領域のみで動作するヘブ学習規則を用いた,高効率な光コンピューティングの可能性を探求する。
- 完全に光学的で,中間的な電気・光・電気変換を必要としない,リアルタイム情報処理ソリューションを実現した。
- 市販の光ファイバープラットフォーム上で,非自明な文字認識タスクにおいて100%の認識率を達成した。
- 光コンピューティングが複雑なAIアプリケーションに適用される可能性を示した。
逆問題に対するMajorization-Minimizationネットワーク:脳波イメージングへの応用 [eess.SP, cs.LG]目的:逆問題に対する学習型Majorization-Minimizationフレームワーク
- 逆問題は,安定性と収束性を保証する必要があり,様々な分野で重要である。
- 深層学習等の手法は性能が高いが,最適化の制御が難しく,頑健性に課題がある。
- 安定した収束を保ちつつ,最適化の制御を可能とするフレームワークを開発する。
- 学習型Majorization-Minimizationフレームワークを提案し,古典的なMM降下法の保証を維持した。
- 脳波ソースイメージング実験において,既存手法と比較して精度,安定性,汎化性能が向上した。
- ヘッセ行列を明示的に形成せずに,効率的なスペクトル推定により局所的な曲率を上回る値を得た。
チューリング合成レーダーデータセット:パルス分離のためのデータセット [eess.SP, cs.LG]目的:レーダーパルス分離研究のベンチマークと新たな研究手法の促進
- 電子戦や信号インテリジェンスにおいて,複数の発信源からのレーダーパルス分離は不可欠である。
- 発信源が不明な複数のレーダーパルスが混在する場合,正確な分離が困難である。
- 現実的なシナリオに基づき,高度なモデル開発を可能にする包括的なデータセットを提供する。
- チューリング合成レーダーデータセットは,2つの受信構成で6000本のパルストレイン,約30億個のパルスを含む。
- 最大110個の発信源と,パラメータ空間の大きな重複を含む現実的なシナリオが特徴である。
- パルスを正しくクラスタリングし,V-measureなどの指標を最大化する「チューリング分離チャレンジ」も開催されている。
PPGを用いたフローマッチング状態空間モデルによる汎用的なバイタルサイン再構成 [eess.SP, cs.LG]目的:汎用的なバイタルサイン再構成
- 健康状態の継続的なモニタリングが重要視される中,非侵襲的かつ低コストなPPGの活用が求められている。
- PPG信号は,動きのアーチファクトやノイズの影響を受けやすく,正確なバイタルサイン推定が困難である。
- 多様なPPGデータに対応可能な,汎用性と高精度なバイタルサイン再構成手法の開発を目指す。
- 提案手法PENGUINは,PPGを条件付けすることで,複数のバイタルサインを連続波形として再構成する生成的フレームワークである。
- 6つの実世界のPPGデータセットを用いた実験で,PENGUINは既存手法と比較して一貫して優れた性能を示した。
- PENGUINは,PPGからのロバストなバイタルサイン再構成を実現する汎用的なフレームワークとして有効であることが示された。
農業分野におけるインド言語向け自動音声認識のベンチマーク [math.CO, cs.DM, eess.AS, cs.AI, cs.CL, cs.SD]目的:インドの農業分野における自動音声認識システムの性能評価基準
- インドの農業支援サービスのデジタル化が求められており,そのためには高精度な音声認識技術が不可欠である。
- インドの多様な言語に対応した農業分野特有の用語認識における性能評価が十分ではない。
- 農業分野における音声認識性能を客観的に評価し,改善のための指針を示す。
- ヒンディー語が最も高い認識精度(WER: 16.2%)を示し,オディア語が最も課題が多い(最良WER: 35.1%)という結果が得られた。
- 実環境の農業現場での録音特有の音質問題を特定し,話者分離技術の有効性を示した(最大66%のWER削減)。
- 農業用語における誤認識パターンを分析し,低リソース環境での音声認識システム改善のための提言を行った。
自己教師あり深層学習を用いた心電図からの妊娠中ストレス検出:開発と外部検証 [q-bio.QM, cs.LG]目的:妊娠中のストレスの客観的な評価
- 妊娠中の心理的ストレスは,早産や神経発達への悪影響と関連があり,母子の健康に重要な影響を与える。
- 現在のストレス評価は主観的な質問票に頼っており,継続的なモニタリングが困難である。
- 心電図データを用いて,客観的かつ継続的なストレス評価手法を確立することを目指す。
- 自己教師あり学習により,母体心電図において98.6%の精度,胎児心電図では99.8%という高い検出精度を達成した。
- 外部検証データセットにおいても,母体心電図で77.3%の精度,腹部心電図で63.6%の精度を示し,一定の有効性が確認された。
- 信号品質に基づくチャンネル選択が,全チャンネル平均よりも高い性能向上に繋がり,介入効果も有意に検出された。
有限混合モデルの超越的正則化:理論的保証と実践的限界 [stat.ML, cs.LG]目的:有限混合モデルの正則化手法
- 教師なし学習において広く利用され,データの背後にある構造を明らかにするために重要である。
- EMアルゴリズムによる最尤推定は,成分の崩壊により不安定になるという課題がある。
- 成分の崩壊を防ぎつつ,漸近効率を維持する正則化手法を提案し,安定した推定を目指す。
- 超越的正則化は,有限混合モデルの識別可能性,一貫性,ロバスト性に関する強力な理論的保証を提供する。
- 提案手法TAMDは,推定の安定化と崩壊の防止に成功するが,分類精度の大幅な向上には至らなかった。
- 高次元における教師なし学習の限界を示唆しており,現実的な制約を考慮した評価が重要である。
動画ハイライト検出のための二重経路オーディオエンコーダ [eess.AS, cs.AI, cs.CV, cs.MM, cs.SD]目的:動画ハイライトの自動検出
- 動画コンテンツの利用促進のため,重要な場面の自動抽出が不可欠である。
- 既存手法では,音声情報を十分に活用できていない場合が多い。
- 音響的な特徴量と意味的な特徴量を両立し,ハイライト検出性能の向上を目指す。
- 提案手法であるDAViHDは,意味経路と動的経路を持つ二重経路オーディオエンコーダを採用している。
- 動的経路は,周波数適応メカニズムにより時間変化する音響的特徴を捉え,過渡的な音響イベントを検出する。
- 大規模なMr.HiSumベンチマークにおいて,最先端の性能を達成した。
ポアソン勾配推定のガイド [stat.ML, cs.LG, q-bio.NC]目的:ポアソン分布潜在変数モデルにおける勾配推定手法の比較と改良
- 計算神経科学において,ポアソン分布潜在変数モデルは広く用いられており,その重要性は高い。
- 離散確率サンプルを通じた微分は難しく,EATシミュレーションとGumbel-SoftMax緩和法に課題が残されていた。
- EAT法の改良により,第一モーメントの不偏性を保証し,第二モーメントのバイアスを低減することを目指す。
- 改良されたEAT法は,分布の忠実度,勾配の質,および性能において,既存手法よりも優れた結果を示した。
- 特に,ハイパーパラメータ選択に対するロバスト性が向上し,実用的な利点があることが確認された。
- 本研究は,これらの手法間のトレードオフを明確にし,ポアソン潜在変数モデルを扱う研究者への具体的な推奨事項を提供する。
ビザンチン機械学習:MultiKrumとロバスト性の最適概念 [stat.ML, cs.AI, cs.LG, math.OC, math.ST, stat.TH]目的:分散学習における集約規則のロバスト性
- 分散学習は,プライバシー保護やデータ分散の利点から重要性が増している。
- 悪意のある参加者(ビザンチン障害)が存在する場合,集約規則のロバスト性が課題となる。
- MultiKrumのロバスト性を理論的に保証し,最適なロバスト性係数を定義すること。
- MultiKrumがロバストな集約規則であることの証明と,そのロバスト性係数の上限と下限を導出した。
- MultiKrumのロバスト性係数は,Krumよりも優れた性能を示すことが示された。
- ロバスト性の新たな指標であるκ^\starが,従来の指標よりも厳密な評価を可能にする。
残差等方性潜在フローによる全原子GPCR-リガンドシミュレーション [q-bio.QM, cs.AI, cs.LG]目的:GPCR-リガンド複合体の全原子シミュレーションの効率化
- GPCRは承認された治療薬の3分の1以上の標的であり,創薬において重要な役割を担う。
- 従来の全原子分子動力学シミュレーションは計算コストが高く,長時間のシミュレーションが困難である。
- 潜在空間における効率的な軌道サンプリングにより,計算コストを削減し,より長時間のシミュレーションを実現する。
- GPCRLMDは,物理情報制約を用いて幾何学的トポロジーを保存する正規化された等方性潜在空間へ複合体をマッピングする。
- 残差メカニズムにより,静的なトポロジーと動的な変動を効果的に分離し,時間的ダイナミクスを捉えている。
- 熱力学的観測値や重要なリガンド-受容体相互作用を忠実に再現し,最先端の性能を達成している。
第一原理AIによる分数量子ホール液体における結晶化の発見 [cond-mat.mes-hall, cond-mat.str-el, cs.AI]目的:分数量子ホール液体における結晶化の条件
- 量子物質の研究において,強相関系の理解は物性物理学の根幹をなす。
- 分数量子ホール効果の液体状態と結晶状態を統一的に扱える理論的枠組みが課題。
- 強Landau準位混合下における液体と結晶の相転移をAIを用いて解明する。
- 第一原理AIモデルMagNetは,分数量子ホール状態と電子結晶状態を同じ構造で記述可能。
- MagNetは,微視的ハミルトニアンのエネルギー最小化のみで,様々な量子状態を発見した。
- この結果は,強相関多体系問題に対する第一原理AIの有効性を示す。
次数不均一な高次ネットワークにおけるパラメータ推定のプライバシーと有用性のトレードオフ [stat.ML, cs.CR, cs.LG, cs.SI, math.ST, stat.TH]目的:次数不均一な高次ネットワークにおけるパラメータ推定のプライバシーと有用性のトレードオフ
- 関係データを含む機密性の高い応用において,個々のリンクに関する情報の保護は重要である。
- ネットワークのノードの次数のみを集約したデータに対するプライバシー保護手法の理論的限界が不明確である。
- βモデルにおけるパラメータ推定のプライバシーと有用性の間の最適なトレードオフを明らかにすることを目的とする。
- βモデルにおいて,局所および集中プライバシー制約下における最小最大最適パラメータ推定の限界が示された。
- 提案された推定器は,定数および対数項を除いてこれらの限界を達成することが確認された。
- 古典的なグラフおよび高次ハイパーグラフモデルの両方について,プライバシーと有用性のトレードオフの包括的な有限サンプル特性評価を提示した。
多種多様な相互作用粒子系の学習 [stat.ML, cs.LG, stat.CO, stat.ME]目的:異種相互作用粒子系におけるネットワーク構造,多種相互作用カーネル,潜在的タイプ割り当ての同時推論
- 複雑なシステム理解に不可欠であり,自然科学や社会科学への応用が期待される。
- 異種データからのシステム構造の特定は難しく,既存手法では精度が十分でない。
- 複数のデータから相互作用のタイプとネットワーク構造を正確に推定すること。
- 提案手法は,低ランク埋め込みとクラスタリングにより,システムパラメータと相互作用タイプを効率的に復元する。
- 理論的保証として,推定誤差の上限と相互作用タイプの正確な復元条件が示された。
- 合成データ実験により,提案手法がノイズに強く,基礎となるダイナミクスを正確に再構築できることが示された。
ループ型ブール回路における推論プローブに関する統計的保証 [stat.ML, cs.LG, cs.NE, math.MG, math.ST, stat.TH]目的:ループ型推論の様式化モデルにおける推論プローブの統計的挙動
- AIの発展において,複雑な推論能力の評価は重要である。その評価手法の信頼性が求められている。
- 推論プローブは部分的な観測しかできないため,汎化性能の理論的な保証が課題となっていた。
- 部分観測下における推論の統計的効率を構造的特性に基づいて明確化することを目指す。
- 推論プローブがグラフ畳み込みネットワーク(GCN)でパラメータ化された場合,クエリノード数Nに対して最悪の場合の汎化誤差が最適なレート$\mathcal{O}(\sqrt{\log(2/\delta)}/\sqrt{N})$を達成する。
- この最適なレートはグラフのサイズに依存せず,誘導されたグラフメトリックの低歪み一次元スノーフレーク埋め込みの存在により実現可能である。
- 計算グラフの構造的特性が,部分的なアクセス下での推論の統計的効率を支配する様を鮮明に特徴づけることができた。
固定予算は,対数項まで考慮すれば,固定信頼度における最良腕識別よりも難しいとは言えない [stat.ML, cs.AI, cs.LG]目的:最良腕識別問題における固定予算設定と固定信頼度設定の難易度比較
- 機械学習において,限られた試行回数で最適な選択肢を特定することは重要である。
- 固定予算設定と固定信頼度設定では,サンプル複雑度の最適値が対数項の範囲で一致する。
- 固定予算設定が固定信頼度設定よりも難しいか否かを明らかにし,より効率的なアルゴリズムを開発する。
- 本研究では,固定予算設定は対数項まで考慮すれば,固定信頼度設定よりも難しいとは言えないことを示す。
- 固定信頼度アルゴリズムを固定予算アルゴリズムに変換するメタアルゴリズムFC2FBを提案し,そのサンプル複雑度が元のアルゴリズムと同程度であることを証明した。
- FC2FBと既存の固定信頼度アルゴリズムを組み合わせることで,いくつかの固定予算問題におけるサンプル複雑度を改善できる。
関数的確率的局所化 [math.PR, cs.DS, cs.LG, math.ST, stat.ML, stat.TH]目的:高次元幾何学とサンプリングアルゴリズム設計における確率的局所化の一般化
- 高次元幾何学や最適化アルゴリズムにおいて,効率的なサンプリング手法の確立が重要である。
- 既存の局所化手法では,非ユークリッド幾何学への適用や,より複雑な最適化問題への対応が課題となっていた。
- 本研究では,より広範な幾何学と最適化問題に対応可能な,関数的確率的局所化の枠組みを提案する。
- 提案手法は,対数ラプラス変換を用いた新しい正則化項を導入することで,ガウス正則化の制約を克服する。
- 提案手法によって誘導されるマルコフ連鎖の混合時間は,関数的ポアンカレ不等式を満たす場合に保証される。
- この枠組みを,微分プライバシーを考慮した凸最適化問題($\ell_p$ノルム,p∈[1, 2))に適用し,既存のクエリ複雑性を改善した。
無線通信とセンシングのためのマルチモーダル基盤モデル [eess.SP, cs.LG]目的:無線物理層システムの転移可能な物理法則に基づいた表現学習
- 次世代の無線通信とセンシングにおいて,人工知能は不可欠な要素である。
- 既存の学習ベースの手法は,タスクや環境に依存し,汎化性能が低いという課題がある。
- 異なるモダリティ間で物理的な対応関係を捉え,多様なタスクへの適応を可能とする。
- 提案手法は,大規模 MIMO 最適化,無線チャネル推定,デバイス位置特定などのタスクにおいて,高い汎化性能を示した。
- 展開環境の変化に対するロバスト性も確認され,タスク固有のベースラインと比較して,必要なデータ量を削減できることが示された。
- 物理誘導型自己教師あり学習戦略により,電磁波伝搬に基づく物理的な対応関係を捉えている点が特徴である。
固相合成予測のための機械学習モデルの熱力学的評価 [math.RA, cs.DM, cond-mat.mtrl-sci, cs.LG]目的:固相合成予測モデルの熱力学との整合性評価
- 材料開発において,計算による探索が効率化されており,機械学習の活用が期待されている。
- 既存の機械学習モデルは,合成成功例のみで学習しているため,合成困難な材料の予測精度が課題である。
- 熱力学的な指標を用いて機械学習モデルの予測精度を評価し,改善の方向性を示す。
- 既存の合成予測モデルは,合成可能性を過大評価する傾向があることが示された。
- 一部のモデルスコアは,熱力学的なヒューリスティックと一致しており,不安定な材料に対して低いスコアを割り当てる傾向がある。
- 本研究は,材料合成のための機械学習モデルの課題を明らかにし,評価手法を提案する。
最適木とグローバルパラメータ融合による効率的なサブグループ分析 [stat.ML, cs.LG]目的:サブグループ分析における最適な分割同定
- 個別化医療において,治療効果の差を特定し,統計的推論を行うことは重要である。
- 既存手法は,貪欲法による不最適な分割や,サンプルサイズ不足時の過学習といった問題がある。
- 混合整数最適化を用いて,グローバルに最適な分割と情報共有を実現し,サブグループ分析の精度向上を目指す。
- 提案手法は,理論的に標本外リスクの上限を保証し,古典的な木構造ベースの手法と比較して優位性を示す。
- シミュレーション実験において,提案手法は既存の代表的な手法と比較して,一貫して高い性能を発揮する。
- 実際の健康と加齢に関する脳研究データセットのケーススタディにおいて,臨床的に意味のある知見が得られた。
パイロット制限型MIMOチャネルの構造情報に基づいたテンソル分解による推定 [eess.SP, cs.AI]目的:パイロット制限型MIMOチャネルの推定
- 次世代通信(5G/6G)では,大容量・高速化のためにMIMO技術が不可欠である。チャネル推定の精度が通信品質を大きく左右する。
- 広い帯域幅と多数のアンテナ要素を持つMIMOシステムでは,パイロット信号のオーバーヘッドが課題となる。特に,パイロット信号の数が限られている場合,正確なチャネル推定が困難。
- 少ないパイロット信号から高精度なチャネル推定を実現し,次世代通信システムの性能向上に貢献する。
- 本研究では,テンソル分解とニューラルネットワークを組み合わせたハイブリッドアーキテクチャを提案し,低ランクテンソル補完によるパイロット制限型チャネル推定を実現。
- 提案手法は,従来のテンソル法よりも低いパイロット密度で,LSやOMPなどの既存手法と比較して10-20dBのNMSE改善を達成。
- 特に,実際の無線伝搬環境を考慮したDeepMIMOチャネル評価において,純粋なテンソル法よりも24-44%のNMSE削減効果が確認された。
夢の計算論的解釈:学習と記憶の固定化 [physics.soc-ph, cs.SI, q-bio.NC, cs.AI, cs.ET]目的:夢の学習・記憶固定化における機能
- 夢は知的能力に影響する可能性があり,そのメカニズム解明は重要である。
- 夢はランダムな信号に過ぎないという考え方が,機能の否定につながっていた。
- ランダム信号が学習や記憶固定化に寄与する可能性を示すモデルを構築する。
- 本研究では,学習と記憶固定化の機能を果たす夢の認知・計算モデルを提示した。
- シミュレーションの結果,ランダムな信号が学習と記憶固定化をもたらすことが示された。
- 夢は,海馬からの自発的・ランダムな信号を処理する覚醒時の脳活動の継続であると考えられる。
線形および滑らかな文脈バンディットに対する耐攻撃性のある均一な公平性 [stat.ML, cs.LG, stat.ME]目的:文脈バンディットにおける均一な$(1-\delta)$-公平性の実現
- デジタルプラットフォームなどでは文脈バンディットが利用される場面が増加しており,その公平性は重要である。
- 従来の文脈バンディットは,公平性の面で操作を受けやすく,プラットフォームの持続可能性が損なわれる可能性がある。
- 本研究では,戦略的な操作に対する脆弱性を解消し,公平性と効率性を両立するアルゴリズムを開発する。
- 提案アルゴリズムは,線形および滑らかな報酬関数に対して,ほぼミニマックス最適に近い後悔値と強固な公平性を実現する。
- 公平性に基づく評価の操作に対する耐性を高めるため,腐敗適応探索と誤差補償閾値処理を取り入れたロバストな変種を設計した。
- 数値実験および実証事例により,提案手法が公平性と効率性を維持することが示された。
最大最小相対改善:公平な学習を交渉問題として [stat.ML, cs.GT, cs.LG]目的:複数サブグループにわたる予測器の公平性確保
- 社会の多様性を考慮した,公平な機械学習の重要性が高まっている。
- 従来の公平性指標は,グループ間の予測可能性の差を考慮していない。
- グループ間の規模や予測可能性の差に依存しない公平性の指標を提案する。
- 本研究では,公平性をサブグループ間の交渉問題として捉え,相対改善という新たな指標を提案した。
- 相対改善は,既存のロバスト最適化手法を包含し,Kalai-Smorodinsky解を回復することが示された。
- 提案手法は,絶対的な規模に依存せず,個々のグループの予測性能向上を考慮する点で優れている。
事前学習モデルの規模拡大に伴う証明可能なターゲットサンプル複雑度の改善 [cond-mat.stat-mech, cs.ET, math.OC, cs.SY, eess.SY, q-fin.PM, stat.ML, cs.LG]目的:事前学習モデルの規模拡大によるダウンストリームタスクのサンプル複雑度の改善
- 近年の機械学習では,多様なタスクで事前学習モデルが不可欠となっている。
- 事前学習モデルの有効性は経験的に示されているが,理論的な説明が不足している。
- 事前学習モデルの規模拡大がサンプル複雑度をどのように改善するかを理論的に解明する。
- 本研究では,パラメータ効率的なファインチューニングに触発された「コーキング」という新しいフレームワークを導入した。
- この分析により,改善された事前学習モデルがダウンストリームタスクのサンプル複雑度を理論的に減少させることが示された。
- これにより,事前学習モデルの規模とダウンストリーム性能の関係に関する経験則に理論的根拠が与えられた。
生理学的情報を活用した自己教師あり学習によるPPGからの大動脈弁膜症検出 [eess.SP, cs.LG]目的:大動脈狭窄症および大動脈逆流症の効率的なスクリーニング
- 心血管疾患は主要な死亡原因であり,早期発見と介入が重要である。
- 大動脈弁膜症の診断は通常,専門的な知識と高コストな心エコー検査に依存する。
- ラベル付きPPGデータの不足を克服し,低コストな大規模スクリーニングを実現する。
- 生理学的情報を活用した自己教師あり学習(PG-SSL)フレームワークを提案し,大規模なラベルなしPPGデータを活用した。
- PG-SSLは,大動脈狭窄症および大動脈逆流症のスクリーニングにおいて,AUC値がそれぞれ0.765,0.776という優れた性能を示した。
- 本研究は,医療AIにおけるラベル不足という課題に対する有効な解決策となり,低コストな大規模スクリーニングの可能性を示す。
ブレス-ワッサースタイン重要度重み付きエビデンス下限:解説と応用 [stat.CO, cs.LG, stat.ME]目的:変分推論のための目的関数の最適化
- ベイズ推論は不確定性の定量化に重要であり,複雑なモデルへの適用が求められている。
- 標準的な変分下限(ELBO)はタイトな近似を与えない場合があり,モード探索に陥りやすい。
- 重要度重み付きエビデンス下限(IW-ELBO)の最適化をブレス-ワッサースタイン空間で行うことで,勾配推定の安定性を向上させる。
- ブレス-ワッサースタイン空間でのIW-ELBOのWasserstein勾配を導出し,実用的なアルゴリズムを開発した。
- 提案手法は,サンプル数が増加しても勾配推定量のSNRが$\Omega(\sqrt{K})$としてスケーリングすることを示し,効率的な最適化を保証する。
- 実験の結果,提案手法は他のベースラインと比較して優れた近似性能を達成した。
クロスドメイン音声認識・音響強調のための汎用的なロバストな音声適応 [eess.AS, cs.CL, cs.LG, cs.SD]目的:クロスドメインにおける音声認識と音響強調の性能劣化軽減
- 音声認識や音響強調は,様々なアプリケーションにおいて重要であり,その性能向上が求められている。
- 既存モデルは,未知のノイズやチャンネル特性に遭遇すると,性能が著しく低下するという課題がある。
- ノイズとチャンネル条件の不一致による性能劣化を軽減し,汎化性能を高めることを目指す。
- 提案手法URSA-GANは,ノイズとチャンネルのエンコーダを用いた二重埋め込み構造により,ドメイン固有の特徴を捉える。
- URSA-GANは,GANベースの音声生成器を条件付け,音声の内容を保持しつつ,ターゲットドメインに音響的に整合した音声を合成する。
- 動的確率的摂動により,生成時の埋め込みに制御された変動を導入し,未知のドメインへのロバスト性を向上させている。
幾何構造を考慮した最適輸送:高速な内在次元とWasserstein距離推定 [stat.ML, cs.LG]目的:大規模最適輸送におけるサンプリング誤差と内在次元の推定手法
- 機械学習において,大規模最適輸送は重要な役割を担うが,計算コストが課題となる。
- 離散化による近似では,サンプリング誤差が収束速度を律するボトルネックとなっている。
- 内在次元とサンプリング誤差を効率的に推定し,離散化誤差を軽減することを目的とする。
- 提案手法は,半二重最適輸送関数を利用し,オプティマル輸送ソルバーを必要としないサンプリング誤差推定器を提供する。
- サンプリング誤差推定器の多重スケール減衰から,高速な内在次元推定器を導出することができた。
- 実験結果から,提案手法が離散化誤差のボトルネックを効果的に軽減し,計算効率を維持することが示された。
教育推薦システムにおけるバンディットアプローチ:学習者のスキル向上を最適化する文脈的トムソンサンプリング [stat.ML, cs.LG]目的:学習者のスキル向上を目的とした,教育用演習の個別最適化手法
- 近年,OR・MS・Analytics等の教育現場でデジタル化が進み,多様な学習者に対応した個別最適化が重要である。
- 大規模な学習者群に対して,個々のニーズに合わせた演習を提供することは困難であった。
- 学習者の理解度向上に最も効果的な演習を,過去のパフォーマンス情報に基づいて選択する手法を提案する。
- 提案手法は,学習者のスキル向上に関連する演習を推奨し,学習者間の差異に適応することが示された。
- 本手法は,大規模な個別最適化を可能にし,学習効果の高い演習を特定する上で有用である。
- 教員は,追加支援が必要な学習者を発見するための情報も得られる。
いつでも有効な共形リスク制御 [stat.ML, cs.LG]目的:予測タスクにおける不確実性の定量化
- 予測モデルの信頼性確保は,安全性や意思決定の質に不可欠である。
- 従来の共形予測では,キャリブレーションデータセットサイズが固定されており,時間経過に伴う有効性の保証が困難であった。
- 累積的に増加するキャリブレーションデータセットに対する,確率的有効性の保証を実現する。
- 提案手法は,quantileに基づく議論を用いて,任意の時点において高い確率で有効な誤差制御を保証する。
- 分布シフトが発生する環境下での適用可能性が示され,理論的な限界との一致性も証明された。
- シミュレーションと実データによる数値実験により,提案手法の実用的な性能が確認された。
パフォーマンス学習理論 [stat.ML, cs.AI, cs.CY, cs.LG, math.ST, stat.TH]目的:予測が予測対象に影響を与える状況下におけるモデルの一般化性能
- 予測が結果に影響を及ぼすという現象は,社会科学や経済学において重要な課題である。
- 予測が現実を変化させる場合,既存の学習理論では一般化性能を正確に評価できない。
- 予測による影響を考慮した一般化誤差の理論的限界を導出し,予測の改善策を提示すること。
- 予測がデータに与える影響が大きいほど,そこから学習できる情報は減少するというトレードオフが明らかになった。
- 予測によって歪められたデータを用いて再学習することで,一般化性能を向上させられる可能性があることが示された。
- ドイツの失業者への職業訓練割り当てに関する実証研究により,理論的結果の妥当性が確認された。
ペロブスカイトの拡張X線回折データを用いた機械学習による結晶系予測 [cond-mat.mtrl-sci, cs.LG]目的:ペロブスカイト材料の結晶系,点群,空間群の分類
- 材料科学において,結晶構造の同定は材料特性の理解と最適化に不可欠である。
- X線回折データからの結晶系予測は専門知識を要し,時間と労力を要する。
- 機械学習を用いてX線回折データからの結晶系予測を効率化し,材料探索を加速する。
- Time Series ForestモデルとSMOTE拡張を組み合わせることで,結晶系予測において高い性能(MCC=0.9, F1=0.92, Accuracy=97.76%)を達成した。
- 点群および空間群の予測においても,95%を超えるバランスの取れた精度が得られた。
- 特に立方晶系,点群3mとm-3m,空間群PnmaとPnnnといった対称性の異なるクラスに対して高い性能を示した。
クラスタ中心への旅:ネットワーク干渉下におけるA/Bテストのための内部ノードの活用 [stat.ME, cs.LG]目的:ネットワーク干渉下でのA/Bテストにおける内部ノードの活用
- プラットフォームでのA/Bテストは重要だが,ネットワーク効果により結果が歪められる可能性がある。
- 既存手法では,バイアス低減のためにデータトリミングを行うが,分散が大きくなるという課題がある。
- 本研究では,内部ノードに着目し,分散を削減しつつバイアスを修正する手法を提案する。
- 内部ノードは,トリミング後のサブポピュレーションの大部分を占めることが示された。
- 内部ノードの平均に基づくMII推定量は,既存手法よりも分散が小さく,効率的であることが確認された。
- カウンターファクチュアル予測を用いた拡張MII推定量は,共変量の分布シフトを補正し,バイアスを低減する。
不確か性考慮型逆問題のためのベイジアンPINN (BPINN-IP) [stat.ML, cs.LG]目的:不確か性に対応した逆問題を解くための階層型ベイジアンPINNの構築
- 逆問題は,画像復元など幅広い分野で重要であり,その解決は高度な技術を要する。
- 従来のPINNでは,出力や重みの事前知識を組み込むことが難しく,不確か性の評価も困難であった。
- 本研究は,事前知識と不確か性の定量化を可能にするPINNの拡張を目指す。
- 提案手法BPINN-IPは,ニューラルネットワークの出力と重みに関する事前知識を考慮できる。
- 事後確率分布を利用することで,再構成画像の予測値と分散に基づいた不確か性の定量化が可能となる。
- デコンボリューションや超解像への応用例を通して,実装手順と予備的な結果が示されている。
一般化されたスパイクテンソルモデルの普遍性 [math.ST, cs.LG, math.PR, stat.ML, stat.TH]目的:高次元領域におけるランク1スパイクテンソルモデルの解析
- テンソルモデルは機械学習や統計物理など,多様な分野で重要な役割を担う
- 従来のテンソルモデルはガウス分布を仮定している場合が多く,より広範なノイズ分布への対応が課題であった
- 非ガウス性ノイズ下においても普遍的な高次元スペクトル挙動を明らかにすること
- テンソル縮約の経験的スペクトル分布が,ガウス分布の場合と一致する決定論的限界にほぼ確実に収束することが示された
- 固有値および推定されたスパイク方向と真のスパイク方向のアライメントが,ガウスノイズ下での結果と同一の明示的な特徴を持つことが明らかになった
- これにより,スパイクテンソルモデルの普遍性が確立され,高次元スペクトル挙動が非ガウス性ノイズに対してロバストであることが示された
神経活動のメカニズムモデルの発見:in silicoゼブラフィッシュを用いたシステム同定 [q-bio.NC, cs.AI, cs.LG]目的:神経回路のメカニズムモデル構築
- 脳科学の根幹であり,神経系の機能解明に不可欠である。
- モデル検証が困難であり,真のメカニズムの特定が課題である。
- in silico環境でモデル発見の精度向上を目指す。
- LLMベースの探索によって,予測性能が既存手法を上回るモデルが自律的に発見された。
- 感覚刺激は必要だが,統計的な近道に頼るモデルも存在することが示された。
- 構造的制約が,汎化性能と解釈可能なモデルの回復に重要であることがわかった。
