arXiv雑要約
AI - 2026/02/04 公開
EverMemBench:大規模言語モデルにおける長期インタラクティブメモリのベンチマーク [cs.CL, cs.AI]目的:大規模言語モデルにおける長期的な会話メモリの性能評価
- 対話型AIの進化には,長期間にわたる情報保持と活用が不可欠である。
- 既存のベンチマークは現実世界の複雑さを捉えきれておらず,性能評価に限界がある。
- 現実的な対話状況下でのメモリシステムの限界を明らかにし,改善の方向性を示す。
- EverMemBenchは,複数参加者,複数トピック,時間的変化を含む大規模な会話データセットである。
- 複数段階の推論は,複数参加者の設定で大幅に低下し,最適なモデルでも26%の精度にとどまる。
- 時間推論にはタイムスタンプだけでなく,文脈的な意味理解が不可欠であることが示された。
非構造化テキストにおける集約クエリ:ベンチマークとエージェント的手法 [cs.AI]目的:非構造化テキストに対する集約クエリの解決
- テキストデータから情報を抽出する重要性が高まっており,集約クエリへの対応が求められている。
- 既存の手法では,網羅的な証拠収集が難しく,完全性を保証できない。
- 厳格な完全性を要する集約クエリの評価と解決を目指す。
- AGGBenchという,完全性重視の集約クエリ評価用ベンチマークを新たに提案した。
- DFA(Disambiguation-Filtering-Aggregation)という,解釈可能な段階に集約クエリを分解するエージェントベースラインを提案した。
- DFAは,強力なRAGや既存のエージェントベースラインよりも,集約証拠の網羅性を一貫して向上させた。
プラグマからパートナーへ:エージェントによる高水準合成の共生的進化 [cs.CL, cs.AI]目的:エージェントを活用したハードウェア設計における高水準合成の役割
- AI技術の発展に伴い,ハードウェア設計の自動化が重要視されている。
- 既存の高水準合成ツールは,性能フィードバックの不足やデバッグの困難さといった課題がある。
- エージェントによる最適化を通じて,高水準合成の限界を克服し,自動設計を促進する。
- 大規模言語モデルの台頭により,AI主導のハードウェア設計への関心が高まっている。
- 高水準合成は,高速な反復サイクルと移植性を提供し,エージェントによる最適化に適した層となる。
- エージェントの役割は,設計の共同作業者から自律的な設計パートナーへと進化する。
スペクトルテキスト融合:周波数認識型マルチモーダル時系列予測 [cs.LG, cs.AI]目的:マルチモーダル時系列予測におけるテキスト情報の効果的な統合
- 現実世界の意思決定において,数値データと文脈的シグナル両方が重要であるため。
- 既存手法はテキスト特徴量と時系列パターンを逐次的に対応付けるため,長期的な文脈を捉えられない。
- スペクトル分解により時系列の周波数成分を分析し,文脈と時系列のミスマッチを解消する。
- 提案手法SpecTFは,テキスト埋め込みを周波数領域に投影し,軽量なクロスアテンション機構で時系列のスペクトル成分と融合する。
- テキストの関連性に基づいて周波数帯域を適応的に重み付けすることで,予測精度を向上させる。
- 多様なマルチモーダル時系列データセットにおいて,最先端モデルを凌駕する性能を示した。
検証可能な報酬を持つオンライン強化学習における適応的なロールアウト配分 [cs.CL, cs.LG, cs.AI, cs.CL]目的:検証可能な報酬を持つオンライン強化学習におけるロールアウト配分戦略
- 強化学習は,複雑な意思決定問題への応用が期待され,様々な分野で注目されている。
- ロールアウト数の制約下での学習効率が課題であり,計算資源の有効活用が求められている。
- 提示されたプロンプトごとの情報量を考慮し,ロールアウト配分を最適化することで学習効率を向上させる。
- 提案手法VIPは,各プロンプトの勾配分散を予測し,ロールアウト数を最適に配分することで,サンプリング効率を改善する。
- VIPは,軽量なガウス過程モデルを用いてプロンプトの成功確率を予測し,その予測値を最適化問題に組み込む。
- 複数のベンチマークにおいて,既存手法と比較して,VIPは一貫して高い性能を示すことが確認された。
時系列異常検知のための符号帳ベースオンライン適応型多スケール埋め込み (COMET) [cs.LG]目的:時系列異常検知のための手法
- 産業界の様々な分野において,時系列データの異常検知は重要な課題である。
- パッチレベルの表現学習において,時間的依存性や多変量相関の捉えが不十分である。
- 異なる時間範囲での異常検知を可能にし,分布シフトへの脆弱性を軽減することを目指す。
- COMETは,多スケールパッチエンコーディング,ベクトル量子化コアセット,オンライン符号帳適応の3つの要素で構成される。
- 実験の結果,COMETは45の評価指標中36で最高性能を達成し,多様な環境での有効性が確認された。
- この手法は,符号帳と量化誤差,メモリ距離を組み合わせた二重スコアにより異常を検知する。
RGB-D送電線欠陥検出のためのクロスモーダルアライメントと融合 [cs.CV, cs.AI]目的:送電線欠陥の検出性能向上
- 送電線は社会インフラであり,安定稼働維持は重要である。目視検査の自動化が求められている。
- 小型欠陥,複雑な背景,照度変化により,自動検査は困難である。RGB画像だけでは識別が難しい場合がある。
- RGB画像と深度情報を統合することで,識別性能を向上させることを目指す。
- 提案手法CMAFNetは,RGB画像と深度情報を効果的に融合し,TLRGBDベンチマークにおいて高い検出精度を達成した。
- 特に,小型欠陥の検出において,既存手法を大幅に上回る性能を示した(mAP@50:32.2%)。
- 軽量バージョンは,低計算コストで高い処理速度(228 FPS)を実現し,YOLOベースの手法を上回る性能を示した。
マルコフ連鎖の視点を通じたGFlowNetsにおける探索と利用の制御 [cs.CL, cs.AI, cs.LG]目的:GFlowNetsにおける探索と利用の制御
- 生成モデルの性能向上は,多様性と品質のバランスが重要であるため。
- GFlowNetsは探索と利用のバランスが固定されており,柔軟性に欠ける。
- マルコフ連鎖の理論に基づき,GFlowNetsの探索と利用を調整する。
- GFlowNetsとマルコフ連鎖の等価性を明らかにし,探索と利用の制約の原因を特定した。
- 調整可能なパラメータαを導入したα-GFNsを提案し,探索と利用の動的制御を実現した。
- 様々なベンチマークにおいて,α-GFNsは既存のGFlowNetsよりも優れたモード発見能力を示した。
MGKAN:多ModalグラフKolmogorov-Arnoldネットワークによる非対称な薬剤-薬剤相互作用の予測 [cs.LG, q-bio.QM]目的:非対称な薬剤-薬剤相互作用予測のための手法
- 安全な薬物治療には,薬剤間の相互作用予測が不可欠である。
- 既存手法は線形集約に依存し,非線形で不均質なパターンを捉えきれない。
- 非対称な相互作用を捉え,予測精度を向上させることを目指す。
- MGKANは,従来のMLP変換をKAN駆動の基底関数に置き換えることで,より表現力豊かな非線形モデリングを実現した。
- 3つのネットワーク(非対称DDI,共相互作用,生化学的類似性)を統合し,方向性情報を保持した。
- 2つのベンチマークデータセットで,7つの最先端手法を上回る性能を示した。
Zero2Text:テキスト埋め込みに対するゼロトレーニングのクロスドメイン反転攻撃 [cs.CL, cs.LG]目的:テキスト埋め込みからの情報漏洩リスク
- 検索拡張生成(RAG)の普及により,ベクトルデータベースが不可欠なインフラとなっている。
- 既存の手法は,計算コストが高いか,ドメイン外のデータに適用できないという課題があった。
- 厳密なブラックボックス環境やクロスドメイン環境下での情報漏洩を防ぐことを目指す。
- Zero2Textは,再帰的なオンラインアライメントに基づき,トレーニングデータなしで攻撃を実現する。
- LLMの事前知識と動的なリッジ回帰機構を組み合わせることで,ターゲット埋め込みへの動的な適応を可能にする。
- MS MARCOベンチマークにおいて,OpenAIモデルに対して,既存手法を大幅に上回る性能を達成した。
IRIS:暗黙的報酬誘導内部選別によるマルチモーダルハルシネーションの軽減 [cs.LG, cs.AI]目的:マルチモーダルハルシネーション軽減のメカニズム
- マルチモーダル大規模言語モデルの性能向上は,多様な応用を可能にする上で重要である。
- マルチモーダル大規模言語モデルはハルシネーションを起こしやすく,その評価と改善が課題となっている。
- 内部状態に基づき,モーダル間の競合を解決する効率的なハルシネーション軽減手法を提案する。
- IRISは,内部の対数確率空間で連続的な暗黙的報酬を利用し,情報損失を最小限に抑えながらモーダル間の競合を捉える。
- 自己生成されたペアを暗黙的報酬に基づいて選別することで,最適化を直接的にモーダル競合の解決に導く。
- わずか5.7kサンプルで,外部フィードバックなしに主要なハルシネーションベンチマークで高い性能を達成した。
文曲線言語モデル [cs.RO, cs.CL, cs.LG]目的:文の構造を考慮した言語モデルの提案
- 近年のAIシステムにおいて,言語モデルは中心的な役割を担っており,その性能向上が不可欠である。
- 従来の言語モデルは,単語埋め込みが固定されており,文全体の構造を捉えきれていないという課題がある。
- 文全体の構造を考慮した表現を用いることで,より高品質な言語モデルを実現することを試みる。
- 文曲線と呼ばれる連続的な文表現を導入し,文全体の構造を捉えることを可能にした。
- 提案手法は,IWSLT14とWMT14のデータセットで,既存の拡散言語モデルを上回る性能を達成した。
- 知識蒸留を必要とせず,安定した学習が可能であり,LM1Bにおいても有望な結果を示した。
低密度筋電図からのロバストなジェスチャー認識のためのTime2Vec Transformer [cs.LG, cs.AI, eess.SP]目的:低密度表面筋電図(sEMG)を用いた,正確かつロバストなジェスチャー認識手法の開発
- 筋電義肢の制御は,高精度が求められるが,高価な多チャンネルアレイが必要となることが課題。
- 従来の筋電義肢制御は,センサー数が多いとコストが高くなり,普及の妨げとなる。
- 本研究は,少ないセンサー数でも高精度な制御を実現する深層学習フレームワークを提案する。
- 提案手法は,10種類のジェスチャー認識において,最先端のF1スコア95.7%±0.20%を達成した。
- 固定位置エンコーディングのTransformerや,CNN-LSTMモデルと比較して,統計的に有意に優れた性能を示した。
- 2回の試行による迅速なキャリブレーションで,未知の被験者に対する性能を大幅に改善できることを示した。
GRAB:LLMに触発されたシーケンス優先のクリック率予測モデリングパラダイム [cs.IR, cs.AI]目的:クリック率予測のための生成的なランキング手法
- 広告におけるレコメンデーションは,収益に直結する重要な課題である。
- 従来の深層学習モデルは,計算効率や汎化性能に課題が残る。
- 長期間の行動シーケンスを効果的にモデル化し,予測精度を向上させる。
- GRABは,従来の深層学習モデルと比較して,収益が3.05%向上,クリック率が3.49%向上した。
- CamAメカニズムにより,ユーザー行動シーケンスの時間的変化と行動信号を効果的に捉えることができた。
- モデルの表現力は,インタラクションシーケンスが長くなるにつれて,単調増加し,ほぼ線形に向上する。
FlyPrompt:脳に触発されたランダム拡張ルーティングと時間的アンサンブルエキスパートによる汎用継続学習 [cs.LG, cs.AI, cs.CV]目的:汎用継続学習における性能向上
- 人工知能システムが変化するデータに対応する必要性から,継続学習の研究が重要である。
- 既存手法は複数回の訓練やタスクの明示的な区別が必要で,汎用的な継続学習には不向きである。
- エキスパートパラメータの割り当てと表現能力の向上を通して,継続的パラメータ効率調整の課題を解決する。
- FlyPromptは,果蠅の階層的記憶システムに着想を得た新しいフレームワークである。
- 提案手法は,インスタンスレベルでのエキスパート活性化と動的な決定境界の適応を実現する。
- CIFAR-100,ImageNet-R,CUB-200において,最先端手法を最大12.43%上回る性能を示した。
Transformerにおける創発的な類推推論 [cs.AI]目的:Transformerにおける類推推論の創発
- 類推は人間知能の中核であり,抽象的パターンを転用する能力は重要である。
- Transformerがどのように類推推論を獲得・実行するかは未だ不明な点が多い。
- 類推推論の創発条件を,制御された環境下で評価することを試みる。
- 類推推論の創発は,データ特性,最適化手法,モデル規模に大きく依存することが示された。
- Transformerにおける類推推論は,埋め込み空間における関係構造の幾何学的配置と,Transformer内部での関手の適用に分解される。
- 事前学習済みLLMにおいても同様の傾向が観察され,類推が具体的なメカニズムに基盤付けられた。
表面連続性事前知識を用いたフィードフォワード2Dガウススプラッティング [cs.CV, cs.AI]目的:疎な画像からの3Dシーン再構築
- 3Dシーンの理解は,ロボット工学,VR/ARなど様々な分野で重要である。
- 最適化なしで正確な形状とテクスチャを復元することは困難である。
- 高解像度での再構築品質を向上させ,アーティファクトを抑制すること。
- SurfSplatは,2Dガウススプラッティングに基づき,より高い幾何学的精度と異方性を提供する。
- 表面連続性事前知識と強制アルファブレンディングにより,一貫性のある形状と忠実なテクスチャを再構築する。
- RealEstate10K,DL3DV,ScanNetでの実験により,既存手法を上回る高忠実度な再構築が可能であることが示された。
DCoPilot:動的なデータセンター運用における生成AIを活用したポリシー適応 [cs.LG, cs.AI, cs.SY, eess.SY]目的:動的なデータセンター運用におけるポリシー適応手法
- AI専用デバイスを搭載したデータセンターは電力密度が高く,運用効率が重要である。
- 変化の速いワークロードに対応するためには,迅速なポリシー適応が求められる。
- 頻繁な動的変化やSLA変更に対応できる,タイムリーな制御ポリシーの確立を目指す。
- DCoPilotは,LLMによる報酬関数の生成とハイパーネットワークによるポリシーの生成を組み合わせたハイブリッドフレームワークである。
- シミュレーションによるストレステスト,メタポリシー蒸留,オンライン適応の3つの段階で動作する。
- 5つの制御タスクファミリーにおいて,DCoPilotは制約違反をほぼゼロに抑え,ベースラインを上回る性能を示した。
ECHO-2:コスト効率の良い強化学習のための大規模分散ロールアウトフレームワーク [cs.CL, cs.LG, cs.DC]目的:強化学習のための大規模分散ロールアウトフレームワーク
- 大規模言語モデルの性能向上には,訓練後の強化学習が不可欠である。
- 分散環境におけるポリシーの伝播遅延が,効率的な強化学習のボトルネックとなる。
- 伝播遅延を考慮した上で,分散環境での強化学習のコスト効率を改善すること。
- ECHO-2は,中央集権型学習と分散ロールアウトを組み合わせ,ポリシーの鮮度をユーザー制御可能とした。
- オーバーラップに基づくキャパシティモデルにより,学習時間,伝播遅延,ロールアウトのスループットの関係を定量化した。
- 実験により,ECHO-2がコスト効率を大幅に改善しつつ,既存手法と同等の報酬を達成することが示された。
TIDE:LLMエージェントのテスト時改善に関する軌跡ベースの診断評価 [cs.AI]目的:LLMエージェントにおけるテスト時改善メカニズムの診断
- 自律型LLMエージェントの能力向上は,現実世界の問題解決に不可欠である。
- テスト時改善の成功・失敗要因が不明確で,効率的な評価指標が不足している。
- テスト時改善の効率性,行動適応,ワーキングメモリの利用状況を評価する。
- TIDEフレームワークは,テスト時改善を包括的な3つの側面から評価する。
- 実験により,エージェントの性能向上には,内部推論のスケーリングだけでは不十分であることが示された。
- エージェントと環境間の相互作用ダイナミクスの最適化が重要である。
SEDformer:イベント同期スパイク変換器による不規則なテレメトリ時系列予測 [cs.LG, cs.AI]目的:大規模インターネット接続システムからの不規則な多変量時系列データの予測
- IoTやオンラインプラットフォームなど,大規模システムの安定運用には正確な時系列予測が不可欠である。
- 既存手法は,不規則な時系列データの特性を無視し,情報損失や計算コストの増大を招いている。
- 不規則な時系列データのイベント同期性と疎性を考慮した,効率的な予測モデルを構築すること。
- SEDformerは,スパイクニューラルネットワークとTransformerを組み合わせることで,予測精度を向上させた。
- イベント同期エンコーダーと時間ダウンサンプリングモジュールにより,疎性とイベントの重要性を維持した。
- 実験結果から,SEDformerは最先端の予測精度を達成し,エネルギーとメモリ使用量を削減することが示された。
リアルタイム再帰型強化学習による事前学習済みコントローラーのオンラインファインチューニング [cs.RO, cs.LG, cs.NE, cs.SY, eess.SY]目的:事前学習済みコントローラーのオンラインファインチューニング手法
- 自動運転技術は,安全性向上や効率化に貢献するため,社会実装が期待されている。
- 環境変化やシステム変動に対して,事前学習済みポリシーの性能が急速に劣化する点が課題である。
- リアルタイム適応能力を持つ手法を用いて,性能劣化を抑制し,実用性を高めることを目指す。
- リアルタイム再帰型強化学習(RTRRL)が,事前学習済みポリシーのファインチューニングに有効であることが示された。
- RTRRLと液体抵抗液体容量RNNモデルの組み合わせが相乗効果を発揮し,自動運転タスクの性能向上に貢献することが確認された。
- シミュレーション環境と実機環境の両方で,提案手法の有効性が実証された。
統合的方策勾配によるLLMの推論解釈と制御 [cs.AI, cs.CL, cs.LG]目的:LLMの推論メカニズムの解釈と制御
- LLMは複雑な問題を解決する強力な推論能力を持つため,そのメカニズム解明が重要である。
- 既存手法では,推論メカニズムの特定や影響の順序把握が困難である。
- 推論行動への内側要素の寄与を特定し,推論能力の調整を可能にすること。
- 提案手法IPGは,推論結果の精度を後方伝播させ,モデル内部要素への寄与を特定する。
- IPGは,従来の解釈手法よりも高精度なメカニズムの局所化を達成した。
- 多様な推論モデルにおいて,推論能力や強度の信頼性のある調整が可能となった。
SLIME:選好最適化のための安定化された暗黙的なマージン強制 [cs.LG]目的:大規模言語モデルの選好最適化
- LLMの性能向上には,人間のフィードバックに基づく調整が不可欠であり,その効率的な手法が求められている。
- 既存手法では,選好の相対的なマージン最適化が絶対的な尤度低下を引き起こし,生成品質の劣化やフォーマット崩壊を招く可能性がある。
- 生成品質を維持しつつ,選好学習と生成品質を分離することで,より安定した選好最適化を実現することを目指す。
- SLIMEは,選好応答の尤度を最大化するアンカリング項,拒否トークンの確率崩壊を防ぐ安定化ペナルティ,そしてハードとソフトの制約を組み合わせた二重マージン機構を採用している。
- 実験結果から,SLIMEは最先端のベースラインと比較して優れた性能を示し,より高い生成安定性を維持することが示された。
無限世界:姿勢推定を用いない階層型メモリによる1000フレームのインタラクティブなワールドモデルの拡張 [cs.CV, cs.AI]目的:複雑な実世界環境における1000フレーム以上のコヒーレントな視覚的メモリを維持可能な,堅牢なインタラクティブなワールドモデル
- 現実世界の理解や操作において,長期的な視覚情報の保持と活用は不可欠である。
- 既存のワールドモデルは,実世界のノイズの多いデータに対して,姿勢推定の誤差や視点再訪の少なさから学習が困難である。
- 本研究は,姿勢推定を用いない方法で長期メモリを効率的に圧縮し,実世界のデータを用いた学習を可能にすることを目指す。
- 提案手法であるInfinite-Worldは,視覚的な品質,行動の制御性,空間的な整合性において,既存手法を上回る性能を示す。
- 階層型姿勢推定フリーメモリ圧縮器(HPMC)により,過去の潜在変数を固定予算の表現に再帰的に蒸留し,計算コストを抑えつつ長期的な生成を可能にする。
- 不確実性認識型行動ラベリングモジュールは,連続的な動きを三値論理で離散化し,ノイズの影響を受けにくいロバストな行動学習を実現する。
ReasonEdit:人間による推論を用いた視覚言語モデルの編集 [cs.CV, cs.AI]目的:視覚言語モデルの編集性能向上
- 大規模言語モデルは多様なタスクに応用可能だが,誤りを修正するには専門知識が必要である。
- 既存の編集手法は,推論を必要とする複雑なタスクへの対応が困難である。
- 人間による推論を活用することで,編集の汎化性能を高めることを目指す。
- ReasonEditは,人間が編集時に推論を説明できる初の視覚言語モデルエディタである。
- 人間による推論をコードブックに保存し,ネットワーク科学に着想を得た手法を用いて関連情報を検索する。
- 複数のデータセットにおいて,最新技術を上回る編集性能を達成し,推論の活用が編集の汎化に貢献することを示した。
SafeGround:GUIグラウンディングモデルの信頼性を不確実性校正で判断 [cs.AI, cs.SE]目的:GUIグラウンディングモデルの信頼性評価
- GUI自動操作の信頼性確保は,誤操作による損失を防ぐ上で重要である。
- 既存のGUIグラウンディングモデルは,誤った座標を生成する可能性があり,リスクが高い。
- モデルの不確実性を定量化し,リスクを制御することで,安全なGUI操作を実現する。
- SafeGroundは,GUIグラウンディングモデルの出力の空間分散を捉えることで,不確実性を定量化する。
- 校正プロセスにより,誤検出率を統計的に保証された閾値を導き出し,リスク管理を可能にする。
- ScreenSpot-Proベンチマークにおいて,既存手法よりも正確な予測の識別性能が向上し,システムレベルの精度を最大5.38%改善した。
漫画による思考:構造化された視覚的物語を通してマルチモーダル推論を強化 [cs.AI]目的:マルチモーダル推論の強化
- AIの進化には,画像や動画などの多様な情報を統合する能力が不可欠である。
- 画像は時間構造の表現が難しく,動画は冗長性と計算コストが高いという課題がある。
- 漫画という高情報密度の媒体を用いて,効率的な推論を実現することを目指す。
- 漫画による思考は,画像のみによる思考よりも,多段階の時系列および因果関係の推論において優れた性能を示した。
- 動画による思考と比較して,計算コストを大幅に削減しつつ,高い推論能力を実現している。
- 漫画の構成やスタイルが推論結果に影響を与えることが示され,効果的な視覚表現であることが示唆された。
AIを用いた需要分析の冒険 [econ.GN, cs.AI, q-fin.EC, stat.AP, stat.ML]目的:AI由来のマルチモーダル製品表現による需要分析の高度化
- 需要分析は,マーケティング戦略や価格設定において不可欠であり,企業活動の根幹を支える。
- 従来の需要分析手法では,製品の多様な特性を十分に捉えきれず,分析精度に限界があった。
- AIを活用し製品特性を詳細に表現することで,需要分析の精度向上と因果推論の信頼性向上を目指す。
- Transformerベースの埋め込みモデルにより,テキスト,画像,表形式データを統合した製品表現が実現した。
- この埋め込み表現は,販売ランキングと価格の予測精度を大幅に向上させることが示された。
- 製品固有の特性が価格弾力性に強い影響を与えることが明らかになり,需要分析の新たな知見が得られた。
公平なCMRセグメンテーションのための理解に基づくバイアス軽減 [eess.IV, cs.AI, cs.CV]目的:公平なCMRセグメンテーションのためのバイアス軽減手法の評価
- 医療画像診断におけるAI利用が拡大しており,その精度と公平性が重要視されている。
- AIモデルは学習データの偏りにより,人種などの属性においてバイアスを示す場合がある。
- 本研究は,CMRセグメンテーションにおける人種間バイアスを軽減する手法を検証し,公平性を向上させる。
- オーバーサンプリング等のバイアス軽減手法は,少数派であるBlack患者群の性能を大幅に向上させた。
- クロップ画像を用いることで,両人種群の性能向上とバイアスの軽減が確認された。
- 臨床検証データセットでは,高いセグメンテーション性能と統計的に有意なバイアスの存在が確認されなかった。
オンライン双対変数ガイダンスによる強化学習のための二時間スケール双対アルゴリズム [quant-ph, cs.CC, math.CO, cs.DM, math.OC, cs.LG]目的:強化学習における二時間スケール双対アルゴリズムの開発
- 強化学習は,自律的な意思決定システムの実現に不可欠であり,その応用範囲は広い。
- オフポリシーデータの活用とオンポリシー探索の両立は,強化学習における重要な課題である。
- オフポリシーデータ利用とオンポリシー探索を両立するアルゴリズムを構築し,その収束性を保証すること。
- 提案手法PGDA-RLは,ほぼ確実に正則化されたMDPの最適価値関数と方策に収束することが証明された。
- 既存の双対アルゴリズムと比較して,シミュレーターや固定行動方策の必要性をなくした弱条件での収束が示された。
- マルコフ連鎖に関するエルゴード性仮定の下で,平均二乗収束率が$\tilde{O} (k^{-2/3})$と示された。
安定化正則化による交差検証 [math.OC, cs.LG, stat.ML]目的:テストセット性能の保証
- 機械学習モデルの汎化性能評価において,交差検証は重要な手法である。
- 交差検証で良好な結果が得られても,テストセットで性能が低下する不安定性がある。
- モデルの安定性を考慮し,テストセット性能の低下を防ぐことを目指す。
- 提案手法は,スパースリッジ回帰では平均で4%,CARTでは2%のMSE改善が見られた。
- XGBoostにおいては,提案手法は性能に影響を与えなかった。
- 不安定なモデルにおいて,テストセット誤差と交差検証誤差の乖離を抑制した。
非平衡拡散の学習:シュレーディンガー橋を用いた,厳密解からシミュレーションフリーへ [stat.ML, cs.LG, math.OC]目的:確率的動力学系の初期状態と最終状態のアンサンブル測定,および動力学に関する事前知識から,データと整合性のある「最も可能性の高い」進化過程の再構成
- 生物システムなど,自然界の多くは平衡状態にないため,非平衡系の理解が重要である。
- 既存研究はブラウン運動を基準とし,ポテンシャルエネルギー勾配によって駆動される系に限定されていた。
- 非平衡状態におけるシュレーディンガー橋を学習し,より幅広いシステムへの適用を目指す。
- 多変量オルンシュタイン・ウーレンベック過程を用いて,シュレーディンガー橋の厳密解を導出した。
- フローおよびスコアマッチングに基づく,シミュレーションフリーアルゴリズムmvOU-OTFMを提案した。
- 合成データおよび実際の単一細胞データを用いた実験により,mvOU-OTFMが競合手法よりも高い精度と学習速度を示すことが示された。
多施設観察データからの傾向スコア集約による連合因果推論 [stat.ME, cs.AI, math.ST, stat.AP, stat.TH]目的:多施設分散型観察データからの平均処置効果の推定
- 因果推論は医療や社会科学において重要な課題であり,その応用範囲は広い。
- データはプライバシー等の制約により中央集権化が困難であり,分散環境での分析が求められる。
- プライバシー保護と因果推論の両立を目指し,分散環境下での推定方法を開発する。
- 提案手法である連合IPWおよび連合AIPWは,サイトレベルの異質性下でも良好な性能を示す。
- 既存のメタ分析法とは異なり,Positivityの制約を受けずに,サイト間の処置割り当ての異質性を活用する。
- 理論的解析と実験により,提案手法がメタ分析法などの既存手法よりも優れていることが示された。
敵対的攻撃下におけるバッチ正規化へのスタイン縮小の適用可能性 [stat.ML, cs.LG]目的:敵対的攻撃下におけるバッチ正規化におけるスタイン縮小の優位性
- 深層学習の安定化と正則化に不可欠なバッチ正規化技術の理論的基盤の理解。
- 敵対的攻撃に対する深層学習モデルの脆弱性,特にバッチ正規化への影響。
- スタイン縮小を用いたバッチ正規化のロバスト性向上と,その実証。
- スタイン縮小推定量が,敵対的攻撃下においてサンプル平均・分散推定量を優位に上回ることが証明された。
- スタイン縮小を用いたバッチ正規化は,標準的なバッチ正規化と比較して局所リプシッツ定数を小さく抑えることが示された。
- CIFAR-10,PPMI,Cityscapeデータセットを用いた実験により,画像分類・セグメンテーションタスクにおいて最先端の性能が確認された。
ドメイン知識に基づく説明を用いた信頼性の高いAIによる亀裂先端のセグメンテーション [cond-mat.mtrl-sci, cs.LG]目的:亀裂先端のセグメンテーションの精度向上
- 材料の破壊力学において,亀裂先端の正確な把握は,材料の強度評価に不可欠である。
- 深層学習モデルの信頼性や頑健性は課題であり,特に重要な科学的応用においては重要である。
- モデルの注意を物理的に意味のある領域に集中させ,汎化性能を高める。
- 提案手法であるAttention-Guided Trainingは,モデルの説明に対するドメイン知識に基づくフィードバックにより,モデルの汎化能力を向上させる。
- Williamsの解析解で記述される物理的に意味のある応力場とモデルの注意を一致させることで,信頼性の高いセグメンテーションを実現した。
- デジタル画像相関データを用いた実験により,提案手法が亀裂先端のセグメンテーションにおいて優れた性能を示すことが確認された。
結合型ケール非線形発振器を用いた量子リザバーコンピューティングにおけるエンタングルメントの役割 [quant-ph, cs.LG, eess.SP]目的:量子リザバーコンピューティングの性能に対するエンタングルメントの影響
- 時系列データ処理の効率化が求められており,量子技術の応用が注目されている。
- 既存のリザバーコンピューティングは計算能力に限界があり,複雑な時系列予測が困難である。
- エンタングルメントを活用することで,量子リザバーの計算性能向上と予測精度の改善を目指す。
- エンタングルメントは,入力周波数の閾値まで,予測精度を平均的および最悪の場合において向上させる。
- ある程度の散逸およびデフェージングが存在する場合でも,エンタングルメントによる計算上の利点が持続する。
- 高い散逸率が性能向上に寄与することが示唆された。ただし,最良の場合のエラーは改善されない。
ごく少数の選好の削除が,大規模言語モデルのランキング上位に影響を及ぼす可能性 [stat.ML, cs.LG]目的:大規模言語モデルのランキングシステムの頑健性評価
- 大規模言語モデルの性能評価は,その実用化と改善に不可欠である。
- 既存のランキングシステムは,わずかな選好データの改ざんによってランキングが変動する脆弱性を持つ。
- ランキングシステムの脆弱性を評価し,信頼性の高い評価方法を模索すること。
- 本研究では,わずかな選好データ削除がランキングに大きな影響を与えることを示した。
- Chatbot Arenaのランキングでは,人間の選好データのごく一部(0.003%)の削除で,上位モデルが変動する可能性がある。
- MT-benchのランキングは,専門家による評価と慎重なプロンプト設計により,Chatbot Arenaよりも頑健であることが示された。
深層強化学習エージェントにおける間隔時間計測タスクを通じた創発的な時間保持機構 [q-bio.NC, cs.LG]目的:間隔時間計測タスクを実行する深層強化学習エージェントにおける時間保持機構の解明
- 複雑な生物学的メカニズムの理解は困難であり,深層学習との比較が有用である。
- 時間処理の基盤メカニズムは未だに十分に解明されていない。
- 深層学習エージェントの時間保持戦略と生物学的モデルとの類似性を探る。
- エージェントの内部状態において,生物系に見られるような振動的な神経活動が確認された。
- エージェントの行動は,ターゲット間隔に対応する高振幅・高周波の振動を示すニューロンによって大きく影響を受けた。
- 学習後,エージェントは環境への依存性を最小限に抑え,時間保持機構を内面化した。
テンソル推定におけるバイアス・バリアンスのトレードオフ [stat.ML, cs.LG, math.ST, stat.ME, stat.TH]目的:テンソル推定におけるバイアスとバリアンスの関係性の解析
- 高次元データ解析において,テンソル分解は効率的な表現手法として重要である。
- 従来のテンソル分解は,低ランク構造を仮定しており,その仮定が成り立たない場合に性能が低下する。
- 本研究では,低ランク構造を仮定しないテンソル推定におけるバイアス・バリアンスのトレードオフを明らかにすることを目指す。
- 提案手法は,任意のタッカーランクに対して,推定誤差の二乗ノルムの上界を与える。
- 推定誤差は,ノイズレベルと,推定器の自由パラメータ数に依存する項に分解される。
- 推定器のランクを大きくするとバイアスは減少し,バリアンスは増加する,明確なバイアス・バリアンスのトレードオフが確認された。
LogSumExpの確率的最適化の改善 [math.OC, cs.LG]目的:LogSumExpに基づく確率的最適化手法
- 最適化問題において,LogSumExp関数は重要な役割を果たす。
- 項数が膨大になると,勾配計算が困難となる。
- 効率的な確率的勾配法による最適化を実現する。
- 提案手法は,LogSumExp関数の近似を通じて,既存手法よりも効率的な最適化を可能にする。
- この近似は,KLダイバージェンスの修正に基づき,新たなfダイバージェンスを定義する。
- 分布ロバスト最適化や連続最適輸送における実験的・理論的分析により,提案手法の有効性が示された。
BioGen:抗菌薬耐性研究におけるRNA-seq遺伝子クラスター解釈のためのエビデンスに基づくフレームワーク [q-bio.QM, cs.AI, cs.LG]目的:RNA-seq遺伝子クラスターの解釈
- 抗菌薬耐性研究において,遺伝子クラスターの機能的理解はメカニズム解明に不可欠である。
- 既存の方法では,解釈の透明性,再現性,スケーラビリティが課題となっていた。
- エビデンスに基づいた,追跡可能な生物学的推論による遺伝子クラスター解釈を目指す。
- BioGenは,文献検索,仮説形成,批判的検証を統合したフレームワークである。
- PubMedやUniProt等の外部情報源との明示的な連携により,解釈の根拠と整合性を評価できる。
- サルモネラ・エンテリカのRNA-seqデータへの適用により,エフロックス調節,病原性,代謝適応に関する解釈が示された。
ピアノダイナミクスと拍動構造の同時推定:マルチタスク・マルチスケールネットワーク [eess.AS, cs.LG, cs.SD]目的:ピアノダイナミクスと拍動構造の推定
- 音楽表現の理解には,ダイナミクスと拍動構造の分析が不可欠である。
- 既存手法では,計算量が多く,長時間の楽曲解析が困難であった。
- 効率的なモデルにより,大規模な音楽データの解析を可能にすること。
- 本研究では,ダイナミクスレベル,変化点,拍,ダウンビートを同時に推定するマルチタスクネットワークを提案した。
- Barkスケール特有のラウドネスを入力特徴量とすることで,モデルサイズを大幅に削減し,長時間の入力に対応した。
- 公開データセットMazurkaBLにおいて,全てのタスクで最先端の結果を達成した。
マルチエージェントシステムによる横断的対角ゲートを用いた量子符号の共同設計 [quant-ph, cs.AI, cs.CL, math-ph, math.MP]目的:横断的対角ゲートを持つ量子誤り訂正符号の共同設計
- 量子計算の実現には,量子ビットの誤りを訂正する量子誤り訂正符号が不可欠である。
- 効率的な量子誤り訂正符号の設計は,計算資源の制約や複雑な制約条件により困難である。
- AIを活用し,符号設計プロセスを自動化・加速することで,実用的な符号の発見を目指す。
- 本研究では,GPT-5を活用したマルチエージェントシステムを開発し,Subset-Sum Linear Programming (SSLP) フレームワークを基盤とした共同設計ワークフローを構築した。
- その結果,6量子ビットまでのK∈{2,3,4}の次元において,14,116個の新しい非加法的符号をカタログ化することに成功した。
- また,残差退化コード((6,4,2))を構築し,横断的制御位相ゲートdiag(1,1,1,i)を実装できることを示した。
量子情報順序と差分プライバシー [quant-ph, cs.IT, cs.LG, math.IT]目的:量子状態間の情報量の順序付け
- 情報セキュリティの高度化に伴い,量子情報技術のプライバシー保護が重要となる。
- 量子差分プライバシーの厳密な定義と,その限界の理解が十分に進んでいない。
- 量子差分プライバシーメカニズムの特性評価と,プライバシー保護下での情報量の限界を解明する。
- 情報量の順序付けによって,量子差分プライバシーメカニズムを完全に特徴付けられることが示された。
- 仮説検定や量子パラメータ推定におけるプライバシー保護の限界が明確化された。
- 差分プライバシーを保護する量子チャネルの収縮性に関するほぼ最適な上限が導出された。
AIRMap:無線デジタルツインのためのAI生成無線マップ [eess.SP, cs.AI]目的:無線ネットワークシミュレーションとデジタルツインアプリケーションのための,正確かつ低遅延なチャネルモデルの構築
- 無線通信システムの性能評価や最適化において,正確な無線環境のモデルは不可欠である。
- 従来のレイトレース法は計算コストが高く,動的な環境変化への対応が困難である。
- AIを活用し,高速かつ高精度な無線マップの推定を実現することで,リアルタイムな無線環境シミュレーションを可能とする。
- AIRMapは,地形と建物高さを入力として,U-Netオートエンコーダを用いて無線マップを高精度に推定する。
- 推論速度はGPUアクセラレーションされたレイトレース法と比較して7000倍以上高速であり,4msで4dB以下のRMSEを達成した。
- 実測値の20%を用いた較正により,誤差中央値は約5%に低減され,従来のシミュレータを大幅に上回る精度を示した。
フリンジ投影法におけるフォトリアリスティックな合成データを用いた包括的な機械学習ベンチマーク [quant-ph, cs.ET, eess.IV, cs.CV, cs.LG]目的:フリンジ投影法における機械学習のベンチマーク評価
- 非接触三次元計測技術として,工業検査や逆設計など幅広い分野で活用されている。
- 機械学習の導入には,大規模で多様なデータセットと標準化された評価プロトコルの不足が課題である。
- フォトリアリスティックな合成データセットとベンチマーク環境を構築し,機械学習の性能向上を目指す。
- 提案手法により,従来の深度マップ再構成精度を9.1倍向上させる個別正規化の効果が確認された。
- 背景フリンジパターンの除去が性能低下を引き起こすことが示され,その空間位相参照の重要性が明らかになった。
- ハイブリッドL1損失が最適であり,UNetアーキテクチャが最も優れた性能を発揮した。しかし,古典的なフリンジ投影法と比較して誤差が大きい。
予測的不確実性を超えて:構造的制約を用いた信頼性の高い表現学習 [stat.ML, cs.LG]目的:信頼性の高い表現学習のための枠組み
- 機械学習の発展において,モデルの信頼性評価は不可欠であり,その精度向上は重要な課題である。
- 既存研究では,学習された表現の信頼性が暗黙的に前提とされており,表現レベルでの不確実性を考慮していない。
- 表現レベルでの不確実性を明示的にモデル化し,構造的制約を用いて表現空間を正則化することを目指す。
- 本研究では,表現空間における不確実性を考慮した正則化手法を提案し,予測性能と表現の安定性を両立する。
- 構造的制約を組み込むことで,スパース性や関係性などの意味のある幾何構造を表現に導入し,不要な変動を抑制する。
- 提案手法は特定のモデルアーキテクチャに依存せず,様々な表現学習手法に適用可能である。
未測定交絡下における情報理論的因果境界 [stat.ML, cs.AI, cs.LG, stat.ME]目的:未測定交絡下での因果効果の鋭い部分的識別
- 因果推論は,政策決定や科学的発見において重要な役割を果たすため,その精度向上が求められている。
- 従来の因果推論手法は,強い仮定や追加情報に依存しており,現実の問題への適用が困難な場合が多い。
- 観測データのみから,外部情報を必要とせずに因果効果を識別するための新しい手法を開発すること。
- 提案手法は,観測分布と介入分布の間のf-divergenceが,プロペンシティスコアだけで上界に抑えられることを示した。
- これにより,観測データから直接,条件付き因果効果を鋭く部分的識別することが可能になった。
- シミュレーションや実データへの適用により,提案手法の有効性とロバスト性が確認された。
有限混合モデルのバイアス低減推定:パネルデータにおける潜在グループ構造への応用 [math.DS, cs.CG, math.DG, stat.ME, cs.LG, econ.EM, stat.CO]目的:有限混合モデルにおけるパラメータのバイアス低減
- 不均一性を捉える手段として計量経済学で広く利用されている
- 成分密度に外れ値の影響を受けやすく,パラメータに有意なバイアスが生じやすい
- 分類混合尤度関数を最大化することで,バイアスを低減する手法を提案する
- 最尤推定法(MLE)が示す有限サンプルバイアスが,サンプルサイズや成分密度の統計的距離の増加とともに軽減されることをシミュレーションで確認
- 提案手法は,従来のMLEと比較して,バイアスと平均二乗誤差の両面で優れた性能を示すことが確認された
- 健康行政データを用いた実証分析により,提案手法がアウトオブサンプル予測誤差を約17.6%削減することが示された
