arXiv雑要約
AI - 2025/12/19 公開
ピクセルシール:不可視画像・動画透かしのための敵対的学習 [cs.CV, cs.AI, cs.CR, cs.LG]目的:不可視透かし技術の性能向上
- デジタルコンテンツの出所追跡は重要であり,そのために不可視透かし技術が不可欠である。
- 既存手法は,堅牢性と完全な不可視性のバランスを取るのが難しく,透かしが目に見えるアーティファクトが生じやすい。
- 人間の知覚に合致した不可視透かしを実現し,高解像度画像・動画への適用を可能にする。
- Pixel Sealは,画像および動画透かしにおいて最先端の性能を達成する。
- 敵対的学習のみを用いることで,不安定なピクセル単位の損失関数への依存を排除し,学習の安定化を実現した。
- JNDベースの減衰と,学習時推論シミュレーションにより,高解像度化時のアーティファクトを抑制し,動画への効率的な適応を可能にした。
信頼楕円体の学習とロバストな部分空間復元への応用 [cs.DS, cs.LG, math.ST, stat.ML, stat.TH]目的:任意の分布における信頼楕円体の探索
- 高次元データ分析において,分布の形状を捉え,外れ値に強い推定を行う上で重要である。
- 楕円体の条件数が大きくなると,体積の近似計算がNP困難となる点が課題である。
- 有限の条件数を持つ楕円体に対する体積近似保証付きの信頼楕円体を効率的に探索することを目指す。
- 提案アルゴリズムは,多項式時間で,最適な条件数βの楕円体の体積に対してO(β^γd)の乗法誤差以内で確率質量を少なくとも1-O(α/γ)以上カバーする楕円体を見つける。
- この結果は,最悪ケースのインスタンスに対するロバストな部分空間復元問題に対する近似保証付きの多項式時間アルゴリズムを初めて提供する。
- 計算困難性の結果も示され,提案アルゴリズムの指数部の依存性はほぼ必要であることが示唆される。
共同学習によるより良い診断:コラーゲンVI関連筋ジストロフィーに対する連合学習 [cs.LG, cs.AI, cs.CV, cs.DC]目的:コラーゲンVI関連筋ジストロフィーの診断における連合学習の有効性
- 希少疾患の診断は患者数が少ないため困難であり,診断精度の向上が求められている。
- 患者データが分散し,プライバシー保護の観点からデータ共有が制限されることが課題である。
- 分散データを利用しつつ,プライバシーを保護しながら診断精度の向上を目指す。
- 連合学習を用いることで,単一機関のモデルよりも高いF1スコア(0.82)を達成した。
- 本研究は,コラーゲンVI関連筋ジストロフィーの病因メカニズムに基づいた画像分類を可能にした。
- このアプローチは,診断精度向上に加え,不明確な変異の解釈や新たな病原性変異の特定に役立つと期待される。
PolaRiS:汎用ロボットポリシーの現実世界からシミュレーションへの評価スケーラビリティ [cs.RO, cs.LG]目的:汎用ロボットポリシーの評価のための,現実世界からシミュレーションへのスケーラブルなフレームワーク
- ロボット学習の進展には,ポリシーの性能を正確に測定・比較する手法が不可欠である。
- 現実世界での評価は,再現性や時間的コストが課題であり,特に汎用ポリシーの評価は困難である。
- 現実世界の環境を忠実に再現したシミュレーション環境を効率的に構築し,評価の信頼性を高める。
- PolaRiSは,現実世界の短いビデオスキャンからインタラクティブなシミュレーション環境を構築する。
- シミュレーションデータの共同学習により,現実世界とシミュレーションのギャップを縮小し,未知の環境でのゼロショット評価を可能にする。
- PolaRiSによる評価は,既存のシミュレーションベンチマークよりも現実世界の性能との相関が高いことが示された。
LinkedOut:次世代ビデオ推薦のためのビデオLLMからの世界知識表現の連携 [cs.CV, cs.AI, cs.IR, cs.LG, cs.MM]目的:ビデオ推薦における世界知識の活用
- ビデオ理解において,大規模言語モデルの活用が重要視されている。
- リアルタイムな多動画入力と低遅延推論が課題となっている。
- 世界知識を保持しつつ,詳細な視覚情報を活用する表現を構築する。
- LinkedOutは,ビデオLLMから直接世界知識を抽出し,高速推論を実現する表現である。
- 多動画履歴に対応し,言語の制約を取り除くことで,より精度の高い推薦が可能となる。
- 標準的なベンチマークで最先端の結果を達成し,解釈可能性も確認された。
ニュースAIの歴史的学習データにおける人種バイアスの影響 [cs.LG, cs.AI, cs.CL, cs.CY]目的:ニュースAIの学習データに内在する人種バイアスの影響の調査
- AI技術は報道分野で活用が広がり,公平性・正確性が重要課題となっている。
- 過去のデータには人種差別的な偏りが含まれており,AIに学習させることで再生産される可能性がある。
- 学習データに埋め込まれたバイアスを明らかにし,AIの公正な利用を阻害する要因を特定すること。
- ニューヨーク・タイムズのコーパスで学習したモデルにおいて,「black」というラベルが人種バイアスを示すことが確認された。
- このラベルは,ある程度「人種差別検知器」として機能する一方,近年の事例では性能が低いことが示された。
- 報道機関がAIを導入する際,歴史的バイアスの再生産リスクを軽減するための対策が求められる。
文脈内代数 [cs.CL, cs.LG]目的:変数とその意味が相互作用によってのみ決定される系列での算術問題を解くようにTransformerを訓練した際に生じるメカニズム
- Transformerモデルの数学的推論能力を向上させることは,AIの汎用性向上に不可欠である。
- 従来の学習設定では,記号の意味が固定されており,柔軟な記号推論が困難であった。
- 意味が可変な変数を用いた文脈内学習において,Transformerがどのように代数構造を学習するかを解明する。
- Transformerは,記号の代数群要素への割り当てが系列ごとに変化する困難なタスクにおいて,ほぼ完璧な精度を達成し,未知の代数群にも汎化する。
- 実験の結果,Transformerは,答えをコピーする「可換コピー」,恒等要素を認識する「恒等元認識」,群のメンバーシップを追跡する「閉包に基づく打ち消し」という3つのメカニズムを学習することが示された。
- これらのメカニズムは,固定記号設定で発見された幾何学的表現とは異なり,Transformerが文脈内で変数を使用して記号的推論を行う能力を示している。
推論から運動へ:一人称視点ヒューマンインタラクション動画からの3D手軌跡予測学習 [cs.CV, cs.AI, cs.RO]目的:3D手軌跡予測の精度向上
- ロボットの人間との協調や仮想現実など,多様な応用において3D手動作の理解が不可欠である。
- 既存の研究では,運動と意味的理解が分離されたデータセットや,推論と行動の結びつきが弱いモデルが課題となっていた。
- 意味的,空間的,運動的な推論を統合し,より正確で段階的な軌跡予測を実現することを目指す。
- 大規模な一人称視点データセットEgoMANを新たに構築し,インタラクション段階に応じた3D手軌跡予測を可能にした。
- 推論と運動を繋ぐReasoning-to-MotionフレームワークEgoMANモデルを提案し,軌跡トークンインターフェースを用いて視覚言語推論と運動生成を連携させた。
- 段階的に学習することで,現実世界のシーンにおいても汎化性能の高い,正確な軌跡予測を達成した。
SFTok:離散型トークナイザーの性能ギャップを埋める [cs.CV, cs.LG]目的:高解像度画像生成における画像トークン化の性能向上
- マルチモーダルモデルにおいて,画像トークン化は計算効率と複雑性軽減に不可欠である。
- 離散型トークナイザーは連続型に比べて性能が劣り,マルチモーダルシステムへの応用が制限されている。
- 多段階反復メカニズムにより,離散型トークナイザーの再構成精度を高め,性能ギャップを解消すること。
- SFTokは,自己強制ガイド付きビジュアル再構成と,バイアス除去・適合学習戦略を統合することで,多段階プロセスの学習・推論の不整合を解消した。
- ImageNetにおける再構成品質は,rFID = 1.21と最高水準を達成した。
- クラスから画像への生成タスクにおいても,gFID = 2.29と優れた性能を示した。
事後行動模倣:効率的な強化学習ファインチューニングのためのBCポリシーの事前学習 [cs.LG, cs.AI, cs.RO]目的:強化学習ファインチューニングのための行動模倣ポリシーの事前学習
- ロボット工学から言語まで,様々な分野で人間の能力を超える性能が求められている。
- 事前学習済みポリシーが強化学習の初期化として効果的であるかどうかの検討が少ない。
- 強化学習のファインチューニングをより効果的にするための事前学習手法を開発すること。
- 標準的な行動模倣は,デモンストレーションにおける行動の網羅性を保証しない可能性があることが示された。
- デモンストレーションの分布をモデル化する事後行動模倣(PostBC)が,行動の網羅性を保証し,より効果的なファインチューニングを可能にすることが示された。
- PostBCは,ロボット制御ベンチマークや現実世界のロボット操作タスクにおいて,標準的な行動模倣と比較して,強化学習のファインチューニング性能を大幅に向上させることが確認された。
探索と活用:クリッピング,エントロピー,および誤った報酬によるRLVRの再考 [cs.LG, cs.AI, cs.CL]目的:強化学習と検証可能な報酬(RLVR)における探索と活用のトレードオフの解明
- 大規模言語モデル(LLM)の推論能力向上は,AI研究の重要な課題である。
- RLVRにおいて,探索と活用を抑制するメカニズムが,なぜ推論能力を高めるのか不明である。
- 誤った報酬とエントロピー最小化が推論能力に与える影響を解明し,より効果的なRLVR訓練の指針を示す。
- 誤った報酬下でのクリッピングバイアスが政策エントロピーを減少し,より確実な出力を導くことが示された。
- エントロピー最小化単独では性能向上に不十分である。
- 誤った報酬が汚染された設定を超えて性能を向上させる理由を説明する報酬誤調整モデルを提案した。
敵対的生成推論器:敵対的強化学習によるLLMの推論能力の向上 [cs.AI, cs.CL, cs.LG]目的:LLMの推論能力の向上
- 大規模言語モデルは多様なタスクで活用され,その性能向上は重要である。
- LLMは計算ミスや論理の脆弱性など,推論過程で誤りを犯すことがある。
- 敵対的強化学習により,LLMの推論ステップにおける報酬の精度向上を目指す。
- 敵対的生成推論器は,LLM推論器と識別器を共同進化させることで,推論能力を向上させる。
- AIME24ベンチマークにおいて,DeepSeek-R1-Distill-Qwen-7Bの精度を54.0から61.3へ,DeepSeek-R1-Distill-Llama-8Bを43.7から53.7へ改善した。
- モジュール化された識別器は,教師蒸留や選好アラインメントなど,多様な報酬設計を可能にする。
DVGT:運転用視覚幾何変換器 [cs.CV, cs.AI, cs.RO]目的:運転環境における3次元シーンの幾何学的知覚
- 自動運転の実現には,周囲環境の正確な3次元把握が不可欠である。
- 既存手法は,特定のカメラ設定に依存し,多様な環境への適応が困難である。
- DVGTは,カメラパラメータに依存せず,柔軟な幾何学的知覚を実現する。
- DVGTは,複数の視点からの画像系列から,グローバルな3次元点マップを再構築する。
- DINOバックボーンと注意機構により,画像間の幾何学的関係を推論し,正確な3次元形状を予測する。
- nuScenes等の大規模データセットで学習した結果,既存モデルを大きく上回る性能を示した。
EasyV2V:高品質な指示に基づく動画編集フレームワーク [cs.CV, cs.AI]目的:指示に基づく動画編集のためのフレームワークの設計と実装
- 画像編集技術の進歩に比べ,動画編集は発展が遅れている。高品質な動画編集技術の確立が求められている。
- 動画編集において,一貫性,制御性,汎用性の確保が課題となっている。既存の手法では十分な性能が得られていない。
- 多様なデータとシンプルなモデル設計により,高品質かつ制御可能な動画編集を実現することを目指す。
- 既存のモデルを活用し,軽量なLoRAによる微調整のみで,強力な動画編集モデルを構築できることを示した。
- 動画とテキスト,動画とマスク,動画とマスクと参照画像など,多様な入力形式に対応可能である。
- 提案手法EasyV2Vは,既存の手法や商用システムと比較して,最先端の動画編集結果を達成した。
重要な違い:能力ギャップの発見と修正のための監査モデル [cs.CV, cs.AI]目的:マルチモーダルLLMの能力ギャップの発見と修正
- LLMの性能向上は重要であり,特にマルチモーダルLLMはその応用範囲の広さから注目されている。
- 既存の評価方法は解釈性に欠け,モデル間の重要な能力ギャップを十分に明らかにできないという課題がある。
- モデル間の不一致を監査することで,マルチモーダルLLMの弱点を明らかにし,改善を目指す。
- AuditDMは,モデル間の不一致を最大化する質問と反事実画像を生成する監査モデルを強化学習で学習させる。
- 学習された監査モデルは,モデルの弱点を示す多様で解釈可能な事例を発見し,修正のための無注釈データを提供する。
- AuditDMはGemma-3やPaliGemma-2において20種類以上の失敗タイプを発見し,16のベンチマークでモデルの性能を向上させた。
深層ニューラルネットワークとGrad-CAMによる胸部X線写真からの弱学習肺炎局在化 [cs.CV, cs.AI]目的:胸部X線写真を用いた肺炎の分類と局在化
- 肺炎の診断には胸部X線写真が広く用いられるが,詳細なアノテーションが必要。
- ピクセルレベルのアノテーション作成には,コストと時間がかかるという課題がある。
- 画像レベルのラベルのみで肺炎領域を特定し,診断支援の効率化を目指す。
- 提案手法では,画像レベルのラベルを用いて臨床的に意味のある熱力学マップを生成した。
- ResNet-18やEfficientNet-B0は高い分類精度(96-98%)を示し,MobileNet-V3は軽量な代替案となった。
- Grad-CAMによる可視化により,提案手法が臨床的に関連性の高い肺領域に焦点を当てていることが確認された。
不均一な時間スケールを持つ疎なニューラルネットワークのランダム行列理論 [q-bio.NC, cond-mat.dis-nn, cs.LG, hep-th, math.PR]目的:訓練されたニューラルネットワークの特性と,望ましい動的景観を形成する役割との関連性の解明
- 脳の計算メカニズム理解に不可欠であり,人工知能開発への応用が期待されている
- ネットワークの訓練特性と,そのダイナミクスにおける役割との関連性が未解明である
- 均衡点近傍のヤコビ行列のスペクトル解析を通じて,頑健なワーキングメモリ計算のメカニズムを明らかにする
- 訓練されたネットワークのヤコビ行列は,疎な非エルミートの長方形ブロック行列として特徴付けられる
- ヤコビ行列のスペクトルを記述するランダム行列アンサンブルを開発し,統計的手法を用いて解析した
- ヤコビ行列の統計的パラメータ(疎性,重み分散,E/I比など)と,均衡点の臨界的特徴との関係を明らかにした
6G統合知覚・通信・計算ネットワークのための大規模モデルによる具現化知能 [cs.DC, cs.NI, cs.OS, cs.PF, eess.SP, cs.AI, cs.IT, math.IT]目的:6Gにおける知覚,通信,計算の統合を実現するための大規模モデル搭載型インテリジェント基地局エージェントの実現
- 次世代6Gでは,通信インフラに知能を組み込み,知覚・通信・計算を一体化することが重要である。
- 従来の基地局は機能が限定的であり,高度な知覚・推論・行動能力が求められている。
- 大規模モデルを活用し,基地局に知能を付与することで,より高度なサービス提供を目指す。
- 本研究では,基地局を知覚・認知・実行パイプラインとクラウド・エッジ・エンド連携によって構成されるインテリジェント基地局エージェントとして提案した。
- 自動運転における協調的な車両・路面知覚や,低高度無人航空機の安全監視といったシナリオを通して,その有効性を示した。
- 大規模モデルの設計・学習,効率的なエッジ・クラウド推論,マルチモーダル知覚と行動,そして信頼性の高いセキュリティなど,キーとなる技術要素を分析した。
連邦準備金利ターゲット金利予測のためのマルチエージェントシステムアーキテクチャ:FedSight AI [q-fin.GN, cs.AI]目的:連邦準備金利ターゲット金利の予測
- 金融政策は経済全体に大きな影響を与えるため,その予測精度向上は重要である。
- FOMCの意思決定プロセスは複雑であり,予測は困難を伴う。
- LLMを用いたシミュレーションにより,FOMCの議論を再現し,予測精度を高める。
- FedSight CoDは,2023-2024年の会議において93.75%の精度を達成した。
- 既存のモデル(MiniFed,Ordinal RF)を上回り,透明性の高い意思決定プロセスを再現した。
- Chain-of-Draft (CoD) 拡張により,効率性と精度が向上した。
TinyMyo:エッジにおける柔軟な筋電信号処理のための小型ファウンデーションモデル [eess.SP, cs.AI, cs.HC, cs.LG]目的:筋電信号処理のための小型ファウンデーションモデルの開発
- 筋電信号は,バイオメカニクス,リハビリテーション,義肢制御など,幅広い分野で活用されており,その重要性は高い。
- 筋電信号の汎化性能は,被験者,記録システム,取得プロトコルによって影響を受けやすく,ロバストな性能を得ることが課題である。
- 本研究は,多様なデータセットとハードウェアで高い性能を発揮する,エッジデバイスにデプロイ可能な小型ファウンデーションモデルを提供することを目指す。
- 本研究で開発したTinyMyoは,Transformerエンコーダを基盤とする軽量なファウンデーションモデルであり,わずか3.6Mパラメータで高い再構成精度を達成した。
- 様々なダウンストリームタスク(ハンドジェスチャ分類,運動学的回帰,音声生成・認識)において,既存の最先端技術と同等またはそれ以上の性能を示した。
- また,超低電力マイクロコントローラ(GAP9)へのデプロイメントに成功し,平均消費電力36.45mWを実現した。
高頻度取引における深層進化の限界:赤の女王の罠 [q-fin.TR, cs.LG, cs.NE, q-fin.CP]目的:深層強化学習と進化計算の統合による自律的な適応システムの実現可能性の検証
- 金融市場は常に変化するため,適応能力を持つ取引システムの開発が重要である。
- 高頻度取引環境では,ノイズが多く,生存バイアスが進化計算の性能を損なう可能性がある。
- 情報非対称性がない状況下でのモデルの複雑化が,システム全体の脆弱性を高める点を明らかにする。
- 高頻度暗号通貨取引において,訓練時の指標と実際のパフォーマンスの間に大きな乖離が見られた。
- 訓練データにおける偶然性の高い不確実性の過剰適合,進化選択における生存バイアス,マイクロストラクチャー摩擦の克服の困難さが失敗の原因である。
- 情報非対称性がない状況でのモデル複雑化は,システム全体の脆弱性を悪化させるという実証的証拠が得られた。
複雑系アプローチを用いたコンテキストフリーなスマートグリッドモデル [math.OC, cs.AI, cs.SY, eess.SY]目的:スマートグリッドのモデル化
- エネルギー問題や環境汚染は現代社会の喫緊の課題であり,その解決策が求められている。
- スマートグリッドは複雑なシステムであり,全体最適化が困難である。
- ゲーム理論と古典的手法を組み合わせることで,柔軟かつ拡張性のある最適化を実現する。
- 本研究では,複雑系アプローチをスマートグリッドのモデル化に適用した。
- ゲーム理論と古典的手法を組み合わせることで,異なるレベルでの最適化を可能にした。
- この手法は,柔軟性,拡張性,および一般性を維持しながら最適化を実現する。
不確実な非線形システムに対するイベントトリガー型ロバスト適応動的計画法による深層強化学習の最適化 [math.OC, cs.AI, cs.SY, eess.SY]目的:不確実な非線形システムの制御性能向上
- 複雑なシステムの制御は自動化が難しく,高度な制御技術が求められている。
- システムの不確実性や外乱の影響により,ロバストな制御が課題となっている。
- 計算負荷を軽減しつつ,高性能かつロバストな制御を実現すること。
- 強化学習と外乱除去拡張状態オブザーバを組み合わせた制御アーキテクチャを提案した。
- イベントトリガー機構により,学習モジュールのパラメータ更新回数を抑制し,計算負荷を大幅に削減した。
- 数値実験により,提案手法が優れた制御性能と外乱耐性を実現することを示した。
金融リスク予測とコンプライアンスにおける不確実性管理のためのベイズモデリング [q-fin.RM, cs.AI, cs.LG]目的:金融リスク管理における不確実性の定量化
- 金融市場の変動や不正行為は,経済の安定を脅かす重要な問題である。
- 従来のモデルでは,金融リスクを正確に定量化し,不確実性を考慮することが困難であった。
- ベイズモデリングを用いて,金融リスク予測とコンプライアンスにおける不確実性をより適切に管理すること。
- 提案手法は,S&P500のデータを用いて,95% VaR予測において,LSTMベースラインと同程度の正確性を示した。
- GARCH(1,1)モデルはテールリスクを過小評価するのに対し,提案手法は不確実性を適切に捉えている。
- ベイズロジスティック回帰は不正検知の精度を向上させ,階層ベータ状態空間モデルはコンプライアンスリスクの透明性と適応性を高める。
多視点学習によるコンセンサス次元削減 [stat.ME, cs.LG, stat.ML]目的:高次元データの可視化における信頼性向上
- データの可視化は,複雑なデータ構造の理解に不可欠である。
- 次元削減手法は多岐に渡り,結果にばらつきが生じやすい。
- 複数の次元削減結果の共通構造を抽出し,信頼性の高い可視化を目指す。
- 提案手法は,複数の次元削減結果を統合し,安定した低次元構造を抽出する。
- シミュレーションデータと実データを用いて,その有効性が確認された。
- 次元削減手法やハイパーパラメータの選択に依存しない頑健性も示された。
生体医用画像における基盤モデル:誇大宣伝を現実へ [eess.SP, cs.ET, q-bio.QM, cs.AI, cs.CV, cs.LG]目的:生体医用画像における基盤モデルの現状と課題の評価
- 医療分野におけるAI活用は,診断精度向上や効率化に不可欠であり,基盤モデルはその可能性を広げる。
- 基盤モデルの臨床評価と導入には,信頼性,バイアス,安全性といった課題が立ちはだかっている。
- 因果推論に基づいた,安全で検証可能なシステム開発が重要である。
- 基盤モデルは,複雑な臨床推論や多種多様なデータ統合において潜在能力を持つが,現状では表面的なパターン認識に留まる場合が多い。
- アルゴリズムバイアス,データバイアス,モデルの幻覚といった問題に対処し,信頼性と安全性を確保する必要がある。
- 完全な自動診断はまだ遠いものの,臨床現場を支援する強力なツールとして,基盤モデルの活用が期待される。
皮質ニューロンの発火タイミングの精度に基づく長期ワーキングメモリの協調機構 [q-bio.NC, cs.AI]目的:皮質ニューロンの発火タイミングの精度と皮質走査波の関係性を通じた,長期ワーキングメモリの神経基盤の解明
- 皮質ニューロンの研究は,感覚運動処理の理解に不可欠であり,認知機能の解明に繋がる重要な分野である。
- 従来の感覚運動研究は発火頻度に焦点を当てていたが,時間スケールが時間単位の長期ワーキングメモリのメカニズムは未解明であった。
- 皮質走査波とスパイクタイミング依存性可塑性(STDP)の連携が,長期ワーキングメモリを支える一時的な神経ネットワークの形成に寄与する可能性を検証する。
- 皮質走査波が,興奮性シナプスと抑制性シナプスを同期的に刺激し,STDPを活性化するメカニズムを提示した。
- 活性化されたSTDPが持続することで,長期にわたるワーキングメモリを支える二次的な神経ネットワークが形成される可能性を示唆した。
- 皮質走査波とSTDPの組み合わせが,思考の基盤となる高度な認知機能を担っている可能性を示唆した。
内在性無秩序タンパク質を標的とするバイオ医薬品設計のためのスケーラブルなエージェント的推論 [q-bio.QM, cs.AI]目的:内在性無秩序タンパク質を標的とするバイオ医薬品の設計
- 疾患,特に癌において重要な役割を果たす内在性無秩序タンパク質は,創薬における重要なターゲットである。
- 安定した二次構造や三次構造を持たないため,内在性無秩序タンパク質は従来の創薬手法では困難とされる。
- 複雑な立体配座集合を推論し,多様な計算ツールを大規模に連携させる自律システムを構築することで,創薬を加速させる。
- StructBioReasonerは,特殊なエージェントが治療仮説を生成・改良するトーナメントベースの推論フレームワークを採用し,計算負荷を効率的に分散する。
- Der f 21タンパク質に対する設計候補787個のうち,50%以上が文献中の参照バインダーよりも結合自由エネルギーが改善された。
- より困難なNMNAT-2タンパク質に対しても,97,066個のバインダーから3つの結合モードを特定し,NMNAT2:p53インターフェースなど,既知の結合様式を再現した。
共起:時系列データの依存性基準,生物学的データへの応用 [eess.SP, cs.LG]目的:時系列データの依存性評価基準
- 科学的発見において,観測された信号間の統計的依存性の測定は重要なツールである。
- 生物系は複雑な非線形相互作用を示すことが多く,事前知識や大規模データセットなしには捉えられない。
- 信号の広範な範囲における関係性を,事前調整や大量のデータなしに明らかにすること。
- 本研究で導入された共起という基準は,2つの時系列データが,それらから抽出された時間的に整列したセグメントと不整列のセグメントを識別する分類器を構築できる場合に依存関係があると判断する。
- 共起は理論的に依存性と関連しており,分野を横断した科学分析における標準的なアプローチとなりうる。
- fMRI,生理学的データ,行動データなど,多様な信号に対し,新たな依存性評価手法を適用できる可能性を示唆する。
干渉計シミュレーションのためのグラフニューラルネットワーク [astro-ph.IM, cs.LG]目的:干渉計シミュレーションにおけるグラフニューラルネットワークの応用
- 物理学,材料科学,流体力学など,様々な分野でグラフニューラルネットワークの活用が期待されている。
- 大規模な干渉計のシミュレーションは計算コストが高く,設計・最適化に時間がかかるという課題がある。
- グラフニューラルネットワークを用いて,高速かつ高精度な干渉計シミュレーションを実現し,設計プロセスを効率化する。
- グラフニューラルネットワークは,最先端のシミュレーションパッケージよりも815倍高速に,LIGOの複雑な光学物理を正確に捉えることができた。
- この研究は,機械学習モデルにとって特有の課題を提示するとともに,新たなベンチマークデータセットを提供する。
離散空間におけるベイズ数値積分 [stat.ML, cs.LG]目的:離散領域における困難な期待値の推定
- 複雑なモデルの推論において,期待値計算は重要な役割を果たす。
- モンテカルロ法は一貫性があるものの,高精度な結果を得るには多大なサンプル数が必要となる。
- ベイズ数値積分の拡張であるBayesSumにより,サンプル効率の向上を目指す。
- 提案手法BayesSumは,ガウス過程を通して被積分関数に関する事前情報を活用することで,モンテカルロ法よりもサンプル効率が良い。
- 理論的に,幅広い設定でモンテカルロ法よりも有意に速い収束率を示すことが証明された。
- 合成データやConway-Maxwell-Poissonモデル,Pottsモデルのパラメータ推定において,BayesSumがより少ないサンプル数で同等の精度を達成することが実証された。
半導体ナノチューブ成長に向けた触媒の包括的設計における人工知能の活用 [cond-mat.mtrl-sci, cs.LG]目的:半導体ナノチューブ成長のための触媒設計に関する包括的なフレームワーク
- 材料合成において,触媒設計は重要な役割を担う。特に複雑な反応ネットワークにおいてはその重要性が高まる。
- ナノスケールでの触媒反応は複雑であり,高密度かつ高品質な半導体ナノチューブの合成が課題となっている。
- 機械学習と従来の触媒設計を統合し,選択的な半導体ナノチューブ合成を可能にする触媒設計法の確立を目指す。
- 機械学習を統合したフレームワークにより,触媒による電子注入を調整し,光照射下で半導体ナノチューブを選択的に合成する方法が提案された。
- 54種類の触媒候補をスクリーニングした結果,高い可能性を持つ3つの触媒が特定され,実験によって予測の妥当性が検証された。
- FeTiO3触媒を用いた実験では,半導体選択率が98.6%を超え,本手法の有効性が示された。
火星誘導磁気圏のモデリングのための物理情報ニューラルネットワーク [astro-ph.EP, cs.LG, physics.space-ph]目的:火星誘導磁気圏の磁場モデリング
- 火星大気イオンの散逸過程を理解する上で,磁場環境とその太陽風への応答は重要である。
- 従来の火星誘導磁気圏モデルは物理ベースであり,計算コストが高いという課題があった。
- 物理情報ニューラルネットワークを用いて,データ駆動型の磁場モデルを構築し,その予測能力を検証する。
- 物理情報ニューラルネットワークモデルは,太陽風条件の変化に応じて,火星誘導磁気圏の3次元磁場構造を正確に再現できた。
- 磁場配置は太陽風パラメータに依存し,特に火星太陽電気座標における半球非対称性が確認された。
- 本研究は,火星と太陽風の相互作用研究において,物理情報ニューラルネットワークの有用性を示唆している。
ゼロ過剰カウントデータからの連続最適化によるDAG学習 [stat.ML, cs.LG]目的:ゼロ過剰カウントデータからのネットワーク構造学習
- 因果関係の解明は,科学的発見や意思決定において重要な役割を果たす。
- 従来のネットワーク構造学習は,ゼロ過剰データへの対応が不十分である。
- ゼロ過剰カウントデータに適したDAG学習手法を開発すること。
- 提案手法ZICOは,シミュレーションデータにおいて優れた性能と高速な実行時間を実現した。
- ZICOは,遺伝子制御ネットワークの逆解析において,既存のアルゴリズムと同等以上の性能を示した。
- ベクトル化とミニバッチ処理により,大規模な変数セットに対する学習が可能である。
解釈可能な深層学習による株価リターン:コンセンサス・ボトルネック資産価格モデル [q-fin.PR, cs.AI, cs.LG]目的:株式のリターン予測と,投資家の信念集約が期待リターンに与える影響の構造的解釈
- 資産価格決定のメカニズム解明は,効率的な資本配分とリスク管理に不可欠である。
- 従来のモデルでは,投資家の信念の多様性が価格にどのように反映されるか不明確である。
- 投資家信念の集約過程をモデル化し,解釈可能な形で株式のリターンを予測することを目指す。
- 本研究で提案するCB-APMは,米国の株式のリスクプレミアムを予測し,信念集約と期待リターンとの関連性を構造的に解釈可能にする。
- CB-APMは,長期的なリターン予測において,従来の深層学習モデルよりも高い予測精度と説明力を示す。
- 学習されたコンセンサス表現は,従来のファクターモデルでは捉えきれない,信念に起因するリターンの構造を明らかにしている。
変圧器は履歴依存性流のシミュレーションにおけるデータ不足を克服できるか [physics.flu-dyn, cs.LG]目的:履歴依存性流のシミュレーションにおけるデータ不足への対処能力の評価
- 流体などの動力系記述には変数が不足しがちであり,歴史依存性やノイズが生じるため,精密なシミュレーションが困難となる。
- 従来の経験的な変数では実験的な測定が難しい場合があり,モデルの精度向上に限界がある。
- 変圧器アーキテクチャを用いて,実験データが不足している状況下でのシミュレーション精度向上を目指す。
- 変圧器は,実験データが不足しているシステムにおいて,構造を保存するニューラルネットワークよりも優れた性能を示した。
- 低次元の潜在空間においても,変圧器はより低い誤差で予測を実現した。
- 一方,変数の状態が完全に既知のシステムにおいては,構造を保存するモデルの方が高い性能を発揮した。
ブラウン運動の符号を用いた普遍近似 [math.PR, cs.LG, q-fin.MF]目的:ラフパス上の汎関数に対する普遍近似定理
- 確率過程の近似は,金融モデリングや物理シミュレーション等,幅広い分野で重要である。
- 複雑なラフパス上の汎関数に対して,効率的な近似手法が確立されていなかった。
- ブラウン運動の符号を用いた線形汎関数による近似能力を明らかにする。
- ラフパス上の汎関数空間において,符号を用いた線形汎関数が$L^p$距離で稠密であることが示された。
- 特にブラウン運動に対して普遍近似定理が成立し,符号が$p$-可積分確率過程を近似できることが確認された。
- これにより,確率微分方程式の解を含む,ブラウン運動に関する情報を符号で表現できる可能性が示唆された。
因果機械学習における個別治療効果推定への転移学習の利点と限界 [cond-mat.soft, cs.SY, eess.SY, stat.ML, cs.LG]目的:個別治療効果推定における転移学習の有効性と限界
- 因果推論は,政策評価や意思決定に不可欠であり,その精度向上が求められている。
- 大規模データセットから得られた推定値を,異なる文脈に適用する際,外部妥当性が課題となる。
- 小規模データセットにおける個別治療効果推定の精度向上を目指す。
- 転移学習を組み込んだTARNet (TL-TARNet) は,標準的なTARNetと比較して,ITE推定誤差を低減し,バイアスを軽減することが示された。
- 大規模で偏りのないソースデータセットと小規模なターゲットサンプルにおいて,TL-TARNetの有効性が確認された。
- インドの人間開発調査(IHDS-II)の応用において,転移学習はターゲットのITE推定値をソース推定値に近づけ,バイアスを低減した。
宇宙自身による学習:ビッグバンから機械知能へのダイナミクスの進化について [nlin.AO, cs.AI]目的:宇宙の構造形成の連続的な連鎖の記述
- 宇宙論から機械知能まで,多様な分野を統合的に理解する上で重要である。
- 各分野が孤立しており,普遍的な原理に基づいた統合的な視点が欠けている。
- 宇宙の歴史をダイナミクスの進化として捉え,分野間のつながりを明らかにする。
- ビッグバンから現代の人間の社会,そして人工学習システムまでの構造形成の連続性を,ダイナミカルシステムとして記述した。
- 宇宙の進化における不安定性,分岐,多重スケール結合といった数学的なモチーフが普遍的に見られることを強調した。
- 生物や人工システムが自身の未来をモデル化し,予測し,意図的に擾乱する能力に至る,ダイナミクスの進化を包括的に示した。
機械学習を用いた小規模データセットに基づく予測的無機合成:サイズ制御されたCuナノ粒子に関する事例研究 [cond-mat.mtrl-sci, cs.LG]目的:Cuナノ粒子のサイズ予測
- ナノ材料の合成は,触媒や電子デバイスなど幅広い分野で重要であり,その特性制御が求められる。
- 無機合成は反応条件に敏感であり,再現性のあるサイズ制御が困難である。
- 実験データの不足を補い,効率的な合成条件の最適化を目指す。
- 小規模データセット(25件)と機械学習モデル(AMADEUSフレームワーク)を用いて,Cuナノ粒子のサイズを高い精度で予測できた。
- 予測精度($R^2 = 0.74$)は,古典的な統計手法($R^2 = 0.60$)を上回った。
- 本研究は,小規模高品質データセットと解釈可能な機械学習モデルが,実験規模の合成最適化において有効であることを示した。
PPO-Clipの漸近的グローバル収束性 [math.OC, cs.LG]目的:PPO-Clipアルゴリズムの理論的基盤
- 大規模言語モデルの性能向上に,人間のフィードバックを用いた強化学習が注目されている。
- PPOアルゴリズムの実証的な成功は大きいものの,理論的な理解が十分ではない。
- PPO-Clipアルゴリズムの収束性に関する厳密な理論的保証を与える。
- 本研究では,ソフトマックス方策パラメータ化の下で,決定論的アクターのみのPPOアルゴリズムを解析した。
- 非一様リプシッツ滑らか条件と,{\L}ojasiewicz不等式を導出した。
- これにより,前方KL正則化器に対して,グローバル最適方策への非漸近線形収束率が確立され,逆KL正則化器に対しては定常収束と局所線形収束が導かれた。
モーメンタム分散低減によりMuonは確実に高速化される [math.OC, cs.LG]目的:深層学習オプティマイザの収束性改善
- 大規模言語モデルの学習において,Adam型手法の性能向上が課題である。
- 既存の最適化手法では,十分な収束速度が得られない場合がある。
- モーメンタム分散低減(MVR)を導入し,最適化手法の収束速度を向上させる。
- 提案手法は,GluonフレームワークにMVRを組み込むことで,MuonやScionを含む様々な最適化手法の性能を向上させる。
- 非凸の場合,収束率は${\cal O} (\frac{1}{K^{1/4}})$から${\cal O} (\frac{1}{K^{1/3}})$へと改善される。
- 数値実験により,提案手法の反復複雑さの優位性が確認された。
非晶質粒子系のRiemann多様体確率補間 [stat.ML, cond-mat.stat-mech, cs.LG, physics.comp-ph]目的:非晶質材料の平衡配置サンプリング手法
- 物理シミュレーションの加速に生成モデルが期待されている。
- 非晶質材料の平衡配置サンプリングは非常に困難である。
- 確率的補間と等変フローマッチングによる生成フレームワークを開発する。
- 本手法は周期境界条件と多成分粒子系の対称性を厳密に組み込む。
- モデル非晶質系における数値実験で,幾何学的制約が生成性能を向上させることを示した。
- Riemann多様体確率補間フレームワークにより,平衡配置を高精度に生成可能。
異種触媒反応における基盤的機械学習原子間ポテンシャルの精度はどの程度か [cond-mat.mtrl-sci, cs.LG, physics.chem-ph]目的:異種触媒反応を対象とした機械学習原子間ポテンシャルの精度評価
- 触媒反応の効率向上は,エネルギー問題や環境問題の解決に不可欠である。
- 従来の計算手法では,計算コストが高く,大規模系のシミュレーションが困難であった。
- 機械学習原子間ポテンシャルを用いて,触媒反応の効率的なシミュレーションを可能とする。
- 既存の機械学習原子間ポテンシャルは,ペロブスカイト酸化物やナノクラスタのゼロ点エネルギー予測において高い精度を示す。
- 磁性材料に対しては,多くの機械学習原子間ポテンシャルが破綻的な失敗を示すことが判明した。
- 特定のタスクに特化したモデルは,精度において基盤的機械学習原子間ポテンシャルと競合できる可能性がある。
フローマッチングサンプラーの隠れたバイアスについて [stat.ML, cs.LG, math.PR]目的:フローマッチングサンプラーの暗黙的なバイアスの分析
- 生成モデル研究において,効率的なサンプリング手法の開発は重要である。
- フローマッチングは高速だが,最適輸送とは異なるバイアスが存在しうる。
- 経験的なフローマッチングのエネルギー的非最適性を明らかにすること。
- 経験的なフローマッチング最小化解は,条件付きフローが勾配場であっても,勾配場とはほとんどならない。
- ガウス分布をソースとした場合,生成サンプルの運動エネルギーは指数関数的に集中する。
- 重い裾を持つソース分布では,運動エネルギーは多項式的に減少する。分布の選択が主要因である。
量子ホッケー棒ダイバージェンスに対する非線形強データ処理 [quant-ph, cs.CR, cs.IT, cs.LG, math.IT]目的:量子ホッケー棒ダイバージェンスに対する非線形強データ処理不等式の確立
- 情報理論において,量子チャネルを通じた状態識別性の変化を測ることは重要である。
- 従来の線形強データ処理不等式は必ずしも最適ではなく,改善の余地がある。
- ノイズ条件を満たすチャネルにおける,よりタイトな不等式を導出すること。
- 本研究では,ノイズのあるチャネルに対する量子ホッケー棒ダイバージェンスの非線形強データ処理不等式を確立した。
- この結果は,既存の線形不等式や古典ホッケー棒ダイバージェンスに対する非線形不等式を改善する。
- これらの非線形不等式は,線形不等式では達成できない,より短い有限混合時間を導き出すことができる。
統合複合変分モード分解と空間的注意転移による少サンプル特定送信機識別 [eess.SP, cs.LG]目的:特定送信機識別の性能向上
- 物理層セキュリティは,ハードウェア特性を利用し,安全な通信を実現する重要な技術である。
- 深層学習法は高性能だが,大量の学習データや事前情報が必要であり,実用上の課題が多い。
- 少ない学習データでも高精度な識別を可能にし,実環境での適用性を高めることを目指す。
- 複合変分モード分解により信号を分解・再構築することで,特徴抽出の精度が向上した。
- 空間的注意機構によって,重要な信号セグメントに焦点を当て,識別性能を大幅に改善した。
- 公開データセットにおいて,事前知識なしで10シンボルのみで96%の精度を達成した。
Cartesian-nj: e3nnの拡張 - 不可約カルテシアンテンソル積と縮約 [physics.chem-ph, cond-mat.mtrl-sci, cs.LG]目的:不可約カルテシアンテンソル積と縮約の実現
- 物質科学において,原子レベルでのシミュレーション精度向上は重要課題である。
- 従来の球テンソル表現が主流だが,カルテシアン表現の可能性も探求されている。
- カルテシアンテンソル演算の体系的な枠組みを構築し,その利点を評価すること。
- カルテシアン-3jおよびカルテシアン-nj記号を導入し,ICTsの結合を可能にした。
- e3nnを拡張し,カルテシアンテンソル積と縮約をサポートするPythonパッケージcartnnを公開した。
- MACE,NequIP,Allegroのカルテシアン版を実装し,球テンソルモデルとの比較を可能にした。
デング熱予測のためのニューラルネットワーク:系統的レビュー [cs.LG, cs.CY]目的:デング熱予測におけるニューラルネットワークの応用に関する研究の現状把握
- デング熱の早期予測は,感染症対策において重要な役割を果たす。
- 既存研究におけるニューラルネットワークのモデル設計や評価方法にばらつきがある。
- 今後のデング熱予測モデル設計における指針を提供すること。
- レビューの結果,62論文が対象となり,浅いフィードフォワードニューラルネットワークが主流であることがわかった。
- ニューラルネットワークの予測性能は,他のモデルと比較して優位性を示す場合と,そうでない場合があり,研究状況に依存することが示された。
- 深層ニューラルネットワークの活用や,より多様な入力変数の利用が,今後の研究課題として挙げられた。
補助情報へのアクセスを伴う最適化 [cs.LG, math.OC]目的:ターゲット関数fの最小化
- 機械学習の効率化は重要であり,計算コストが課題。
- 勾配計算が困難,または利用可能なデータが限られる場合がある。
- 安価な勾配計算が可能な補助関数を利用して最適化を図る。
- ターゲット関数と補助関数のヘッセ行列の類似性が低い場合,恩恵が得られる。
- 補助ノイズがターゲット関数のノイズと相関する場合,確率的アプローチによる利点も示唆される。
- SGDバッチの再利用,転移学習,分散学習など,多様な設定に適用可能な汎用アルゴリズムを提案。
