arXiv雑要約
AI - 2026/03/09 公開
MiDAS:ロボット支援低侵襲手術のためのマルチモーダルデータ取得システムとデータセット [cs.RO, cs.CV, cs.LG]目的:ロボット支援低侵襲手術におけるマルチモーダルデータの取得
- ロボット支援手術の発展には,多様なデータの活用が不可欠である。
- ロボットメーカー独自のテレメトリデータへのアクセスが制限されている。
- オープンソースでプラットフォームに依存しないデータ取得システムの開発。
- MiDASは,ロボットの独自テレメトリに頼らず,複数のモダリティデータを同期して取得できる。
- 外部センサーによる手の動きと足元の操作は,ロボット内部の動きと高い相関性を示した。
- MiDASで取得したデータを用いたジェスチャー認識の性能は,独自テレメトリを用いた場合と同等であった。
需要予測における地平線劣化に対応した適応モデル選択フレームワーク [cs.RO, cs.LG, cs.AI]目的:需要予測モデル選択のメカニズム
- 事業戦略とオペレーションにおいて,正確な需要予測は不可欠であり,在庫管理やサプライチェーン最適化に影響する。
- 需要パターンが変化しやすく,予測期間が長くなるほど予測精度が低下する傾向がある。
- 予測期間や需要の変動に応じて最適なモデルを動的に選択することで,予測精度の低下を防ぐ。
- AHSIVは,既存の単一指標ベースラインと同等の集約性能を達成しつつ,地平線固有の最適なモデル選択頻度を向上させる。
- 需要環境が多様であるため,静的なモデルランキングではなく,地平線に一貫性のある構造的に適応的なメカニズムが必要である。
- MDFHによる誤差指標調整,需要構造の分類,多目的パレート優位性,階層的バイアス修正を統合したフレームワークが有効である。
GaiaFlow:セマンティクス誘導拡散チューニングによるカーボンフットプリント削減検索 [cs.IR, cs.LG]目的:カーボンフットプリント削減検索のための手法
- 高性能なニューラルアーキテクチャの電力消費増大に伴い,情報検索における環境持続可能性が重要課題となっている。
- 既存のニューラルランキングモデルは高精度だが,大規模展開時の環境負荷が十分に考慮されていない。
- 検索精度と環境負荷のバランスを最適化し,持続可能な次世代検索システムを実現すること。
- GaiaFlowは,セマンティクス誘導拡散チューニングにより,検索精度を維持しつつカーボンフットプリントを大幅に削減する。
- 検索ガイダンスによるランジュバン力学とハードウェア非依存の性能モデルを組み合わせることで,環境負荷と精度のトレードオフを最適化する。
- 適応的な早期終了プロトコルと精度を考慮した量子化推論により,多様な計算環境で高い検索品質を維持する。
IntelliAsk:RLVRによる質の高い研究質問の学習 [cs.CL, cs.AI]目的:質の高い研究質問生成
- 査読は研究の質保証に不可欠であり,建設的な質問がその鍵となる。
- 既存のLLMは表層的な質問しか生成できず,人間の査読者の質問に及ばない。
- 人間の基準に沿った,根拠に基づいた質問生成を目指す。
- IntelliRewardは,既存のSFTベースラインよりも査読者質問の質を正確に予測できる。
- IntelliAskは,より根拠があり,実質的で,労力を要する質問を生成し,冒頭部分への依存を減らす。
- MuSRとWritingBenchのベンチマークにおいて,Qwen3-32Bと比較して性能が向上した。
MolCrystalFlow:フローマッチングによる分子結晶構造予測 [cs.LG, cond-mat.mtrl-sci]目的:分子結晶構造予測の新しい手法
- 分子の大きさと複雑な相互作用から,計算化学における重要な課題である。
- 周期的な分子結晶に対する生成モデルの拡張が困難であった。
- 分子結晶構造予測の効率化とデータ駆動型の結晶探索を目指す。
- MolCrystalFlowは,分子内複雑さと分子間パッキングを分離することで,分子結晶構造を生成する。
- 分子を剛体として扱い,格子行列,分子配向,重心位置を共同で学習する。
- 機械学習ポテンシャルとの統合により,予測速度の向上が示された。
大規模言語モデルにおける長文脈推論の限界:自動バグ修正に着目して [cs.SE, cs.LG]目的:長文脈におけるコードのデバッグと修正生成能力の評価
- ソフトウェア開発の効率化と品質向上において,自動バグ修正技術は重要な役割を担う。
- 大規模言語モデルの文脈長は伸びているが,実際に長文脈を有効活用できるかは不明である。
- 現在のLLMが,真に長文脈の情報を利用してバグ修正を行えるか検証する。
- エージェント機構を用いることで,モデルの性能は向上するものの,成功する軌跡のトークン数は2万~3万程度に留まる。
- 文脈長を人工的に増加させた実験では,性能が著しく低下し,64kトークンでは解決率が7%にまで低下した。
- LLMには,名目上の文脈長と実際に利用可能な文脈容量との間に大きなギャップが存在することが示唆された。
計算ICE時代:アドレス可能グラフ進化下における不変計算包絡 [cs.OS, cs.AI]目的:決定論的意味状態基盤の性能評価
- AI推論アーキテクチャの計算コスト増加に伴い,効率的な意味状態管理が重要となっている。
- 従来の推論駆動型AIでは,トークン数や文脈範囲の拡大に伴い計算コストが指数関数的に増加する。
- アドレス可能なグラフ進化による不変計算包絡の実現可能性を示す。
- Apple M2シリコン上での実験で,トラバーサル遅延は0.25~0.32msと不変であった。
- CPU使用率は約17.2%で安定し,ノード数が100万から2500万に増加しても熱特性に変化はなかった。
- 1TiBのメモリ領域で16億ノードの容量を予測可能であり,メモリ容量がスケーリングを支配する新しい計算領域を示唆している。
FLoRG:低ランクグラム行列とプロクルステスアライメントによる連合学習 [cs.LG, cs.AI]目的:低ランク適応による大規模言語モデルの効率的な適応
- 大規模言語モデルの活用は,様々な分野で重要性が増しており,効率的な適応手法が求められている。
- 連合学習において,複数の低ランク行列を個別に集約することで,集約誤差や分解ドリフトが発生しやすい。
- グラム行列の集約とプロクルステスアライメントにより,集約誤差と分解ドリフトを抑制し,効率的な連合学習を実現する。
- FLoRGは,既存の最先端手法と比較して,より高いタスク精度を示すことが実験的に確認された。
- FLoRGは,通信オーバーヘッドを最大2041倍削減できることが示された。
- プロクルステスアライメントの導入により,よりタイトな収束境界が理論的に証明された。
カスケード等価仮説:音声LLMはいつASR→LLMパイプラインのように振る舞うか [cs.CL, cs.CL, cs.AI, eess.AS]目的:音声LLMの挙動の評価方法とメカニズム的解釈
- 音声認識と自然言語処理の融合が,より高度な音声インタフェースの実現に不可欠である。
- 音声LLMは計算コストが高く,特にノイズ環境下では性能が低下する可能性がある。
- 現在の音声LLMが,実用上は従来のASR→LLMパイプラインと大差ないことを検証する。
- 本研究では,音声LLMの挙動を分離評価する「マッチドバックボーンテスト」を提案した。
- LLMの隠れ状態から文字起こしが生成され,テキスト表現が因果的に必要であることが示された。
- 多くの実用的なケースにおいて,現在の音声LLMはコストの高いカスケードであり,ノイズ下では性能が低下する。
抗体配列の条件付きサイト非依存ニューラル進化 [cs.LG, q-bio.PE]目的:抗体配列進化のモデル化
- 抗体工学は,医薬品開発において重要な役割を担う
- 既存手法は抗体成熟過程の情報を十分に活用できていない
- 複雑な相互作用を捉え,抗体親和性最適化を目指す
- CoSiNEは連続時間マルコフ連鎖モデルであり,抗体配列進化を近似的に表現する。
- CoSiNEは,最先端の言語モデルよりも,変異効果予測において優れた性能を示す。
- Guided Gillespieを用いることで,特定の抗原に対する抗体親和性を効率的に最適化できる。
ハイブリッドオン・オフポリシー最適化による探索的メモリ拡張LLMエージェント [cs.LG, cs.AI]目的:強化学習によるLLMエージェントの探索能力向上
- LLMエージェントは強力だが,探索が不十分だと複雑な環境で性能が低下する。
- 既存手法は事前知識に依存し,未知の状態を発見できない場合がある。
- メモリを活用し,新たなタスクへの適応性と汎化性能を高めることを目指す。
- EMPO$^2$はScienceWorldでGRPOより128.6%の性能向上を達成した。
- WebShopにおいてもEMPO$^2$はGRPOより11.3%の改善を示した。
- 分布外テストで,EMPO$^2$は高い適応性と汎化能力を発揮した。
モダリティ崩壊:不適合なデコーディングとしての解釈 - マルチモーダルLLMの情報理論的限界 [cs.CL, cs.AI, cs.LG]目的:マルチモーダルLLMにおけるモダリティ崩壊のメカニズム解明
- 近年,画像や音声とテキストを統合するマルチモーダルLLMの研究が盛んである。
- マルチモーダルLLMは単純なタスクで誤りを起こすことがあり,その原因が不明である。
- モダリティ崩壊は,デコーダーがテキスト情報に偏っていることに起因すると解明する。
- マルチモーダルLLMの推論は,不適合なデコーダー問題として捉えられ,テキストに沿った方向への情報抽出に制限を受ける。
- 情報損失は,データ分布の不一致やデコーダーの感度の上昇によって限界が定められることが示された。
- LoRAによる介入実験で,感情関連の目的関数で学習することで,感情検出精度が大幅に向上することが確認された。
CoME:情報に基づいたハイブリッド能力推論によるモバイル専門家チャネルの強化 [cs.RO, cs.CL, cs.AI]目的:モバイルエージェントのハイブリッド能力推論の実現
- モバイルエージェントの自律的なタスク実行において,多様な能力が不可欠である。
- 既存のエージェントは,能力の分離と統合のバランスを取ることが難しい。
- CoMEは,各能力を専門とする専門家群により,効率的なハイブリッド能力推論を実現する。
- CoMEは,4つの専門家からなる新しいアーキテクチャを採用し,各推論段階で対応する専門家を活性化させる。
- 段階的な訓練戦略により,各専門家の能力向上と,段階ごとの活性化,そして能力間の協調を最適化する。
- Info-DPOにより,各段階の貢献度を評価し,より情報に基づいた推論を促すことで,エラーの伝播を抑制する。
ドメイン特化型サプライヤー探索のための網羅性考慮型ウェブクローリング:ウェブ--知識--ウェブパイプライン [cs.LG]目的:特定産業分野の中小企業に関する網羅的な情報収集
- サプライチェーンの強靭化において,中小企業の把握は不可欠である。
- 既存のビジネスデータベースは,特に下位サプライヤーや新興市場において,情報網羅性に課題がある。
- ウェブデータと知識グラフを活用し,情報収集の網羅性と効率を向上させる。
- 提案手法は,半導体製造装置分野において,既存手法を上回る精度とF1スコアを達成した。
- わずか144ページで,関係タイプの一貫性を100%維持した知識グラフ(664エンティティ,542関係)を構築した。
- 生態学的種豊富度推定に基づいた網羅性推定フレームワークにより,情報収集の完成度を定量的に評価した。
重み更新を活性化シフトとして捉える:操舵のための原理的な枠組み [cs.LG]目的:活性化空間での介入と重み空間での更新の等価性
- 近年,少ないパラメータで効率的な適応を実現する技術が求められている。大規模モデルのファインチューニングのコストが課題となっている。
- 活性化操舵は有望だが,介入場所やパラメータ設定が経験則に頼っており,理論的な基盤が不足している。
- 活性化操舵がファインチューニングを再現する条件を導き,最適な操舵設計のための指針を示す。
- 活性化空間での介入と重み空間での更新の間に,一次の等価性が存在する。
- 特に,ブロック後の出力が,理論的に支持された表現力の高い介入場所であることが示された。
- ブロック後操舵は,フルパラメータチューニングの精度に匹敵し,パラメータ数はわずか0.04%で済む。
コード空間の理論:コードエージェントはソフトウェアアーキテクチャを理解しているか [cs.SE, cs.AI]目的:ソフトウェアアーキテクチャ理解の評価
- AIによるソフトウェア開発の自動化は,生産性向上に不可欠である。
- 現在のAIコードエージェントは,大規模なソフトウェアアーキテクチャの理解が不足している。
- コードエージェントのアーキテクチャ理解能力を定量的に評価する手段が求められている。
- 新たなベンチマーク「コード空間の理論(ToCS)」を開発し,コードエージェントのアーキテクチャ理解能力を評価した。
- 積極的な探索戦略がモデルによって効果が異なり,モデル固有の能力が明らかになった。
- 構造化された信念マップの保持が,モデルによっては自己学習を促進する一方で,別のモデルでは逆効果になることが示された。
多次元データ復元のための再パラメータ化テンソルリング関数分解 [cs.CV, cs.AI, cs.LG]目的:多次元データの復元
- 高次元データモデリングにおいて,テンソルリング分解は強力な手法である。
- 従来のテンソルリング分解は,固定グリッド上の離散データに限定されている。
- 非グリッドデータや微細な詳細を捉える連続フレームワークの最適化を改善する。
- 提案手法は,学習可能な潜在テンソルと固定基底の組み合わせにより,テンソルリング因子の学習ダイナミクスを向上させる。
- 固定基底の初期化スキームを導出し,提案モデルのLipschitz連続性を証明した。
- 画像インペインティング,ノイズ除去,超解像度,点群復元などの実験で,既存手法を上回る性能を示した。
エージェント開発は現実世界の仕事にどの程度反映されているか [cs.AI]目的:エージェント開発の努力と現実世界の人間が行う仕事の分布の関係
- AI技術の発展により,仕事の自動化が現実味を帯びており,その影響を理解する必要がある。
- AIエージェントの開発は,労働市場全体の代表性という点で,ベンチマークの限界が指摘されている。
- 社会的に重要かつ技術的に困難な仕事内容をより適切に捉えたベンチマーク設計の原則を提案する。
- 43のベンチマークと72,342のタスクを分析した結果,エージェント開発はプログラミング中心であり,人間の労働と経済価値の集中カテゴリとの間に大きな乖離が見られた。
- エージェントが対象とする仕事領域において,現在のエージェントの有用性は,自律レベルを測定することで評価された。
- ベンチマーク設計の原則として,網羅性,現実性,そして詳細な評価の3つが提案された。
タンパク質活性部位同定のための検索拡張を用いた多峰性エキスパートモデル [cs.RO, cs.AI]目的:タンパク質活性部位の同定
- タンパク質の機能理解や創薬において,活性部位の正確な特定は不可欠である。
- 既存手法は,学習データ不足による予測の不安定性や,信頼性の低いモダリティの影響を受けやすいという課題がある。
- 検索拡張と多峰性エキスパートモデル,信頼度に基づいた融合戦略によって,これらの課題を解決することを目指す。
- MERAは,ProTAD-GenおよびTS125データセットにおいて,最先端の性能を達成した。
- 活性部位予測において90%のAUPRCを達成し,ペプチド結合部位の同定においても有意な改善が見られた。
- 検索拡張型多峰性エキスパートモデリングと信頼度に基づく融合戦略の有効性が確認された。
MatRIS:信頼性と効率的な事前学習済み機械学習原子間ポテンシャルへ [cs.LG, cs.AI]目的:機械学習原子間ポテンシャル(MLIP)の信頼性および効率性の向上
- 材料科学や計算化学において,MLIPは重要な役割を担い,物質探索の加速に貢献している。
- 既存のMLIPは計算コストが高く,大規模なデータセットへの適用が困難な場合がある。
- 高次元な原子間相互作用を効率的に捉え,計算コストを削減することを目指す。
- MatRISは,3体相互作用に対する注意機構に基づいた不変なMLIPであり,線形計算量$O(N)$を達成する。
- MatRISは,既存の主要な等変モデルと同等の精度を様々なベンチマーク(Matbench-Discovery等)で示した。
- MatRISは,同等の精度をより低い学習コストで達成し,正確かつ効率的なMLIP開発の可能性を示唆する。
「引き継ぎと共同作業のタイミング」:同時対話を通じた人間とエージェントの協調的創造活動の拡大 [cs.HC, cs.AI]目的:人間とエージェントの協調的創造活動における協力のあり方
- 創造活動において,人間の協調は不可欠であり,その効率化が重要である。
- AIエージェントは,多くの場合,最終的な出力のみを提供するか,一方通行の情報開示に留まる。
- エージェントが人間の行動を解釈し,リアルタイムに適応することで,より円滑な協調を目指す。
- プロセス可視化はエージェントの行動理解を促進するものの,フィードバックと独立作業の区別が課題となることが示された。
- 開発したCLEOは,協調的意図を解釈し,リアルタイムに適応する。
- 分析の結果,デザイナーは,委任,指示,共同作業を状況に応じて使い分けることが明らかになった。
Kiwi-Edit:指示と参照による汎用的な動画編集 [cs.CV, cs.AI]目的:指示と参照を用いた動画編集手法の開発
- 動画編集はコンテンツ制作において不可欠であり,その効率化と品質向上が求められている。
- 自然言語による指示だけでは,複雑な視覚的ニュアンスを正確に伝えることが困難である。
- 高品質な参照データ不足が,参照に基づく動画編集の性能向上を阻害している。
- 本研究では,画像生成モデルを活用したデータ生成パイプラインを開発し,大規模なデータセットRefVIEを構築した。
- Kiwi-Editは,学習可能なクエリと潜在的視覚特徴を組み合わせた統合編集アーキテクチャであり,参照に基づくセマンティックガイダンスを実現している。
- 提案手法は,制御可能な動画編集において最先端の性能を達成し,指示追従性と参照忠実性を大幅に向上させた。
タンパク質設計と構造アンサンブルのための剛性認識幾何学的事前学習 [cs.LG, cs.AI]目的:タンパク質設計と構造多様性の向上
- タンパク質は生命活動に不可欠であり,その設計は創薬や材料開発に繋がる重要な分野である。
- 既存の手法では,タンパク質の幾何学的形状と設計を同時に学習することが困難であり,構造の多様性を捉えきれない。
- 本研究は,剛性を考慮した事前学習により,タンパク質の設計可能性と構造的多様性を高めることを目指す。
- RigidSSLは,AlphaFoldデータベースを用いて幾何学的事前学習を行うことで,設計可能性を最大43%向上させた。
- RigidSSL-Perturbは,モチーフ足場のゼロショット成功率を5.8%向上させ,新規性と多様性を高めた。
- RigidSSL-MDは,分子動力学軌跡を用いて構造を洗練することで,Gタンパク質共役受容体のより現実的な構造アンサンブルを捉えた。
農業助言のための会話型AIのファインチューニングと評価 [cs.CL, cs.AI, cs.LG]目的:農業助言における会話型AIの性能向上と評価
- 食糧安全保障の観点から,農業技術の普及と生産性向上は重要課題である。
- 既存のLLMは,根拠のない推奨や具体的でない助言,農家ニーズとのずれが生じやすい。
- 専門知識に基づいた正確な情報提供と,農家への適切なコミュニケーションを実現する。
- 専門家が厳選した農業知識を用いてLoRAによるファインチューニングを実施し,事実の想起精度を向上させた。
- 抽出された事実を,文化的に適切かつ安全性を考慮した応答に変換する「ステッチング層」を導入した。
- 専門家による検証に基づいた評価フレームワークDG-EVALにより,事実の再現率,適合率,矛盾検出を評価した。
脆弱な思考:大規模言語モデルにおける思考連鎖の摂動 [cs.CL, cs.AI, cs.LG]目的:大規模言語モデルにおける思考連鎖プロンプティングの頑健性
- 大規模言語モデルの推論能力は,様々な分野で応用が期待されており,その信頼性は重要である。
- 思考連鎖プロンプティングは有効だが,推論過程の途中の摂動に対する脆弱性が不明である。
- 思考連鎖プロンプティングにおける摂動の種類と,モデルサイズとの関係を明らかにすること。
- 数学的誤りを含む摂動は,小規模モデルで大きな性能低下を引き起こすが,モデルサイズを大きくすることで改善する傾向がある。
- 単位換算の摂動は,モデルサイズに関わらず依然として課題であり,大規模モデルでも性能損失が見られる。
- 余分なステップの摂動は,モデルサイズに関わらず,ほとんど性能に影響を与えない。
Phys4D:ビデオ拡散からの微細な物理整合性4Dモデリング [cs.CY, cs.CV, cs.AI, cs.RO]目的:物理整合性4Dワールド表現の学習
- 近年の大規模生成モデルの発展に伴い,現実世界の再現が重要になっている。
- 既存のビデオ拡散モデルは,時間経過に伴う物理的に不自然な挙動を示す場合がある。
- ビデオ拡散モデルから,微細な物理整合性を持つ4Dワールド表現を獲得することを目指す。
- Phys4Dは,大規模な疑似教師あり事前学習,物理に基づいた教師ありファインチューニング,シミュレーションに基づく強化学習という3段階の訓練パラダイムを採用する。
- 実験結果から,Phys4Dは外観ベースのベースラインと比較して,微細な時空間的および物理的一貫性を大幅に向上させることが示された。
- 4Dワールドの一貫性評価指標を導入し,幾何学的コヒーレンス,運動安定性,長期的な物理的妥当性を評価した。
大規模言語モデルによる部分観測タスク・モーションプランニングにおける状態推定 [cs.RO, cs.AI]目的:部分観測環境下におけるロボットプランニングのための状態推定手法
- ロボットが不確実な状況下で効率的に行動するためには,周囲の環境を正確に理解することが重要である。
- 従来のプランニング手法では,観測できない物体や,タスクに関係のない物体への対応が課題であった。
- 本研究では,大規模言語モデルを活用し,常識的な知識に基づいた状態推定を行うことで,この課題の解決を目指す。
- 提案手法CoCo-TAMPは,大規模言語モデルを用いてタスク関連オブジェクトに対する信念を形成する階層的状態推定を導入する。
- シミュレーション実験の結果,CoCo-TAMPは,常識的知識を組み込まないベースラインと比較して,プランニングと実行時間を平均で62.7%削減した。
- 実世界でのデモンストレーションにおいても,平均で72.6%のプランニングと実行時間の削減を達成した。
AI研究開発の自動化の測定 [cs.CY, cs.AI]目的:AI研究開発の自動化の程度と影響の把握
- AI技術の急速な進展は社会に大きな影響を与えており,その動向を正確に把握することが重要である。
- AI研究開発の自動化の程度は不明であり,安全性の進歩とのバランスや,監視体制の維持が課題となっている。
- AI研究開発の自動化の程度と影響を測定するための指標を提示し,適切な安全対策の実施を支援すること。
- 本研究では,AI研究開発における資本配分,研究者の時間配分,AI悪用事例などの指標を提案した。
- これらの指標を通じて,AI研究開発の自動化がAIの進歩と監視に与える影響を定量的に評価することが可能となる。
- 企業や研究機関がこれらの指標を追跡し,政府がその努力を支援することを推奨する。
mlx-vis:Apple SiliconにおけるGPU加速次元削減と可視化 [cs.LG]目的:Apple Silicon向けMLXフレームワークによる次元削減手法と可視化手法の実装
- 機械学習における高次元データの可視化は,データ理解とモデル改善に不可欠である。
- 従来の次元削減手法は,GPUの性能を十分に活用できていない場合がある。
- Apple SiliconのGPU性能を最大限に活用し,高速な次元削減と可視化を実現する。
- 本ライブラリは,UMAP,t-SNEなど6つの次元削減手法をApple SiliconのGPUで高速に実行する。
- Fashion-MNISTデータセットにおいて,次元削減と800フレームのアニメーション生成をM3 Ultraでそれぞれ2.1-3.8秒,1.4秒で完了する。
- データから動画への処理全体は3.6-5.2秒で完了し,高い処理性能を示す。
意味のシミュレーションはもう終わり!LLMテキスト要約の評価のための記号論・解釈学的指標ICRの導入 [cs.DB, cs.DB, cs.CL, cs.AI]目的:LLM生成テキストの要約における意味の評価指標の開発
- 言語の意味は関係性,文脈,そして記号システムの相互作用から生じるため,その理解は不可欠である。
- 既存の評価指標は,統計的な近似に依存し,人間の解釈的な意味理解との乖離が存在する。
- LLM生成テキストの意味の正確性と,参照テキストとの意味的整合性を評価する新たな指標を提案する。
- LLMは高い言語的類似性を達成するものの,文脈依存的な意味の把握において,人間の要約に劣る傾向が確認された。
- データセットの規模が大きくなるほど性能は向上するが,モデルによってばらつきがあり,概念の頻度と一貫性が影響していると考えられる。
- LLM生成テキストの意味評価には,体系的な質的解釈の実践を取り入れた評価枠組みが重要である。
vLLMセマンティックルーター:混合モダリティモデルのためのシグナル駆動型決定ルーティング [cs.NI, cs.AI]目的:混合モダリティモデルの展開における,シグナル駆動型決定ルーティングフレームワーク
- 大規模言語モデルの多様化に伴い,適切なモデル選択がシステム上の重要な課題となっている。
- 推論時に最適なモデルを効率的に選択するルーティング方法が確立されていない。
- 多様な展開シナリオに対応可能な,柔軟で高性能なルーティングフレームワークを構築する。
- 本研究では,多様なシグナルを組み合わせた信号オーケストレーションにより,柔軟なルーティングポリシーを実現した。
- その結果,コード変更なしに,コスト,プライバシー,安全性の異なるポリシーを適用できることを示した。
- このフレームワークは,vLLMをはじめとする多様なバックエンドに対応し,本番環境での実用性も確認された。
物理情報ニューラルネットワークの精度向上:最終層の再学習による [math.NA, cs.LG, cs.NA]目的:物理情報ニューラルネットワークの精度向上
- 科学計算の分野で機械学習の応用が進む中で,物理法則を組み込んだPINNは重要な手法である。
- PINNの学習戦略は明確でなく,得られる解の精度が十分でない場合が多い。
- ネットワークに関連する関数空間での最良近似を求める後処理ステップにより,PINNの精度を改善すること。
- 提案手法は,様々なアーキテクチャや次元において,元のPINNよりも4~5桁低い誤差を達成した。
- 線形空間の基底関数を再利用することで,時間依存問題や非線形問題など,より複雑な設定への転移学習が可能となった。
- 残差に基づいた指標を用いることで,最適な基底関数の数を決定できることが示された。
MOOSE エコシステムのためのドメイン特化型 AI エージェント:MOOSEnger [cs.AI, cs.CE, cs.SE]目的:MOOSE エコシステムにおける入力ファイル生成とデバッグの効率化
- 科学技術計算において,シミュレーションの高速化と効率化は,研究開発の進展に不可欠である。
- MOOSE の入力ファイルは複雑で厳密な構文規則があり,初期設定やデバッグに時間がかかるという課題がある。
- 自然言語による指示から実行可能な入力ファイルを生成し,デバッグ作業を効率化することを目指す。
- MOOSEnger は,自然言語による指示を MOOSE の入力ファイルに変換する会話型ワークフローを提供する。
- Retrieval-augmented generation と MOOSE 固有の解析・検証ツールを組み合わせることで,高い入力生成精度を実現した。
- 125 のプロンプトを用いたベンチマークテストでは,実行成功率 90% を達成し,LLM 単体では 6% に留まった。
時系列予測アルゴリズムの自律的コード生成のための自己進化エージェント SEA-TS [cs.AI]目的:時系列予測アルゴリズムのコードを自律的に生成,検証,最適化するフレームワーク
- 様々な分野における意思決定の基盤であり,その精度向上は重要である。
- 新しい環境への適応が難しく,手動での改善には限界がある。
- データ不足や分布シフトへの対応,自動化による効率的なアルゴリズム開発を目指す。
- SEA-TSは,公開ベンチマークにおいて,TimeMixerと比較して平均絶対誤差を40%削減した。
- 企業データセットにおいて,太陽光発電予測と住宅負荷予測で,それぞれWAPEを8.6%,7.7%削減した。
- 進化的モデルは,太陽放射制約を組み込んだ物理情報に基づいた減衰ヘッドなど,斬新なアルゴリズムパターンを発見した。
十分なLLM難読化 (GELO) [cs.CL, cs.CL, cs.CR, cs.LG]目的:LLMの推論時のプライバシー保護
- LLMの利用拡大に伴い,共有アクセラレータ上での情報漏洩リスクが重要になっている。
- 既存の暗号化技術は速度が遅く,静的難読化は統計的攻撃に脆弱である。
- アクセラレータ上のKVキャッシュ等からの情報漏洩を軽減する軽量なプライバシー保護手法を提案する。
- GELOは,バッチごとに異なる可逆的混合を用いることで,隠れ状態を隠蔽する。
- Llama-2 7Bにおいて,float32出力を正確に維持しつつ,低精度ベースラインに匹敵する性能を達成した。
- GELOは,主要な行列乗算の遅延を20-30%程度に抑え,様々な攻撃を防御できることを示した。
RoboPocket:スマートフォンでロボットのポリシーを即座に改善 [cs.RO, cs.CL, cs.HC, cs.RO, cs.RO, cs.RO, cs.RO, cs.AI, cs.LG]目的:ロボットのポリシー改善におけるデータ収集効率の向上
- ロボットの学習には大量のデータが必要であり,効率的なデータ収集が課題となっている。
- 既存のデータ収集方法は,網羅性やコストの面で問題があり,十分な性能向上が見られない。
- スマートフォンを用いたリモート操作により,物理ロボットを使わずに効率的なデータ収集を実現する。
- RoboPocketは,ARを活用してポリシーの予測軌跡を可視化し,弱点を特定してデータ収集を効率化する。
- オンラインファインチューニングパイプラインにより,収集したデータでポリシーを継続的に更新し,学習ループを短縮する。
- 実験の結果,RoboPocketはデータスケーリング則に従い,既存手法と比較してデータ効率を2倍に向上させた。
大規模言語モデルによるアルゴリズム的共謀 [econ.GN, cs.AI, cs.GT, q-fin.EC]目的:大規模言語モデルに基づく価格設定エージェントのアルゴリズム的共謀
- AI技術の価格設定への応用は,市場効率性と企業収益に大きな影響を与えるため重要である。
- AIエージェントが意図せず共謀し,価格操作を行う可能性が懸念されている。
- 本研究は,大規模言語モデルを用いた価格設定エージェントにおける共謀メカニズムを解明する。
- 大規模言語モデルを用いた価格設定エージェントは,寡占市場において競争を制限し,価格と利益を上昇させる。
- プロンプトのわずかな変更が,価格競争の程度に大きく影響することが示された。
- 価格競争への懸念が,共謀の要因の一つであることが明らかになった。
BInD:多目的構造ベース創薬のための結合・相互作用生成拡散モデル [q-bio.BM, cs.LG, physics.bio-ph]目的:多目的構造ベース創薬のための分子とターゲットタンパク質との相互作用の共生成
- 構造データ蓄積と幾何深層生成モデルの発展により,タンパク質情報のみから薬剤設計が可能となった。
- 既存モデルは特定のタスクに特化しやすく,複数の目的をバランス良く最適化することが困難である。
- ターゲットタンパク質との相互作用,分子特性,局所的な形状を考慮し,バランスの取れた薬剤設計を目指す。
- BInDは,ターゲットタンパク質との相互作用,分子特性,局所形状の全ての目的において堅牢な性能を発揮する。
- 最先端手法と同等またはそれ以上の性能を達成し,多目的最適化の課題を克服した。
- NCI主導の分子設計・最適化手法を提案し,ターゲット結合と特異性の向上を可能にした。
自己整合学習に基づく効率的な自己教師あり地震データ再構成手法 [eess.IV, cs.CV, cs.LG, physics.geo-ph]目的:地震データの再構成
- 地下構造の特性評価には地震探査が不可欠であり,資源探査や防災に貢献する。
- 地形の影響等により受信点の配置が不均一となり,地震データの品質が低下する課題がある。
- 追加データ不要で,安定した地震データ再構成を実現し,探査作業の効率化を目指す。
- 提案手法は,自己整合学習戦略と軽量ネットワークを用いて高品質な再構成を可能にする。
- 追加のデータセットを必要とせず,地震データ内部の成分間相関を活用した損失関数を設計した。
- 公開データセットでの検証により,大規模かつ複雑な地震探査タスクへの有効性が示された。
線形システムに対するエントロピー鏡降下法:ポリアクのステップサイズと暗黙的バイアス [math.OC, cs.LG, stat.ML]目的:線形システムの解法
- 最適化問題の効率的な解法は,機械学習をはじめ様々な分野で不可欠である。
- 領域が有界でない場合,収束性の解析が困難となる点が課題である。
- ポリアク型ステップサイズの導入により,制約なしで収束性を保証することを目指す。
- エントロピー鏡降下法において,ポリアク型ステップサイズを用いることで,線形システムの解法における収束性が示された。
- L1ノルムに対する暗黙的バイアスの上限を強化し,準線形および線形収束の結果を得た。
- 提案手法は,凸L-smooth関数に対しても一般化された収束結果を示し,指数の計算を回避する代替手法も提示した。
反復量子特徴写像 [physics.soc-ph, cs.SI, physics.app-ph, physics.data-an, quant-ph, cs.AI, stat.ML]目的:量子機械学習における特徴量表現の性能向上
- 量子機械学習は,古典計算機では困難な問題を解決する可能性を秘めているため重要である。
- 深層量子特徴写像は,量子ハードウェアの制約やノイズの影響を受けやすく,実用化が課題となっている。
- 本研究は,反復的な構造により,量子計算資源を削減し,ノイズの影響を軽減することを目的とする。
- 提案手法である反復量子特徴写像(IQFMs)は,浅い量子特徴写像を反復的に接続するハイブリッド量子古典フレームワークである。
- IQFMsは,コントラスト学習と層ごとの学習メカニズムを組み込むことで,量子実行時間を削減し,ノイズによる性能劣化を抑制する。
- 実験の結果,ノイズのある量子データにおいて,IQFMsは量子畳み込みニューラルネットワークよりも優れた性能を示した。
収束型画像再構成のための多変量エキスパート場 [eess.IV, cs.CV, cs.LG, eess.SP]目的:画像事前分布の学習に関する新たな枠組み
- 画像処理において,高品質な画像再構成は重要な課題である。ノイズ除去や鮮明化など,様々な応用分野で求められている。
- 既存手法では,計算コストが高い場合や,学習に必要なデータ量が膨大な場合がある。また,解釈性が低いという問題点も存在する。
- 多変量関数を用いたモデルにより,効率的かつ解釈性の高い画像再構成を実現すること。
- 本研究で提案する多変量エキスパート場は,画像ノイズ除去,ぼかし除去,MRIやCTなどの逆問題において優れた性能を発揮する。
- 既存の単変量モデルと比較して性能が向上し,深層学習ベースの正則化手法に匹敵する結果を,より高速かつ少ないパラメータで実現した。
- モデルの構造設計により高い解釈性を保ち,理論的な収束性保証によって信頼性の高い再構成が可能となる。
カーネルVICReg:再生核ヒルベルト空間における自己教師あり学習 [stat.ML, cs.CV, cs.LG]目的:再生核ヒルベルト空間における自己教師あり学習のためのフレームワーク
- ラベルなしで表現学習を行う自己教師あり学習は,近年非常に重要な手法となっている。
- 既存手法はユークリッド空間で動作するため,非線形な依存関係や幾何学的構造の捕捉が困難である。
- カーネル化により非線形な特徴学習を可能にし,表現の崩壊リスクを軽減することを目的とする。
- 提案手法であるKernel VICRegは,MNIST,CIFAR-10,STL-10などのデータセットで,ユークリッド空間におけるVICRegを上回る性能を示した。
- 特に,非線形構造が顕著なデータセットにおいて,顕著な改善が見られた。
- カーネル化による自己教師あり学習は,古典的なカーネル法と最新の表現学習を繋ぐ有望な方向性を示唆している。
ニューラルネットワークアンサンブルを用いた連続測定データからの量子パラメータ推定と不確実性定量化 [quant-ph, cs.LG]目的:量子パラメータ推定における不確実性定量化
- 量子技術の発展には,高精度なパラメータ推定が不可欠である。
- 従来の機械学習手法では,パラメータ推定の不確実性を評価することが困難である。
- ベイズ推論の利点である不確実性定量化を機械学習に導入し,高精度かつ迅速な推定を実現する。
- 深層ニューラルネットワークのアンサンブル(ディープアンサンブル)が,量子パラメータ推定と不確実性定量化に有効であることが示された。
- 精度と不確実性の較正の両方を最適化しても,推定精度が低下することはない。
- アンサンブルモデルは,実験データのドリフトを検出し,従来のベイズ推論よりも高速な推論が可能である。
カルテシアン空間におけるユニバーサル埋め込みを用いたスペクトル/空間テンソル原子クラスター展開 [stat.ML, cond-mat.mtrl-sci, cs.LG, physics.chem-ph]目的:原子レベルでの機械学習モデルの構築
- 物質科学において,原子レベルでのシミュレーションは材料設計や物性予測に不可欠である。
- 従来の球テンソル表現は複雑であり,エネルギーや力の計算以外への拡張が困難である。
- カルテシアンテンソル分解を用いた,より汎用的な原子クラスター展開法を開発すること。
- テンソル原子クラスター展開(TACE)は,スカラーおよびテンソルモデルをカルテシアン空間で統一的に扱うことを可能にする。
- TACEは,フィデリティタグや電荷などの普遍的な不変量,および外部電場などの共変量を効率的に埋め込む。
- 有限分子から拡張材料まで,様々な系で高い精度,安定性,効率性を実証した。
自己推測型マスク拡散 [stat.ML, cs.LG]目的:離散データ生成のための新しいマスク拡散モデル
- 近年の生成モデル研究は,画像やテキストなど多様なデータ生成を可能にする。
- 従来のマスク拡散モデルは,計算コストが高く,高品質なサンプル生成に時間がかかる。
- 本研究は,計算コストを削減し,より効率的なサンプル生成を目指す。
- 自己推測型マスク拡散は,従来のモデルと比較して,必要なネットワークの順伝播回数を約2倍削減できる。
- これは,非因数分解な予測と,モデル統合型推測サンプリング機構によって実現されている。
- GPT2規模のテキストモデリングとタンパク質配列生成において有効性が確認された。
TCR-EML: TCR-pMHC予測のための説明可能なモデル層 [q-bio.QM, cs.CE, cs.LG]目的:TCR-pMHC結合予測における説明可能性の向上
- T細胞応答は免疫の中心であり,ワクチン開発や癌免疫療法に不可欠である。
- 既存の機械学習モデルは予測の根拠が不明瞭であり,解釈性に課題がある。
- 生化学的メカニズムを考慮した説明可能なモデルの構築を試みる。
- 提案手法TCR-EMLは,アミノ酸残基接触のプロトタイプ層を組み込むことで,高精度な予測と説明性を提供する。
- 大規模データセットを用いた実験により,予測精度と汎化性能が確認された。
- TCR-XAIベンチマーク評価では,既存手法と比較して説明性が向上した。
合成データ検証によるモデル崩壊からの脱却:短期的な改善と長期的な収束 [stat.ML, cs.LG]目的:生成モデルの自己生成合成データによる再学習におけるモデル崩壊の回避
- 生成モデルは急速に進歩しており,その性能向上は様々な応用を可能にするため重要である。
- 生成モデルを合成データで再学習すると,モデル性能が低下する「モデル崩壊」という問題が生じることが報告されている。
- 外部の検証器を用いて合成データ再学習を導くことで,モデル崩壊を回避し,性能を向上させることを目指す。
- 外部検証器(人間や高性能モデル)による合成データ検証が,モデル崩壊を防ぐ鍵となることが示された。
- 線形回帰の設定下で理論的に,検証器による再学習が短期的な改善をもたらす一方,最終的には検証器の知識中心にパラメータが収束することを示した。
- 線形回帰,VAE,SmolLM2-135Mのファインチューニング実験により,理論的知見が確認された。
LA-MARRVEL:知識に基づき言語を認識するLLMフレームワークによる臨床的に堅牢な希少疾患遺伝子優先順位付け [q-bio.GN, cs.AI]目的:希少疾患遺伝子優先順位付けの精度向上
- 希少疾患の診断は困難であり,迅速な遺伝子特定が重要である。
- 既存のパイプラインは時間と労力を要し,十分な精度が課題である。
- 患者表現型を考慮したLLMフレームワークによる遺伝子優先順位付けの改善。
- LA-MARRVELは,既存手法と比較してRecall@1を12-15ポイント絶対的に向上させた。
- 表現型情報を明示的に組み込んだプロンプト設計が,精度向上に大きく貢献した。
- 実際のデータセットにおいて,遺伝子ランキング性能が全体的に向上し,臨床レビューを効率化する根拠も示された。
DAISI:確率的補間を用いた逆サンプリングによるデータ同化 [stat.ML, cs.LG, physics.ao-ph]目的:データ同化手法の開発
- 科学技術分野において,モデル予測と観測値を統合し,システム状態を推定する上で不可欠である。
- 複雑な力学系や観測演算子においては,ガウス近似が妥当でなく,高次元データ同化の精度が制限される。
- フローベース生成モデルを活用し,データ駆動型事前分布を用いた柔軟な確率的推論により,この課題を解決する。
- DAISIは,事前学習済みの生成モデルを利用し,予測情報を逆サンプリングステップで組み込むことで,スケーラブルなフィルタリングを可能にする。
- 従来法が苦戦する,疎でノイズが多く非線形な観測下においても,高精度なフィルタリング結果が得られることが示された。
- DAISIは,各同化ステップで生成モデルを再学習・微調整する必要なく,あらゆる予測モデルを同化パイプラインに組み込める。
