arXiv雑要約
AI - 2026/05/14 公開
複雑で混雑した多エージェントパスファインディングのための離散的拡散と疎なソーシャルアテンション [cs.AI, cs.LG, cs.MA]目的:複雑かつ混雑した環境下における多エージェントパスファインディング問題の解決
- ロボットや群知能など,複数エージェントの協調行動を計画する上で重要な課題である。
- 高密度環境下では,初期計画の品質が修理の効率に大きく影響するが,その点が十分に検討されていない。
- 初期計画の品質を向上させることで,修理の効率を高め,より良い解を見つけることを目指す。
- 提案手法DiffLNSは,離散的ノイズ除去拡散確率モデル(D3PM)とLNS2を統合したハイブリッドフレームワークである。
- D3PMは疎なソーシャルアテンションを用いて,エージェントの行動軌跡に関する時空間的事前分布を学習し,多様な初期計画を生成する。
- 実験結果から,DiffLNSは最先端のベースラインを9.6%上回り,平均成功率95.8%を達成した。
PaMM:明示的な局所構造インターフェースを持つ原子モデルのための周期モチーフメモリ [cs.LG]目的:原子モデルにおける周期モチーフメモリの導入
- 結晶構造は周期的な局所構造を繰り返すため,その特性を捉えることが重要である。
- 既存のモデルでは,これらのパターンが暗黙的にしか表現されておらず,性能の限界がある。
- 周期モチーフメモリを導入し,局所構造の表現を明示的にすることで,モデルの性能向上を目指す。
- PaMMを導入したモデルは,エネルギーMAEにおいてゲートのみの変種が,力MAEにおいてアフィン変種が,ベースラインよりも優れていた。
- ペアモチーフ単独,トリプレットモチーフ単独,ランダムバケット,パラメータ調整されたMLPと比較して,PaMMの効果が持続している。
- 特定のUMA-S + OMAT環境において,明示的なモチーフメモリが有効な誘導バイアスであることが示された。
単純かつ統一的なスケーリングによるオリンピアードレベルの推論能力の達成 [cs.AI, cs.CL]目的:オリンピアードレベルの数学・物理問題解決能力
- 高度な推論能力は,数学や科学における複雑な問題解決に不可欠であり,学術的進歩の鍵となる。
- 既存の推論モデルは,長期間にわたる問題解決において,厳密な検証と自己修正が不十分な場合がある。
- 厳密な証明探索と自己検証能力を強化し,オリンピアードレベルの難問に対応できるモデルを開発すること。
- 提案手法により,30B-A3BバックボーンモデルSU-01を訓練し,10万トークンを超える長文にも対応可能な安定した推論能力を実現した。
- SU-01は,国際数学オリンピアード(IMO)や国際物理オリンピアード(IPhO)などの数学・物理競技において,金メダルレベルの成績を達成した。
- 本モデルは,数学・物理以外の科学分野においても,推論能力の優れた汎化性能を示すことが確認された。
線形共地域化モデルにおける不確実な相関行列に対する安全なベイズ最適化 [cs.LG, cs.SY, eess.SY]目的:線形共地域化モデルにおける安全な多タスクベイズ最適化
- 複数のタスクを同時に最適化することで,効率的な学習が可能となるため重要である。
- タスク間の相関が不確実な場合,最適化の安全性確保が課題となる。
- 共地域化モデルの相関行列の不確実性を考慮した安全な最適化手法を確立する。
- 線形共地域化モデルを用いることで,多タスクベイズ最適化における誤差の均一な上限を導出した。
- 線形共地域化モデルは,より柔軟なタスク間相関のモデリングを可能にする。
- 数値実験により,線形共地域化モデルが安全な多タスクベイズ最適化の性能向上に貢献することが示された。
MPINeuralODE:多初期条件物理制約ニューラル常微分方程式による一貫性のある動的システム学習 [cs.LG, math.DS, physics.chem-ph]目的:動的システムの学習におけるグローバルな一貫性
- 複雑な物理現象のモデル化は科学技術の発展に不可欠である。
- ニューラルODEは初期条件や長期間予測において汎化性能が低い場合がある。
- 未知の初期条件と長期間予測における汎化性能の向上を目指す。
- 提案手法MPINeuralODEは,既存のニューラルODEと比較して,外挿誤差と長期間安定性で優れた性能を示した。
- Lotka-Volterraモデルにおいて,MPINeuralODEはデータ駆動型手法の中で最も低い平均二乗誤差を達成し,ベースラインのニューラルODEより26%削減された。
- 物理制約の除去実験において,MPINeuralODEはハミルトニアンドリフトに関してPINNと同等の性能を示した。
IdeaForge:知識グラフに基づいた多エージェントフレームワークによる異種イノベーション分析と特許請求項生成 [cs.CL, cs.HC, cs.DL, cs.DB, cs.IR, cs.AI, cs.IR, cs.MA]目的:異種イノベーション分析および特許請求項生成
- 技術革新は経済成長の源泉であり,その加速は産業競争力強化に不可欠である。
- 既存のAI支援システムは単一手法に偏り,手法間連携が不十分で,体系的な新規性評価が困難である。
- 多様なイノベーション手法を統合し,知識グラフを活用することで,より信頼性の高い発明候補を創出すること。
- 知識グラフを基盤とした多エージェントフレームワークIdeaForgeを開発し,TRIZ,デザイン思考,SCAMPERなどの手法を統合した。
- グラフベースのクレームリンケージ機構により,複数の手法で裏付けられたクレームを特定し,信頼性の高い発明候補を抽出することに成功した。
- 実験の結果,IdeaForgeは単一手法ベースラインと比較して,より多様で追跡可能なイノベーション候補を生成することが示された。
解釈可能な脳ネットワーク解析のための教師あり深層多様体行列分解 [cs.LG]目的:脳ネットワークの統合解析のための解釈可能なフレームワーク
- 脳機能の理解は,精神疾患の診断・治療に不可欠であり,その解析手法の発展が求められている。
- 従来の脳ネットワーク解析は,単一のデータ形式に依存し,多角的な情報統合が困難であった。
- 本研究は,多様な脳データ統合による解析精度の向上と解釈性の確保を目指す。
- SD3MFは,既存の深層学習モデルと比較して,脳ネットワークデータに対する予測性能で一貫して優れた結果を示した。
- コミュニティレベルの相互作用行列を用いることで,生物学的に解釈可能な特徴量を抽出することを可能にした。
- 教師あり深層多様体行列分解は,脳ネットワーク解析における新たなアプローチを提供する。
身体化された神経計算:生物学的ニューラル培養と大規模タスク駆動型検証とのインターフェースのためのフレームワーク [cs.ET, cs.LG, cs.NE, cs.SY, eess.SY, q-bio.NC]目的:生物学的ニューラルネットワークを用いた神経計算の最適化メカニズム
- エネルギー効率と適応性に優れた次世代情報処理基盤として,生物学的ニューラルネットワークへの期待が高まっている。
- 従来のシリコンコンピューティングとのインターフェースにおける,最適な符号化・復号化メカニズムが課題となっていた。
- タスク駆動型アプローチにより,生物学的ニューラルネットワークの潜在能力を最大限に引き出すことを目指す。
- 提案された「身体化された神経計算」フレームワークにより,大規模なパラメータ最適化が可能となった。
- シミュレーション環境下でのナビゲーションタスクにおいて,12の構成が安定的に学習能力を示した。
- 同等の相互作用予算下で,最適化されたシリコンベースのDQNエージェントを上回る性能を達成した。
精神保健における倫理的・責任あるAIの検証:VERA-MH [cs.AI, cs.ET]目的:精神保健支援におけるチャットボットの安全性評価
- メンタルヘルスケアの需要増加に伴い,AIの活用が注目されている。
- チャットボットの安全性評価基準が確立されておらず,リスク管理が課題である。
- 自殺念慮リスクへの対応能力など,チャットボットの倫理的・責任ある運用を検証する。
- 新規評価フレームワークVERA-MHを開発し,臨床的妥当性を検証した。
- 自殺念慮リスクのあるユーザーに対応するチャットボットの応答を評価した。
- 主要なLLMプロバイダー4社の評価結果を示し,課題を明らかにした。
KamonBench:視覚言語モデルにおける構成要素回収の評価のための文法ベースのデータセット [cs.DC, cs.RO, cs.CV, cs.LG]目的:視覚言語モデルにおける構成要素回収の評価
- 視覚と言語を結びつける研究は,画像理解と自然言語処理の融合に不可欠である。
- 既存のデータセットでは,構成要素に基づいた詳細な分析が困難であった。
- 構成要素の識別と組み合わせの理解を評価できるテストベッドの提供
- KamonBenchは,20,000枚の合成家紋画像と関連する記述データを提供する。
- 家紋の構成要素(容器,修飾子,モチーフ)に着目した評価指標を導入した。
- ViTエンコーダー/TransformerデコーダーとVGG n-gramデコーダーのベースライン結果を示した。
ビジョンと言語によるナビゲーションの限界とは何か [cs.RO, cs.AI, cs.CL, cs.CV]目的:実世界におけるビジョンと言語によるナビゲーションの一貫性向上
- 具現化された知能において,ビジョンと言語によるナビゲーションは重要な役割を担う。
- シミュレーションから実世界への展開において,知覚の不安定性や指示の曖昧さが課題である。
- 空間的理解の強化とドメイン横断的な事前知識の活用により,実世界でのナビゲーション問題を解決する。
- StereoNavは,実世界でのナビゲーションの一貫性を高めるための,ロバストなビジョン・言語・行動フレームワークである。
- R2R-CEおよびRxR-CEにおいて,最先端のエゴセントリックRGB性能(SR 81.1%,SPL 68.3%および67.5%,52.0%)を達成した。
- 実世界でのロボットによる実験により,StereoNavが複雑な環境下でのナビゲーションの信頼性を大幅に向上させることが確認された。
LLM事前学習におけるペルソナベクトルの追跡 [cs.CL, cs.AI]目的:大規模言語モデルにおける高水準な行動の内部表現の解明
- AIの安全性確保において,モデル内部の行動表現理解は不可欠である。
- ペルソナベクトルは有用だが,事前学習中にどのように形成されるかは不明であった。
- 事前学習初期にペルソナベクトルが形成・進化する過程を明らかにすること。
- ペルソナベクトルは,OLMo-3-7Bの事前学習の0.22%時点で形成され,最終モデルの制御に有効であることが示された。
- ベクトルは,事前学習を通して幾何学的・意味的に洗練され続けることが明らかになった。
- Apertus-8Bでも同様の結果が得られ,異なるモデルへの一般性も確認された。
抽象的議論における拡張の多様性 [cs.AI, cs.CC]目的:拡張の多様性の定量的な概念
- AIにおける議論モデリングと推論の基盤であり,対立する主張の構造化に不可欠な研究分野である。
- 拡張間の距離が明確でなく,受け入れ可能な視点の相違度合いを把握しにくいという課題がある。
- 拡張の多様性を定量化し,その複雑性を分類することで,議論の構造をより深く理解することを目指す。
- 拡張の多様性は,対称差分に基づいて定義され,異なる拡張がどの程度かけ離れているかを示す指標となる。
- AFがk-多様な拡張を持つかどうかの判定問題,特定の主張をカバーするk-多様な拡張の存在問題,および最大kの計算問題の複雑性クラスを明らかにした。
- 多様性レベルを計算するためのプロトタイプを実装し,評価を行った結果,有用性が確認された。
ハイパーネットワーク駆動低ランク適応による様式化テキストからモーション生成 [cs.CV, cs.AI, cs.GR, cs.LG]目的:テキストによるモーション生成における様式表現の改善
- 人間らしい自然なモーション生成は,バーチャルリアリティやロボット工学等の分野で重要性を増している。
- テキストのみではモーションの細かなニュアンス,すなわち様式を表現することが難しく,精度向上が課題である。
- ハイパーネットワークを用いた低ランク適応により,効率的かつ汎用的な様式制御を可能にすることを目的とする。
- 提案手法は,事前学習済みの拡散モデルに対し,ハイパーネットワーク生成のLoRAパラメータを適用することで,軽量に様式を制御する。
- 様式潜在空間を構造化するコントラスト損失を用いることで,多様な様式特性を捉え,未知の様式への汎化性能を向上させている。
- HumanML3Dおよび100STYLEデータセットにおいて,最先端の様式化結果と,未知の様式に対する改善が確認された。
Ego2World: 自己中心的調理ビデオを信念状態計画のための実行可能な世界に変換 [cs.CL, cs.AI, cs.CV]目的:自己中心的調理ビデオを,グラフ遷移規則によって制御される実行可能な記号的世界へと変換するベンチマーク
- 家庭環境における具現化されたエージェントは,部分観測下での計画が不可欠である。現実的なタスク遂行能力の評価が求められている。
- 既存のベンチマークは能力を十分にテストしていない。ビデオデータセットは受動的で,シミュレータは現実との乖離がある。
- 自己中心的ビデオから再利用可能な遷移規則を抽出し,部分観測下での計画能力を評価する。
- アクションの重複スコアは物理状態の成功を過大評価することが示された。
- 持続的な信念記憶は,タスク完了率を向上させ,不要な視覚探索を減少させる効果が確認された。
- 信念の維持は,具現化されたエージェントの評価における重要な目標であるべきである。
MITRE ATT&CKを活用した行動プロファイリングによるオープンソースSIEMシステムにおける文脈を意識したWeb攻撃検知 [cs.CR, cs.LG]目的:Web攻撃検知の精度向上
- サイバー攻撃は巧妙化の一途をたどっており,組織のセキュリティ対策を脅かす大きな要因となっている。
- 従来のSIEMシステムは,個々のイベントを独立して分析するため,多段階にわたるWebアプリケーション攻撃の特定が困難である。
- 過去の行動履歴を考慮することで,より正確なWeb攻撃検知を実現し,セキュリティレベルを向上させる。
- 本研究で開発したSmart-SIEMは,Wazuh SIEMプラットフォームにAIモジュールとして組み込むことで,攻撃検知のF1スコアを大幅に向上させた。
- 特に,ブルートフォース攻撃や認証突破といった従来検出が困難だった攻撃に対して,100%または98.3%という高い検知率を実現した。
- 自己適応型再学習メカニズムにより,未知の攻撃タイプが出現した場合でも,F1スコアを元の水準まで回復させることが確認された。
過剰思考の誘発:ブラックボックス大規模言語推論モデルに対する階層型遺伝的アルゴリズムに基づくDoS攻撃 [cs.CR, cs.AI]目的:大規模言語推論モデルにおける過剰思考を誘発し,サービス妨害を引き起こすための手法
- 推論能力の高いモデルは様々なシステムに組み込まれているが,その信頼性確保が重要である。
- 入力の不備や矛盾に対し,過剰な推論を行うことで計算資源を浪費する脆弱性が存在する。
- 入力の論理構造を操作することで,モデルの過剰思考を誘発し,DoS攻撃を可能にする。
- 提案手法は,大規模言語推論モデルの出力長を大幅に増加させ,MATHベンチマークで最大26.1倍の増大を達成した。
- この手法は,単純な入力欠損による攻撃よりも優れた性能を示し,異なるモデル間での高い転移性も確認された。
- 過剰思考は現代の推論システムに共通する脆弱性であり,より堅牢な防御策の必要性を示唆している。
言語モデルにおけるパーソナ依存的な嗜好の探求 [cs.CL, cs.AI]目的:言語モデルの嗜好表現の構造
- 大規模言語モデルの性能向上には,モデルの内部メカニズムの理解が不可欠である。
- 言語モデルが示す嗜好は,プロンプトによって変化するため,その制御が課題となる。
- 異なるパーソナが示す嗜好の共有度合いを解明し,制御可能性を探る。
- Gemma-3-27BとQwen-3.5-122Bにおいて,残差ストリーム活性化から嗜好ベクトルが特定された。
- この嗜好ベクトルは,様々なプロンプトや状況下でモデルの嗜好変化を追跡し,Gemma-3-27Bではペアワイズ選択を因果的に制御することが示された。
- この表現はパーソナ間で共有されており,友好的なアシスタントで学習したプローブが,敵対的なパーソナの選択も予測・制御できることが明らかになった。
疑似陽性サンプルによる近道緩和 [cs.LG]目的:モデルが誤った理由で正解することなく,情報のある特徴に依存するように学習すること
- 機械学習モデルの汎化性能向上は重要であり,特に現実世界のデータにおける偏りへの対処が求められる。
- モデルは,訓練データに存在する見かけ上の相関関係(近道)に頼り,汎化性能が低下することがある。
- 追加のバランスの取れたデータやアノテーションなしに,モデルの頑健性を向上させることを目指す。
- モデルが誤った特徴に依存しているインスタンスを特定するための分析手法を提案した。
- 特定されたインスタンスを用いて,重要なニューロンを特定し,その影響を正則化することで,近道への依存を軽減する。
- 提案手法は,追加のデータやアノテーションなしに,モデルの頑健性を向上させることを示した。
インタラクティブ物理シミュレーションのための階層型Transformer事前条件付け [cs.NI, cs.DC, cs.GR, cs.DC, cs.LG, cs.NA, math.NA]目的:リアルタイム物理シミュレーションのためのニューラル事前条件付け手法の改良
- 物理シミュレーションは,工学,科学,エンターテイメントなど広範な分野で不可欠な技術である。
- 従来のニューラル事前条件付けは,長距離結合の効率的な捕捉が課題であった。
- 本研究は,階層型Transformerを用いて,効率的かつ高速な物理シミュレーションを実現することを目指す。
- 階層型Transformer事前条件付けは,H行列分割を基盤とし,O(N)のスケーリングで近似逆行列計算を可能にする。
- コサイン・ハッチンソンプローブ目的関数により,収束に重要なスペクトル部分空間でのMA作用を学習し,条件数を改善する。
- stiff multiphase Poissonシステムにおいて,GPU Jacobi,IC/DILU,neural SPAIと比較して,最大28倍の高速化を実現した。
救急科におけるマルチエージェントシステム:救急デジタルツインの検証研究 [cs.AI, cs.MA]目的:救急科デジタルツインを用いたマルチエージェントシステムの検証
- 救急科は患者ケアと資源管理において課題を抱えており,効率化が求められている。
- 既存のシミュレーションモデルでは,現実の救急科の複雑さを十分に再現できていない。
- 現実世界の救急科の状況を忠実に再現し,資源配分戦略の最適化を目指す。
- 離散事象シミュレーションとエージェントベースモデリングを組み合わせたハイブリッドモデルを開発し,現実の救急科を柔軟にシミュレーションできることを示した。
- シミュレーション結果が既存の研究文献の値と一致することから,モデルの妥当性が確認された。
- マルチエージェントシステムを統合することで,資源配分戦略の自律的な探索が可能となり,救急科運営の改善に貢献することが期待される。
リソース制約のあるデバイス向け確率的学習を用いた文脈的バンディット [cs.LG]目的:リソース制約のあるデバイスにおける文脈的バンディット問題の解決
- 適応型サービスの基盤となる文脈的バンディットは,近年需要が拡大している。
- 標準的な線形バンディットアルゴリズムは,計算・メモリコストが高く,リソース制約のあるデバイスには不向きである。
- 高精度な演算を必要とするHD-CBの課題を,確率的な更新ルールで克服することを目指す。
- 提案手法である確率的HD-CBは,HD-CBと同等の性能を,より少ないビット数で実現した。
- 確率的な更新ルールにより,オーバーフローを抑制しつつ,重要な情報を保持することが可能となった。
- 更新コストを削減し,低精度なコンポーネントでも高精度なバンディット問題を解くことを実現した。
GeoFlowVLM:幾何構造を考慮した凍結型ビジョン言語埋め込みにおける不確実性の同時推定 [cs.LG]目的:ビジョン言語モデルにおける不確実性(アレイリック不確実性とエピステミック不確実性)の同時推定
- ビジョン言語モデルは,画像とテキストの理解において重要な役割を担うため,その性能向上は不可欠である。
- 従来のモデルでは,不確実性を適切に捉えられておらず,予測の信頼性が低いという課題があった。
- 幾何構造を考慮した新しい手法により,不確実性を正確に推定し,モデルの信頼性を向上させることを目指す。
- 提案手法GeoFlowVLMは,球面上のビジョン言語埋め込みの同時分布を学習するアダプターである。
- エントロピーはRecall@1と高い相関を示し,周辺典型的スコアは選択的精度を改善し,良好な校正性能を示した。
- 本研究は,不確実性の推定と解釈可能性の向上に貢献し,より信頼性の高いビジョン言語モデルの構築を可能にする。
AIハーネスエンジニアリング:基盤モデルソフトウェアエージェントのためのランタイム基盤 [eess.SY, cs.SY, cs.SE, cs.AI]目的:基盤モデルソフトウェアエージェントの信頼性を高めるためのランタイム基盤の設計と評価
- 近年の基盤モデルの発展は自動コード生成を飛躍的に向上させたが,現実的な開発環境での自律的なソフトウェアエンジニアリングエージェントの信頼性は課題である。
- 既存研究ではモデル自体の能力不足が問題視されてきたが,ソフトウェアエンジニアリング能力はモデル,ハーネス,環境のシステム全体から生まれる。
- モデルと環境を仲介するハーネスの重要性を認識し,その構成要素と段階的なサポートレベルを定義することで,検証可能な変更を可能にする。
- AIハーネスエンジニアリングを形式化し,タスク仕様,コンテキスト選択,ツールアクセスなど11の要素を特定した。
- ハーネスレベルをH0からH3までの4段階で運用化し,エージェントの実行を監査可能なエピソードパッケージに変換する評価プロトコルを提案した。
- 実験の結果,ハーネスレベルの上昇に伴い,エピソードパッケージの証拠構造が系統的に変化し,より詳細なログや検証レポートが生成された。
非同期I/Oと推測的ツール呼び出しによるインタラクティブなリアルタイムエージェントの構築 [cs.LG]目的:リアルタイム性を有するエージェントの構築
- 顧客サービスやパーソナルアシスタント等の分野で,自律的なAI技術への需要が高まっている。
- LLMによる推論とツール呼び出しの実行は遅延を生じやすく,リアルタイムな応答性を阻害する。
- 複雑なマルチターンツール呼び出しを行うエージェントでもリアルタイムな対話を可能にすることを目指す。
- 非同期I/Oにより,エージェントの処理と外部からの情報待ちを分離し,オーバーラップ処理を実現した。
- 推測的ツール呼び出しにより,情報が不完全な状態でもタスク実行を管理し,応答速度を向上させた。
- クラウドモデルでは1.3-1.7倍の高速化,小規模モデルでは1.6-2.2倍の高速化をベンチマークで確認した。
計量空間における憲法による統治 [cs.MA, cs.AI, cs.DC, cs.GT, econ.TH]目的:デジタルコミュニティや組織における憲法に基づく民主的統治の包括的解決策
- 社会選択理論とアルゴリズム的決定理論は重要である。集団的意思決定の基盤となる理論的枠組みを提供するから。
- 既存研究では,集約,熟議,改正,合意形成が孤立しており,効率的な統治プロセスを構築できないという課題がある。
- 計量空間における憲法による統治を提案することで,これらの段階を統合し,効率的な意思決定プロセスを確立することを目指す。
- 本研究では,憲法を定めることで,各要素に計量空間,集約規則,超多数決の閾値を割り当てる。
- 一般化された中央値を用いることで,誠実な投票が弱支配されないことが証明された。
- シミュレーションにより,単純なヒューリスティックを用いることで,最適なピークと制約なしの最適値の妥協ギャップが縮小されることが示された。
ゲノ合成アルゴリズム:異質遺伝子型と組み立てられた表現型のためのタイプファクタを用いた共進化最適化 [cs.NE]目的:異質パラメータを持つ複合設計対象の最適化
- 現実世界の最適化問題は多様であり,従来のベクトル最適化手法では対応が難しい場合が多い。
- 従来の進化アルゴリズムは,異質なパラメータを単一の染色体に圧縮するため,表現の忠実度が低下する。
- 表現のタイプごとに遺伝子を分割し,タイプ固有の演算子を用いることで,最適化性能の向上を目指す。
- ゲノ合成アルゴリズム(GSA)は,複素数値記述子や埋め込みベクトルを含む遺伝子群でも動作する唯一の手法である。
- 滑らかな多家族合成問題では,調整されたフラット化された差分進化が依然として最も強力なベースラインである。
- BBOB-MixIntにおいて,GSA_DIRECTはFLATTENED_DEと統計的に区別がつかず,FLATTENED_EAは順位が低下した。
電気生理学におけるニューラルサロゲート前方モデル:細胞内伝導テンソルの明示的な指定なし [cs.CV, cs.LG]目的:心臓電気生理学における前方モデルの精度向上
- 非侵襲的心臓電気生理学は,特に心房細動の診断・治療において重要である。
- 従来の物理モデルは細胞内伝導テンソルの正確な情報に依存し,臨床的な課題となっていた。
- 細胞内伝導テンソルを用いずに,高精度な前方モデルを構築し,不確実性を低減すること。
- 深層学習モデルが,74例のデータから左心房の細胞内電位と遠位心電図の関係を学習した。
- モデルはR2値0.949±0.037を達成し,高い予測精度を示した。
- 本研究は,構造的不確実性の低減と非侵襲的な心房細動評価の改善に貢献する可能性がある。
NLデータ複雑性を持つDL-LiteのHorn拡張 [cs.LO, cs.AI, cs.DB]目的:オントロジーを介したクエリ応答の効率的な手法
- オントロジーを基盤としたデータ管理は,知識表現と推論を通じて高度なデータ活用を実現する。
- 既存のDL-Lite以外の記述論理では,データ複雑性に関する計算困難性が示されており,実用的なクエリ書き換えが制限されている。
- より表現力豊かな記述論理を維持しつつ,グラフクエリ言語への書き換えを可能にする新たな手法を確立すること。
- ELIの層状化メカニズムを導入し,DL-Liteを厳密に拡張するELbotpreceqという記述論理を提案した。
- ELbotpreceqは到達可能性公理と制限された連言をサポートし,NL時間で推論が可能であることを示した。
- 提案言語をGQLのフラグメントであるネストされた双方向正規パスクエリに書き換えることで,NLの上界を確立した。
クエリ条件付きテスト時自己教師あり学習による大規模言語モデルの性能向上 [cs.CL, cs.CL, cs.AI, cs.LG]目的:大規模言語モデルにおけるテスト時の自己適応メカニズム
- 大規模言語モデルの活用は広がるが,推論時の計算コストや性能向上が課題。
- 従来のテスト時最適化は外部データ依存や汎用的な学習目標に偏りがち。
- 入力クエリ自体に含まれる情報を活用し,クエリに特化した適応を目指す。
- 提案手法QueSTは,入力クエリから問題と解答のペアを生成し,パラメータ効率の良いファインチューニングを行う。
- 外部データを用いず,クエリ固有の適応を実現し,数学的推論および科学的推論タスクで既存手法を上回る性能を示した。
- クエリ条件付き自己教師あり学習は,大規模言語モデルのテスト時適応のための効果的かつ実用的な手法である。
ファゾーメモリネットワーク:スケーラブルな明示的メモリのための安定した時間遡及誤差逆伝播 [cs.LG, cs.CL]目的:時間遡及誤差逆伝播における勾配の不安定性を克服する,スケーラブルな明示的メモリアーキテクチャの開発
- 言語モデリングにおいて,長期依存関係を捉えるために明示的メモリの利用が期待されている。
- 従来の明示的メモリアーキテクチャは,時間遡及誤差逆伝播時の勾配消失や爆発といった問題に直面していた。
- 本研究は,勾配の安定性を構造的に保証することで,スケーラブルな明示的メモリの実現を目指す。
- ファゾーメモリネットワーク(PMNet)は,複素円上の位相回転による状態更新制約により,勾配ノルムを維持し,発散を抑制する。
- 合成Copy-Pasteタスクにおいて,PMNetは85スロットの階層的メモリツリーを用いて,局所的な注意機構の受容野を超える時間距離での正確な検索を実現した。
- PMNetは,より大きなモデルと比較して,ゼロショットの長文コンテキストに対する頑健性を同等レベルで達成した。
GRIP-VLM:効率的な視覚言語モデルのためのグループ相対重要度プルーニング [cs.CL, cs.CV, cs.AI]目的:視覚言語モデルの効率化のためのプルーニング手法
- 視覚言語モデルは多様な応用を持つが,計算コストが高い点が課題である。
- 既存のプルーニング手法は勾配近似に依存し,離散的な最適化問題への対応が不十分である。
- 強化学習を用いて離散的な選択空間を直接探索し,より効率的なプルーニングを実現する。
- GRIP-VLMは,既存のプルーニング手法と比較して,より優れた性能を示すことが確認された。
- 多様なマルチモーダルベンチマークにおいて,同等以上の精度を維持しつつ,最大15%の推論速度向上を達成した。
- 予算を考慮したスコアリング機構により,任意の圧縮率に適応可能である。
GNNにおける信号伝搬の理解:観測可能量によるアプローチ [cs.RO, cs.LG]目的:GNNにおける信号伝搬のメカニズム解明
- グラフ構造データは様々な分野で利用され,GNNはその分析手法として重要である。
- GNNは信号伝搬時に情報損失が起こりやすく,意図した領域へのルーティングが困難になる。
- 量子力学の観測可能量に着想を得て,GNNの信号伝搬能力向上を目指す。
- 標準的なスペクトルGNNは,信号伝搬能力が低いことが理論的に証明された。
- 提案手法であるSchrödinger GNNは,信号をグラフ全体に効率的にルーティングできることが示された。
- 観測可能量に基づく新たなモデリングにより,GNNの信号伝搬メカニズムを詳細に理解することが可能になった。
演繹的誤り下における教育と学習 [cs.LG]目的:演繹的誤りを考慮した教育と学習の枠組み
- 機械学習における教師あり学習の効率化は重要であり,学習者の能力を最大限に引き出す鍵となる。
- 従来のモデルでは学習者の演繹的推論における誤りが無視されており,現実の学習者の挙動と乖離が生じている。
- 少量のデータで学習する環境下における学習者の誤りを考慮し,より現実的な教育戦略を確立すること。
- 演繹的誤りを考慮したPAC学習の枠組みを理論的に分析し,教師が適切な教育セットを見つけるための条件を明らかにした。
- 最適な教育セットを計算するための6つの問題について計算複雑性を評価し,ETHなどの標準的な複雑性仮定下で実行時間の上界を導出した。
- 大規模言語モデルの教育セッションにおける観測された行動を最もよく表現できる教育と学習プロトコルを実験的に調査した。
サポート条件付きフローマッチングはカーネル平滑化である [cs.FL, cs.LG, stat.ML]目的:生成モデルにおける条件付けの理論的基盤の解明
- 生成モデルはデータ生成において重要な役割を担うが,その性能は条件付けに大きく依存する。
- 従来の条件付け手法は,高次元データや複雑なデータ構造に対して性能が低下する課題がある。
- カーネル理論に基づき,条件付けのメカニズムを理解し,その改善策を提示することを目指す。
- 有限サポート集合による速度場は,フロー時間とともに帯域幅が減少するNadaraya-Watsonカーネル平滑化器に対応することが示された。
- 単一のガウスカーネル注意ヘッドがこの速度場を正確に計算し,クロスアテンション条件付けと古典的なカーネル理論を結びつける。
- 実験結果は,学習された条件付けが,高次元,データ形状との不一致,サポート不足といった課題に対して改善されることを確認した。
RS-Claw:リモートセンシングエージェントのための階層型スキルツリーによる漸進的アクティブツール探索 [eess.SY, cs.SY, cs.AI]目的:リモートセンシングツール空間におけるエージェントの能動的なツール探索
- リモートセンシング技術は,地球観測において不可欠であり,多岐にわたる課題解決に貢献する。
- 既存のツール選択方法は,大規模で多様なツール群において,コンテキスト負荷とツールセットの網羅性のバランスを取ることが困難である。
- RS-Clawは,ツール空間の能動的な探索を通じて,この課題を解決し,効率的なツール利用を実現する。
- RS-Clawは,ツール記述を階層的に構造化することで,エージェントのコンテキスト空間を大幅に解放する。
- 実験結果から,RS-Clawは,既存のFlatやRAGベースラインを上回り,複雑な推論タスクにおいて高い性能を示す。
- 入力トークンの圧縮率が最大86%に達し,ノイズのフィルタリングと推論空間の自由化に貢献する。
長尾分布への対処:適応的摂動による敵対的学習の再調整 [cs.LG, cs.CV]目的:敵対的学習における摂動の調整
- 深層学習モデルの脆弱性対策は,実用化において不可欠である。
- 現実世界のデータは長尾分布を示すことが多く,既存の敵対的学習法では対応が難しい。
- 長尾分布データに対する敵対的学習の安定性と性能向上を目指す。
- 提案手法RobustLTは,敵対的学習中に摂動を適応的に調整することで,長尾分布データにおけるモデルのロバスト性を向上させる。
- RobustLTは,クラス不均衡と敵対的脆弱性の両方を同時に緩和する効果がある。
- 実験結果から,RobustLTが長尾データセットにおいて一貫して高い性能を示すことが確認された。
拡散エンコーダ [cs.AR, cs.DB, cs.DC, cs.LG, cs.IT, math.IT]目的:拡散モデルを活用した新しいエンコーダの構築
- 潜在空間の学習は,画像生成や表現学習において重要な役割を担う。
- 変分オートエンコーダでは,エンコーダの分布の制約が課題となる。
- エンコーダとデコーダの同期を改善し,より表現力豊かな潜在空間を学習する。
- 拡散モデルをエンコーダに適用するため,期待値最大化アルゴリズムに着想を得た交互学習法を開発した。
- この手法により,エンコーダとデコーダの信頼性の高い同期が可能となり,標準的な拡散モデルの効率的な学習目標を維持する。
- 従来の変分オートエンコーダにおけるエンコーダの制約を緩和し,潜在表現の質を向上させることが期待される。
オフライン強化学習のための軌跡レベルデータ拡張 [cs.LG, cs.RO, stat.ML]目的:オフライン強化学習におけるデータ拡張手法
- ロボット制御等に応用が期待され,実環境での学習効率向上が重要である。
- 限られた不完全な軌跡データからの学習は,性能向上において課題となる。
- 不完全な軌跡データに対しても有効な学習を可能とする手法を提案する。
- 本研究で提案する軌跡ベースの拡張手法は,タスク構造と報酬・価値関数の関係を利用する。
- データ収集時の不完全なログポリシーを支援し,データ品質とオフライン強化学習の性能を向上させる。
- 様々な次元,部分観測下での位置決めタスクにおいて,理論的・実験的な検証を行った。
言語モデルのスケールアップにおいて,ウォームスタートはいつ有効か [cs.LG]目的:言語モデルのスケールアップにおけるウォームスタートの有効性
- 大規模言語モデルの学習コスト削減が重要視されており,ウォームスタートはその有効な手段となり得る。
- ウォームスタートは,その効果が理論的に示唆されながらも,実用的な採用例が少ない。
- ウォームスタートの効果を最大限に引き出すための条件と限界を明らかにすること。
- 初期性能の維持は最終的な性能に必須ではないことが示された。
- 単純な成長戦略が複雑なウォームスタート手法よりも優れている場合がある。
- 成長率の上限を超えると,最初から学習する方が効率的であることが経験的に確認された。
ベクトル量子化された離散潜在要素と金融事前知識の融合:ポートフォリオ構築のための動的なクロスセクション株価ランキング予測 [cs.LG, cs.CE, q-fin.ST]目的:クロスセクション株価ランキング予測の改善
- 金融市場における資産運用において,株価の変動予測は収益向上に不可欠である。
- 従来のファクターモデルは解釈性に優れるものの柔軟性に欠け,深層学習モデルは金融事前知識の活用が不十分である。
- 金融事前知識と学習された潜在要素を統合し,解釈性と予測精度の両立を目指す。
- PRISM-VQは,クロスセクション構造から学習したベクトル量子化された潜在要素と専門家による事前知識を融合する。
- CSI 300およびS&P 500における実験により,既存手法と比較してクロスセクションリターン予測とポートフォリオパフォーマンスが向上することが示された。
- ベクトル量子化はノイズを抑制し,堅牢な市場構造を捉え,解釈性を維持する。
デンマーク難民申請決定における信用性評価の注釈作成におけるLLMの活用:分類性能と集約指標を超えたエラー評価 [cs.CL, cs.AI]目的:デンマーク語難民申請決定文における信用性評価の有無と感情の特定
- 難民申請は人道的な問題であり,迅速かつ正確な判断が求められる。
- 専門知識を要する分野や少数言語におけるLLMの有効性は未解明な点が多い。
- LLMを活用した難民申請決定文の効率的なラベル付与の可能性と限界を明らかにすること。
- LLMは難民申請決定のラベル付与においてコスト効率の良い可能性を示すが,その性能は完全ではなく一貫性がない。
- モデルやプロンプトの選択がゼロショットおよびフューショット分類に影響を与えることが確認された。
- 単一のモデルの予測だけでなく,LLMの注釈作成者の不完全性と不整合性を考慮する必要がある。
TRIAGE:リソース制約下におけるLLMの将来的なメタ認知制御の評価 [cs.AI]目的:言語モデルにおける将来的なメタ認知制御の評価
- 自律エージェントの実現には,タスク精度だけでなく,リソース配分能力が重要である。
- 限られたリソース下で最適なタスク選択・順序決定が困難である。
- LLMが将来的なメタ認知制御能力を持つか検証し,効率的なエージェント展開を目指す。
- TRIAGEという評価フレームワークを導入し,タスク選択,順序,リソース配分を評価した。
- 最先端モデルおよびオープンソースモデルにおいて,将来的なメタ認知制御に大きな課題があることが判明した。
- この研究は,リソース効率の良いエージェント展開のための新たな能力次元を明らかにした。
多言語基盤モデルを用いた継続学習 [cs.CL, cs.AI, cs.LG]目的:多言語ソーシャルメディアにおける再利用された侮辱語の検出
- ソーシャルメディア上でのヘイトスピーチ対策は,多様性を尊重する社会の実現に不可欠である。
- 侮辱語の再利用という現象は,感情分析や言語理解の既存手法では捉えきれない。
- 多言語における侮辱語の文脈に応じた識別を可能にするフレームワークを構築する。
- クロスバリデーションによるモデル選択,バックトランスレーションによるデータ拡張,動的アンダーサンプリングなどの手法を組み合わせた。
- XLM-RoBERTaが,マクロ平均F1スコアにおいて最も優れた性能を示した。
- 言語固有の閾値最適化により,モデルの再学習なしにF1スコアが2-5%絶対的に向上した。
DP-KFC:プライバシー保護深層学習のためのデータフリー事前条件付け [cs.LG]目的:プライバシー保護深層学習のための事前条件付け手法
- 個人情報保護の重要性が高まる中,プライバシー保護機械学習のニーズは増加している。
- 差分プライバシー最適化では,損失関数の形状と注入ノイズの異方性が不一致する。
- プライベートデータや公開データに頼らず,カーバチャを推定する手法を開発する。
- DP-KFCは,合成ノイズを用いてネットワークをプローブすることで,KFAC事前条件付け器を構築する。
- DP-KFCは,DP-SGDや適応的なベースラインと比較して,強いプライバシー条件下で一貫して優れた性能を発揮する。
- DP-KFCはプライベートデータ事前条件付け器に匹敵し,公開データを用いたものは最大4.8%低下する。
LIFT:表の構造化のための最終段階の微調整 [cs.LG, cs.CL]目的:表の構造化におけるエラー修正
- 自然言語処理の発展により,非構造化データからの情報抽出が重要になっている。
- 既存の表構造化手法は,入力形式の変化に弱く,学習データが限られる場合がある。
- 限られたデータでもロバストな表構造化を実現すること。
- 提案手法LIFTは,大規模言語モデルと小規模言語モデルを組み合わせることで,既存手法と同等以上の性能を示す。
- 特に,学習データが少ない環境下や入力形式が変動する場合において,LIFTは優れた性能を発揮する。
- LIFTは,わずか1,000件の学習データで,エンドツーエンドの微調整を最大0.144 TEDSポイント上回る。
幾何学的定義可能性による戦略的PAC学習可能性 [cs.LG, math.AG]目的:戦略的学習におけるサンプル複雑度の制御
- 特徴量の操作を許容する状況下での学習理論の発展が求められている。
- 特徴量操作によって,容易な学習問題が非学習可能となる場合がある。
- 幾何学的定義可能性という構造を導入することで,学習可能性を維持する。
- 戦略的行動は,単純なケースでも学習を不可能にする可能性があることが示された。
- 仮説クラスとコスト構造を$\mathbb{R}_{\mathtt{exp}}$上の1階述式で定義できる場合,学習可能性が保持される。
- 定義する述式の複雑度によって,サンプル複雑度が制御されることが証明された。
大規模生成推薦のための高速学習システム TurboGR [cs.DC, cs.LG]目的:大規模生成推薦モデルの学習システム
- 推薦システムの精度向上は,ユーザー体験の向上やビジネス成果に直結する重要な課題である。
- Transformerベースの生成推薦モデルは計算コストが高く,Ascend NPUでの効率的な学習が困難である。
- Ascend NPUに最適化された学習システムを構築し,生成推薦モデルの学習効率を改善する。
- TurboGRは,Ascend NPUにおける学習のボトルネックを解消するため,ジャグド演算の高速化,分散通信の最適化,負例サンプリングの効率化という3つの革新的な技術を導入している。
- KuaiRand-27Kデータセットを用いた評価では,TurboGRは最大0.2Bパラメータのモデルを学習でき,MFU 54.71%を達成し,ほぼ線形的なスケーラビリティ(0.97)を示した。
- デバイス間の負荷分散率を47%から2.4%に大幅に改善し,NPU利用率を94%に維持することに成功した。
再スケーリング非同期SGD:データとシステム異質性下での最適な分散最適化 [cs.LG, cs.DC, math.OC, stat.ML]目的:分散学習における非同期確率的勾配降下法(ASGD)の最適化
- 機械学習の効率化に不可欠な分散学習の基盤技術である。
- 異質性のある計算資源下では,ASGDが局所的な目的関数に偏る問題がある。
- 計算時間を考慮したステップサイズ調整により,ASGDのバイアスを解消すること。
- 再スケーリングASGDは,各ワーカーの集約学習率を等しくすることで正しい目的関数に収束する。
- 非凸な設定下,滑らかさと有界な異質性仮定のもとで定常点に収束することを証明した。
- 実験結果は,正しい目的関数への収束と最先端のベースラインとの競争力を示している。
Q-Flow:フローベースの方策による安定かつ表現力の高い強化学習 [cs.LG, cs.AI]目的:フローベースの方策を用いた強化学習における価値最大化
- 強化学習は,複雑な意思決定問題を解決する上で重要な技術であり,その性能向上は様々な分野に貢献する。
- フローベースの方策は表現力に優れるが,数値ソルバーを通る勾配計算の不安定性が課題となっていた。
- フローの決定論的性質を利用し,安定した方策最適化を実現し,表現力と安定性の両立を目指す。
- Q-Flowは,方策誘導フローに沿って終端軌道の価値を中間潜在状態へ明示的に伝播させることで,数値ソルバーの展開なしに中間価値勾配を用いた安定した方策最適化を可能にした。
- オフライン学習設定において,難易度の高いOGBenchスイートで,Q-Flowは最先端のベースラインを平均10.6パーセントポイント上回る性能を示した。
- 同じフレームワーク内で,安定したオンライン適応も可能であることを示した。
