arXiv雑要約
AI - 2026/03/17 公開
精神の計算概念 [cs.AI, cs.SY, eess.SY]目的:精神のモデル化に関するアプローチの概要
- 人工知能研究において,人間の精神構造の理解は不可欠である。
- 既存のAIは,柔軟性や適応性に欠け,汎用的な知能を実現できていない。
- ニーズに基づいた意思決定システムにより,汎用人工知能の構築を目指す。
- 精神を主体(生物・人工)のオペレーティングシステムと捉える概念が提案された。
- 状態空間内で,ニーズを考慮した経験学習による人工汎用知能の実現可能性が示唆された。
- 不確実性下で最適な意思決定を行うシステムとして,汎用人工知能構築の問題が定式化された。
ハイブリッドxLSTMアーキテクチャへの効果的な知識蒸留 [eess.SY, cs.SY, cs.AR, cs.LG]目的:知識蒸留による性能向上
- 大規模言語モデルの利用拡大のため,計算資源の削減が重要である。
- 既存の知識蒸留では,教師モデルの性能を十分に再現できない場合が多い。
- xLSTMを用いた蒸留パイプラインにより,教師モデルの性能を可能な限り再現すること。
- 本研究で提案する蒸留パイプラインは,Llama,Qwen,Olmoなどのモデルにおいて有効であることが示された。
- 蒸留されたxLSTMベースの生徒モデルは,多くのケースで教師モデルの性能をほぼ回復し,一部のタスクでは上回った。
- この研究は,TransformerベースのLLMに代わる,よりエネルギー効率が高く費用対効果の高いモデル開発への重要な一歩となる。
OpenSeeker:トレーニングデータを完全オープンソース化することで,最先端の検索エージェントを民主化する [cs.AI, cs.CL]目的:最先端の検索エージェント開発のためのトレーニングデータセットの提供
- LLMエージェントの性能向上に検索能力は不可欠であり,その発展は重要である。
- 高品質なトレーニングデータの不足が,研究コミュニティの発展を阻害している。
- 透明性の高いトレーニングデータセットを提供し,研究開発を促進することを目指す。
- OpenSeekerは,11.7kの合成サンプルのみで,最先端の検索性能を達成した。
- BrowseCompなどの複数のベンチマークで,他のオープンソースエージェントを大きく上回る性能を示した。
- Tongyi DeepResearchといった産業界の競合他社を,一部ベンチマークで上回る結果となった。
敵対的汚染と重い裾を持つノイズ下におけるロバストで計算効率の高い線形文脈バンディット [cs.LG]目的:敵対的汚染と重い裾を持つノイズ下における線形文脈バンディット問題の解決
- 文脈バンディットは,パーソナライズされた意思決定において重要な役割を果たすため,幅広い応用が期待される。
- 従来の線形文脈バンディット研究では,分散有限性の仮定や計算効率の悪さが課題となっていた。
- 本研究は,敵対的汚染と重い裾を持つノイズの両方に対応しつつ,計算効率の高いアルゴリズムを開発することを目指す。
- 提案アルゴリズムはオンラインミラー降下法に基づき,既存アルゴリズムと比較して計算コストを大幅に削減した。
- 本研究では,ノイズの$(1+\epsilon)$-次モーメントと汚染総量に依存する加法的な後悔限界を確立した。
- 汚染がない場合,重い裾を持つノイズ下における線形文脈バンディットの最良既知のレートに一致する結果が得られた。
参照音声誘導によるビデオからの音声合成:音響転送 [cs.SD, cs.CV, cs.LG, cs.MM, eess.AS]目的:ビデオからの音声合成における音響制御の精密化
- 映像と音響の連携は,没入感のあるマルチメディア体験の創出に不可欠である。
- 既存手法は,テキストラベルの曖昧さや音響的詳細の記述の難しさにより,精緻な音声合成が困難である。
- 参照音声を用いることで,テキストの曖昧さを回避し,音響属性の精密な操作を実現することを目指す。
- AC-Foleyは,参照音声に基づいて,従来のビデオからの音声合成モデルを凌駕する性能を示す。
- 参照音声を使用しない場合でも,最先端のビデオからの音声合成モデルと同等の競争力を持つ。
- 本手法は,音色の転送,ゼロショット音声生成,そして音質の向上を可能にする。
SmartSearch:ランキングが構造に勝る会話型記憶検索 [cs.LG]目的:会話型記憶検索におけるランキングの重要性
- 対話システムの性能向上には,過去の会話内容を適切に活用することが不可欠である。
- 既存手法では,会話内容の構造化や学習ベースの検索ポリシーに依存し,計算コストが高い。
- 非構造化データからの効率的な情報検索と,ランキングによる精度向上を目指す。
- SmartSearchは,構造化や学習に頼らず,高い再現率(98.6%)を達成した。
- ランキングにより,トークン制限下でも重要な情報を維持し,高い精度を実現(LoCoMo: 93.5%, LongMemEval-S: 88.4%)。
- 既存システムを凌駕し,トークン使用量を大幅に削減(8.5倍削減)した。
受動的観察者から積極的批判者へ:強化学習がロボットマニピュレーションのためのプロセス推論を引き出す [cs.RO, cs.AI, cs.CL, cs.CV]目的:ロボットマニピュレーションにおけるプロセス推論の改善
- 長期的ロボットマニピュレーションの精度向上は重要課題である。
- 既存の視覚言語モデルは,タスク目標との関連性評価が不十分である。
- 強化学習を用いて,より積極的なプロセス評価を実現する。
- PRIMO R1は,既存の視覚言語モデルを「観察者」から「批判者」へと変革する。
- PRIMO R1は,専門的な推論ベースラインと比較して平均絶対誤差を50%削減した。
- RoboFailベンチマークにおいて67.0%の精度を達成し,OpenAI o1を6.0%上回る性能を示した。
反実的説明の評価指標はユーザーの認識と一致するか? [cs.RO, cs.RO, cs.AI, cs.HC]目的:反実的説明の評価指標と人間の評価の間の関連性
- AIシステムの信頼性確保には,説明可能性が不可欠であると考えられている。
- 既存の評価指標はアルゴリズムに基づき,人間の主観的な評価との整合性が確認されていない。
- 人間の評価との乖離を明らかにし,より人間中心な評価手法の必要性を示す。
- アルゴリズム評価指標と人間の評価の間には,一般的に弱い相関が見られた。
- 相関の強さはデータセットに強く依存し,指標の組み合わせによる予測性能の向上は限定的であった。
- 既存の評価指標は,ユーザーが重視する説明の質を十分に捉えられていない可能性が示唆された。
言語モデルにおける道徳的無関心のメカニズム的起源 [cs.CL, cs.AI]目的:言語モデルにおける道徳的無関心のメカニズム解明と改善
- 大規模言語モデルの安全性確保は,社会実装において不可欠であり,倫理的な観点からも重要である。
- 既存手法では,表面的な道徳的適合性と内部表現の乖離が見られ,予期せぬリスクを生む可能性がある。
- 言語モデル内部表現における道徳的無関心に対処し,より安全で信頼性の高いAIを開発することを目指す。
- 大規模言語モデル23種において,道徳概念の区別や細かなニュアンスの表現が不十分であることが確認された。
- Qwen3-8Bに対し,スパースオートエンコーダを用いて道徳的特徴を分離・再構築することで,表現のずれを是正した。
- 道徳的表現の改善により,対立的ベンチマークFlamesにおいて75%の勝率を達成し,道徳的推論能力が向上した。
HorizonMath:自動検証による数学的発見へのAIの進歩測定 [cs.LG]目的:数学的発見に向けたAIの進歩の測定
- 数学は科学技術の基盤であり,その進歩は社会全体の発展に不可欠である。
- 未解決問題へのAIの取り組みは初期段階であり,真の数学的発見能力の評価が難しい。
- 未解決問題に対するAIの解決能力を検証可能な形で評価し,数学研究への貢献を促す。
- HorizonMathは,8つの分野にわたる100以上の未解決問題を含むベンチマークである。
- GPT-5.4 Proは,2つの問題に対して既存の結果を上回る解を提案しており,潜在的な新しい貢献となる可能性がある。
- HorizonMathは,未解決問題へのAIの挑戦を促進し,数学文献への新たな結果の創出を支援するオープンなリソースとして公開されている。
深さ混合型アテンション [cs.CL, cs.AI]目的:大規模言語モデルにおける信号減衰の抑制
- 大規模言語モデルの性能向上には,モデルの深さが重要な要素である。
- 深層化に伴い,浅層で形成された重要な特徴が希釈され,深層での回復が困難になる。
- MoDAは深さ方向に情報を伝播させ,信号減衰を軽減することで性能向上を目指す。
- MoDAは,各アテンションヘッドが現在の層と先行層のKVペアの両方を参照する仕組みである。
- 1.5Bパラメータモデルの実験で,MoDAは既存手法を凌駕し,平均パープレキシティを0.2改善した。
- ダウンストリームタスク10種類で平均性能を2.11%向上させ,計算コストの増加はわずか3.7%であった。
ブロックベースの不確実性を活用した構造表現の学習:海底地形マッピングへの応用 [cs.LG, cs.AI, cs.CE, cs.CV, stat.ML]目的:海底地形マッピングのための構造表現の学習と不確実性の定量化
- 高精度な海洋モデリングや沿岸災害予測には高解像度な水深データが不可欠である。
- 既存の世界的な水深データは粗く,正確な数値シミュレーションには不十分である。
- 物理的な構造の一貫性を保ちつつ,海底地形の不確実性を定量化する手法を開発すること。
- ブロックベースの conformal prediction を用いることで,局所的な地形の複雑さを効率的に捉え,空間適応的な信頼性推定を実現した。
- 提案手法は,構造的整合性を維持しつつ,水深再構成の品質と不確実性推定の信頼性を向上させた。
- 本研究は,より堅牢な気候モデリングと沿岸災害評価への道を開く。
反復は完璧を作る:再帰型グラフニューラルネットワークはメッセージパッシング限界に匹敵 [cs.LG, cs.CC]目的:計算可能な再帰型グラフニューラルネットワークの表現力
- グラフ構造データの解析は,様々な分野で重要性を増している。
- 従来のグラフニューラルネットワークの表現力には限界があり,Color Refinementアルゴリズムに制限される。
- 再帰型グラフニューラルネットワークが,その限界に匹敵する表現力を持つことを示す。
- 再帰型グラフニューラルネットワークは,有限精度パラメータ,総和集約,ReLU活性化関数を用いることで,Color Refinementアルゴリズムのメッセージパッシング不変性を満たすグラフアルゴリズムを計算できる。
- 非再帰型グラフニューラルネットワークとは異なり,再帰型グラフニューラルネットワークは,グラフサイズごとに異なるGNNを必要としない,より強い意味でのWeisfeiler-Lemanの能力を持つ。
- 連結グラフに対しては,ランダムな初期化を組み込むことで,すべてのグラフアルゴリズムを表現できることが示された。
ML-EcoLyzer:機械学習推論における環境コストの,フレームワークとハードウェアを通じた定量化 [cs.LG, cs.AI, cs.CV, cs.HC, cs.SE]目的:機械学習推論の環境コストの定量化
- 機械学習の利用拡大に伴い,環境負荷の評価と削減が重要課題となっている。
- 特に低リソースハードウェア環境下での環境影響は不明確であり,詳細な分析が必要である。
- 多様なハードウェア環境下での環境コストを定量化し,持続可能なモデル選択を支援する。
- ML-EcoLyzer は,CPU,GPU,データセンターアクセラレータなど,様々な環境での二酸化炭素排出量,エネルギー消費量,熱量,水使用量を測定するツールである。
- 量子化により,CO$_2$ 排出量あたりの有効パラメータ数が向上し,効率的な推論が可能になることが示された。
- 大規模アクセラレータは軽量なアプリケーションにおいて非効率的であり,モデルの最適化が重要であることが明らかになった。
SPIKE:疎なクープマン正則化による物理情報ニューラルネットワーク [cs.LG, cs.AI, cs.CE, cs.NA, math.DS, math.NA]目的:物理制約を埋め込んだニューラルネットワーク訓練による微分方程式の解法
- 物理現象のシミュレーションにおいて,メッシュフリーな手法の需要が高まっている
- PINNは学習領域内での過学習を起こしやすく,未知領域への外挿性能が低い
- クープマン演算子を用いてPINNを正則化し,汎化性能の向上を目指す
- SPIKEは,学習された観測空間で線形力学を適用することで,疎な生成行列を学習する
- 様々な偏微分方程式(放物型,双曲型,分散型,強剛性)において,時間外挿,空間汎化,長期予測の精度が向上した
- 連続時間形式を用いることで,強剛性システムに対して無条件安定性を実現し,離散時間クープマン演算子の問題点を回避する
単一画像からの反射分離:層融合分離による手法 [cs.CV, cs.LG]目的:単一画像からの透過層と反射層の分離
- 画像編集や視覚効果において,反射成分の分離は重要な処理である。
- 非線形混合下では,既存手法は透過層と反射層の混同が生じやすい。
- 深層デコーダ層における誤りを減らし,より正確な分離を目指す。
- 提案手法ReflexSplitは,クロススケールゲート融合と層融合分離ブロックにより,従来のSIRS手法を上回る性能を示す。
- 特徴量の一貫性を保ち,勾配の流れを安定させることで,より高品質な分離結果が得られる。
- 合成データセットと実データセットの両方で,最先端の性能とロバストな汎化性能を実証した。
CLIPoint3D:言語に基づく少数のサンプルによる3D点群ドメイン適応 [cs.HC, cs.CY, cs.ET, cs.CV, cs.LG]目的:3D点群のドメイン適応における,言語知識を用いた効率的な手法
- 近年,画像だけでなく3D認識においても,画像と言語を結びつけるモデルが注目されている。
- 合成データから実データへの適応は困難であり,汎化性能の向上が課題となっている。
- CLIPを活用し,少ないサンプルで効率的にドメイン適応を行うことを目指す。
- CLIPoint3Dは,従来のCLIPベースおよびエンコーダーベースの手法と比較して,一貫して3~16%の精度向上を達成した。
- 3Dサンプルを複数の深度マップに投影し,軽量な3Dエンコーダーと知識に基づいたプロンプト調整を用いてCLIPを改良する。
- 最適輸送に基づくアライメント損失と,不確実性を考慮したプロトタイプアライメント損失により,ソースとターゲットの分布のギャップを埋める。
OpenClaw-RL:会話を通してエージェントを容易に学習 [cs.CL, cs.AI, cs.CV, cs.LG]目的:次状態信号を利用した強化学習フレームワークの構築
- エージェントの性能向上には,継続的な学習が不可欠であり,そのための効率的な手法が求められている。
- 従来の強化学習システムは,特定のタスクに特化しており,多様なインタラクションからの学習が困難であった。
- 様々な対話形式から情報を抽出し,統一的な学習ループを実現することで,汎用的なエージェントの学習を可能にする。
- OpenClaw-RLは,ユーザーの応答,ツール出力,GUIの変化など,あらゆる次状態信号を学習に活用する。
- 報酬と行動指針を抽出する手法を導入し,トークンレベルでの学習を可能にすることで,従来の報酬信号よりも詳細な学習を実現。
- 非同期設計により,リアルタイムでの応答,評価,ポリシー更新を並行して行い,オーバーヘッドを最小限に抑える。
ハイブリッドエネルギー認識型報酬整形:方策最適化のための統一された軽量物理ガイド手法 [cs.LG, cs.SY, eess.SY, math.OC]目的:強化学習における報酬整形とエネルギーを考慮した行動正則化の統合
- 継続制御において深層強化学習は優れているが,効率的な探索が課題である。
- 物理モデルは完全な方程式を必要とし,計算コストが高いという問題がある。
- 軽量な物理事前知識の統合によるモデルフリー強化学習の性能向上を目指す。
- ハイブリッドエネルギー認識型報酬整形(H-EARS)は,線形時間複雑度O(n)を達成する。
- H-EARSは,タスク固有のポテンシャルとエネルギーに基づいたポテンシャルのバランスを取ることで,収束性と安定性を向上させる。
- 車両シミュレーションにより,極限状態下での安全性確保への応用可能性が確認された。
知識グラフ補完のためのLLM活用:OMNIA [cs.DB, cs.AI]目的:知識グラフの補完
- 知識は構造化された形で表現される必要があり,知識グラフはその重要な役割を担う。
- LLMを用いた知識グラフの自動構築では,不完全またはノイズの多い結果が生じやすい。
- 構造と意味の両方を考慮した知識グラフ補完手法を開発し,LLM生成グラフの品質向上を目指す。
- OMNIAは,知識グラフ内のエンティティと関係のクラスタリングにより候補トリプルを生成する。
- 生成されたトリプルは,軽量な埋め込みフィルタリングとLLMによる意味検証を経て検証される。
- 複数のデータセットでの実験により,OMNIAが従来の埋め込みベースの手法と比較してF1スコアを大幅に向上させることが示された。
CreativeBench:自己進化型課題による機械の創造性のベンチマーキングと向上 [cs.AI, cs.CL]目的:機械の創造性評価のためのベンチマーク
- 質の高い事前学習データの限界により,継続的に新しいものを生み出す能力が重要視されている。
- 機械の創造性の進歩は,厳密な定量評価の欠如によって阻害されている。
- 客観的な評価指標とベンチマークを通じて,機械の創造性の向上を目指す。
- CreativeBenchは,コード生成における機械の創造性を評価するベンチマークであり,組み合わせ的創造性と探索的創造性を対象とする。
- モデルの規模拡大は組み合わせ的創造性を向上させるが,探索的創造性には限界があることが示された。
- EvoRePEという推論時制御戦略を提案し,進化探索パターンを活用して機械の創造性を一貫して向上させた。
決定木におけるハイブリッドTsallis-偏光不純度指標:理論的基礎と経験的評価 [stat.ML, cs.AI, cs.LG]目的:決定木学習のためのハイブリッド不純度指標の提案
- 決定木は,解釈可能性の高い機械学習手法として広く利用されている。
- 既存の不純度指標は,理論的妥当性と計算効率のバランスが課題であった。
- 理論的保証と計算効率を両立する不純度指標を開発し,その有効性を検証する。
- 提案手法であるITCは,Tsallisエントロピーと偏光成分を組み合わせることで,理論的根拠に基づいた新しい不純度指標を提供する。
- 実験結果から,Tsallis α=0.5の単純なパラメータ設定が最も高い平均精度(91.17%)を示し,ITCの変種も良好な結果(88.38-89.16%)を示した。
- 統計的分析の結果,トップパフォーマー間に有意な差は見られず,多くの応用において実用的な等価性を示唆している。
AI 転換ギャップ指数(AITG):産業および企業レベルにおけるAI 転換機会,混乱リスク,および価値創造を測定するための経験的枠組み [econ.GN, cs.AI, cs.CY, q-fin.EC]目的:AI 転換機会,混乱リスク,および価値創造の測定
- AI 投資の拡大に伴い,その効果測定と戦略策定が重要となっている。
- 既存の評価手法は主観的で,業界間比較や経済データとの連携が不十分である。
- 客観的な指標と経済データに基づいたAI 転換の評価手法を確立すること。
- AI 転換ギャップ指数(AITG)は,企業のAI導入状況と業界の最先端との差を測定する。
- AITGスコアとEBITDA利益率の拡大の間には,相関係数0.818という強い正の相関関係が見られた。
- AI 転換ギャップが大きいほど必ずしも価値密度が高くなるとは限らず,実行の摩擦などが影響する。
PolyMon:ポリマー特性予測のための統一フレームワーク [cond-mat.soft, cond-mat.mtrl-sci, cs.LG]目的:ポリマー特性予測のための統一的なフレームワーク
- 材料設計において,ポリマー特性の正確な予測は不可欠である。
- データ不足,多様なポリマー表現,モデリング選択の体系的な評価不足が課題。
- ポリマー特性予測における表現,モデル,学習戦略の影響を評価する。
- PolyMonは,多様なポリマー表現,機械学習手法,学習戦略を統合したフレームワークである。
- 5つのポリマー特性をベンチマークとして用い,表現とモデルの予測性能への影響を体系的に評価した。
- 限られたデータや物理モデル由来の情報を取り込むための学習戦略の適用例を示した。
自己教師あり多段階ドメインアンラーニングによる白質病変セグメンテーション [eess.IV, cs.AI, cs.LG]目的:磁気共鳴画像におけるスキャナー間変動に対するロバストな白質病変セグメンテーションモデルの開発
- 磁気共鳴画像は診断・予後において重要だが,スキャナーの違いによる画像品質の変動が課題となっている。
- ドメイン適応手法の効果は,モデル学習時の教師データの量や深さに依存することが示唆されている。
- 本研究は,教師なしドメイン適応により,スキャナー間変動を抑制し,セグメンテーション精度を向上させる。
- 提案手法SSMSUは,ドメイン関連の特徴量を抑制することで,病変の検出感度を向上させ,誤検出を抑制した。
- SSMSUは,セグメンテーションの重複度合いと相対病変体積誤差の観点から,既存手法と比較して高いセグメンテーション品質を示した。
- FLAIRモダリティのみを入力することで,前処理の簡素化とモダリティ間登録誤差の回避を実現した。
低線量CTにおけるノイズ除去のための射影誘導型個別化連合学習 [eess.IV, cs.CV, cs.LG]目的:低線量CT画像のノイズ除去における個別化連合学習手法の確立
- CT検査における被ばく線量を低減することは,患者の安全性を高める上で重要である。
- 低線量CTではノイズやアーチファクトが増加し,画像診断の精度が低下する可能性がある。
- 各機関のCT装置固有のノイズに対応し,高画質な画像再構成を実現することを目指す。
- ProFedは,射影空間での二段階の個別化により,装置ノイズと患者解剖構造を分離し,性能を向上させた。
- CNNおよびTransformerバックボーンにおいて,既存の連合学習手法を平均1.42dB上回るPSNR値(最大44.83dB)を達成した。
- 解剖学的・プロトコル適応ネットワークと不確実性に基づいた選択的集約により,安定した学習と高精度なノイズ除去を実現した。
量子主成分分析のためのフィルタリングされたスペクトル射影 [stat.ML, cond-mat.mtrl-sci, cs.LG]目的:量子主成分分析における主要なスペクトル部分空間へのデータ射影
- 量子計算の発展に伴い,大規模データセットの効率的な解析が求められている。
- 従来の量子主成分分析は,固有値と固有ベクトルの計算に依存し,計算コストが高い。
- 本研究は,固有値計算を回避しつつ,主要なスペクトル構造を維持する射影ベースの手法を提案する。
- 提案手法であるFSPAは,主要な部分空間との初期オーバーラップを増幅し,小さなギャップや退化した状態においてもロバストである。
- 振幅符号化されたデータにおいて,アンサンブル密度行列が共分散行列と一致することが示された。
- ベンチマークデータセットを用いた実験により,射影品質が維持される限り,下流タスクの性能が安定していることが確認された。
原子スケールにおける窒化アルミニウムのひび割れ伝播予測のための拡散生成モデル [cond-mat.mtrl-sci, cs.LG]目的:窒化アルミニウムにおける原子スケールひび割れ伝播予測
- 半導体信頼性確保の鍵となる原子レベルでの材料挙動理解は重要である。
- 分子動力学計算では計算コストが高く,大規模な解析が困難である。
- 拡散モデルを用いて,高速かつ高精度なひび割れ伝播予測を実現する。
- 拡散生成モデルは,初期微細構造のみから原子スケールひび割れ伝播を高精度に予測可能である。
- 従来の分子動力学計算と比較して,大幅な計算時間の短縮を実現した。
- ひび割れ発生,分岐,ブリッジングなどの複雑な破壊現象を再現し,汎用性も確認された。
金属誘導型金属アーチファクト低減法:X線CTにおける金属アーチファクトの低減 [eess.IV, cs.AI, cs.CV]目的:X線CT画像における金属アーチファクトの低減
- X線CTは医療診断において不可欠だが,金属インプラントは画像品質を著しく低下させる。
- 金属インプラントによるアーチファクトは,診断精度を低下させ,誤診のリスクを高める。
- 金属情報を活用し,より高精度なアーチファクト低減を実現すること。
- 提案手法MGMARは,金属に影響されない投影データを用いて学習した条件付き暗黙的ニューラル表現(INR)を活用する。
- INRは,金属腐食画像とアーチファクトフリー画像で事前学習することで,金属依存的なパターンを捉える。
- AAPM-MARベンチマークにおいて,MGMARは最先端の性能を示し,平均最終スコア0.89を達成した。
標準獲得関数で十分な非同期ベイズ最適化 [stat.ML, cs.LG]目的:非同期ベイズ最適化における標準獲得関数の有効性
- 実験時間が変動する並列実験において,勾配を用いない最適化手法として広く利用されている。
- 既存研究では,標準獲得関数が冗長なクエリを繰り返すとされており,多様性を確保する複雑な手法が提案されてきた。
- 標準獲得関数でも十分な性能が得られることを示し,冗長性の問題を解決する。
- 標準的な獲得関数(UCBなど)は,逐次Thompsonサンプリングと同等の理論的保証を持つことが示された。
- 非同期ベイズ最適化において,既存研究は中間事後更新を軽視しており,それが冗長なクエリを避ける上で十分であることが示された。
- 多様性を強調する手法は,非同期設定で過剰探索を引き起こし,性能を低下させる可能性がある。
VoXtream2:動的発話速度制御を備えたフルストリームTTS [eess.AS, cs.CL, cs.HC, cs.LG, cs.SD]目的:インタラクティブシステム向けフルストリームTTSにおける低遅延性と動的制御の実現
- 対話型システムにおける自然な音声合成は,ユーザー体験を向上させる上で不可欠である。
- 既存のTTSモデルは,リアルタイム性や継続的なテキスト更新への対応に課題がある。
- 遅延を最小限に抑えつつ,テキストの逐次的な入力に対応できるTTSモデルの構築。
- VoXtream2は,duration statesの分布一致機構とclassifier-free guidanceにより,制御性と合成品質を向上させている。
- プロンプトテキストのマスキングにより,プロンプトの書き起こしが不要となり,柔軟性が高まっている。
- 標準ベンチマークおよび専用の速度テストセットにおいて,既存モデルと比較して競争力のある結果を達成している。
有限ショット測定に基づく能動的サンプリング量子対角化 [math.OC, cs.MA, cs.SY, eess.SY, quant-ph, cs.LG]目的:有限ショット測定からの基底状態エネルギーの効率的な回復
- 近年の量子デバイスの発展は,複雑な問題を解決する可能性を示唆している。
- 現在の量子デバイスはノイズが多く,完全な状態測定が困難である。
- 有限ショット測定と不完全な状態でも信頼性の高いエネルギー推定を実現する手法の開発。
- 提案手法AS-SQDは,既存のSQDやランダム拡張と比較して,大幅に低いエネルギー誤差を達成した。
- 物理に基づいた基底選択により,計算をエネルギー的に関連性の高い方向に集中させ,指数関数的な計算量を回避した。
- IBM Quantumプロセッサからの物理的サンプルを用いて,AS-SQDのSPAMエラーに対するロバスト性が検証された。
ホログラフィック不変量記憶:ベクトル記号アーキテクチャによる設計時安全契約 [stat.ML, cs.CL, cs.IT, cs.LG, math.IT]目的:LLMのコンテキストドリフト軽減のための設計時安全契約
- 大規模言語モデルの性能は,コンテキストの変化に大きく左右されるため,安定性の確保が重要である。
- LLMは,コンテキストの変化によって性能が劣化する「コンテキストドリフト」の問題を抱えている。
- 設計段階で安全性を保証し,コンテキストドリフトの影響を軽減する手法を確立すること。
- 提案手法(HIS)は,設計時に評価可能な3つの保証(信号回復忠実度,ノイズ耐性,多信号容量劣化)を提供する。
- 信号回復忠実度は,ノイズの深さや内容に関わらず,約0.707に収束することが示された。
- 実験の結果,2B規模のLLMにおいて,安全性の再注入が遵守率の向上に貢献することが確認された。
スクエアルートカルマンフィルタのグラム行列微分によるロバストな自動微分 [stat.ML, cs.LG, cs.SY, eess.SP, eess.SY]目的:スクエアルートカルマンフィルタの自動微分手法
- 状態空間モデルのパラメータ学習において,勾配ベースの手法は重要な役割を果たす。
- 従来のQR分解による微分では,行列のランク落ちや非一意性により,勾配が定義されない問題がある。
- グラム行列を用いた微分により,行列のランク落ちや非一意性による問題を回避し,安定した勾配計算を実現する。
- フィルタの出力は入力行列のグラム行列のみに依存するため,三角分解がなくても損失関数は滑らかである。
- グラム行列の微分から直接連鎖律を導出し,カルマン尤度とフィルタリングされたモーメントに対してその正確性を証明した。
- ランク落ち入力に対しても,ムーア・ペンローズ擬逆行列と零空間補正を用いた二成分分解により,微分を拡張した。
タスク指向3D点群ワイヤレス伝送:幾何学的 vs. 意味的ロバスト性 [eess.SP, cs.LG]目的:3D点群のタスク指向ワイヤレス伝送における幾何学的ロバスト性と意味的ロバスト性の関係
- 産業協調ロボットシステムにおいて,3D点群のワイヤレス伝送の需要が高まっている。
- 従来の圧縮手法は幾何学的精度を優先するが,タスクレベルの推論の方が重要である場合が多い。
- 帯域幅・電力制約のある環境下でのタスク指向ワイヤレス知覚システムの設計指針を得る。
- 幾何学的再構成の品質が低下しても,意味的推論は広いSNR範囲で安定していることが示された。
- 信頼性の高いタスク実行には,高精度な幾何学的再構成は必要ないことが明らかになった。
- 共有された伝送表現から幾何学的復元と物体分類を同時にサポートするフレームワークを提案した。
不正検知のための表形式データ生成に対するEmbedding Diffusion Transformer [stat.ML, cs.LG]目的:不正検知における表形式データの生成
- 不正検知は金融取引等において重要であり,不正行為を早期に発見し,損害を最小限に抑えることが求められる。
- 不正データは通常少数であり,データの不均衡が分類器の性能低下を招くという課題がある。
- 少数クラスの不正データを生成し,データ不均衡を解消することで,分類器の性能向上を目指す。
- 提案手法EmDTは,UMAPクラスタリングを活用し,不正パターンの識別とTransformerによる特徴量の関係性学習を実現した。
- 実験結果から,EmDTは既存のオーバーサンプリングや生成手法と比較して,下流の分類性能を大幅に向上させることが示された。
- また,EmDTはプライバシー保護と元のデータの特徴相関の維持にも優れていることが確認された。
アンサンブル制御の観点を通じた状態空間モデル [math.OC, cs.LG]目的:状態空間モデルの学習ダイナミクスに関する理論的理解
- 系列モデリングにおいて,状態空間モデルは有効なアーキテクチャであるため,その理論的基盤の確立が重要である。
- 状態空間モデルの学習ダイナミクスに関しては,厳密な理論的理解が不足しているという課題が存在する。
- アンサンブル制御の枠組みを通じて,状態空間モデルの学習プロセスを最適化し,理論的解釈を与えることを目指す。
- 状態空間モデルの学習を,入力に依存するダイナミクスシステムを制御するアンサンブル最適制御問題として定式化した。
- この定式化に対し,ポンチャギン最大原理を適用し,最適性の必要条件を導出した。
- 導出された条件に基づき,逐次近似法に基づくアルゴリズムを提案し,その収束性および最適性条件を証明した。
有界情報幾何と非パラメトリック場作用によるロバストな逐次追跡 [stat.ML, cs.LG, math.ST, stat.TH]目的:極端な外れ値に対する逐次推論のロバスト性の向上
- 逐次推論は,時間変化するシステムの状態を推定する上で不可欠な技術である。
- 従来の推論アーキテクチャは,異常な外れ値により正常化危機に陥りやすい。
- 無限次元空間における作用の極大化を,非パラメトリック場によって実現する。
- 提案手法は,情報幾何学に基づき,外れ値を解析的に打ち切り,ロバストな推定を実現する。
- 厳密不変なデルタ情報分離を用いることで,空間分布の無限尾を物理的に打ち切る。
- LiDAR,暗号通貨,量子状態トモグラフィーの実験結果により,有効性が確認された。
FDGからPSMA PET/CTへの教師なし適応によるラベルシフト下での3D病変検出 [eess.IV, cs.AI, cs.CV, physics.med-ph]目的:3D病変検出における,ラベル付きFDG PET/CTからラベルなしPSMA PET/CTへのドメイン適応
- PET/CT画像を用いた病変検出は,がんの診断や治療効果判定において重要な役割を担う。
- 異なるトレーサー(FDGとPSMA)間では,病変の大きさや数に分布のずれが生じ,検出精度が低下する。
- ラベルシフトを考慮した自己教師あり学習により,PSMA PET/CTにおける病変検出のロバスト性を向上させる。
- 提案手法は,AutoPET 2024データセットにおいて,FDGのみを用いたベースラインや従来の自己教師あり学習を上回る性能を示した。
- ターゲットドメインの病変サイズの分布と発生頻度をモデル化することで,トレーサー間のロバストな病変検出が可能となった。
- 検出アンカー形状の適応的な調整と,病変サイズに応じた擬似ラベルの割り当てが有効であることが示された。
AI支援決定における人間の介入時期:最適な人員配置 [stat.ML, cs.LG, stat.AP]目的:AI支援決定における,AI出力の修正に要する人的コストと最終的な意思決定の精度向上とのバランス
- AI技術の発展に伴い,複雑な意思決定においてAIが人間の判断を支援する機会が増加している。
- AIによる事前評価はノイズやバイアスを含む可能性があり,人的介入の必要性が生じる。
- AIと人間の協調において,人的資源を最も効果的に活用するための介入基準を明確化する。
- 提案手法は,AIのみの予測や完全な人間レビューと比較して,同等の性能をより少ない人的コストで達成する。
- 線形モデルに基づく単純なルールでも,計算コストを削減しつつ,最終的な予測性能を維持できることが示された。
- 本研究は,人間の介入の価値と,原則に基づいた効率的な人員配置の重要性を強調する。
人工知能を用いた材料科学の四面体研究パラダイム [eess.IV, cs.RO, cond-mat.mtrl-sci, cs.AI]目的:材料科学における構造-特性-加工-性能-特性評価の関係を表す古典的な材料四面体研究パラダイムの変革
- 材料科学の発展には,材料の構造と機能の関係性を体系的に理解する枠組みが不可欠である。
- 古典的なパラダイムは有効だが,データ駆動型のアプローチやAIの活用が十分ではない。
- AIを材料科学に効果的に統合し,新たな研究パラダイムを提案することで,材料開発を加速する。
- 本研究では,材料-データ-モデル-ポテンシャル-エージェントの関係に着目した新たな四面体パラダイムを提唱する。
- データ-アーキテクチャ-エンコーディング-最適化-推論の関係を示すAI研究のパラダイムも提示する。
- AIの科学利用には,明確な科学的課題を設定し,合理的な分析に基づいたアプローチが重要である。
乱流における極端現象の予測可能性の階層構造:機械学習による解明 [nlin.CD, cs.LG, math.DS, physics.comp-ph, physics.flu-dyn]目的:乱流における極端現象の予測可能性
- 流体現象の理解と予測は,気象,航空,海洋など幅広い分野で不可欠である。
- 乱流の極端現象は予測が難しく,その予測限界を特定することが課題となっている。
- 極端現象の予測可能性をデータから診断する手法の開発を目指す。
- 機械学習を用いて,2次元Kolmogorov流のシミュレーションから,現象ごとの予測可能性の限界を定量的に評価した。
- エントロピーの極端現象は,イベント間で約1から4リャプノフ時間以上の予測スキルを示す明確な階層構造を持つことが明らかになった。
- 予測の限界は主に大規模構造によって制御され,極端現象の発生前には特定の渦構造が形成されることが示唆された。
疎な主成分分析のための解釈可能かつ安定なフレームワーク [stat.ML, cs.LG]目的:疎な主成分分析における解釈性と安定性の向上
- 高次元データでは,PCAの解釈性と変数間の冗長性が課題となるため,SPCAが重要視される。
- 従来のSPCAは変数重要度の違いを考慮せず,ノイズや複雑な構造に対して不安定になりやすい。
- SP-SPCAは,変数の重要度に応じたペナルティ調整により,安定性と解釈性を高めることを目指す。
- 提案手法SP-SPCAは,シミュレーション実験において,既存の疎な主成分分析手法を上回る性能を示した。
- 特に高次元かつノイズの多いデータにおいて,疎なローディングパターンを特定し,ノイズ変数をフィルタリングする能力に優れる。
- 実際の犯罪データや金融市場データへの応用からも,より少ない変数で高い説明力を維持できる実用性が示された。
低電力エレクトロニクス向けコールドメタル生成の逆設計 [cond-mat.mtrl-sci, cs.LG]目的:低電力エレクトロニクスに適したコールドメタルの新規候補物質の創出
- コールドメタルは急峻なトランジスタ特性を示し,低消費電力デバイス実現への期待が集まっている。
- 既存のデータベース探索では,既知の化合物に限定され,探索範囲が狭いという課題があった。
- 生成AIを活用し,データベースに存在しない新規なコールドメタル候補を効率的に探索することを目指す。
- MatterGPTを用いてコールドメタルの構造を生成する逆設計ワークフローを開発した。
- 生成された148,506件の候補中,257件の新規コールドメタルが第一原理計算によって検証された。
- 本研究は,コールドメタルの化学的空間を拡大し,低消費電力材料探索の新たな道を開くことを示す。
心エコー画像生成のための潜在フローマッチング:EchoLVFM [quant-ph, cs.ET, eess.IV, cs.AI, cs.CV]目的:心エコー画像の合成を通じた,左室駆出率などの臨床パラメータ制御
- 心エコーは心機能評価に不可欠であり,正確な診断と治療に重要な役割を果たす。
- 既存手法は計算コストが高く,多様な臨床データへの適用が制限されている。
- 効率的かつ制御可能な心エコー画像合成を実現し,データ拡張や専門家トレーニングに貢献する。
- EchoLVFMは,従来の多段階フローベースラインと比較して約50倍のサンプリング効率を達成した。
- 臨床変数に基づく条件付けが可能であり,左室駆出率の正確な制御を実現した。
- 専門家による識別精度は偶然レベルに近い結果を示し,実用的な画像合成の可能性を示唆する。
電子診療記録のためのイベントストリームモデリングの分類,訓練,および応用 [eess.SP, cs.LG]目的:電子診療記録のイベントストリームモデリングに関する体系的な整理と展望
- 医療AIの発展には,多様な臨床データの活用が不可欠であり,そのためのモデリング手法が重要となる。
- 既存の時系列モデリングは,臨床データの疎性と不規則性への対応が難しく,課題となっていた。
- イベントストリームモデリングの現状を整理し,今後の発展を促すための指針を提示すること。
- 本研究では,電子診療記録イベントストリームの統一的な定義と,イベント時間,種類,値を基にした新たな分類を確立した。
- 教師あり学習から自己教師あり学習まで,幅広い訓練戦略を体系的にレビューし,臨床シナリオにおける応用例を網羅的に議論した。
- 今後の課題と方向性を特定し,次世代の医療モデル開発を支援することを目的とした。
コンパクト連結リー群上のシュレーディンガー橋 [quant-ph, cs.NI, eess.SP, math.OC, cs.RO, cs.SY, eess.SY, math.OC, cs.LG, cs.SY, eess.SY, math.PR]目的:リー群上での初期密度と終端密度間の制御拡散
- 幾何学的な構造を持つ多様体上での確率過程の制御は,ロボティクスや機械学習に応用が期待される。
- リー群上の確率過程の制御は,局所的なパラメータ化やユークリッド空間への埋め込みに依存し,制約を受ける場合がある。
- リー群の幾何構造を尊重した座標フリーな定式化により,確率過程の最適制御問題を解決する。
- コンパクト連結リー群上のシュレーディンガー橋問題に対する解の存在と一意性が示された。
- 確率密度を最適に補間する幾何学的なコントローラが導出された。
- SO(2)とSO(3)に対する数値例が提示され,結果の有効性が確認された。
ボラティリティプロキシに基づく条件付けが,集団市場相関の apparent timescale を圧縮する [q-fin.CP, cond-mat.stat-mech, cs.LG]目的:集団市場相関の apparent timescale の圧縮
- 市場のダイナミクス理解は,金融リスク管理や投資戦略において不可欠である。
- 市場相関の持続性は,その起源が内因的なのか,外因的なのかが不明であった。
- 本研究は,ボラティリティプロキシを用いて,市場相関の持続性の起源を解明することを目的とする。
- VIX と結合した Ornstein-Uhlenbeck モデルは,有効緩和時間を 298 取引日から 61 取引日に短縮した。
- 情報残差である log(VIX) 単独でも,その効果の大部分を保持することが示された。
- 本研究の結果は,観測された VIX プロキシに基づいた条件付けが,市場相関の apparent timescale の大部分を説明することを示唆する。
最大最小ロバストベイズ実験計画法 [stat.ML, cs.LG, math.ST, stat.CO, stat.ME, stat.TH]目的:モデル誤指定下におけるベイズ実験計画法の脆弱性に対処する手法
- 実験計画法は,効率的なデータ収集を通して科学的発見を加速する上で重要である。
- ベイズ実験計画法はモデルの誤指定に弱く,そのロバスト性が課題となっている。
- モデル不確実性に対するロバストな実験計画法を開発し,その性能を保証することを目的とする。
- 本研究では,実験者と敵対的な自然の間の最大最小ゲームとして問題を定式化することで,ロバストな目的関数を導出した。
- Sibsonのα-相互情報量を用いて,ロバストな信念更新と条件付き情報ゲインの適切な尺度を明らかにした。
- PAC-Bayesフレームワークを用いることで,有限サンプルエラーを明示的に制御しつつ,ロバストな期待情報ゲインの下限を確立した。
制約条件付き物理モデルを考慮した逆問題に対する条件付きフローマッチング [math.OC, cs.SY, eess.SY, stat.ML, cs.LG]目的:物理モデル制約のあるベイズ逆問題の解法
- 物理現象の逆問題は,観測データから未知のパラメータを推定する上で重要である。
- 従来の解法では,事前分布や尤度関数の評価が必要であり,高次元かつ非微分可能なモデルでは困難である。
- 観測データと推論変数のサンプルがあれば,明示的な密度評価なしで逆問題を解くことを目指す。
- 条件付きフローマッチングは,複雑な多峰性を持つ事後分布を正確に捉え,計算効率を維持する。
- 学習データが限られている場合,過学習が条件付き分布の退化を引き起こす可能性があることが示された。
- テスト損失の監視に基づく標準的な早期停止基準が,そのような退化を効果的に軽減できる。
