arXiv雑要約
AI - 2026/03/25 公開
OmniDiT:拡散TransformerをOmni-VTONフレームワークへ拡張 [cs.CV, cs.AI]目的:仮想試着および試着解除タスクの統合モデル構築
- 仮想試着技術は,オンラインショッピング体験を向上させ,返品率を低下させる上で重要である。
- 既存手法は,細部の再現性,複雑なシーンへの対応,効率的な推論に課題がある。
- 拡散Transformerを用いて,汎用性と効率性を両立した仮想試着フレームワークを開発する。
- 提案手法OmniDiTは,自己進化型データキュレーションパイプラインと大規模データセットOmni-TryOnを活用する。
- Shifted Window Attentionを拡散モデルに導入することで,計算量の線形化と生成品質の向上を実現した。
- 様々な複雑なシーンにおいて,モデルフリーおよびモデルベースの仮想試着・試着解除タスクで最先端性能を達成した。
FIPO:未来KL影響による方策最適化による深層推論の誘発 [cs.RO, cs.LG]目的:大規模言語モデルにおける推論のボトルネック克服
- 大規模言語モデルの能力向上は,複雑な推論能力の獲得が不可欠である。
- 既存の方策最適化は,トークン間の重要度を区別できず,性能に限界がある。
- トークンの影響度に基づく密な利点形成により,推論能力を向上させる。
- FIPOは,Qwen2.5-32Bにおいて,連鎖思考の平均長を4,000トークンから10,000トークン以上に拡張した。
- AIME 2024 Pass@1の精度を50.0%から58.0%に向上させ,DeepSeek-R1-Zero-Math-32Bやo1-miniを上回った。
- 密な利点形成は,基盤モデルの潜在能力を最大限に引き出す上で重要である可能性が示唆された。
忠実度測定は測定方法に依存する:LLMの思考連鎖評価における分類器の感度 [cs.CL, cs.AI, cs.LG]目的:LLMの思考連鎖における忠実度評価における分類器の感度
- 大規模言語モデルの信頼性評価は重要であり,その結果はモデルの応用可能性に直接影響する。
- 既存の研究では,忠実度を客観的な指標として捉えがちであり,分類器の選択による影響が考慮されていない。
- 本研究は,異なる分類器が忠実度評価に与える影響を明らかにし,評価方法の標準化を促す。
- 異なる分類器を用いることで,同じデータセットに対する忠実度の評価結果に大きな乖離が見られた。
- 分類器の選択によってモデルのランキングが変動し,評価結果の解釈に注意が必要であることが示された。
- 忠実度測定は,分類器の厳密さに依存するため,結果を比較する際は複数の分類器を用いた感度分析が不可欠である。
子供の知能検査はMLLMに課題を突きつけるか? KidGym:MLLMのための2Dグリッドベース推論ベンチマーク [cs.CL, cs.AI]目的:MLLMの五つの主要能力(実行,知覚的推論,学習,記憶,計画)の評価
- MLLMは人間らしい汎用的な能力を目指しており,その能力評価が重要である。
- 既存の評価方法は,MLLMの多様な能力を網羅的に評価できていない。
- 子供の認知発達段階を模倣したベンチマークを通じて,MLLMの適応能力を評価する。
- KidGymは,12種類のタスクから構成され,多様なシナリオとオブジェクトを含む。
- 最先端のMLLMの評価により,モデルの能力に関する重要な知見と限界が明らかになった。
- KidGymは,研究者が新しい評価シナリオを作成したり,難易度を調整したりできる柔軟性を備えている。
CRoCoDiL:言語のための連続的かつロバストな条件付き拡散 [cs.CL, cs.AI]目的:言語生成における効率性と品質の向上
- 自然言語生成は,多様な応用において重要な役割を担う技術である。
- 従来のマスク拡散モデルは,トークン間の依存関係や意味的な一貫性に課題があった。
- 連続的な意味空間への拡散プロセスを移行することで,これらの課題を解決する。
- CRoCoDiLは,エンコーダー・デマスカーアーキテクチャを共同学習することで,より高品質な文章生成を実現した。
- ConThenDiscとConWithinDiscという二つのテキスト合成アルゴリズムを提案し,生成速度を大幅に向上させた。
- 実験結果から,提案手法は無条件生成において,既存手法を凌駕する性能を示した。
属性に基づく視点からの音声プライバシー [cs.SD, cs.AI]目的:音声プライバシー保護の評価基準
- 音声データは個人識別情報を含むため,プライバシー保護は重要である。
- 既存の評価基準は信号間の比較に依存し,属性情報の漏洩リスクを考慮していない。
- 属性情報に基づく脅威に対する音声プライバシー保護の現状を明らかにする。
- 音声の匿名化処理後も,推測された属性情報から個人を特定されるリスクが残存することが示された。
- 単一の発話サンプルのみを用いた攻撃シナリオにおいても,属性情報が脅威となることが確認された。
- 今後の音声プライバシー研究において,属性情報に関連する脅威と保護メカニズムの両方を考慮する必要がある。
要件工学のための産業規模検索拡張生成フレームワーク:自動車製造データによる実証評価 [cs.SE, cs.AI]目的:産業規模の要件工学における検索拡張生成(RAG)フレームワークの性能評価
- インダストリー4.0において,要件工学は,技術仕様,サプライヤーリスト,コンプライアンス基準など,多様で非構造化された文書の処理という重要な課題に直面している。
- 既存の研究では,本物の産業用REワークフローと包括的な生産グレードの性能指標を用いてRAGを評価したものは存在しない。
- 本研究は,自動車製造の実際の文書を用いて,RAGが要件工学の自動化にどの程度貢献できるかを実証的に評価することを目的とする。
- 提示されたフレームワークは,完全なトレーサビリティを備え,98.2%の抽出精度を達成し,BERTベースおよびLLMアプローチと比較してそれぞれ24.4%および19.6%高い性能を示した。
- ハイブリッドな意味的・語彙的検索は,MRR 0.847を達成し,専門家による品質評価の平均は5段階評価で4.32点であった。
- 評価の結果,手動分析時間が83%削減され,マルチプロバイダーLLMオーケストレーションにより47%のコスト削減が実現された。また,要件の件数は55%減少し,ITセキュリティへの焦点は1800%増加した。
MKA:効率的な長文脈推論のためのメモリキー注意機構 [cs.LG, cs.AI]目的:長文脈言語モデリングにおける効率的な注意機構
- 言語モデルの性能向上には長文脈の処理が不可欠であり,その効率化が求められている。
- 大規模なKey/Valueキャッシュの維持・処理コストが,学習・推論のボトルネックとなっている。
- メモリ消費量を抑えつつ,表現力と処理速度を両立する注意機構の実現を目指す。
- 提案手法MKAは,多層のKVキャッシュと動的な注意経路学習により,効率的な長文脈処理を可能にする。
- FastMKAは,キャッシュソースの融合により更なる高速化を実現し,学習・評価の効率を大幅に向上させる。
- 実験結果から,FastMKAはMLAと同等の精度を維持しつつ,学習スループットが最大5倍,評価レイテンシが1.8倍低減されることが示された。
指数型分布判別分析:ガウス型モデルを超えた生成的分類 [cs.LG, stat.ML]目的:指数型分布族の各クラス条件付き密度を仮定した,線形判別分析の拡張
- 機械学習において,データ分類は重要なタスクであり,その精度向上は長年の課題である。
- 線形判別分析は仮定が厳しく,非ガウス分布データへの適用が困難であった。
- 指数型分布族に基づく汎用的な判別分析手法を提案し,その理論的性質を検証する。
- 提案手法である指数型分布判別分析は,ガウス分布に限定されず,指数型分布族全体に対応可能である。
- シミュレーション実験の結果,既存手法と同等の分類精度を維持しつつ,校正誤差を大幅に削減した。
- 尤度推定量の漸近的効率性が証明され,理論的結果はLean 4を用いて形式的に検証された。
知的な地理空間データ探索:大規模言語モデルを活用した知識グラフ駆動型マルチエージェントフレームワーク [cs.DC, cs.AI, cs.MA]目的:地理空間データ探索のための知識グラフ駆動型マルチエージェントフレームワーク
- 地理空間データ量は急増しており,その活用は社会経済活動において不可欠である。
- 既存のデータカタログはキーワード検索に依存しており,ユーザーの意図を正確に捉えられない。
- 異質なメタデータ間の整合性を高め,より知的なデータ探索を実現することを目指す。
- 本フレームワークは,地理空間メタデータ知識グラフを構築し,データセット間の多次元的な関係を明示的にモデル化した。
- マルチエージェント協調アーキテクチャにより,意図解析,知識グラフ検索,回答合成を効率的に行う。
- 代表的なユースケースと性能評価の結果,従来のシステムと比較して,意図適合性,ランキング品質,再現率が大幅に向上した。
LPNSR:低解像度画像誘導ノイズ予測による事前知識強化型拡散画像超解像 [cs.CV, cs.AI]目的:拡散モデルを用いた画像超解像の性能向上
- 画像超解像は,低解像度画像から高解像度画像を復元する技術であり,様々な応用分野で重要である。
- 既存の拡散モデルは,推論効率と復元品質のトレードオフが存在し,特に少ないステップ数での性能劣化が課題である。
- LPNSRは,最適化されたノイズ予測と高品質な事前アップサンプリングにより,効率的かつ高精度な超解像を実現する。
- LPNSRは,残差シフト拡散フレームワークにおいて,最適な中間ノイズを数学的に導出し,LR画像を考慮したノイズ予測器を設計した。
- これにより,LR画像の構造的情報を逆プロセスに組み込み,エラーの蓄積を抑制し,初期バイアスを軽減することに成功した。
- 合成データセットと実写データセットの両方で,LPNSRは最先端の知覚的性能を達成し,大規模なテキスト画像事前知識に依存しない。
モデルが自己評価する:マルチモーダル推論のための教師なし自己進化 [cs.RO, cs.CV, cs.AI]目的:マルチモーダル推論における自己進化
- 大規模言語モデルの進歩により推論能力が向上しているが,高品質なアノテーションデータが必要。
- アノテーションデータの作成コストが高い,また外部の報酬モデルに依存する問題がある。
- 人間のラベルや報酬モデルなしで,推論性能を安定的に向上させる方法を確立する。
- 提案手法は,ラベルなしデータのみで推論性能と汎化性能を向上させることを実証した。
- 複数の推論経路をグループ化し,経路間の整合性に基づいて学習することで,安定した進化を実現する。
- 5つの数学的推論ベンチマークで一貫して性能が向上し,自己進化するマルチモーダルモデルへの道を開く。
DeepXplain:XAI誘導による多段階APTキャンペーンに対する自律的防御 [cs.CR, cs.AI]目的:多段階APTキャンペーンに対する自律的防御のための説明可能な強化学習フレームワーク
- サイバー攻撃は巧妙化の一途をたどっており,組織への被害が深刻化している。
- 従来の防御手法では,未知のAPT攻撃に対応しきれないという課題がある。
- 強化学習による自律的防御の信頼性と解釈性を向上させる。
- DeepXplainは,攻撃の段階を考慮した防御を実現し,F1スコアと成功率を向上させた。
- 説明信号を強化学習に組み込むことで,防御の透明性と信頼性を高めた。
- DeepXplainは,APT防御における説明可能な強化学習の第一歩となる。
TimeTox:臨床試験プロトコルからの時間毒性自動抽出のためのLLMベースパイプライン [cs.CL, cs.LG]目的:臨床試験プロトコルからの時間毒性抽出
- 臨床試験における患者への負担評価は重要であり,時間毒性はその重要な指標である。
- 時間毒性の抽出作業は手作業に頼る部分が多く,時間と労力を要する。
- LLMを活用し,時間毒性の抽出を自動化することで,効率化と精度向上を目指す。
- 本研究で開発したTimeToxは,Geminiモデルを用いてプロトコルからの時間毒性抽出を3段階で行う。
- 合成データでは2段階パイプラインが100%の臨床的に許容可能な精度を示したが,実データでは1段階パイプラインの方が再現性が高かった。
- 実データにおける安定性が,LLMのプロダクション環境へのデプロイメントを決定する重要な要素となることが示された。
外部化された推論を促すためのTransformerアーキテクチャ変更 [cs.AI]目的:大規模言語モデルにおける推論過程の可視化と効率化
- 推論能力はAIの重要な要素であり,より高度な問題解決が求められている。
- Transformerモデルは計算コストが高く,無駄な計算資源を消費しやすい。
- モデルが効率的に推論を行い,必要な計算のみを実行できるようにすること。
- 提案手法により,モデルは予測が容易なトークンに対しては早期に計算を終了することが示された。
- 強化学習を用いることで,タスク性能を維持しつつ,計算量の削減を促すことが可能となった。
- 大規模モデルへの応用により,より効率的な計画立案と推論が期待される。
LLMを活用した学際的ソフトウェア開発のワークフロー最適化:自動車産業における事例研究 [cs.SE, cs.AI]目的:学際的ソフトウェア開発におけるワークフロー最適化
- 自動車産業等では,多様な専門知識を統合したソフトウェア開発が不可欠である。
- 専門家と開発者の間には形式や成果物の不整合があり,非効率な連携が生じている。
- LLMを活用し,知識と実装を結ぶワークフローを自動化することで,効率化を目指す。
- 提案手法は,自動車APIシステムにおいて93.7%のF1スコアを達成した。
- API開発時間を約5時間から7分以下に短縮し,推定979時間の工数を削減した。
- 実運用では,専門家と開発者双方から高いコミュニケーション効率への満足が得られた。
Cerebra:多角的AIボードによる多角的認知症特性評価とリスクアセスメント [cs.DC, cs.MS, cs.AI, cs.CV]目的:多角的認知症特性評価とリスクアセスメントのためのAIボード
- 患者データは多様かつ変化し,不完全な場合が多い。適切な臨床判断には,その活用が不可欠である。
- 既存のAIモデルは静的で解釈が難しく,実際の臨床ワークフローとの整合性に課題がある。
- 不完全なデータでも解釈可能な,臨床現場での意思決定支援を実現することを目的とする。
- Cerebraは,EHR,臨床記録,医用画像分析を連携させ,リスク評価を視覚的に提示する。
- 300万人規模のデータセットを用いた評価で,既存モデルや大規模言語モデルを凌駕する性能を示した。
- 認知症リスク予測ではAUROC0.80,診断では0.86,生存予測ではC-index 0.81を達成し,医師の診断精度を17.5%向上させた。
mSFT:マルチタスクSFTにおける異質データセット混合の過学習への対処 [cs.LG, cs.AI]目的:マルチタスクSFTにおけるデータセット混合の過学習問題に対する解決策
- 大規模言語モデルの性能向上は,効果的な事前学習と教師あり微調整に依存する。
- 従来のマルチタスクSFTでは,全てのサブデータセットに対して均一な計算資源が割り当てられるため,過学習や未学習が発生しやすい。
- データセットごとの学習速度の差を考慮し,過学習を抑制することで,マルチタスクSFTの性能を最大化すること。
- mSFTは,早期に過学習を示すサブデータセットを特定し,除外することで,全体の学習効率を向上させる。
- 10のベンチマークと6つのベースモデルにおいて,mSFTは4つのベースラインと比較して一貫して優れた性能を示した。
- mSFTは,データセットサイズやタスク粒度に関わらず,頑健な性能向上を維持し,計算コストを削減する可能性も示唆された。
科学画像における分布間フローマッチングの不確実性定量化 [cs.LG]目的:科学画像における分布間フローマッチングの不確実性定量化手法
- 科学的画像処理において,細胞の応答予測や画像変換など,分布間生成モデルの応用が広がっている。
- 生成モデルの信頼性確保と,予測の信頼性評価が課題であり,分布間モデルにおける不確実性定量化は未開拓である。
- モデルの汎化性能向上と,分布外検出による信頼性評価を実現し,科学的画像処理の信頼性を高める。
- 提案手法であるBSFMは,偶然性と認識的不確実性を分離し,分布外検出において優れた性能を示した。
- 確率的フローマッチング(SFM)により,モデルの汎化性能が向上し,信頼性が高まった。
- MCD-Antitheticは,効率的な異常スコア生成により,分布外検出の精度を向上させた。
CellFluxRL:強化学習による生物学的制約付きバーチャルセルモデリング [cs.LG, q-bio.QM]目的:生物学的制約を満たしたバーチャルセルモデルの構築
- 創薬の加速に貢献する,in silicoでの細胞挙動シミュレーションの重要性が高まっている。
- 既存の画像生成アプローチでは,物理・生物学的制約に反する不自然な細胞画像が生成される課題がある。
- 強化学習を用いてモデルを改善し,生物学的に意味のあるバーチャルセルモデルを生成することを目指す。
- CellFluxRLは,CellFluxと比較して全ての報酬において一貫して性能が向上した。
- テスト時のスケーリングによって,さらに性能が向上することが確認された。
- 本研究は,強化学習による物理基盤制約の導入を通じて,視覚的なリアリティを超えた生物学的に意味のあるモデル構築を実現する。
BadminSense:単一のスマートウォッチによるバドミントンストロークの細分化された評価を可能にする [cs.HC, cs.AI]目的:バドミントンストロークの評価手法
- 競技力向上には客観的な評価が不可欠である。しかし,専門家の指導は限られている。
- アマチュア選手にとって,自身の技術を定量的に評価する手段が不足している。
- スマートウォッチを用いた,手軽で高精度な評価システムの開発。
- BadminSenseは,ストロークの分類において91.43%の精度を達成した。
- ストローク品質の評価誤差は平均0.438であり,高い精度を示す。
- シャトルインパクト位置の推定誤差は平均12.9cmであり,実用的な精度である。
双曲視覚言語モデルにおける不確実性に基づく構成的アラインメントと部分-全体意味表現性 [cs.HC, cs.CV, cs.AI]目的:双曲視覚言語モデルにおける部分-全体意味表現性のモデリング
- 視覚言語モデルは高性能だが,階層的関係の表現に限界がある。双曲空間を用いることで,その課題を克服可能となる。
- 既存手法では,部分画像の全体に対する意味表現性の違いを考慮していない点が課題である。
- 不確実性に基づく重み付けにより,より正確な部分-全体の関係を学習し,複雑なシーン理解を目指す。
- 提案手法UNCHAは,不確実性に基づく重み付けを導入し,部分-全体関係のモデリングを強化する。
- UNCHAは,不確実性に基づいた損失関数とエントロピー項による正則化を用いて,より正確な部分-全体順序を学習する。
- その結果,ゼロショット分類,検索,マルチラベル分類のベンチマークにおいて最先端の性能を達成した。
タイル照合を超えて:視覚のみによるUAVナビゲーションのための空中画像と衛星画像のずれの解消 [cs.CV, cs.AI]目的:ずれのある空中画像と衛星画像間の対応付けによる,視覚のみによるUAVナビゲーションの実現
- GNSSが利用できない環境下でのUAVナビゲーションにおいて,クロスビュージオローカリゼーションは重要な技術である。
- 既存手法はタイル照合に依存し,精度とストレージ容量のトレードオフ,UAVのheadingの考慮不足が課題である。
- クロスビューのずれやオーバーラップに強く,軽量かつロバストなナビゲーションシステムの構築を目指す。
- 提案手法Bearing-UAVは,周辺の特徴からUAVの絶対位置とheadingを同時に予測することで,高精度なナビゲーションを実現する。
- 多様な地形において,既存の照合・検索手法よりも低い位置特定誤差を示すことが実験的に示された。
- グローバル・ローカル特徴と相対的な空間関係を明示的に符号化することで,クロスビューの変動やずれに強い。
多スケールガウスGraphicalモデルの推論 [stat.ML, cs.LG]目的:高次元データにおける変数間の相互作用の合成
- ゲノミクスや画像解析など,複雑なデータ解析において,変数間の関係性を理解する重要性。
- 既存手法では,適切なクラスタリングが事前に必要であり,解析の柔軟性が低いという課題。
- グラフ推論と同時にクラスタリングを行うことで,より解釈性の高いネットワーク構造を構築する。
- 提案手法MGLassoは,異なる粒度のグラフを生成することで,ネットワークの解釈性を向上させる。
- 凸クラスタリングと階層的クラスタリングを用いて,クラスタを推定し,同時に条件付き独立グラフを推論する。
- 合成データおよび実際のゲノムデータ,遺伝子データへの応用により,提案手法の有効性が示された。
HD-Bind:低精度な超次元二値表現による分子構造の符号化 [q-bio.BM, cs.LG]目的:分子構造の符号化手法
- 創薬において,膨大な数の化合物から有望な候補を見つけ出すことは重要である。
- 既存の分子ドッキング法は計算コストが高く,大規模な化合物ライブラリには適用が困難である。
- 超次元計算を用いて,高速かつ低コストな分子構造の表現方法を開発し,スクリーニングを効率化する。
- 提案手法は,既存の機械学習手法と比較して最大90倍の推論速度向上を達成した。
- 分子ドッキング法と比較すると,約9桁のオーダーで推論が高速化された。
- 本研究は,分子表現学習による超効率的な事前スクリーニングツールの開発を促進する。
最適に近い非凸・強凸二段階最適化:完全な一階微分オラクルを用いる手法 [math.OC, cs.LG]目的:非凸・強凸な二段階最適化問題に対する効率的な解法
- 機械学習の分野において,二段階最適化は,敵対的学習やハイパーパラメータ最適化など,様々な問題に応用可能である。
- ヘッセ行列ベクトル積(HVP)オラクルは計算コストが高く,実用的な問題への適用が困難となる場合がある。
- HVPオラクルを用いずに,より効率的に二段階最適化問題を解くこと。
- 本研究では,二段階更新を用いることで,既存の一階微分法よりも高速な$\tilde {\mathcal{O}}(\epsilon^{-2})$のオラクル複雑度を達成した。
- 確率的設定において,ノイズの種類に応じて,$\tilde {\mathcal{O}}(\epsilon^{-4})$または$\tilde {\mathcal{O}}(\epsilon^{-6})$のオラクル複雑度を達成する。
- 高次滑らかさの条件下では,ノイズ注入とNesterovのモーメンタムにより,より高速な$\tilde {\mathcal{O}}(\epsilon^{-1.75})$の収束率を実現した。
スピンネットワークに基づくSU(2)同変変分量子回路:必要なのはスピンだけ [quant-ph, cond-mat.stat-mech, cs.LG, stat.ML]目的:SU(2)同変変分量子回路の構築
- 量子機械学習は,問題の対称性を回路に組み込むことで効率化が期待される。
- 対称性を組み込んだ量子回路の具体的な構築方法が確立されていない。
- スピンネットワークを用いて,SU(2)同変変分量子回路を直接構築し,効率的な学習を実現する。
- スピンネットワークは,SU(2)群作用をブロック対角化する基底において,パラメータ化された同変量子回路の自然な構成要素となる。
- 本研究で提案する構築法は,twirlingや一般化置換に基づく既存の方法と同等でありながら,量子ハードウェア上での実装がより直接的である。
- SU(2)対称なHeisenbergモデルの基底状態問題を解くことで,提案回路の有効性が確認された。性能向上が示唆され,実問題への応用が期待される。
重み付きサポートベクターマシンによるスパース学習とクラス確率推定 [stat.ME, cs.LG, stat.ML]目的:スパース学習におけるクラス確率推定の精度向上
- 機械学習やデータサイエンスの分野において,分類と確率推定は基盤技術である。
- 既存の重み付きSVMは密な特徴量向けであり,スパースな特徴量と冗長なノイズに対して性能が限られる。
- 変数選択を自動化することで,スパースデータにおける確率推定の精度向上を目指す。
- 提案手法は,L1正則化またはElastic Net正則化を用いた重み付きSVMを用いて効率的な変数選択を実現する。
- Elastic Net正則化は,変数選択と確率推定の両方において優れた性能を示し,変数グループ化の利点も有する。
- 本手法は広範な適用可能性を持ち,アンサンブル学習を通じてKクラス問題にも容易に拡張できる。
クラスタパスを用いたガウスGraphicalモデル [stat.ML, cs.LG]目的:Graphicalモデルにおける変数クラスタリングの促進
- 変数間の条件付き依存性を可視化する上で有用であり,複雑なデータ解析に不可欠である。
- 変数の増加に伴い,解釈が困難となり,パラメータ数に対する観測値数の不足が推定誤差を増大させる。
- データ駆動型のアプローチにより,変数間のクラスタリングを促し,Graphicalモデルの解釈性と精度向上を目指す。
- 提案手法であるClusterpath推定量は,ブロック構造を持つ精度行列を生成し,共分散行列へその構造を反映させる。
- シミュレーション実験において,既存の最先端手法と比較して,変数のクラスタリング性能が同等またはそれ以上の結果が得られた。
- 多様な実データへの適用を通して,提案手法の汎用性と実用性が示された。
大規模言語モデルによる量子特徴マップ設計の自動化 [quant-ph, cs.AI]目的:量子特徴マップの自動生成,評価,改良
- 量子機械学習は,古典データ処理の限界を超える可能性を秘めている。量子状態へのデータエンコードが鍵となる。
- 実用的な優位性を持つ量子特徴マップの設計は依然として困難であり,古典手法との比較が課題である。
- 大規模言語モデルを活用し,データに適応した量子特徴マップを自動的に探索,改良することを目指す。
- 提案システムは,MNISTデータセットにおいて97.3%の分類精度を達成し,既存の量子特徴マップを上回った。
- 古典的なRBFカーネルと比較しても,0.3%以内の精度差に留まり,競争力のある性能を示した。
- Fashion-MNISTとCIFAR-10においても同様の改善が見られ,LLM駆動型探索の有効性が示された。
クープマン作用素と遷移行列近似のための動的に学習される基底 [math.DS, cs.LG, cs.NA, math.NA]目的:複雑な非線形動的システムの表現と解析
- 複雑系理解への貢献が期待され,制御や予測といった応用範囲が広い。
- 効率的なスペクトル推定が困難であり,計算コストが高いという課題がある。
- 動的システムに特化した基底関数を学習し,近似精度向上を目指す。
- 提案手法により,クープマン作用素と遷移行列のスペクトル特性を効果的に抽出可能となった。
- 学習された基底は,システムのダイナミクスに適応的に変化し,高精度な近似を実現する。
- 固有関数や不変測度の効率的な復元にも貢献し,動的システムの理解を深める。
積ヒルベルト空間から一般化クープマン作用子,および非線形基本補題へ [math.OC, cs.SY, eess.SY, math.OC, cs.AI]目的:非線形システムのデータ駆動型制御手法開発における鍵となる問題の解決
- 非線形システムの制御は困難であり,データ駆動型アプローチの重要性が増している
- 従来のクープマン作用子理論は,制御入力を持つシステムや,測度保存性の条件が厳しい
- 状態と入力の観測可能関数のテンソル積で構成される積ヒルベルト空間に基づく新しい解法を提供する
- 制御入力を伴うシステムのクープマン作用子の一般化と,非線形基本補題の導出に成功した。
- 古典的なクープマン不変条件とは異なり,測度保存性は必須ではないことが示された。
- 構築された正確な無限次元双線形クープマン表現とハンケル作用子を用いて非線形基本補題を導出した。
予測に基づいた推論と逆確率重み付け [stat.ML, cs.LG]目的:部分的にラベル付けされたデータを用いた妥当な統計的推論
- 現代社会におけるデータ収集の効率化が求められる中で,ラベル付けのコスト削減が重要である
- ラベル付きデータが少ない場合,従来の統計的推論では信頼性の高い結果を得ることが困難である
- 予測モデルと重み付けを組み合わせることで,少ないラベルデータでも精度の高い推論を実現すること
- 予測に基づく推論(PPI)は,大規模な未ラベルデータと少量のラベル付きデータを利用し,バイアス補正を行うことで,妥当な推論を可能にする。
- 本研究では,PPIの修正が設計に基づいた解釈を持つこと,および情報的なラベル付けをHorvitz--ThompsonやH\'ajekスタイルの補正で自然に扱えることを示した。
- シミュレーションの結果,推定された傾向スコアを用いたIPW調整PPIは,既知の確率の場合とほぼ同等の性能を示し,PPIの公称カバレッジと分散削減効果を維持した。
マスク付き条件付き生成モデリングによる形態認識ペプチド探索 [q-bio.BM, cs.LG]目的:ペプチドの新規配列生成
- 生体適合性材料開発への貢献が期待されるため。
- ペプチド配列空間の広大さから,形態制御が困難である。
- 形態を制御したペプチド設計を自動化すること。
- PepMorphは,ペプチド記述子を条件として,線維状または球状の形態への自己組織化を誘導する新規配列を生成する。
- Transformerベースの条件付き変分オートエンコーダとマスキング機構を用いたパイプラインである。
- 粗視化分子動力学シミュレーションによる検証で,目標とする形態の成功率が83%に達した。
ゼロショットテキスト読み上げにおける選択的識別子不要ガイダンス [eess.AS, cs.AI, cs.SD]目的:ゼロショットテキスト読み上げの品質向上
- 音声合成技術は,人間とコンピュータの自然な対話を可能にする重要な要素である。
- ゼロショット学習では,ターゲットスピーカーへの忠実性とテキスト内容の正確性の両立が課題である。
- 画像生成で有効な識別子不要ガイダンスを音声合成に応用し,その効果を検証する。
- 画像生成で効果的な識別子不要ガイダンスは,一般的に音声合成の向上には寄与しないことが示された。
- 初期段階で標準的な識別子不要ガイダンスを適用し,後期段階で選択的な識別子不要ガイダンスに切り替えることで,話者類似性を向上させつつ,テキスト内容の劣化を抑制できることが明らかになった。
- 選択的識別子不要ガイダンスの効果は,テキスト表現に大きく依存し,英語と中国語で異なる結果が得られることが観察された。
基盤モデル産業における体系的脆弱性の定量化 [econ.GN, cs.AI, q-fin.EC]目的:基盤モデル産業の体系的脆弱性評価のための指標
- AI技術の発展は経済や社会に大きな影響を与えるため,産業構造の安定性が重要である。
- 基盤モデル産業は特定資源への依存度が高く,サプライチェーンの脆弱性が懸念されている。
- 本研究は,資源制約を考慮した脆弱性評価指標を開発し,リスクを特定することを目的とする。
- AIIVI(人工知能産業脆弱性指標)は,6社の最先端基盤モデル開発者に対して0.82という高い脆弱性を示した。
- 特に,計算インフラ(0.85)とエネルギーシステム(0.90)が脆弱性の主要因となっていることが明らかになった。
- 半導体増強だけでなく,エネルギーインフラへの投資が喫緊の課題であることが示唆された。
リース回帰と直接密度比推定 [stat.ML, cs.LG, econ.EM, math.ST, stat.ME, stat.TH]目的:リース回帰と密度比推定の関連性
- 因果推論は,社会科学や医療分野など,様々な分野で重要な役割を果たす。
- 既存の密度比推定法は,モデルの複雑さやデータ分布によっては収束が遅い場合がある。
- リース回帰の等価性を示すことで,密度比推定の既存研究を活用し,より効率的な推定を可能にする。
- リース回帰の表現子が符号付き密度比として表現できることが示された。
- リース回帰の目的関数は,最小二乗重要度適合基準と一致することが明らかになった。
- この等価性により,収束率解析や正則化手法など,密度比推定の既存結果をリース回帰に適用できる。
生成AIが6GとBeyondに貢献:セマンティック通信のための拡散モデル [eess.SP, cs.IT, cs.LG, cs.MM, math.IT]目的:セマンティック通信における拡散モデルの応用
- 無線システムは理論的上限に近づいており,意味伝達が重要になっている。
- 拡散モデルと通信システム設計を結びつける体系的な指針が存在しない。
- 拡散モデルを次世代無線ネットワークの基盤技術として確立すること。
- 本研究は,拡散モデルを用いたセマンティック通信の包括的なチュートリアルを提供する。
- 条件付き拡散,効率的な拡散,汎用化された拡散という3つの技術的柱を体系的にレビューする。
- 拡散モデルが,セマンティック忠実性と堅牢性を維持しながら極端な圧縮を可能にすることを示す。
位置エンコーディングの影響:文脈内回帰におけるTransformerのクリーンおよび敵対的ラダメッシャー複雑性 [quant-ph, cs.ET, stat.ML, cs.LG]目的:Transformerにおける位置エンコーディングの一般化性能とロバスト性に関する解析
- Transformerは自然言語処理の基盤技術であり,その性能向上が重要である。
- 位置エンコーディングが一般化性能とロバスト性に与える影響は未解明な点が多い。
- 位置エンコーディングが一般化ギャップを拡大するメカニズムの解明を目指す。
- 位置エンコーディングは,文脈内回帰における一般化ギャップを系統的に拡大することが示された。
- 敵対的設定下では,位置エンコーディングの有無によるギャップが拡大し,モデルの脆弱性を増幅することが確認された。
- 本研究は,位置エンコーディングを用いた文脈内学習におけるクリーンおよび敵対的一般化を理解するための新たな枠組みを確立する。
高次元フォッカー・プランク方程式に対する適応確率フロー残差最小化 [physics.comp-ph, cs.LG, cs.NA, math.NA]目的:高次元フォッカー・プランク方程式の効率的な解法
- 物理学や確率力学において高次元方程式の解法は不可欠である。
- 次元の呪いにより,従来の数値解法は高次元で計算コストが増大する。
- 高次元における計算コストを削減し,精度を維持する解法の開発。
- 適応確率フロー残差最小化(A-PFRM)法を提案し,ヘッセ行列の明示的な計算を回避した。
- 連続正規化フローとハッチンソン・トレース推定器を利用し,計算複雑度をO(d)に削減した。
- 様々なベンチマークテストで,次元の呪いを軽減し,高い精度と一定の計算時間を維持することを示した。
音声テキスト検索のための適応的自己改善知識フレームワーク [eess.AS, cs.IR, cs.LG, cs.MM, cs.SD]目的:音声テキスト検索における知識フレームワークの改善
- 音声とテキストの関連性を捉えることは,情報検索やマルチモーダルな理解に不可欠である。
- 既存手法では,局所的な学習に偏り,曖昧な音響情報や希少な概念の学習が不十分である。
- 知識注入による課題解決が試みられるが,知識ベースとモデルの不整合が性能低下を招く。
- 本研究では,多粒度知識注入と動的な知識ベースの更新により,これらの課題を克服するASKフレームワークを提案する。
- ASKは,勾配の局所性の問題を解消し,表現のドリフト不一致を軽減することで,検索性能を向上させる。
- 複数のベンチマークにおいて,ASKは最先端の性能を達成し,様々なバックボーンで有効であることが示された。
LLMエージェントの行動一貫性検証:株式市場シミュレーションを通じた取引スタイル転換の分析 [q-fin.TR, cs.AI]目的:LLMエージェントの取引スタイル転換の一貫性
- 金融市場シミュレーションは,ミクロ行動がマクロ現象に集約するかを検証する上で重要である。
- シミュレーションにおけるエージェントの戦略が固定化されており,現実の市場ダイナミクスを反映していない。
- LLMエージェントの戦略転換が金融理論と一致するかどうかを評価し,シミュレーションの妥当性を高める。
- 近年のLLMエージェントの取引スタイル転換は,行動ファイナンス理論と部分的に一致することを示した。
- エージェントの行動と金融理論とのずれは,LLMエージェントの行動調整の必要性を示唆している。
- 損失回避,ハーディング,富の差異化,価格の誤りといった行動ファイナンス要因を性格特性として活用した。
経済学における強化学習の現状 [q-bio.NC, cs.SY, eess.SY, econ.GN, cs.LG, q-fin.EC]目的:経済学への強化学習手法の導入
- 経済モデルは複雑化の一途を辿り,従来の解法では対応が困難になっている。
- 次元の呪いにより,厳密な動的計画法の適用範囲が限られている。
- 高次元・連続行動・戦略的相互作用を含む経済モデルへの適用を目指す。
- 強化学習は動的計画法の拡張として,より複雑な問題への対応を可能にする。
- 価格設定,在庫管理,戦略的ゲーム,選好抽出といったシミュレーションで有効性が確認された。
- ただし,脆弱性,サンプル効率の低さ,ハイパーパラメータへの依存性などの課題も存在する。
Wi-Fiレンジフィルタリングドップラースペクトルによる人体検知 [eess.SP, cs.AI, cs.CV]目的:Wi-Fiを用いた人体検知手法の開発
- 省電力化やセキュリティ向上に貢献するため,デバイスにおける人体検知技術の重要性が高まっている。
- 既存手法は,外部センサーやカメラに依存し,コスト増大やプライバシー侵害のリスクを伴う。
- 内蔵Wi-Fiのみで,低コストかつプライバシー配慮型の検知手法を確立し,環境への適応性を高める。
- 提案手法RF-DSは,Wi-Fi信号のチャネルインパルス応答に基づき,レンジフィルタリングとドップラー分析を組み合わせることで,効率的な人体検知を実現した。
- 時間窓を用いることで推定の安定性を高め,適応的なマルチレート処理により計算量を削減した。
- 本手法は,特別な校正や再学習を必要とせず,様々な環境やデバイスへの展開が可能である。
ファウンデーションモデルによる代理モデルが,材料発見のためのデータ効率的な能動学習を可能にする [cond-mat.mtrl-sci, cs.LG]目的:材料発見のための能動学習におけるデータ効率の向上
- 材料科学では,実験回数を減らし効率的に最適な材料を見つけることが重要である。
- 既存の代理モデル(ガウス過程,ランダムフォレスト)は,データ量が少ない場合に性能が低下する課題がある。
- 本研究は,事前学習済みのファウンデーションモデルを代理モデルとして利用し,少ないデータでも高精度な能動学習を実現する。
- 提案手法(ICAL)は,10個の材料データセットでガウス過程やランダムフォレストと比較して,8/10のデータセットで優れた性能を示した。
- 実験評価から,提案手法はガウス過程に比べて平均52%,ランダムフォレストに比べて29.77%,追加評価回数を削減できることが確認された。
- 交差検証分析により,提案手法の優位性は,より優れた不確実性推定に起因することが示された。
深層適応モデルに基づく実験計画法 [stat.ML, cs.LG, cs.SY, eess.SY, stat.ME]目的:非線形動的システムにおけるパラメータ効率的な推定
- 複雑なシステムを効率的に理解・制御するためには,正確なパラメータ推定が不可欠である。
- 従来の適応型実験計画法は計算コストが高く,リアルタイムでの応用が困難であった。
- 深層学習を用いて実験計画を効率化し,リアルタイムでのパラメータ推定を実現すること。
- 深層適応設計(DAD)と微分可能なメカニズムモデルを組み合わせることで,効率的な実験計画を可能にした。
- 動的システムの時間構造を考慮したTransformerベースのポリシーアーキテクチャを提案した。
- 提案手法を複数のシステムで検証し,リアルタイム展開の可能性を示した。
脱相関,多様性,創発的知能:社会性昆虫コロニーとアンサンブル機械学習の同型性 [stat.ML, cs.LG]目的:社会性昆虫コロニーとアンサンブル機械学習の同型性
- 分散型情報処理は自然界と計算科学において重要であり,高度な問題解決能力を持つシステムを理解する鍵となる。
- 既存の研究では,生物学的システムと人工システムにおける知能の創発メカニズムの共通点を明確に説明できていない。
- 社会性昆虫と機械学習における知能創発の原理を数学的に解明し,両者の普遍的な共通性を明らかにすること。
- 社会性昆虫の意思決定とランダムフォレスト学習が,確率的アンサンブル知能という共通の形式の下で同型であることが示された。
- 遺伝的に同一なアリが局所的な手がかりと正のフィードバックによって機能分化を達成するメカニズムは,決定木の脱相関に用いられるブートストラップ集積とランダムな特徴部分サンプリングと対応することが明らかになった。
- 両システムは,同一ユニットの脱相関を通して,同一の分散減少戦略を実行していることが数学的に証明された。
TRACE:地震学的物理的推論のためのマルチエージェントシステム [physics.geo-ph, cs.AI]目的:地震シーケンスを支配する物理メカニズムの推論
- 地震発生メカニズムの解明は,防災・減災に不可欠であり,社会への貢献が期待される。
- 地震の解釈は専門家の経験に依存し,再現性や異地域への適用が課題となっていた。
- 異質な地震現象を体系的に解釈するための論理的基盤を構築し,自律的な発見を促進する。
- TRACEは,大規模言語モデルと地震学的制約を組み合わせ,地震シーケンスの物理的メカニズムを推論する。
- 2019年のRidgecrest地震列において,遅延誘発のメカニズムを自律的に特定した。
- Santorini-Kolumbo地震では,構造に起因するマグマ貫入モデルを特定し,均質破壊とは異なる破砕伝播を明らかにした。
