arXiv雑要約

AI - 2025/12/16 公開

  • ドメイン適応型検索のためのプロトタイプに基づく意味的一貫性アライメント [cs.LG, cs.AI]目的:ドメイン適応型検索における知識転移とドメイン間の差異軽減
    • 検索システムの性能向上は,情報アクセスにおいて重要な課題である。
    • ドメイン適応型検索では,ラベルなしターゲットドメインでの性能が課題となる。
    • 既存手法の限界を克服し,より効果的なドメイン適応型検索を実現する。
    • 提案手法PSCAは,クラスレベルの意味的接続を確立し,ドメイン間の知識転移を促進する。
    • 幾何学的近接性に基づく信頼性指標により,疑似ラベルの精度向上と学習の安定化を図る。
    • 再構成された特徴量に基づく量子化により,ハッシュ符号の品質を向上させ,両ステージを円滑に接続する。

    Link: https://arxiv.org/abs/2512.04524

  • 知性の幾何学:決定論的関数トポロジーによる現実世界知覚の基盤 [cs.LG, math.OC]目的:現実世界知覚の基盤となる決定論的関数トポロジーの枠組み
    • 現実世界の物理過程は,複雑な変動を持たないため,効率的な学習が期待できる。
    • 従来の機械学習は,大量のデータが必要であり,現実世界の制約に対応できない場合がある。
    • 少ないデータから汎化可能な知覚メカニズムの数学的基盤を確立すること。
    • 物理現象の有効な実現集合は,安定した不変量を持つコンパクトな知覚多様体として表現できる。
    • 多様体の境界は,制御方程式が不明な場合でも,モンテカルロサンプリングによって自己教師ありで発見可能である。
    • 電気機械式ポイントマシン,電気化学的バッテリー放電曲線,生理学的ECG信号において実証された。

    Link: https://arxiv.org/abs/2512.05089

  • より安全な共同超知能のためのAIと人間の相互進化 [cs.AI]目的:AIと人間の共同研究による超知能の実現
    • AI分野の発展は,社会に大きな変革をもたらす可能性を秘めている。
    • 自己改善型AIは危険性を伴うため,安全な開発が課題となっている。
    • 人間とAIの協調により,より安全かつ迅速な超知能の実現を目指す。
    • AIと人間の協調的改善に焦点を当てることで,超知能研究の加速化が期待される。
    • 人間の研究能力向上を組み込むことで,AIと人間双方にとって安全な超知能が実現可能となる。
    • このアプローチは,従来の自己改善型AIよりも迅速かつ安全な道筋を提供する。

    Link: https://arxiv.org/abs/2512.05356

  • 残差補正拡散モデルに基づく中国地域3kmダウン スケーリング [cs.LG, cs.AI, physics.ao-ph]目的:中国地域における3kmの高解像度天気予報の生成
    • 数値天気予報において,高解像度な予報を効率的に生成することは重要である。
    • グローバルモデルの出力から高解像度な予報を得るにはダウン スケーリングが必要だが,既存手法には限界がある。
    • 拡散モデルを活用し,中国地域においてより高精度なダウン スケーリングを実現することを目指す。
    • 提案手法によるダウン スケーリングは,目標変数についてMAEにおいてCMA-MESOの直接予報を上回る結果を示した。
    • 残差補正拡散モデルは,決定論的な回帰モデルと比較して,より現実的な予測につながる微細な詳細を生成できることが示された。
    • CMA-GFSおよびSFFのグローバルモデル予報に対し,提案手法を適用することで3kmの高解像度予報を生成した。

    Link: https://arxiv.org/abs/2512.05377

  • ウォーターシュタイン進化:進化最適化を相転移として捉える [cs.NE]目的:進化計算と統計物理学を結びつける新しい枠組み
    • 最適化問題は科学技術の根幹であり,効率的な解法が求められている。
    • 既存の最適化手法は,局所解への陥りやすさや多様性の維持が課題である。
    • 統計物理学の相転移の概念を用いて,最適化の原理的理解を目指す。
    • ウォーターシュタイン進化(WE)は,ボルツマン分布への収束が理論的に保証されている。
    • WEは,ベンチマーク関数および物理ポテンシャル関数において,他の5つのアルゴリズムよりも低い自由エネルギーと高いエントロピーを達成した。
    • WEは,並進,スケール,回転不変性を示し,問題の座標表現に依存しないロバスト性を持つことが確認された。

    Link: https://arxiv.org/abs/2512.05837

  • 機械学習による企業レベルのビジネスサーベイ用合成マイクロデータ開発 [cs.LG, econ.GN, q-fin.EC, stat.AP, stat.ME]目的:企業レベルのビジネスサーベイにおける合成マイクロデータの開発
    • 企業活動の分析には,詳細な企業データが不可欠である。経済政策や産業構造の変化を把握するためにも重要。
    • 匿名化されたデータでも,再識別リスクが存在する。特に企業データは,業種や地域が特定されやすく,機密性保護が課題。
    • 機密性を保護しつつ,実データに近い分析可能な合成データを提供することを目指す。
    • 機械学習モデルを用いて,Annual Business Survey (ABS) を基にした合成PUMSを構築した。
    • 2007年のSurvey of Business Owners向けに2つの合成PUMSを開発し,Small Business Economics誌の分析を再現した。
    • 合成データは実データと高い類似性を示し,ABSの様々な応用可能性を示唆した。

    Link: https://arxiv.org/abs/2512.05948

  • クラウドにおける信頼できるAIエージェント [cs.CR, cs.AI, cs.MA]目的:AIエージェントの信頼性確保
    • AIエージェント利用拡大に伴い,機密データ保護の重要性が増している。
    • 既存技術では,多要素間の信頼確保や詳細な振る舞い監視が困難である。
    • エンドツーエンドの隔離と検証可能な信頼関係構築によるAIエージェント保護を目指す。
    • Omegaは,Confidential VMとGPUを活用し,単一のCVM内で複数のエージェントを隔離するプラットフォームを構築した。
    • 差分アテステーションにより,エージェント間の信頼関係を効率的に確立し,ポリシーに基づいたデータアクセス制御を実現した。
    • AMD SEV-SNPとNVIDIA H100上で,高い性能とスケーラビリティを両立し,クラウド環境での安全なAIエージェント運用を可能にした。

    Link: https://arxiv.org/abs/2512.05951

  • SparsePixels:FPGAにおける疎なデータに対する効率的な畳み込み [cs.AR, cs.LG, hep-ex]目的:FPGA上での疎なデータに対する効率的な畳み込み処理の実現
    • 現代の実験では,マイクロ秒以下の低遅延が求められる高速なデータ処理が不可欠である。
    • 標準的な畳み込みニューラルネットワークは,疎な入力データに対しても全てのピクセルを処理するため,非効率である。
    • 有効なピクセルのみを処理することで,FPGA上での畳み込み処理の高速化と省資源化を目指す。
    • SparsePixelsフレームワークを実装することで,FPGA上での疎な畳み込み処理が可能になった。
    • 4kピクセルのLArTPC画像において,標準CNNと比較して73倍の高速化を達成した (48.665μs → 0.665μs)。
    • 性能損失はわずかであり,オンチップリソースの使用量も十分な余裕があることが確認された。

    Link: https://arxiv.org/abs/2512.06208

  • RefBench-PRO:参照表現理解のための知覚と推論指向型ベンチマーク [cs.CV, cs.AI]目的:参照表現理解の評価
    • 画像とテキストの理解は,AIのマルチモーダルな能力において重要である。
    • 既存のベンチマークは知覚能力に偏っており,推論能力の評価が不十分である。
    • 知覚と推論の側面から評価可能な,より包括的なベンチマークの構築。
    • RefBench-PROは,参照表現を知覚と推論の二つの次元に分解し,6つの段階的なタスクに分類する。
    • 自動データ生成パイプラインにより,多様な参照表現を生成できる。
    • Ref-R1という強化学習スキームを提案し,複雑な推論条件下での定位精度を向上させた。

    Link: https://arxiv.org/abs/2512.06276

  • 音声LLMにおける選択的聴取を通じた傍聴者のプライバシー保護 [cs.SD, cs.AI]目的:音声LLMにおける傍聴者のプライバシー保護
    • 音声LLMの利用拡大に伴い,プライバシー保護の重要性が増している。
    • 既存の評価指標や防御策では,意図しない傍聴者の音声によるリスクに対応できていない。
    • 傍聴者の音声を認識・漏洩しない選択的聴取能力を評価・改善する。
    • SH-Benchという,選択的聴取能力を評価するための新たなベンチマークを開発した。
    • Selective Efficacy (SE)という,多話者理解と傍聴者プライバシー保護を評価する指標を提案した。
    • BPFTというファインチューニング手法により,傍聴者関連の質問への回答を拒否しつつ,主要な話者の理解力を維持することができた。

    Link: https://arxiv.org/abs/2512.06380

  • ESPADA:意味理解に基づいた模倣学習用デモンストレーションデータダウンサンプリングによる実行速度向上 [cs.RO, cs.AI]目的:模倣学習における実行速度向上
    • ロボットの操作効率化は,産業の自動化や人手不足解消に不可欠である。
    • 人間のデモンストレーションは正確だが,速度が遅く実用化のボトルネックとなっている。
    • 意味理解に基づき,重要でない部分のデータを削減することで,速度向上を目指す。
    • ESPADAは,VLM-LLMパイプラインを用いてデモンストレーションをセグメント化し,非重要なセグメントを積極的にダウンサンプリングする。
    • 追加データやアーキテクチャ変更,再学習を必要とせず,精度を維持しながら約2倍の速度向上を達成した。
    • ダイナミックタイムワーピング(DTW)により,単一のエピソードからデータセット全体へのラベル伝播を実現した。

    Link: https://arxiv.org/abs/2512.07371

  • 交互事前条件付き勾配降下法による効率的な低チューブランクテンソル推定 [cs.LG, math.OC]目的:低チューブランクテンソル推定のための効率的な手法
    • 高次元信号処理,機械学習,画像科学など広範な分野で基礎的な課題である。
    • 大規模テンソルに対して,計算コストが高く,既存のテンソル特異値分解は適用が困難である。
    • 過パラメータ化設定下での収束を加速し,テンソルランクの過大推定による問題を解決する。
    • 提案手法である交互事前条件付き勾配降下法(APGD)が,一般的な低チューブランクテンソル推定問題に対して線形収束を保証する。
    • APGDは過パラメータ化下でも線形収束を達成し,収束速度はテンソルの条件数に依存しない。
    • 合成データを用いた実験により,理論的根拠の妥当性が確認された。

    Link: https://arxiv.org/abs/2512.07490

  • SA$^{2}$GFM:構造を意識した意味的拡張によるロバストなグラフ基盤モデルの強化 [cs.LG]目的:ドメインノイズ,構造的摂動,敵対的攻撃に対するロバスト性向上
    • グラフ構造データは様々な分野で重要であり,その応用範囲は広い。
    • 既存のグラフ基盤モデルは,ドメインノイズや構造変化に弱いという課題がある。
    • 階層的な構造的意味を効果的にモデル化し,汎化性能を高めることを目指す。
    • 提案手法SA$^{2}$GFMは,構造を意識した意味的拡張により,ドメイン適応表現を改善する。
    • 構造誘導圧縮によるロバストで転移可能な表現を抽出し,クロスドメイン適応における負の転移を抑制する。
    • ノードとグラフの分類タスクにおいて,最先端のベースライン9つを上回り,有効性とロバスト性を実証した。

    Link: https://arxiv.org/abs/2512.07857

  • スペクトルグラフアラインメントによるグラフ対照学習 [cs.LG]目的:グラフ埋め込み間のペアワイズアラインメントと,それに基づくグラフのグローバル構造制御
    • グラフ構造データの表現学習は,様々な応用において重要性を増している。
    • 既存の対照学習法は,ビュー固有のグラフのグローバル構造の制御機構を持たない。
    • ビュー固有のグラフのグローバル構造を整合させることで,表現学習の性能向上を目指す。
    • 提案手法SpecMatch-CLは,正規化されたラプラシアンの差を最小化することでグラフアラインメントを実現する。
    • 理論的に,ラプラシアンの差が,理想的なアラインメント損失と現在の損失の上限となることを示す。
    • 実験的に,TUベンチマーク,PPI-306K,ZINC 2Mデータセットにおいて,最先端の性能を達成した。

    Link: https://arxiv.org/abs/2512.07878

  • 知識の体系化:モデルコンテキストプロトコルエコシステムにおけるセキュリティと安全性 [cs.CR, cs.AI]目的:モデルコンテキストプロトコルエコシステムにおけるリスクの包括的な分類
    • 大規模言語モデルの利用拡大に伴い,外部データやツールとの連携が不可欠となり,その標準化が求められている。
    • モデルと外部環境の分離は相互運用性を高める一方,セキュリティ侵害と認識エラーの区別が曖昧になるという新たな課題が生じている。
    • モデルコンテキストプロトコル特有の脆弱性を分析し,多エージェント環境における不正操作のリスク軽減を目指す。
    • モデルコンテキストプロトコル(MCP)の基本的な要素(リソース,プロンプト,ツール)の構造的な脆弱性を特定した。
    • 「コンテキスト」が悪用され,多エージェント環境において不正な操作を引き起こす可能性を示唆した。
    • 暗号学的Provenance(ETDI)や実行時インテント検証など,最新の防御策を調査し,自律型エージェントオペレーティングシステムへの移行に向けたロードマップを提示した。

    Link: https://arxiv.org/abs/2512.08290

  • アンサンブル学習とニューラルネットワークモデルによるカリフォルニア支持力比の予測:トルコにおける事例研究 [cs.AI, cs.LG]目的:カリフォルニア支持力比の予測
    • 地盤の支持力は土木インフラや基礎設計において重要な指標であり,迅速かつ正確な評価が求められる。
    • 従来の支持力比の測定は室内試験に依存し,時間と費用がかかる上に,大規模な調査には不向きである。
    • 機械学習を用いて,地盤特性から支持力比を効率的に予測するモデルを構築し,従来の測定方法の代替となる。
    • ランダムフォレスト回帰モデルが最も高い予測精度を示し,テストデータでR2スコア0.83を達成した。
    • この結果は,機械学習が複雑な土壌挙動を非線形的にモデル化する能力を示しており,地盤工学における予測タスクに有効である。
    • 本研究は,インフラ分析・設計におけるデジタル変革を促進し,データ駆動型アプローチの導入を支援する。

    Link: https://arxiv.org/abs/2512.08340

  • 軽量転移学習に基づくバッテリー状態監視:自律飛行機への応用 [cs.DB, cs.AI]目的:リチウムイオンバッテリーの状態監視
    • バッテリーはモバイル機器の重要なエネルギー源であり,その性能管理は不可欠である。
    • 従来のバッテリー状態監視には大量のデータが必要であり,リアルタイムでの適用が困難である。
    • 少ないデータで高精度な状態監視を実現し,モバイル機器の動作時間を確保すること。
    • 提案手法は,ドメイン適応型転移学習を用いて,少ないデータでバッテリーの状態を正確に推定する。
    • 実験結果から,提案手法は既存手法と比較して,状態推定精度で大幅な改善が見られた。
    • 構造的リスク最小化により,転移学習の有効性とネットワークのコンパクト性を理論的に保証している。

    Link: https://arxiv.org/abs/2512.08512

  • 新規テルペン合成酵素生成のためのTpsGPT [cs.LG]目的:新規テルペン合成酵素の設計
    • テルペン合成酵素は,多くの天然物,抗がん剤などの多様な骨格を生成する重要な酵素群である。
    • 指向性進化によるテルペン合成酵素の新規設計は,コストと時間がかかるという課題がある。
    • 本研究は,効率的なテルペン合成酵素の新規生成を可能にすることを目的とする。
    • TpsGPTは,ProtGPT2をファインチューニングすることで,大規模なテルペン合成酵素の設計を可能にする生成モデルである。
    • 生成された候補酵素は,様々な検証指標を用いて評価され,7つの有望な候補が特定された。
    • 実験的検証により,これらの候補酵素の少なくとも2つが酵素活性を持つことが確認された。

    Link: https://arxiv.org/abs/2512.08772

  • Astra:自己回帰的ノイズ除去による汎用インタラクティブ世界モデル [cs.CV, cs.AI, cs.LG]目的:長期的未来予測を可能にする汎用的な世界モデルの構築
    • 現実世界の複雑な状況を理解し,予測することは,ロボット工学や自動運転などの応用において重要である。
    • 既存の世界モデルは,多様なシナリオや行動形式に対応する長期的予測能力に課題があった。
    • 過去の観測と行動から未来を予測し,様々なインタラクションをサポートする汎用モデルを開発すること。
    • Astraは,自己回帰的ノイズ除去アーキテクチャと時間的因果注意機構を用いることで,一貫性のある長期的ビデオ予測を実現した。
    • ノイズを付加した履歴メモリと行動認識アダプタにより,応答性と時間的整合性を両立し,多様な行動に対応できる。
    • 複数のデータセットにおける実験で,Astraが既存モデルを上回る忠実度,長距離予測,行動整合性を示すことが確認された。

    Link: https://arxiv.org/abs/2512.08931

  • 潜在的フローマッチングによる縦断的画像生成のための患者特有の疾患動態の学習 [cs.CV, cs.AI]目的:縦断的画像から患者特有の疾患動態を学習すること
    • 疾患の進行理解は,早期診断や個別化治療に不可欠であり,臨床上重要な課題である。
    • 潜在表現が散在し,意味構造に乏しいこと,および拡散モデルが連続性を損なうことが問題点である。
    • 患者特有の潜在的アライメントを学習し,疾患の重症度と相関する一貫性のある潜在空間を構築すること。
    • 提案手法$\Delta$-LFMは,疾患の動態を捉え,より解釈可能な進行を可能にする。
    • $\Delta$-LFMは,3つの縦断的MRIベンチマークにおいて,優れた実証的な性能を示した。
    • この手法は,疾患動態の解釈と可視化のための新たな枠組みを提供する。

    Link: https://arxiv.org/abs/2512.09185

  • 潜在的自己回帰GP-VAE言語モデル [cs.HC, cs.LG]目的:潜在的自己回帰スキームによる言語モデルの構築
    • 言語モデルは自然言語処理の根幹であり,その性能向上は様々な応用分野に不可欠である。
    • 従来の言語モデルは,計算コストが高い,学習が不安定になりやすい等の課題が存在する。
    • 潜在空間の確率的幾何学を利用することで,より効率的かつ安定的な言語モデルを実現することを目指す。
    • 提案モデルは,ガウス過程と変分オートエンコーダを統合した潜在的自己回帰スキームに基づく。
    • 実験結果から,モデルは安定的に学習可能であり,逐次サンプリングと並列サンプリングのバリアントが一貫した挙動を示すことが確認された。
    • 言語モデルの時間的構造の一部は,ニューラル演算に依存せず,潜在空間の確率的幾何学によって表現可能であることが示唆された。

    Link: https://arxiv.org/abs/2512.09535

  • 大規模推薦における意味的トークンと拡張表現:STARS [cs.IR, cs.LG]目的:大規模なEコマース環境における,低遅延な推薦システムの構築
    • Eコマースの発展に伴い,顧客に適切な商品を迅速に推薦することが重要となっている。
    • 新商品や変化するユーザーの意図,季節性などの影響により,推薦の精度が課題となっていた。
    • 意味的情報を活用し,多様なユーザーの意図に対応することで,推薦精度と効率を両立することを目指す。
    • STARSは,既存のLambdaMARTシステムと比較して,Hit@5が75%以上向上した。
    • 大規模A/Bテストでは,注文数,カート追加率,ユーザーあたりの訪問数において統計的に有意な改善が確認された。
    • 意味的情報と多意図モデリング,そして運用効率を重視した設計により,高品質な推薦を実現した。

    Link: https://arxiv.org/abs/2512.10149

  • 多変量時系列予測のための適応情報ルーティング [cs.LG, cs.AI]目的:多変量時系列予測における情報ルーティング手法
    • 時系列予測はAIの重要な課題であり,様々な実世界アプリケーションに不可欠である。
    • 従来の予測手法は過去の時系列データに依存するため,情報不足の場合に精度が低下する。
    • テキストデータ等の他のモダリティを活用し,時系列モデルの振る舞いを動的に制御することで予測精度向上を目指す。
    • 提案手法AIRは,テキスト情報を活用して時系列モデルの多変量情報の組み合わせ方を制御し,予測精度を向上させる。
    • 大規模言語モデルを用いたテキスト洗練パイプラインを開発し,多変量時系列予測のためのベンチマークを新たに構築した。
    • 原油価格や為替レート等の実データ実験により,AIRがテキスト入力を用いて時系列モデルを効果的に調整し,予測精度を大幅に向上させることが示された。

    Link: https://arxiv.org/abs/2512.10229

  • MotionEdit:モーション中心画像編集のベンチマークと学習 [cs.CV, cs.AI, cs.CL]目的:モーション中心画像編集のためのデータセットと評価基準
    • 画像編集技術は,コンテンツ制作や視覚効果において重要な役割を担う。
    • 既存の画像編集データセットは,モーションの変化に対応できず,品質も十分ではない。
    • モーションを忠実に再現しつつ,より自然な画像編集を実現することを目指す。
    • 本研究では,モーション中心画像編集に特化したデータセットMotionEditを開発した。
    • 既存の拡散モデルを用いたベンチマークテストの結果,モーション編集は依然として困難であることが示された。
    • MotionNFTという後処理フレームワークにより,編集品質とモーションの忠実性が向上することが確認された。

    Link: https://arxiv.org/abs/2512.10284

  • 質問応答のための協調検索拡張生成:相互情報交換と対照層によるランキング [cs.CL, cs.AI]目的:質問応答における協調検索拡張生成フレームワーク
    • 大規模言語モデルの知識不足による誤情報の生成が問題視されており,外部知識の活用が重要である。
    • 既存の検索拡張生成手法では,検索の誤りや幻覚が依然として発生しやすい。
    • 検索と生成モデルの協調により,より正確な質問応答を目指す。
    • 提案手法CoopRAGは,質問を部分質問と推論チェーンに分解し,不確実な箇所をマスクする。
    • マスクされた箇所を埋めることで推論チェーンを再構築し,関連文書のランキング精度を高める。
    • 複数の質問応答データセットにおいて,CoopRAGは最先端手法を上回る性能を示すことが確認された。

    Link: https://arxiv.org/abs/2512.10422

  • 再正規化可能スペクトルシェルダイナミクス:ニューラルスケーリング則の起源 [cs.LG]目的:ニューラルスケーリング則とダブルデセント現象の解明
    • 深層学習は高い性能を示すが,その理論的基盤は未だ十分に解明されていない。
    • 非線形な最適化ダイナミクス下での深層学習の構造が不明確であり,汎化性能の理論的説明が困難。
    • スペクトルシェルダイナミクスを通じて,深層学習の基礎的メカニズムを明らかにする。
    • 勾配降下法を関数空間で解析し,時間依存自己随伴演算子を用いて学習誤差の進化を記述した。
    • 対数スペクトルシェル粗視化により,シェル内の相互作用が打ち消され,シェルエネルギーは境界を介してのみ変化することが示された。
    • 有効なべき乗則スペクトル輸送を仮定することで,自己相似解が得られ,ニューラルスケーリング則とダブルデセント現象を説明した。

    Link: https://arxiv.org/abs/2512.10427

  • グラフ構造の命令系列による表現 [cs.AI]目的:グラフ構造の表現方法
    • グラフ処理は様々な分野で重要であり,効率的な表現が不可欠である。
    • 既存のグラフ表現法は,深層学習言語モデルによる処理に適していない。
    • 深層学習モデルによるグラフ処理を促進するための表現法を提案すること。
    • グラフの隣接行列を,簡単な命令の文字列として表現する新しい方法を提案した。
    • 提案手法は,グラフから文字列への変換,およびその逆変換が可能である。
    • 実験により,提案表現がグラフ分類性能を向上させ,計算時間を短縮することが示された。

    Link: https://arxiv.org/abs/2512.10429

  • 却下から承諾へ:LLMベースの科学論文査読者の間接プロンプトインジェクション脆弱性の定量化 [cs.AI, cs.CL, cs.CR]目的:LLMを査読者として利用するシステムの脆弱性評価
    • 科学論文査読は研究の質を保証する上で不可欠であり,LLMの導入による効率化が期待されている。
    • LLM査読システムは,悪意のあるPDF操作によって,不当に論文が採択されるリスクが存在する。
    • LLM査読システムの脆弱性を定量的に評価し,攻撃への耐性を高めるための対策を検討する。
    • LLM査読システムは,PDF内の特定の操作によって,却下判断が承諾判断に翻転される可能性があることが示された。
    • 特に「Maximum Mark Magyk」のような難読化手法は,大規模言語モデルにおいても高い効果を発揮し,採択判断を操作することが確認された。
    • 本研究で構築したデータセットとインジェクションフレームワークは,今後の研究を促進するための公開資源として提供される。

    Link: https://arxiv.org/abs/2512.10449

  • ヒューマノイドロボット向けヒューリスティック正規化較正アクター・クリティックアルゴリズム「シンフォニー」 [cs.RO, cs.NE]目的:ヒューマノイドロボットのゼロからの学習におけるサンプル効率,サンプル近接性,安全性を実現するアルゴリズムの開発
    • ロボット工学において,ヒューマノイドロボットは人間との協調や災害現場での活動など,多様な応用が期待されている。
    • ロボットの学習には大量の試行錯誤が必要であり,学習時間の短縮と安全性の確保が課題である。
    • 本研究は,不安定な学習段階におけるロボットの安全性を高め,効率的な学習を可能にするアルゴリズムを提案する。
    • 提案手法「シンフォニー」は,アクターとクリティックを組み合わせ,行動の強さを抑制する「スワドリング」正則化を導入することで,学習の安定性を向上させている。
    • 近年,ガウシアンノイズの過度な増加がモータやギアボックスに悪影響を及ぼすことが知られており,提案手法ではパラメータノイズを制限し,行動の強度を安全に増加させている。
    • 「フェーディングリプレイバッファ」を用いることで,短期記憶と長期記憶を組み合わせ,Temporal Advantageを活用した効率的な学習を実現している。

    Link: https://arxiv.org/abs/2512.10477

  • Phythesis:LLMを用いた物理法則に基づいた進化的シーン合成による省エネデータセンター設計 [cs.AI, cs.NE]目的:LLMと物理法則に基づいた進化的最適化を組み合わせた,シミュレーション可能なデータセンターシーンの自動合成
    • データセンターは計算能力の需要増加を支える基盤であり,その重要性は増している。
    • 従来の設計手法はシステム複雑化に伴い限界があり,AIによる自動設計も物理法則を考慮していない。
    • LLMと物理法則を統合し,エネルギー効率の高いデータセンター設計を実現すること。
    • Phythesisは,既存のLLMベースの手法と比較して,シーン生成成功率を57.3%向上させた。
    • Phythesisは,電力使用効率(PUE)を11.5%改善することに成功した。
    • LLMによる物理的に妥当なレイアウト生成と,物理法則に基づいた資産パラメータ最適化を反復的に行う。

    Link: https://arxiv.org/abs/2512.10611

  • 5G/6Gネットワーク向け動的ニューラルモデルと敵対的学習を活用した適応型侵入検知システム [cs.CR, cs.LG]目的:5G/6Gネットワークにおける,敵対的学習と動的ニューラルネットワークを活用した侵入検知システムの構築
    • 5G/6Gネットワークは社会基盤であり,サイバー攻撃からの保護は不可欠である。
    • 従来の侵入検知システムは,未知の攻撃や変化する攻撃に対応できないという課題がある。
    • 本研究は,高精度かつ効率的なリアルタイムな脅威検知・対応システムの実現を目指す。
    • 敵対的学習と動的ニューラルネットワークを組み合わせることで,データ汚染に対する耐性を強化。
    • 従来のモデルと比較して,再学習の頻度を低減し,効率的な学習を実現。
    • NSL-KDDデータセットを用いた評価において,82.33%という高い多クラス分類精度を達成。

    Link: https://arxiv.org/abs/2512.10637

  • 協調フィルタリングにおける人気バイアス再考:解析的ベクトル分解によるアプローチ [eess.SY, cs.SY, cs.IR, cs.AI]目的:協調フィルタリングにおける人気バイアスの根本原因の解明と軽減
    • 協調フィルタリングは推薦システムの基盤技術であり,多様な分野で広く活用されている。
    • 人気アイテムへの偏りが強く,ユーザーの潜在的なニーズに応えきれていないという課題がある。
    • 人気バイアスの幾何学的な原因を特定し,それを修正する新しいフレームワークを提案する。
    • 人気バイアスは,Bayesian Pairwise Ranking (BPR)最適化における固有の幾何学的アーティファクトであることが示された。
    • 提案手法DDCは,埋め込み空間の幾何学的な歪みを修正することで,人気バイアスを効果的に軽減する。
    • DDCは既存の手法と比較して,学習損失の低減と推薦品質の向上において優れた性能を発揮する。

    Link: https://arxiv.org/abs/2512.10688

  • グラフ事前知識を増強したTransformerによるテンプレートフリー逆合成反応予測 [cs.LG]目的:逆合成反応予測における,妥当な反応試薬分子の推論
    • 有機合成化学の効率化に貢献し,新薬開発などの時間とコストを削減する上で重要である。
    • 既存モデルは,実用レベルの精度と頑健性を備えていないという課題がある。
    • 手動で作成された反応テンプレートや化学ルールエンジンを必要としない手法を開発し,精度向上を目指す。
    • 本研究では,分子グラフ情報を注意機構に組み込むことで,SMILES系列と構造的特徴を同時に活用するTransformerベースのフレームワークを提案した。
    • さらに,データ拡張戦略を適用することで,学習データの多様性を高め,モデルの性能を向上させた。
    • USPTO-50Kベンチマークにおける実験により,テンプレートフリー手法の中で最先端の性能を達成し,標準的なTransformerと比較して大幅な性能向上を示した。

    Link: https://arxiv.org/abs/2512.10770

  • 全身VLA:全身運動操作制御のための統一された潜在VLAへ [cs.RO, cs.AI, cs.CV]目的:全身運動と器用な操作を組み合わせた,人間型ロボットの運動操作制御
    • 人間型ロボットの発展には,複雑な環境での作業能力が不可欠であり,その鍵となるのが運動と操作の連携である。
    • 既存手法では,操作を考慮した運動制御が難しく,ロボットの活動範囲が制限され,大規模な空間での作業が困難である。
    • 人間による遠隔操作データの不足と,既存の強化学習コントローラーの精度・安定性の限界を克服し,ロボットの作業能力を向上させる。
    • 提案手法WholeBodyVLAは,低コストな自己中心的動画から学習する統一された潜在学習フレームワークを用いて,より豊富な運動操作知識を獲得する。
    • また,効率的なデータ収集パイプラインを開発し,データセットを拡張することで,その効果を拡大している。
    • 実験の結果,WholeBodyVLAは既存手法を21.3%上回り,大規模空間での人間型ロボットの運動操作制御を実現し,高い汎化性能と拡張性を示した。

    Link: https://arxiv.org/abs/2512.11047

  • 物理情報機械学習におけるReLU活性化関数の失敗について [cs.LG]目的:物理情報機械学習におけるReLU活性化関数の性能低下の原因解明
    • 物理現象をデータ駆動的に解析する手段として,物理情報機械学習の重要性が増している。
    • ReLUは,その単純さから広く用いられるが,物理情報機械学習においては他の活性化関数に劣る。
    • ReLUの性能低下が,勾配の誤りにあることを,PyTorchの自動微分に着目して解明する。
    • ReLUは,物理情報機械学習において,シグモイド関数やSwish関数などの他の活性化関数と比較して性能が劣る。
    • その原因は,ReLUの不連続性による二階微分が,損失関数の勾配の誤りを引き起こすことにある。
    • PyTorchの自動微分が不連続な場を正しく微分できないことが,ReLUの失敗に繋がっている。

    Link: https://arxiv.org/abs/2512.11184

  • 統合予測と複数期間ポートフォリオ最適化 [cs.CE, cs.LG]目的:複数期間ポートフォリオ最適化のモデル
    • 現実的なポートフォリオ管理において重要であり,取引コストや時間依存のリスクを考慮する。
    • 従来の二段階手法では,予測と意思決定の間にずれが生じ,取引コストが無視される。
    • 予測と最適化を統合し,取引コストを考慮した複数期間ポートフォリオ最適化を実現する。
    • 提案手法IPMOは,予測と最適化を統合し,ポートフォリオパフォーマンスによって学習を促進する。
    • スケーラビリティのために,KKTシステムを因数分解せずに安定した勾配を得るミラー・ディセント固定点(MDFP)スキームを導入。
    • 実データを用いた実験で,IPMOは取引コストを考慮したリスク調整後パフォーマンスにおいて既存手法を上回った。

    Link: https://arxiv.org/abs/2512.11273

  • グリーンウォッシング検出のための知識グラフ拡張フレームワーク EmeraldMind [eess.SY, cs.SY, cs.AI]目的:グリーンウォッシング検出の自動化
    • 持続可能性への意識の高まりに伴い,企業の環境に関する虚偽の主張であるグリーンウォッシングの検出が重要である。
    • 既存の一般的な知識ベースでは,検証可能な証拠が見つけにくい場合がある。
    • 企業のESGレポートから検証可能な証拠を提示し,グリーンウォッシングの検出精度を高める。
    • EmeraldMindは,ドメイン固有の知識グラフと検索拡張生成を統合したフレームワークであり,グリーンウォッシングの検出において高い精度を達成した。
    • 汎用的なLLMと比較して,より広範な網羅性と優れた説明品質を示し,ファインチューニングや再学習は不要である。
    • 透明性の高い証拠に基づいた判断を提供し,検証できない主張に対しては責任をもって判断を保留する。

    Link: https://arxiv.org/abs/2512.11506

  • 行動機械学習か?正則化と予測バイアス [quant-ph, cs.ET, q-fin.ST, cs.LG, econ.GN, q-fin.EC, q-fin.GN]目的:予測バイアスの正則化による説明
    • 予測の精度向上は,経済学や経営学において重要な課題である。
    • 従来の予測効率性テストは,バイアスを合理的に説明できない場合があった。
    • 予測テストの違反が,必ずしも行動バイアスによるものではない可能性を示す。
    • 機械学習による予測は,1年先ではバイアスがほぼゼロだが,2年先では過剰反応を示す。
    • これは,正則化と測定ノイズのモデルによる予測と一致する。
    • 2013年頃の機械学習導入前後で,テクニカルトレーニングを受けたアナリストの過剰反応が顕著になった。

    Link: https://arxiv.org/abs/2303.16158

  • 帰納的複雑性に基づく推移的学習の一般化誤差の上界改善とその応用 [math.OC, cs.MS, cs.PF, stat.ML, cs.LG]目的:推移的学習手法の一般化性能を分析するための新たな指標である推移的局所複雑性(TLC)の提案
    • 機械学習において,モデルの汎化性能を理論的に保証することは重要であり,学習アルゴリズムの設計や性能評価に不可欠である。
    • 帰納的学習における局所ラドマッハー複雑性(LRC)は有効であるが,推移的学習への適応は困難であり,理論的な上界の導出が課題であった。
    • TLCを用いて,推移的学習における一般化誤差の上界を導出し,帰納的学習における結果と整合性の高い鋭い上界を得ることを目指す。
    • TLCは,テストデータと訓練データの損失の差を捉える「テスト-訓練過程」に関する新たな集中不等式を導出することで構築された。
    • TLCに基づき,推移的学習における超過リスクの上界を導出し,古典的なLRCに基づく帰納的学習の上界とほぼ一致する結果が得られた。
    • 二値クラス分類における実現可能な推移的学習や,推移的カーネル学習において,既存の結果を改善する鋭い上界を導出した。

    Link: https://arxiv.org/abs/2309.16858

  • 良好腕の同定のためのいつでもアルゴリズム [stat.ML, cs.LG]目的:良好腕の同定
    • 多腕バンディット問題において,最適な行動選択は重要であり,良好な腕の特定が不可欠である。
    • 予算制約下や,随時推奨要求に対応する「いつでも」設定での良好腕同定の研究は不足している。
    • 固定予算と固定信頼区間下で,効率的な良好腕同定を可能とするアルゴリズムを提案し,性能を評価する。
    • 提案アルゴリズムAPGAIは,パラメータ調整を必要とせず,良好腕の同定において,一様サンプリングよりも効率的であることが示された。
    • APGAIと停止則を組み合わせることで,任意の信頼水準において期待サンプル数を理論的に上界評価した。
    • 合成データおよび実世界のデータを用いた実験により,APGAIの高い実用性が確認された。

    Link: https://arxiv.org/abs/2310.10359

  • 割引マルコフ決定過程におけるエントロピー正則化の最適な収束率 [math.OC, cs.LG, cs.SY, eess.SY]目的:割引マルコフ決定過程におけるエントロピー正則化によって生じる誤差の評価
    • 強化学習は,ロボット工学や意思決定など,様々な分野で重要な役割を担っている。
    • エントロピー正則化は探索を促進するが,その誤差の収束率が明確でなかった。
    • エントロピー正則化の誤差が指数関数的に減衰することを証明し,収束率を明確化する。
    • エントロピー正則化による誤差は,正則化の強さの逆数に対して指数関数的に減衰することが示された。
    • 上限と下限が一致し,エントロピー正則化の指数関数的な収束率が特徴づけられた。
    • エントロピー正則化された自然方策勾配法の誤差は,反復回数の平方根に対して指数関数的に減衰することが示された。

    Link: https://arxiv.org/abs/2406.04163

  • 辞書学習を用いた説明可能なDNA配列表現スキーム:Dy-mer [eess.SP, cs.SY, eess.SY, q-bio.GN, cs.AI, cs.LG]目的:DNA配列の表現方法
    • 遺伝情報の解読において,DNA配列解析は不可欠であり,生命科学研究の進展に大きく寄与する。
    • 既存の手法では,配列の構造的特徴の捉えにくさや,小規模データセットでの汎化性能の低さが課題となっていた。
    • 局所的な部分配列の構造的特徴を捉え,解釈性と汎化性能を向上させる新たなDNA配列表現法の開発。
    • 提案手法Dy-merは,辞書学習に基づき,DNA配列を動的長さの部分配列(dymers)の組み合わせとして再構成する。
    • その結果,DNAプロモーター分類やモチーフ検出などの下流タスクにおいて,最先端の性能を達成した。
    • 学習されたdymersが既知のDNAモチーフと一致し,Dy-merを用いたクラスタリングにより意味のある系統樹が得られた。

    Link: https://arxiv.org/abs/2407.12051

  • CIC:円環型画像圧縮 [eess.SP, cs.SY, eess.SY, eess.IV, cs.CV, cs.LG]目的:画像圧縮性能の向上
    • 画像圧縮はデータ伝送や保存において重要な役割を担う技術である。
    • 学習済みの画像圧縮モデルは,未知の画像に対する性能劣化が課題となる。
    • テスト画像と訓練画像のギャップを最小化し,汎化性能を高めることを目指す。
    • 提案手法である円環型画像圧縮(CIC)は,閉ループ構造により,従来の画像圧縮手法よりも高い性能を発揮する。
    • テイラー展開による解析から,再構成画像と元の画像の間の定常状態誤差がほぼゼロになることが示された。
    • 5つの公開画像データセットを用いた実験により,CICが最先端の画像圧縮アルゴリズムを上回る性能を示すことが確認された。

    Link: https://arxiv.org/abs/2407.15870

  • スライスごとの学習された生成拡散事前分布を用いたロバストな同時マルチスライスMRI再構成 [eess.IV, cs.AI, cs.CV, eess.SP, physics.med-ph]目的:同時マルチスライスMRI再構成のロバスト性向上
    • MRI検査時間の短縮が望まれる中で,同時マルチスライス法は高速化に貢献する重要な技術である。
    • スライス間の複雑な信号干渉により,同時マルチスライスMRIの再構成は依然として困難な課題である。
    • 本研究は,データ整合性を保ちつつ,学習された拡散事前分布を用いてロバストな再構成を実現する。
    • 提案手法ROGERは,ノイズから徐々に画像を復元する逆拡散過程と,測定されたk空間データの一貫性を組み合わせる。
    • ROGERは,シングルスライス画像で学習した拡散モデルをそのまま同時マルチスライス再構成に適用可能である。
    • 実験結果から,ROGERは既存手法と比較して優れた性能を示し,解剖学的および機能的イメージングの品質を向上させることが確認された。

    Link: https://arxiv.org/abs/2407.21600

  • 複数の対象物におけるスクリーニングなしがより効率的である [econ.TH, cs.AI, cs.GT, cs.LG]目的:複数の異質な対象物の割り当てに関する効率的なメカニズム設計
    • 資源配分において,効率的なメカニズム設計は,社会全体の厚生水準を向上させる上で重要である。
    • 対象物の種類が増加するにつれて,最適なメカニズム設計が困難になるという課題が存在する。
    • 対象物の多様性が増す状況下で,スクリーニングを伴わないメカニズムの効率性を検証し,改善を目指す。
    • 対象物の種類が増えるにつれて,スクリーニングを伴わないメカニズムがより良い結果をもたらす傾向が確認された。
    • この傾向は,簡略化された環境下における漸近的に効率的なメカニズムの特性付けと,数値的な検証によって裏付けられた。
    • パンデミックに対するワクチン接種スケジューリングシステムとして,登録・招待・予約システム (RIB) が提案された。

    Link: https://arxiv.org/abs/2408.10077

  • 層を意識したTDNN:事前学習済みモデルからの多層特徴を用いた話者認識 [eess.AS, cs.AI]目的:事前学習済みモデルからの多層特徴を用いた話者認識手法
    • 近年の自己教師あり学習の進展により,話者認識の性能が向上している。
    • 既存手法では,事前学習済みモデルの多層構造を十分に活用できていない。
    • 多層構造を有効活用し,話者認識の精度向上とモデルの効率化を目指す。
    • 提案手法L-TDNNは,複数のSSL Transformerと話者データセットで優れた認識性能を示した。
    • L-TDNNは,従来手法と比較して低いエラー率を達成し,モデルの小型化にも成功した。
    • 層を意識した処理により,話者認識の性能向上と効率化が確認された。

    Link: https://arxiv.org/abs/2409.07770

  • MAISI:合成画像のための医療AI [eess.IV, cs.AI, cs.CV]目的:医療画像生成によるデータ不足,アノテーションコスト,プライバシー問題の緩和
    • 医療画像解析は,病状診断や治療計画において不可欠であり,その重要性は増している。
    • 十分な学習データ確保が困難であり,アノテーション作業に多大なコストと時間がかかる。
    • 拡散モデルを用いた合成画像生成により,データ不足やプライバシー問題を解決する。
    • MAISIは,高解像度(512x512x768)の3D CT画像を柔軟な寸法とボクセル間隔で生成可能である。
    • ControlNetを活用し,127種類の解剖学的構造を含む臓器セグメンテーションを条件として,正確なアノテーション付きの合成画像を生成する。
    • 生成された画像はリアリティと解剖学的精度が高く,合成データ利用による課題解決に貢献する可能性を示す。

    Link: https://arxiv.org/abs/2409.11169

  • Deep-ER:高速高分解能神経代謝イメージングのための深層学習ECCENTRIC再構成 [eess.IV, cs.LG]目的:高速高分解能神経代謝イメージングのための深層学習再構成手法の開発
    • 神経代謝異常は多くの神経疾患や脳腫瘍の重要な病理メカニズムであり,MRSIによる非侵襲的な評価が求められる。
    • 高速なMRSIは可能だが,再構成に時間がかかり,専門知識が必要であり,処理能力が課題となっている。
    • 高速かつ高品質な再構成を実現し,MRSIの効率的なワークフローを可能にすることを目的とする。
    • Deep-ERは従来の再構成手法と比較して,600倍高速な再構成を達成した。
    • 空間・スペクトル品質が向上し,代謝物の定量性も高まった(信号対雑音比が12-45%向上,Cramer-Rao下限が8-50%減少)。
    • 得られた代謝画像は,脳腫瘍の不均一性や境界を鮮明に可視化し,臨床応用への貢献が期待される。

    Link: https://arxiv.org/abs/2409.18303

  • WALINET:1H MRスペクトルイメージングにおけるノイズ除去のための水と脂質を識別する畳み込みニューラルネットワーク [eess.IV, cs.CV, cs.LG]目的:1H MRスペクトルイメージングにおける水と脂質の除去
    • 脳代謝を非侵襲的に評価できる1H-MRSIは,疾患の診断や治療効果の評価に重要である。
    • 頭皮からの脂質信号や水信号が大きく,代謝物質のスペクトルと重なり,正確な分析を妨げている。
    • 高分解能1H-MRSIにおける脂質と水信号の効率的かつ正確な除去を可能にすること。
    • WALINETは,従来のHLSVD+L2法と比較して,処理時間が大幅に短縮され,高分解能脳全体のMRSIを8秒で完了する。
    • 定量評価により,WALINETは脂質除去性能が向上し,シミュレーションデータおよびin-vivoデータにおいて代謝物質の保存も優れていることが示された。
    • WALINETを用いて得られた代謝マップは,健康な被験者および患者において,より鮮明な灰白質/白質対比と構造の詳細を示す。

    Link: https://arxiv.org/abs/2410.00746

  • ヒルベルト空間におけるマルコフ連鎖勾配降下法 [stat.ML, cs.LG, math.FA]目的:二次損失関数の最適解の近似
    • 機械学習の根幹であり,最適化アルゴリズムの性能が重要である。
    • 大規模データに対する効率的な最適化手法が課題となっている。
    • マルコフ連鎖を用いた勾配降下法の収束性を保証すること。
    • 本研究では,一般的なヒルベルト空間におけるマルコフ連鎖に基づく確率的勾配法について収束性の確率的上限を確立した。
    • これらの結果を,再生核ヒルベルト空間におけるオンライン正則化学習アルゴリズムに拡張した。
    • マルコフ連鎖の軌跡に沿ってサンプルが描画される状況下での学習を扱った。

    Link: https://arxiv.org/abs/2410.08361