arXiv雑要約

AI - 2025/12/17 公開

  • 社会経済指標,スマート交通システム,都市シミュレーターを活用したZEV導入促進とVMT削減 [cs.CY, cs.CY, cs.AI]目的:ZEV導入促進とVMT削減のための手法
    • 地球温暖化対策は喫緊の課題であり,都市部の排出量削減が重要である。
    • ヒューストン市のように,低密度で自家用車依存度が高い都市ではZEV導入が遅れる。
    • 社会経済指標とITSを活用し,ZEV導入を促進しVMTを削減することを目指す。
    • 本研究では,オンロード排出量のベースラインを確立し,政策の効果を評価する手法を提示する。
    • スマートパーキングや交通インセンティブなどの政策オプションを分析し,実現可能な対策を特定する。
    • Unity 3Dを用いたシミュレーション環境を開発し,都市の移動状況を動的にモデル化し,政策シナリオを可視化する。

    Link: https://arxiv.org/abs/2512.11870

  • Semantic-Drive:オープンボキャブラリ接地点と神経記号VLMコンセンサスによるロングテールデータキュレーションの民主化 [cs.CV, cs.AI, cs.CL, cs.RO]目的:ロングテールデータのキュレーション手法
    • 自動運転車の開発において,安全性確保のためには豊富な学習データが不可欠である。
    • レアな危険事象の特定は手作業に頼る部分が多く,コストと時間がかかるという課題がある。
    • プライバシーを保護しつつ,低コストで効率的なデータキュレーションを実現する。
    • Semantic-Driveは,オープンボキャブラリ検出器と推論VLMを組み合わせたローカル実行型のフレームワークである。
    • nuScenesデータセットにおいて,Recall 0.966を達成し,CLIPと比較して大幅な性能向上を示した。
    • リスク評価エラーを40%削減し,消費グレードのハードウェアでプライバシーを保護した運用を可能にした。

    Link: https://arxiv.org/abs/2512.12012

  • 安全性の不安定性:ランダムシードと温度がLLMの矛盾した拒否行動を露呈する [cs.LG, cs.AI, cs.CL]目的:大規模言語モデルの安全性評価における不安定性の検証
    • LLMの安全性確保は,社会実装において不可欠であり,その信頼性評価が重要である。
    • 既存の安全性評価は,単一試行に依存しており,モデルの確率的挙動が考慮されていない。
    • ランダムシードと温度設定がLLMの安全性拒否行動に及ぼす影響を明らかにし,より信頼性の高い評価方法を提案する。
    • LLMの安全性拒否判断は,ランダムシードと温度設定によって変動し,18-28%のプロンプトで判断が反転することが確認された。
    • 温度が高いほど安全性拒否の安定性は低下し,単一試行の評価では安全性評価の信頼性が低いことが示された。
    • 安全性を正確に評価するためには,少なくとも3サンプル以上のプロンプト評価が必要であることが推奨される。

    Link: https://arxiv.org/abs/2512.12066

  • Mage:交差軸Transformerによる楕円曲線暗号の解読 [cs.DC, cs.CR, cs.AI]目的:楕円曲線暗号の解読における交差軸Transformerの利用可能性の探求
    • 現代社会のデジタルセキュリティは,楕円曲線暗号などの暗号技術に大きく依存している。
    • 既存の暗号技術の堅牢性に対する検証は十分ではなく,脆弱性が懸念されている。
    • 機械学習を用いて,公開鍵から秘密鍵を推定するプロセスの解明を目指す。
    • 交差軸Transformerアーキテクチャが,公開鍵と秘密鍵の関連性を学習する能力を示した。
    • 機械学習は,secp256r1鍵ペアをある程度記憶できることが確認された。
    • 今後の機械学習の発展により,既存の暗号技術が脅かされる可能性が示唆された。

    Link: https://arxiv.org/abs/2512.12483

  • タスク完了を超えて:自律型AIシステムの評価フレームワーク [cs.MA, cs.AI, cs.SE]目的:自律型AIシステムの評価方法
    • AI技術の発展に伴い,複雑なタスクを自動化する自律型AIシステムの重要性が高まっている。
    • 既存の評価方法は,AIシステムの非決定的な性質を考慮しておらず,結果の不確実性を捉えられていない。
    • 本研究は,AIシステムの能力を多角的に評価するための体系的なフレームワークを提案することで,この課題を解決することを目指す。
    • 提案フレームワークは,LLM,メモリ,ツール,環境の4つの評価軸で構成され,自律型AIシステムの挙動を包括的に評価できる。
    • クラウド運用自動化のユースケースを用いた実験により,従来の評価指標では見過ごされていた挙動のずれが明らかになった。
    • 本フレームワークは,実行時の不確実性を捉え,自律型AIシステムの信頼性向上に貢献することが期待される。

    Link: https://arxiv.org/abs/2512.12791

  • AIは言うことのできないことを理解できるか:認知,対人関係,構造レベルにおける中絶スティグマを通じた多層的整合性の測定 [cs.AI, cs.HC]目的:中絶スティグマの認知,対人関係,構造レベルにおける一貫した表現
    • 大規模言語モデルの利用が進む中で,複雑な心理的・生理的現象への理解度が重要になっている。
    • 現在の言語モデルは,適切な言葉遣いは保証するものの,多層的な理解が不十分である。
    • 言語モデルの多層的な理解能力の欠如を実証的に明らかにし,安全なAI利用のための提言を行う。
    • モデルは,認知レベルにおけるスティグマを過小評価し,対人レベルにおけるスティグマを過大評価する傾向が見られた。
    • モデルは,コミュニティからの非難が均一であると仮定し,実証的に確認されているスティグマと秘密保持の関係を見過ごした。
    • 本研究は,現在の言語モデルが心理的・生理的構成概念の多層的な理解を欠いていることを実証し,高リスクな文脈におけるAI安全対策の必要性を示唆する。

    Link: https://arxiv.org/abs/2512.13142

  • 意味論的強化生成基盤モデルが病理画像合成を改善する [cs.CV, cs.AI]目的:病理画像生成のための基盤モデル
    • 病理診断AIの発展には高品質なデータセットが不可欠である。しかし,その収集は困難を伴う。
    • 既存の生成モデルは,意味の不安定性や異常な形態の生成といった問題点を抱えており,診断精度を損なう。
    • データ不足とプライバシー問題を克服し,診断ツール開発を加速させるための新たな画像データソースの提供。
    • CRAFTSは,約280万組の画像キャプションペアを用いて訓練された初の病理特化テキスト-画像生成基盤モデルである。
    • CRAFTSは,独自のAlignment Mechanismにより意味のずれを抑制し,生物学的な正確性を確保した多様な病理画像を生成する。
    • CRAFTSで生成されたデータセットは,画像分類,クロスモーダル検索,自己教師あり学習,視覚的質疑応答などの臨床タスクの性能を向上させる。

    Link: https://arxiv.org/abs/2512.13164

  • 大規模言語モデルにおける推測的デコーディングの高速化のための効率的適応的棄却サンプリング [cs.CL, cs.AI]目的:大規模言語モデルにおける推測的デコーディングの効率向上
    • 大規模言語モデルの推論速度は,その実用性を大きく左右する重要な課題である。
    • 従来の推測的デコーディングでは,固定された棄却閾値がボトルネックとなり,高不確実性シナリオで効率が低下する。
    • ターゲットモデルの予測不確実性を考慮し,棄却閾値を動的に調整することで,無駄な棄却を減らすことを目指す。
    • 提案手法EARSは,ターゲットモデルの予測不確実性に応じて棄却閾値を調整することで,推測的デコーディングの効率を大幅に向上させる。
    • 創造的な文章生成やオープン領域QAタスクにおいて,EARSはスループットを最大18.12%向上させ,GSM8Kベンチマークの精度低下はわずか0.84%に抑えられた。
    • EARSはモデルアーキテクチャの変更を必要とせず,既存の推測的デコーディングフレームワークにシームレスに統合可能である。

    Link: https://arxiv.org/abs/2512.13194

  • 連合学習における温度予測に対する敵対的攻撃の評価 [cs.LG, cs.CR]目的:連合学習を用いた温度予測における敵対的攻撃の影響評価
    • 気象予測の精度向上は,社会インフラや人々の生活に不可欠であり,その重要性は高い。
    • 連合学習は分散環境下の脆弱性があり,悪意のあるクライアントによるデータ汚染攻撃のリスクがある。
    • 本研究は,気象データ特有の空間相関性を考慮し,連合学習における敵対的攻撃の影響を明らかにすることを目指す。
    • 少数の攻撃クライアントが,広範囲にわたる温度予測を誤らせることが示された。
    • 単一の攻撃クライアントによる全球バイアス攻撃は最大-1.7Kの予測誤差を生じさせることが確認された。
    • トリム平均集約は全球バイアス攻撃に対して有効だが,パッチ攻撃に対しては効果が限定的であることが示された。

    Link: https://arxiv.org/abs/2512.13207

  • 協調探索による多ロボット社会性隊列ナビゲーションにおける内発的動機 [cs.RO, cs.AI]目的:多ロボット社会性隊列ナビゲーションにおける内発的動機に基づく協調探索アルゴリズム
    • 人間とロボットが共存する社会の実現には,ロボットの円滑な移動能力が不可欠である。
    • 歩行者の予測不可能性や非協調的な行動が,ロボットの協調探索効率を低下させる。
    • ロボットの行動保守性を軽減し,協調的な探索能力を向上させること。
    • 提案アルゴリズムは,既存の最先端手法と比較して,重要な指標において優れた性能を示す。
    • 自己学習型の内発的報酬機構が,ロボットの協調的な行動を促進する。
    • 二重サンプリングモードと二時間スケール更新ルールにより,ナビゲーションポリシーと内発的報酬の表現が強化される。

    Link: https://arxiv.org/abs/2512.13293

  • KD-PINN:知識蒸留を用いた超低遅延リアルタイム偏微分方程式ソルバー [cs.LG, cs.NA, math.NA]目的:知識蒸留によるPINNの高速化と精度維持
    • 偏微分方程式の数値解法は,科学技術計算の根幹であり,高精度かつ高速な解法が求められている。
    • 従来のPINNは計算コストが高く,リアルタイム処理には不向きな場合がある。
    • 知識蒸留によりPINNの軽量化と高速化を図り,リアルタイム処理への応用を可能とすること。
    • 本研究では,知識蒸留フレームワークKD-PINNを提案し,教師モデルの予測精度を軽量な学生モデルへ転移させた。
    • KD-PINNは,Navier-Stokes方程式で約4.8倍,Burgers方程式で約6.9倍の推論速度向上を達成しつつ,精度を維持した。
    • CPU上での平均推論遅延は5.3msであり,10ms以下の超低遅延リアルタイム領域への進出を示した。

    Link: https://arxiv.org/abs/2512.13336

  • 非解決型推論(NRR):文脈的同一性と曖昧性保持のための計算フレームワーク [cs.CL, cs.AI, cs.LG]目的:文脈的同一性と曖昧性保持のための計算フレームワークの提案
    • AIの発展において,曖昧性の適切な処理は,より高度な推論や創造性の実現に不可欠である。
    • 既存のAIシステムは,曖昧性を早期に解消する傾向があり,多様な解釈の保持が困難である。
    • 本研究は,曖昧性の保持を有効な推論モードとして捉え,そのための新たなフレームワークを構築する。
    • 本研究で提案するNRRは,同一性の否定,近似的同一性,非解決という3つの原理に基づいている。
    • NRRは,Multi-Vector Embeddings,Non-Collapsing Attention,Contextual Identity Trackingという3つの要素によって実現される。
    • 文脈移行タスクにおける実験により,NRRは標準的なアーキテクチャと比較して高い分布外精度を示し,曖昧性保持が構造的汎化を可能にすることが示された。

    Link: https://arxiv.org/abs/2512.13478

  • オートエンコーダ潜在空間抽象化によるスケーラブルな形式検証 [cs.LG]目的:システムのスケーラブルな形式検証手法
    • 複雑なシステムの正当性保証は重要であり,形式検証はその有効な手段の一つである。
    • 高次元システムにおける状態空間の離散化は指数的に増加し,スケーラビリティが課題となっている。
    • オートエンコーダを用いて潜在空間で抽象化を行い,高次元システムのスケーラビリティ問題を解決する。
    • 凸オートエンコーダとカーネル法により,潜在空間でシステムのダイナミクスを学習し,形式検証を可能にした。
    • 学習された潜在空間での抽象化は元のシステムの振る舞いを包含することが保証された。
    • 潜在空間での検証結果は元のシステムに正確にマッピング可能であり,26次元システムで有効性が示された。

    Link: https://arxiv.org/abs/2512.13593

  • 大規模言語モデルを用いたイベント系列モデリングにおける時間トークン化戦略 [cs.CL, cs.LG]目的:イベント系列のモデリングにおける時間トークン化戦略の比較
    • 時間情報はイベント系列分析において不可欠だが,十分な研究がなされていない。
    • 実世界のイベントデータは分布が多様であり,最適なトークン化手法は明確ではない。
    • イベントデータの統計的性質に合わせたトークン化手法の有効性を示す。
    • 時間トークン化戦略は,データの統計的特性と予測性能に強い依存性があることが示された。
    • 対数に基づいた戦略は歪んだ分布において優れており,人間が理解しやすい形式は混合モダリティに対して頑健である。
    • 普遍的に優れた戦略は存在せず,データに合わせたトークナイザーの選択が重要である。

    Link: https://arxiv.org/abs/2512.13618

  • 感情軌跡の解読:潜在的うつ病評価のための時系列意味ネットワークアプローチ [cs.CL, cs.AR, q-bio.QM, cs.AI, cs.CY, cs.LG]目的:潜在的うつ病の評価に関する研究
    • メンタルヘルス対策において,早期発見と介入は社会的に重要な課題である。
    • 既存のソーシャルメディアに基づく自動検出法は,臨床的に解釈可能な枠組みに欠ける場合がある。
    • うつ病の症状の時間的変化と意味的な特徴を捉え,解釈可能性を高めることを目指す。
    • 提案手法は,大規模なソーシャルメディアデータセットにおいて,既存の最先端手法を上回る性能を示した。
    • 従来の調査では体系的に記録されていない感情表現パターン(例えば,「理想的な生活」への憧憬)を特定できる。
    • 本研究は,ソーシャルメディアにおけるうつ病検出のための構造的に透明で臨床的に整合性の高いフレームワークを提供する。

    Link: https://arxiv.org/abs/2305.13127

  • 限定された観測を持つレストレスバンディット問題に対する一般化された定式化とPCL分析 [stat.ML, cs.LG]目的:レストレス多腕バンディット問題における観測モデルの一般化
    • 資源制約下での意思決定は,現実世界の様々な問題に応用可能である。
    • 観測が限定的,あるいは誤りを含む場合,最適な行動決定が困難となる。
    • 部分観測下におけるレストレスバンディット問題の解法を確立し,実用的なアルゴリズムを提案する。
    • 観測過程の確率モデルを構築し,無限次元の信念状態空間を持つレストレスバンディット問題として定式化した。
    • 部分保存則を用いた達成可能領域法により,問題のインデックス化可能性と優先度インデックスを分析した。
    • 有限状態問題に対するNi~no-Moraアルゴリズムを適用可能な近似手法を提案し,数値実験で優れた性能を実証した。

    Link: https://arxiv.org/abs/2307.03034

  • 量子回路ベンチマーク:量子アルゴリズム設計のベンチマーク用大規模データセット [cond-mat.dis-nn, cond-mat.other, cs.ET, physics.optics, quant-ph, quant-ph, cs.DS, cs.LG, stat.ML]目的:量子アルゴリズム設計能力評価のためのベンチマークデータセット
    • 量子計算は古典計算を凌駕する可能性を秘めており,科学技術の進歩に不可欠な分野である。
    • 量子アルゴリズムの設計・実装は複雑であり,AIを活用するための専用データセットが不足していた。
    • AIによる量子アルゴリズム設計・実装能力を評価し,その限界を明らかにすることを目的とする。
    • QCircuitBenchは,量子アルゴリズム設計の主要な特徴をLLMに学習させるための汎用的なフレームワークを提供する。
    • 基本的な素子から高度な応用まで,3つのタスクスイート,25のアルゴリズム,120,290のデータポイントを含む。
    • 自動検証・確認機能を備え,人間による検査なしに反復的な評価と推論を可能にする。LLMは一貫したエラーパターンを示すことが観察された。

    Link: https://arxiv.org/abs/2410.07961

  • 無限幅の浅いニューラルネットワークに対するリプシッツ空間の視点 [math.FA, cs.LG, stat.ML]目的:浅いニューラルネットワークの平均場パラメータ化に関する研究
    • 深層学習の理論的理解は,その性能向上と安全性の確保に不可欠である。
    • ニューラルネットワークのパラメータ空間の制約や正則化が十分でない場合,最適化が不安定になりやすい。
    • 変分形式の最小化解の存在と,それに基づくコンパクト性の結果を明らかにする。
    • 活性化関数の性質を考慮した双対性を用いて,不均衡な Kantorovich-Rubinstein ノルムを導入した。
    • 総変動やモーメントの制約がない場合,望ましくない振る舞いを示す例を示した。
    • この枠組みにより,表現定理や経験リスク最小化の統一的な大データ限界,蒸留・融合への応用が可能となった。

    Link: https://arxiv.org/abs/2410.14591

  • 構造化モデル学習における一意性について [math.OC, cs.LG, math.AP]目的:偏微分方程式系の物理法則学習における一意性
    • 物理現象のモデル化は,科学技術の発展に不可欠であり,その精度向上は重要な課題である。
    • 既存の手法では,学習されたモデルの一意性が保証されず,過学習や不安定な解につながる可能性がある。
    • 本研究は,構造化モデル学習を通して,一意的なモデル特定を理論的に保証することを目的とする。
    • 完全かつノイズのない測定データ下では,未知のモデル成分の一意的な特定が可能であることが示された。
    • 不完全かつノイズを含む測定データに基づいて学習されたモデル成分は,正則化を最小化する解に収束することが示された。
    • 特定のニューラルネットワークの性質と適切な正則化の選択により,これらの結果が得られる。

    Link: https://arxiv.org/abs/2410.22009

  • 心電図から心臓MRIへの変換:心臓評価と疾患スクリーニングのための多施設研究 [eess.IV, cs.AI, cs.CV]目的:心電図信号から心臓MRIレベルの機能的パラメータと合成画像を生成すること
    • 心血管疾患は世界的な死亡原因の第一位であり,アクセス可能かつ正確な診断ツールが不可欠である。
    • 心臓MRIは精密な評価が可能だが,高コストと複雑さが臨床応用の障壁となっている。
    • 低コストな心電図から心臓MRI相当の情報を得ることで,大規模な心血管疾患スクリーニングを可能にすること。
    • CardioNetsは,心電図から心臓MRIレベルの機能パラメータと合成画像を生成することで,大規模な心臓評価を可能にした。
    • UK Biobankデータセットにおいて,心臓表現型回帰のR2値を24.8%向上させ,心筋症のAUCを最大39.3%改善した。
    • 医師が心電図と実際の心臓MRIを使用した場合と比較して,CardioNetsのみを使用した場合の精度が13.9%向上した。

    Link: https://arxiv.org/abs/2411.13602

  • 全予測に対するほぼ最適アルゴリズム [stat.ML, cs.DS, cs.LG]目的:損失関数クラスに対する損失最小化予測の同時実現
    • 予測は機械学習の根本課題であり,様々な分野で応用されている。
    • 既存手法では,特定の損失関数に最適化された予測しか得られず,汎用性に欠ける。
    • あらゆる損失関数クラスに対して,効率的な汎用予測手法を開発すること。
    • オンライン学習アルゴリズムにおいて,$\tilde O (\sqrt{T \log |H|})$のリグレットを達成した。
    • Bounded Variation損失関数クラスと任意の仮説クラス$H$に対して,ほぼ最適なオフライン学習アルゴリズムを開発した。
    • 提案手法は,ERMオラクルと$m$個のサンプルを用いて,効率的な全予測子を生成する。

    Link: https://arxiv.org/abs/2501.17205

  • 拡散モデルを用いた高速3D超音波再構成 [cond-mat.mtrl-sci, cs.CL, cs.DB, eess.IV, cs.LG]目的:3D超音波再構成における空間・時間解像度の向上
    • 3D超音波はリアルタイムな解剖構造の可視化を可能にし,臨床医の習熟度に関わらず利用でき,自動計測や解析を容易にする。
    • 高速なボリュームレートと高画質の両立が課題であり,3D発散波は組織ハーモニック発生が限られ,マルチパス効果が増加しやすい。
    • 拡散モデルを用いることで,少ないエレベーション面からのデータでも高画質な3D超音波画像を再構成することを目指す。
    • 拡散モデルを用いた再構成は,従来の補間手法や深層学習ベースの手法と比較して,画質と下流タスクの性能において一貫して優れていた。
    • 超音波シーケンスに固有のTemporal Consistencyを活用することで,推論速度を向上させた。
    • 拡散モデルの確率的性質を活用し,再構成の不確実性を定量化することで,異常データに対する再現率を向上させた。

    Link: https://arxiv.org/abs/2505.22090

  • Q2SAR:創薬のための量子多重カーネル学習アプローチ [quant-ph, cs.LG]目的:創薬のためのQ2SAR分類性能向上
    • 計算化学は,効率的な新薬開発に不可欠であり,計算資源の最適化が求められている。
    • 従来のQSPR/QSARモデリングでは,分子記述子の選択やモデルの精度に課題が残る。
    • 量子化学的情報を用いたカーネル学習により,分子表現を豊かにし,分類精度を向上させる。
    • 量子多重カーネル学習(QMKL)とSVMを組み合わせたアプローチが,DYRK1Aキナーゼ阻害剤の特定において高い性能を示した。
    • 古典的なGradient Boostingモデルと比較して,QMKL-SVMはAUCスコアにおいて優れた結果を示し,量子的な優位性を示唆する。
    • SMILES表現から数値分子記述子への変換,PCAによる次元削減,カーネルの最適化を含むワークフローを確立した。

    Link: https://arxiv.org/abs/2506.14920

  • 教師・生徒設定における狭い単隠れ層ネットワークの汎化性能 [cond-mat.dis-nn, cs.LG, math.PR, math.ST, stat.TH]目的:単純な入力・出力分布に対するニューラルネットワークの汎化能力の理解
    • ニューラルネットワークの学習性能を現実のデータセットで説明するためには,その汎化能力の理解が不可欠である。
    • 一般的な活性化関数を持つ全結合単隠れ層ネットワークの性能に関する完全な理論的解明が不足している。
    • 狭いネットワーク(隠れ層のユニット数が入力次元よりも小さい)における汎化性能の理論的枠組みを構築すること。
    • 統計物理学的手法を用いて,有限温度(ベイズ)および経験リスク最小化推定量の典型的な性能に関する閉じた形の式を導出した。
    • サンプル数が十分に大きく,ネットワークのパラメータ数に比例する場合に隠れニューロンが専門化する転移の存在が明らかになった。
    • 本理論は,回帰または分類タスクで学習されたニューラルネットワークの汎化誤差を正確に予測できることが示された。

    Link: https://arxiv.org/abs/2507.00629

  • 発音辞書なしによる,音素ベースのクロスリンガル自動音声認識のための共同確率的近似学習 [eess.AS, cs.AI, cs.CL]目的:発音辞書を必要としない,音素ベースのクロスリンガル自動音声認識手法
    • 言語間の音声認識は,多言語対応の音声インターフェース実現に不可欠であり,グローバルなコミュニケーションを促進する。
    • 従来の音素ベースクロスリンガル音声認識には発音辞書が必要で,言語資源の少ない言語への適用が困難である。
    • 発音辞書なしで音素ベースのクロスリンガル音声認識を実現し,データ効率と言語間の情報共有を向上させる。
    • 提案手法JSA-SPGは,ポーランド語(130時間)とインドネシア語(20時間)の実験で,既存のクロスリンガル微調整手法を5%の誤り率で上回った。
    • わずか10分の音素監督データのみで,優れた性能を発揮し,データ効率の高さを示した。
    • 言語ドメイン適応においても,G2Pモデルの補助により,標準的な言語モデル融合手法を9%の誤り率で上回る成果が得られた。

    Link: https://arxiv.org/abs/2507.06249

  • 誤指定に強い変分法を用いたアモルタイズドシミュレーションベース推論 [math.OC, cs.SY, eess.SY, stat.ML, astro-ph.GA, cs.LG]目的:誤指定に対するロバストな推論
    • 複雑な確率モデルのベイズ推論は困難だが,シミュレーションベース推論が有望視されている。
    • 既存手法は,シミュレーターが真のデータ生成過程を正確に反映していない場合に性能が低下する。
    • シミュレーターと現実世界のギャップを埋め,誤指定下でもロバストな推論を可能にすること。
    • 提案手法RVNPは,変分推論と誤差モデリングにより,アモルタイズドSBIにおける誤指定問題を解決する。
    • 天文学の実データを含む複数のベンチマークタスクで,RVNPはデータ駆動的にロバストな事後推論を回復できることを示した。
    • 誤指定の影響を制御するためのハイパーパラメータや事前分布を必要としない。

    Link: https://arxiv.org/abs/2509.05724

  • 系列モデリングと設計のためのプロパティ等距変分オートエンコーダ [q-bio.QM, cs.AI, cs.LG]目的:所望の機能的特性を持つ生物学的配列(DNA,RNA,またはペプチド)の設計
    • ナノ材料,バイオセンサー,抗菌薬などの新素材発見に重要であり,応用範囲が広い。
    • 既存モデルは二値ラベルに依存し,高次元で複雑な特性の最適化が困難である。
    • 特性空間の幾何学的構造を尊重する潜在表現学習による設計問題を解決する。
    • 提案手法PrIVAEは,特性空間の幾何構造を反映した潜在表現を学習し,新規配列の合理的な設計を可能にする。
    • DNA配列と抗菌ペプチドの生成タスクにおいて,高い再構成精度と特性に基づいた潜在空間の整理を実現した。
    • DNAナノクラスターの実験的検証により,訓練データと比較して16.1倍の稀少特性ナノクラスターの濃縮が確認された。

    Link: https://arxiv.org/abs/2509.14287

  • 例による潜在空間の定義:生成モデル出力に対する最適化 [stat.ML, cs.LG]目的:生成モデルの出力を制約条件付きで最適化する手法
    • 拡散モデル等の生成AIは多様なデータ生成可能だが,実験設計やコンテンツ生成には制御が不可欠。
    • 制約条件下のサンプル探索は評価コストが高く,勾配が利用できないことが課題。
    • 生成モデルの出力を効率的に最適化するための潜在空間を定義し,制御性を向上させる。
    • 生成モデルに依存しない,非パラメータ的な潜在空間を導入し,ブラックボックス最適化を実現。
    • 潜在空間は例によって定義され,解釈性が高く,多様なタスクに適用可能。
    • 画像,音声,動画,タンパク質など,様々なモダリティに対して汎用的に機能。

    Link: https://arxiv.org/abs/2509.23800

  • ロボットにおける自己探求を通じた行動と言語の好奇心駆動型発達 [stat.ML, cs.LG]目的:ロボットにおける行動と言語の発達
    • 人間の効率的な言語獲得メカニズムの解明は,AIの性能向上に不可欠である。
    • 大規模言語モデルは膨大なデータが必要であり,人間の学習効率とは異なる。
    • 好奇心駆動型アプローチを通じて,スケーラブルな言語獲得メカニズムを解明する。
    • 構成要素の規模拡大により,汎化能力が劇的に向上することが示された。
    • 好奇心は,自己探求を通して学習を促進する重要な要素であることが確認された。
    • 単純な行動の発達が複雑な行動に先立ち,人間の発達心理学的観察と一致する。

    Link: https://arxiv.org/abs/2510.05013

  • TomoGraphView:全方向スライス表現とグラフニューラルネットワークを用いた3D医療画像分類 [eess.IV, cs.AI, cs.LG, q-bio.QM]目的:3D医療画像分類のための新たなフレームワーク
    • 医療画像検査の増加に伴い,腫瘍の特徴抽出など下流タスクのための自動化システムの需要が高まっている。
    • 従来のaxial, sagittal, coronal平面でのスライスは,構造物の向きに依存して空間範囲を捉えきれない場合がある。
    • 全方向スライスと球状グラフベースの特徴集約により,空間的 coherence を失わずに3D構造を捉えることを目指す。
    • 提案手法TomoGraphViewは,球面上から均一に分布した点に基づいて生成される,canonicalおよびnon-canonicalな断面を利用する。
    • これにより,従来の平面スライスによる制限を克服し,構造物の空間範囲をより正確に捉えることが可能となる。
    • コードと全方向スライスライブラリを公開し,アクセス性と利便性を高めている。

    Link: https://arxiv.org/abs/2511.09605

  • WaveC2R: ウェーブレット駆動の粗から精細な階層学習によるレーダーデータ取得 [eess.SP, cs.AI]目的:衛星レーダーデータ取得手法の性能向上
    • 地上レーダー観測の補完に不可欠であり,特に地形の影響を受けやすい地域での観測において重要である。
    • 既存手法は単純な構造のため,複雑な降水パターンや気象境界を正確に捉えきれていない。
    • マルチソースデータを統合し,周波数分解により精度の高い降水パターンと気象境界の表現を目指す。
    • 提案手法WaveC2Rは,公開データセットSEVIRにおいて,最先端の性能を達成した。
    • 特に,高強度降水特徴量と鮮明な気象境界の保持において優れた結果を示した。
    • 周波数分解とデータ統合により,粗視的なパターンと細かな構造の両方を効果的に捉えることができた。

    Link: https://arxiv.org/abs/2511.17558

  • 発達的対称性喪失:脳に触発された不変学習に関する自由エネルギーの視点 [math.CO, cs.CG, cs.DM, math.MG, q-bio.NC, cs.AI, cs.LG, nlin.AO]目的:脳に触発された不変学習の原理
    • 脳の情報処理メカニズムの理解は,AIの発展に不可欠である。
    • 既存のAIモデルは,柔軟性や汎化性能に課題がある。
    • 環境の対称性を活用した学習メカニズムを構築し,その問題を解決する。
    • Symmetry-Lossは,環境の対称性から得られる微分可能な制約を通じて,不変性および等変性を強制する原理である。
    • この枠組みは,学習を有効な対称性群の反復的な洗練としてモデル化し,脳の発達過程と類似性を示す。
    • 構造的驚きの最小化を通じて,自由エネルギー的な目的関数を具現化し,効率的で安定した表現学習を可能にする。

    Link: https://arxiv.org/abs/2512.10984

  • 因果空間における因果効果の粒度別な考察 [stat.ME, cs.AI, math.ST, stat.TH]目的:因果効果の評価
    • 科学研究の根幹をなす因果関係の理解は,様々な分野で不可欠である。
    • 従来の因果効果の分析は変数レベルに留まり,画像や言語モデルのような複雑なデータには適用困難であった。
    • 事象レベルでの因果効果を分析することで,より複雑なデータに対する因果推論を可能にすることを目指す。
    • 因果空間の測度論的枠組みにおいて,因果効果の有無を判定するための二値的定義が導入された。
    • 介入測度下における因果効果と独立性の関係に関する性質が証明された。
    • 事象レベルの因果効果の強さと性質を捉える定量的な指標が提示され,既存の治療効果の指標との関連が示された。

    Link: https://arxiv.org/abs/2512.11919