arXiv雑要約
AI - 2026/05/19 公開
変位を考慮したWiFi表現学習による弱教師あり相対位置推定 [eess.SP, cs.AI, cs.CV]目的:WiFiフィンガープリントに基づく相対位置推定
- 屋内測位は,ロボットやAR/VRなどの応用において不可欠であり,その重要性は高い。
- 既存手法は絶対位置推定に偏っており,大規模な座標アノテーションが必要となる点が課題である。
- 本研究は,絶対位置推定に依存せず,弱教師あり学習を用いて相対位置を直接推定することを目的とする。
- 提案手法Intersection Pathway(IP)は,WiFiフィンガープリントと変位情報を共有潜在空間で整合させる。
- 潜在空間で加算・減算を行うことで,物理的な移動の合成に対応し,直接的な相対変位推論を実現する。
- 実験結果から,提案手法が変位を考慮したWiFi表現を学習し,様々な変位範囲で高精度な相対位置推定が可能であることが示された。
ケルビン v1.0:H.264 用ニューラル事前エンコーダ [eess.IV, cs.CV, cs.DC, cs.LG, cs.MM]目的:H.264 エンコーダの前段に配置し,知覚的に重要な箇所にビットを集中させる軽量な学習型事前エンコーダ
- 動画圧縮は,データ量を削減し効率的な配信を実現するために重要である。
- 既存の動画圧縮技術は,画質とビットレートの間の最適化が課題である。
- H.264 規格に準拠しつつ,画質を向上させ,ビットレートを削減することを目指す。
- ケルビン v1.0 は,UVG ベンチマークにおいて,libx264 をベースラインと比較して,平均 BD-VMAF が -27.62% 向上した。
- MCL-JCV パブリックセットにおいても,30 クリップ中 28 クリップで BD-VMAF が向上し,平均 BD-VMAF は -27.70% であった。
- H.264 の非微分可能性という課題に対し,精度の高いレート推定器と U-Net 歪みプロキシを組み合わせたハイブリッドコーデックプロキシを開発した。
拡散に基づく生成学習によるMEMS IMUの性能限界克服 [eess.SP, cs.AI, cs.LG, cs.RO]目的:低コストIMUデータからの高精度仮想IMUデータ合成
- 多源統合航法システムにおいて,IMUは基本的なセンサであり,航法精度を左右する。
- 低コストIMUはハードウェアの制約により,精度に限界がある。
- 拡散生成モデルを用いて,低コストIMUデータの精度向上を目指す。
- 生成された仮想IMUデータは,位置推定と姿勢推定において,元の低コストIMUデータを大幅に上回る性能を示す。
- 航空測量実験では,提案手法により,より薄く,一貫性のある点群が生成された。
- 本研究は,低コストIMUの性能限界を打破し,拡散に基づく生成学習の可能性を示す。
病理学的MILにおけるモダリティボトルネックの解消:仮想分子染色によるアプローチ [q-bio.QM, cs.CV, cs.LG]目的:病理画像における多重インスタンス学習の投影層の改善
- 病理画像解析は,疾患診断や予後予測において重要な役割を果たす。
- 従来のMILでは,H&E染色情報のみに依存する投影層がボトルネックとなっている。
- 空間トランスクリプトミクスを用いて,分子情報を投影層に組み込み,予測精度向上を目指す。
- MISTは,標準的な投影層を置き換えることで,256設定中240設定で性能が向上した。
- 生存予測,組織サブタイピング,バイオマーカー予測の各タスクにおいて,それぞれ+5.2%,+3.3%,+2.6%の平均的な改善が見られた。
- 遺伝子由来のプロトタイプが性能向上に寄与し,H&E染色画像から空間的に一貫性のある分子プログラムを捉えていることが示された。
多峰ガウス混合分布に対する事前条件付き焼きなましランジェバン動力学の次元一様離散化解析 [stat.ML, cs.LG, cs.NA, math.NA, math.PR]目的:多峰ガウス混合分布に対する事前条件付き焼きなましランジェバン動力学における次元一様離散化手法の解析
- 高次元・無限次元問題では,拡散型サンプラーの安定性が課題であり,高周波座標における誤差蓄積が不安定化を招く。
- 離散化は誤差の主要な原因であり,適切なスペクトル崩壊を持つ事前条件付けが誤差蓄積の抑制に必要となる。
- EM離散化の安定性制約と次元一様制御条件を明らかにし,初期分布と目標分布の距離を均一に保つ手法を提示する。
- EM離散化では,事前条件付けと焼きなまし共分散スケールが安定性制約を満たす必要があり,初期分布は次元に依存せず目標分布に近づく。
- 指数積分スキームを用いることで,初期分布と目標分布のカルバック・ライブラー情報量の上限が次元一様であることが証明された。
- この上限は,焼きなまし時間と時間メッシュの細かさを調整することで,任意の次元で小さくすることができる。
MRIスライス補間の深層学習:問題設定の重要性 [eess.IV, cs.CV, cs.LG]目的:MRIスライス補間による,スライス方向の解像度向上
- 臨床MRIでは,スライス方向の解像度が低いことが診断上の課題となる。
- 既存手法では,スライス方向の解像度を向上させることは困難である。
- 深層学習を用いて,スライス間を補間し,解像度を改善することを目指す。
- 問題設定を改善することで,SSIM性能が全決定性アーキテクチャで58%向上した。
- U-Netモデルが最も良い結果を示し,PSNRは30.08dB,SSIMは0.898を達成した。
- 問題設定の工夫が,アーキテクチャの洗練よりも290倍大きな影響を与えることが示された。
MoleCode:大規模言語モデルにおける構造的知性を解き放つ [q-bio.BM, cs.AI]目的:大規模言語モデルにおける分子構造の直接的な理解と操作
- 分子は複雑な構造を持つため,その情報を効率的に処理することが重要である。
- 従来のSMILES形式では分子構造が暗黙的であるため,LLMが構造を再構築する必要がある。
- 分子構造を明示的に表現する新しい言語を開発し,LLMの分子理解能力を向上させる。
- MoleCodeは,分子の構成要素を明示的に表現することで,LLMが構造情報を直接読み書きできるようにする。
- これにより,LLMは複雑な分子構造や操作において,より高い性能を発揮することが示された。
- MoleCodeは,分子構造だけでなく,ポリマーや科学論文など,より広範な科学データにも適用可能である。
拡散とフローを用いた高速尤度計算のためのStAD:スタイン償却発散 [stat.ML, astro-ph.IM, cs.LG]目的:拡散モデルとフローベースモデルにおける確率密度関数の計算効率向上
- 生成モデルや密度推定において,拡散モデルとフローベースモデルの利用が広がっている。
- これらのモデルからの尤度計算は,ヤコビアンのトレースの計算が必要で,計算コストが高い。
- ヤコビアンを直接計算せずに,Langevin-Stein演算子を用いて発散を予測・学習することで効率化を目指す。
- 提案手法StADは,CIFAR-10やImageNetなどの密度推定タスクにおいて,Hutchinson法と比較して分散と速度が向上した。
- StADは,多様な生成モデルに適用可能であり,特定の条件下ではSteinクラスを満たすベクトル場を生成できることが示された。
- ヤコビアンの計算を回避することで,尤度計算の効率化を実現している。
等方性生存回帰:深層Coxモデルからの校正された生存分布 [math.PR, cs.NI, stat.ML, cs.AI, cs.LG]目的:深層Coxモデルからの校正された生存分布の獲得
- 生命科学や工学において,イベント発生までの時間データは広く用いられる。
- 従来の機械学習手法では,打ち切りデータの扱いが難しい点が課題である。
- 深層Coxモデルの生存確率予測の精度向上,特に校正の改善を目指す。
- 本研究では,等方性回帰を用いて深層Coxモデルの予測生存確率を事後的に校正する手法を提案した。
- 理論的保証として,二重頑健性および漸近的校正が確立された。
- 合成データおよび実際の臨床データを用いた実験により,提案手法の有効性が実証された。
分布の統計的アンラーニング:仮説検定アプローチ [math.ST, cs.IT, cs.LG, math.IT, stat.ML, stat.TH]目的:分布レベルのアンラーニング
- 機械学習の応用拡大に伴い,有害情報やバイアスの除去が重要となる。
- 特定のドメインからのデータ完全削除は計算コストが高く,部分削除では統計的保証が得られない。
- 望ましくない分布の影響を減らしつつ,目的分布の性能を維持するサンプル選択を目指す。
- 本研究では,ドメインを確率分布としてモデル化し,仮説検定を用いてサンプル選択基準を定式化した。
- 編集されたデータの分布が許容範囲内であること,および削除・維持のパレート最適解を特徴付けた。
- 多峰性を持つ望ましくないドメインに対するアンラーニングの性質や,大規模なデータセットにおける漸近的振る舞いを明らかにした。
断続的な進歩の普遍的ダイナミクス [physics.soc-ph, cs.AI, cs.SI]目的:科学技術の進歩における断続的なダイナミクスの原理の解明
- 科学技術の進歩を理解することは,社会の発展と課題解決に不可欠である。
- 進歩のパターンが分野間で異なり,普遍的な法則が不明である。
- 様々な分野における進歩の普遍的な法則を特定し,そのメカニズムを明らかにすること。
- 9つの異なる分野における680万件の解決策を分析した結果,待機時間分布がべき乗則に従うことが明らかになった。
- 進歩の速度は亜線形であり,対数関数より速いが線形関数より遅いことが示された。
- 記録更新イベントは時間的に相関しており,短期的な予測可能性と長期的な予測不可能性を示すことがわかった。急進的な革新と漸進的な改良の相互作用が,進歩の普遍的なダイナミクスを駆動する主要因である。
予測介入ゲームと不変集合 [stat.ML, cs.AI, cs.LG, stat.ME]目的:予測介入ゲームにおけるリーダーの最適戦略
- 因果推論の分野において,データから予測し,介入を通して結果を最適化することは重要である。
- 介入者の目的が不明な場合,リーダーは最適な予測戦略を見つけることが困難である。
- 安定ブランケットに基づく予測器が,因果的親に基づく予測器よりも優れていることを証明する。
- 予測介入ゲームにおいて,安定ブランケットに基づく予測器は,因果的親に基づく予測器と同等かそれ以上の性能を示す。
- リーダーの介入後のリスクは,許容される介入全体での最悪の場合のリスクで上限を設けることができる。
- 安定ブランケットに基づく予測器が最悪の場合でも最適となるための十分条件が示された。
HYVINT:変動表現を用いた強度駆動型ハイパーグラフ生成 [stat.ML, cs.LG]目的:ハイパーグラフ生成の新しいフレームワーク
- 複雑な関係性を捉えるため,推薦システムや分子モデリングなど,様々な分野でハイパーグラフの利用が拡大している。
- 既存のハイパーグラフ生成手法は,解釈性が低い,または生成されたハイパーグラフの新規性・多様性が不足しているという課題がある。
- 潜在的な相互作用強度と二値のインシデンスの関係を明確化し,ハイパーグラフの生成メカニズムを解釈可能にすることを目指す。
- HYVINTは,潜在的な相互作用強度を二値のインシデンスに結びつける強度駆動型インシデンス形成メカニズムを開発した。
- 学習のための効率的な変分推定器を導出し,生成誤差の理論的な限界と漸近収束率を示した。
- 合成データおよび実世界のハイパーグラフにおいて,HYVINTが高い忠実度と新規性・多様性を実現することを示した。
ニューラルネットワークの学習力学に関するフーリエ解析:サンプル複雑性とメカニズム的洞察 [stat.ML, cond-mat.dis-nn, cond-mat.stat-mech, cs.LG, math.PR]目的:ニューラルネットワークの学習における単純性バイアスのメカニズム解明
- 深層学習は画像認識等で高い性能を示すが,その学習原理は未だ不明な点が多い。
- 従来の分析は等方的な入力に限定されており,自然画像の特性を考慮した研究が不足している。
- 自然画像に見られる特性が,学習速度に与える影響を明らかにすること。
- ニューラルネットワークは,まずピクセル間の相関に基づく振幅情報を学習し,次にエッジ等の情報を捉える位相情報を学習することが実験的に示された。
- 等方的な高次元入力においては,位相情報のみに基づく分類は困難であり,SGDは$n \ll N^3$ステップでは識別が不可能であることが理論的に証明された。
- しかし,べき乗則スペクトルは位相情報の学習を加速させることが実験と理論の両面から示され,振幅と位相の相互作用が深層学習の効率性に貢献することが示唆された。
CAST:分布値時系列のための因果的アンカー化単純体輸送 [stat.ML, cs.LG]目的:分布値時系列の因果的(オンライン)予測
- 確率分布で表現される現象の予測は,待ち行列,移動,公衆衛生など,多様な分野で重要である。
- 従来の予測手法では,文脈による分布の変化に対応できず,予測精度が低下することがある。
- 単純体構造を考慮し,文脈を意識した予測を行うことで,予測精度の向上を目指す。
- CASTは,既存の統計モデル,構成モデル,再帰型,畳み込み型,Transformerなどの基盤モデルと比較して,KL divergenceおよびautoregressive rollout JSDにおいて平均ランキングで最高の性能を示した。
- CASTは,11のベンチマークセクションのうち,各指標で8/11のセクションで勝利し,残りのセクションでは常に上位2位に入った。
- 実験により,理論で示唆された隠れた遷移カーネルのエイリアシング問題が確認され,CASTの有効性が裏付けられた。
量子フーリエ変換の$\mathcal{O}(n)$代替法:効率的なニューラルネットワーク古典後処理を伴う [eess.SP, cs.ET, math.CO, cs.DM, quant-ph, cs.LG]目的:量子フーリエ変換の代替となる浅い回路の構築と,隠れ部分群問題への応用
- 量子計算は,従来の計算機では困難な問題を解決する可能性を秘めているため重要である。
- 量子フーリエ変換の回路深度は深く,現在の量子ハードウェアでは実装が困難である。
- 量子フーリエ変換の性質を利用し,より浅い回路を構築することで,量子計算の実用化を目指す。
- 提案手法であるHP-$L$回路は,シフト不変性を維持することが数学的に証明された。
- HP-$1$回路は,数値解析により,指数的に増加するFisher情報を保持することが示された。
- HP-$1$回路は,古典的な後処理を行うニューラルネットワークと組み合わせることで,Shorのアルゴリズムにおいて量子フーリエ変換の代替となりうる。
グローバル自動化アトラス [econ.GN, cs.AI, cs.CY, q-fin.EC, stat.AP]目的:世界各国の自動化エクスポージャーの分類
- 自動化は労働市場に大きな影響を与えており,その影響を正確に把握することは重要である。
- 既存の自動化エクスポージャー指標は固定的なスコアを使用し,国間の比較が困難である。
- 自動化の労働代替・補完,技術チャネル,AIの役割を考慮した国別アプローチでこの課題を解決する。
- 自動化エクスポージャーは国によって大きく異なり,南スーダンが3.3%,中国が61.6%と幅がある。
- 低所得国では労働代替型自動化へのエクスポージャーが高く,中所得国では多様性がみられる。
- AIは単純な自動化チャネルよりも普及しておらず,低所得国では労働代替型,高所得国では労働補完型でより多く見られる。
確率的偏微分方程式における不確実性量化のための拡散ベース確率演算ネットワーク [stat.ML, cs.LG, math.OC, math.PR]目的:確率的偏微分方程式の解演算子の不確実性量化
- 複雑な物理システムをモデル化する上で確率的偏微分方程式は不可欠である。
- モデルの不確実性の大きさや構造が不明確であり,ノイズのある計測データからの推定が困難である。
- ノイズのあるデータから直接学習し,平均解と不確実性の量を予測する手法を開発する。
- 提案手法である確率演算ネットワーク(SON)は,DeepONetと確率的ニューラルネットワーク(SNN)を組み合わせることで,確率的な予測を可能にする。
- ハミルトニアン型の損失関数を最小化し,確率的最大原理を用いて目的関数を最適化する学習手順を採用した。
- 複数の不確実性源を持つベンチマークSPDEsに対する数値実験により,提案手法の精度とロバスト性が確認された。
多タスク線形回帰:固有値下界なしのアダプティビティ,ロバスト性,安全性 [stat.ML, cs.LG, stat.ME]目的:汚染されたタスクが存在する多タスク線形回帰問題におけるパラメータ推定
- 多タスク学習は,タスク間の関連性を活用し,各タスクの性能向上を目指す重要な研究分野である。
- 既存研究は,各タスクの二乗モーメントの最小固有値がゼロから離れていることを仮定しており,高次元データでは仮定が成り立たない場合がある。
- この研究は,最小固有値に関する仮定を緩和し,より広範な状況下で多タスク学習の理論的保証を確立することを目的とする。
- 提案手法は,行列重み付きノルム正則化に基づく推定器であり,適応性,ロバスト性,安全性を実現する。
- 適度なバランス定数下では,予測MSEの上界はDuanとWang (2023)の結果と同等であり,タスク全体のMSEはミニマックス最適である。
- バランス定数が大きい場合やタスクが無関係な場合には,独立したタスク学習と同等以上の性能を発揮する安全性を保証する。
量子誤り訂正のためのスパースMambaデコーダ:表面符号シンドロームの効率的な欠陥中心処理 [quant-ph, cs.LG]目的:量子誤り訂正における表面符号シンドロームの欠陥中心処理による効率化
- 量子コンピュータの実現には誤り訂正が不可欠であり,高性能なデコーダが求められている。
- 既存のニューラルデコーダは,シンドローム全体を処理するため,計算コストが高いという課題がある。
- 本研究は,実際にエラーが検出された箇所のみを処理することで,デコーダの効率化を目指す。
- Sparse Mamba Decoder (SMD) は,シンドロームの活性な検出イベントのみを処理することで,計算量を削減した。
- 様々なベンチマークにおいて,SMDは既存のデコーダと比較して,論理エラー率を最大49%削減し,95~467倍高速に動作した。
- SMDは,標準的なNVIDIA GPU上で7.5~16Mパラメータで動作し,特殊なアクセラレータを必要としない。
対角線形ネットワークに対するSGDの高次元限界 [math.OC, cs.LG, math.ST, stat.ML, stat.TH]目的:対角線形ネットワークにおける確率的勾配降下の最適化と汎化特性の解析
- 機械学習の発展において,確率的勾配法は基盤技術であり,その理解は不可欠である。
- 高次元データにおける確率的勾配法の挙動は複雑であり,理論的な解析が困難である。
- 対角線形ネットワークという簡略化された設定を用いて,高次元における確率的勾配法の振る舞いを明らかにすること。
- 高次元において,対角線形ネットワークに対する確率的勾配降下は,確率的微分方程式によって記述される連続ダイナミクスと近似できる。
- 関連する状態量を伝播させ,リスク,曲率などの最適性指標の時間発展を特徴付ける決定論的な偏微分方程式を導出した。
- 適切なパラメータ化の下で,確率的ダイナミクスは安定的にゼロリスクに指数関数的に収束することが示された。
ノイズと不正確なサイド情報を用いた効率的な帰納的行列補完 [stat.ML, cs.IT, cs.LG, math.IT, math.ST, stat.TH]目的:ノイズと不正確なサイド情報下における行列補完の効率性向上
- 行列補完はデータ解析の基礎であり,欠損値からの情報復元に不可欠である。
- 既存手法では,効率性とノイズへの対応を両立することが困難であった。
- サイド情報を活用し,効率的かつ正確な行列補完を実現することを目指す。
- サイド情報に基づいた新しいアルゴリズムにより,従来の次元数に依存しない効率的な補完が可能となった。
- 理論的解析により,提案手法がサイド情報の次元数に基づいたサンプル複雑度で線形収束することを示した。
- 不正確なサイド情報に対しても,効率性と最適性が維持されることが実証された。
SAR画像を用いた量子支援SVMによる海洋油汚染のリアルタイムに近い検出 [quant-ph, cs.LG]目的:海洋油汚染の検出手法
- 海洋油汚染は生態系や経済に深刻な被害をもたらすため,迅速な検知が重要である。
- SAR画像解析は困難であり,深層学習モデルは大量データと高い遅延時間を要する。
- 量子支援SVMを用いて,少量データでも高速かつ高精度な油汚染検出を実現する。
- 量子支援パイプラインは,古典的なベースラインと同等の性能を達成し,IoU 0.60,バランスの取れた精度0.89を示した。
- ゲートベース量子コンピューティングを用いた実験でも同様のセグメンテーション精度が得られたが,アニーリングアプローチの方が推論効率に優れていた。
- ホルムズ海峡の独立した油汚染画像に対する評価により,地理的に異なる油流出イベントへの汎用性の可能性が示された。
量子誤り訂正符号の最尤復号 [quant-ph, cond-mat.dis-nn, cond-mat.stat-mech, cs.LG]目的:量子誤り訂正符号の最尤復号法の現状と課題
- 量子計算の実現には不可欠であり,誤り耐性を持つための基盤技術である。
- 最尤復号法は最適であるが,計算量が膨大であり,実用上の課題となっている。
- 統計力学,テンソルネットワーク,人工知能の視点から,最尤復号法の近似解法を探求する。
- 統計力学的手法により,特定の符号とノイズモデルにおいて正確な解が得られ,閾値推定が可能となる。
- テンソルネットワークを用いることで,最尤復号法に近い精度で,計算コストを抑えた復号器が実現可能となる。
- ニューラルネットワークベースの復号器は,データから最尤復号分布を学習し,高い精度と並列処理能力を両立する。
KL緩和と方策勾配によるスケーラブルな双方向最適輸送 [math.OC, cs.LG]目的:双方向最適輸送の計算手法
- 金融,不確実性評価,多段階確率最適化などに応用が期待される重要な枠組みである。
- 経路空間での双方向制約の強制が計算困難であり,実用性が限定されている。
- 汎用的な周辺分布下での双方向最適輸送計算のスケーラビリティ向上を目指す。
- KLペナルティ付き緩和法を導入することで,厳密な周辺制約を扱いやすいダイバージェンスペナルティに置き換えた。
- 緩和問題がペナルティ増加と共に元の双方向最適輸送問題に収束することを証明した。
- ロバストなヘッジングや時系列統計的ダウンスケーリングといった応用で良好な性能を示した。
安定したボラティリティ・共分散推定のためのハイブリッドガウス過程回帰フレームワーク:グローバル株式指数からのエビデンス [q-fin.RM, cs.LG]目的:ボラティリティ・共分散行列の推定
- 金融規制資本の妥当性評価において,正確なボラティリティ・共分散行列の予測は極めて重要である。
- 従来の計量経済モデルは,パラメトリックな固定性,分布の仮定,ストレス下での数値的不安定性などの問題を抱える。
- 本研究は,テールリスクの過小評価を防ぐ,より安定した推定手法を確立することを目指す。
- 提案するハイブリッドGPR-HSフレームワークは,規制要件を満たす結果を示した。
- ポートフォリオレベルでの期待損失(ES)の合格率は100%であり,静的Historical VaRベンチマークよりも優れている。
- Aggressive Noise Initialization(ANI)戦略により,グラム行列の正定値性が保証され,保守的な予測が可能となった。
有限時間不安定性解析のための予測誤差成長プロファイリング:非線形時系列 [nlin.CD, cs.LG, math.DS]目的:非線形スカラー時系列の有限時間不安定性解析のための予測誤差成長プロファイリング手法
- 非線形時系列解析は,気象,金融,生物学など,複雑な現象の理解に不可欠である。
- 支配方程式が不明な場合,最大リアプノフ指数を正確に推定することは困難である。
- 予測誤差成長の構造化されたプロファイルを利用し,不安定性率の推定と非線形信号解析を行う。
- 提案手法FEG-Proは,自己相関に基づいた疎な履歴を構築し,多段階予測誤差成長を分析する。
- 予測誤差成長の傾きlambda_FEGは,支配的な不安定性率の推定値として,既知の最大リアプノフ指数と比較できる。
- 残差の粗さや予測誤差分布エントロピーといった二次的特徴量は,診断制御や機械学習の特徴量として活用可能である。
グローバル株式市場における多様化ポートフォリオ管理のための深層強化学習フレームワーク [q-fin.PM, cs.AI, cs.LG, cs.NE, q-fin.TR]目的:グローバル株式市場における動的なポートフォリオ配分
- 投資戦略において,リスク調整後のリターンを最大化することは,金融市場の効率性と投資家の利益にとって重要である。
- 伝統的なポートフォリオ最適化手法は,市場の複雑さや変化への適応に限界があり,取引コストや制約を考慮しにくい。
- 深層強化学習を用いることで,市場の変動に対応した柔軟なポートフォリオ戦略を構築し,より良い投資パフォーマンスを目指す。
- 強化学習戦略は,特にユーロ・ストックス50において,リスク調整後のパフォーマンスで競合性のある結果を示した。
- ただし,全市場において,Buy and Hold戦略と比較して統計的に有意な超過収益は確認されなかった。
- 市場の不確実性が高い時期には強化学習の価値が高まり,地理的 diversificationによってリスク調整後のパフォーマンスが向上することが示された。
リチウムイオン電池の劣化に対する因果異常検知 [cond-mat.mtrl-sci, cond-mat.stat-mech, cs.LG, physics.comp-ph]目的:リチウムイオン電池の劣化を早期に検知するための手法
- 電池の信頼性向上は,電気自動車やエネルギー貯蔵システムにおいて不可欠である。
- 従来の劣化検知は,電池の劣化領域にアクセスする必要があり,早期発見が困難である。
- 走行データのみから物理的に解釈可能な指標を用いて,劣化の早期発見を目指す。
- 提案手法「CausalHealth」は,因果グラフ発見と転送エントロピーを用いて異常スコアを生成し,高精度な劣化検知を可能にした。
- 特に「Magnitude-shift」クラスは,全ての試験セルにおいて100%の検知率を達成し,最長402サイクル前に劣化を予測した。
- 複数の検知器を統合したRWMHIは,長寿命セルにおいて予測リードタイムを15-52サイクル改善した。電気化学インピーダンス分光法による検証も,物理的根拠の一貫性を示した。
フォン・エコノモ神経細胞は再帰型スパイクニューラルネットワークにおける信頼性の高い社会性スキルの獲得を可能にする:臨床的予測を含む計算論的考察 [eess.SP, cs.NI, q-bio.NC, cs.NE]目的:再帰型スパイクニューラルネットワークにおける社会性スキルの獲得におけるフォン・エコノモ神経細胞の役割
- 前頭側頭型認知症や自閉スペクトラム症との関連から,社会性に関わる神経メカニズムの解明が重要である。
- フォン・エコノモ神経細胞の機能不全が,社会性スキルの獲得にどのような影響を与えるかは未解明である。
- フォン・エコノモ神経細胞が社会性スキルの獲得において果たす役割を計算論的に解明し,臨床的な予測を立てる。
- フォン・エコノモ神経細胞を含むネットワークは,含まないネットワークと比較して,学習が成功する確率が有意に高かった。
- フォン・エコノモ神経細胞の除去は,学習の中盤に最も影響を与え,再帰型回路における共適応的な依存関係の形成を阻害する。
- フォン・エコノモ神経細胞は,学習の足場として機能し,その欠如は社会性スキルの獲得における確率的な失敗を引き起こす可能性がある。
赤方偏移条件付き銀河画像合成の加速:ワンステップ生成モデリング [astro-ph.IM, astro-ph.GA, cs.LG]目的:赤方偏移条件付き銀河画像生成のための効率的な生成モデリング
- 宇宙時間における銀河形態進化の理解は,現実的な銀河集団を生成するモデルを必要とする。
- 既存手法は,高い計算コストが課題であり,大規模な宇宙サーベイやシミュレーションに基づく科学的推論の効率を阻害する。
- ワンステップ生成モデルを用いることで,計算コストを大幅に削減し,効率的な銀河シミュレーターを実現することを目指す。
- 標準的なDDPMサンプリングは最高の分布忠実度を達成するが,高い計算コストを必要とする。
- 高次サンプラーはDDIMと比較して効率を大幅に向上させる。
- Pixel-MeanFlowは単一ステップでの生成を可能にし,いくつかの形態統計において競争力のある性能を示す。
再生核を用いた任意の構造を持つ仮説空間における偽発見の制御 [stat.ME, cs.AI, q-bio.QM, stat.ML]目的:大規模仮説検定における偽発見率の制御
- 現代科学において,多数の同時検定を行う際の偽陽性を管理することが重要である。
- 古典的な方法は依存関係を保守的に修正するが,構造を活かすことで検出力を向上できる。
- 構造化されたFDR制御を正則化された学習問題として再構築し,検出力を高めることを目指す。
- 適切な再生核ヒルベルト空間(RKHS)内で最適化することにより,連続ドメイン,グラフ,階層構造を統一的に扱えるフレームワークを提案した。
- 本定式化により,従来の離散的な手法に代わり,滑らかな解を得ることが可能となり,サンプル効率の良い実験計画を支援する。
- 提案手法は,空間データや遺伝子発現データなどを用いた検証で,FDRの制御効果が確認された。
多孔質媒体の透水性を予測するためのトポロジーデータ解析と機械学習の組み合わせ [cond-mat.soft, cs.LG]目的:多孔質媒体の透水性予測
- 地層や岩石などの多孔質媒体における流体挙動の理解は,資源開発や環境保全において重要である。
- 多孔質媒体の複雑な構造から,解析的な手法や数値シミュレーションでは精度の高い予測が困難である。
- 機械学習を用いて,多孔質媒体の構造的特徴と透水性の関係を明らかにし,より高精度な予測モデルを構築する。
- トポロジーデータ解析から抽出される特徴量は,機械学習と組み合わせることで,多孔質媒体の透水性を効果的に予測できることが示された。
- 構造,接続性,ネットワークなどの様々な特徴量を入力変数として用いることで,予測精度向上に貢献することが確認された。
- 特に,トポロジーデータ解析は,多孔質媒体の構造に基づいた透水性予測において有用な特徴量を提供することが明らかになった。
Longwang:潜在的生成事前知識を用いたゼロショット全球時空間降水ダウン スケーリング [physics.ao-ph, cs.LG]目的:全球時空間降水ダウン スケーリングの実現
- 気候変動の影響評価には高解像度降水情報が不可欠である。しかし,現在の全球気候モデルでは,その解像度が低い。
- 既存の機械学習によるダウン スケーリング手法は,ペアリングされたデータが必要,地域やスケールに依存,計算コストが高いという課題がある。
- 事前知識を用いた潜在的生成フレームワークにより,分布シフト下でも汎化性能の高いダウン スケーリングを実現する。
- Longwangは,ERA5再解析データにおいて,無条件の生成事前知識を用いた標準的な事後サンプリングよりも優れた性能を示した。
- 特に,微細な空間パターンを再構築し,時間的な一貫性を保ち,極端な降水強度を回復する能力において優れている。
- このフレームワークは,過去の気候シミュレーションや将来の気候予測にも適用可能であり,分布シフトに対する頑健性も確認された。
機械学習に基づくFARICH応答の高速シミュレーション [hep-ex, cs.LG]目的:FARICH検出器応答の高速シミュレーション手法
- 素粒子物理学実験において,検出器シミュレーションはデータ解析に不可欠である。
- 従来のモンテカルロ法は計算コストが高く,シミュレーション時間の短縮が課題である。
- 機械学習を用いて,モンテカルロ法よりも高速なシミュレーションを実現すること。
- 条件付き生成敵対ネットワーク(cGAN)を用いて,粒子パラメータに基づいた検出器応答を再現した。
- cGANは確率マップと再構成された速度分布において,線形統計的ベースラインよりも優れた性能を示した。
- cGANは現実的なサンプルを生成し,モンテカルロシミュレーションと比較して大幅な高速化を達成した。
無限に深く,広いTransformerの学習 [math.OC, cs.AI, cs.LG, stat.ML]目的:Transformerの学習ダイナミクスの数学的フレームワーク
- Transformerは機械学習の主要なアーキテクチャであり,その理論的理解が重要である。
- Transformerの学習ダイナミクスに関する理論的理解は限られている。
- 無限に深さと幅を増すTransformerの学習を厳密に分析する。
- Transformerの学習は,ニューラルPDEの制御に対応することが示された。
- 無限に深いTransformerの順伝播のwell-posednessが確立された。
- アテンション機構のNTKのinjectivityの必要十分条件が導かれた。
関数近似を用いたエントロピー正則化Q学習におけるガウス近似について [stat.ML, cs.LG]目的:高次元中心極限定理における収束レート
- 強化学習は,複雑な意思決定問題への応用が期待される重要な研究分野である。
- 関数近似を用いたQ学習は,高次元状態空間における学習が困難であるという課題がある。
- エントロピー正則化により,探索と活用のバランスを保ち,効率的な学習を実現することを目指す。
- エントロピー正則化された非同期Q学習において,Polyak-Ruppert平均化反復の収束レートを導出した。
- サンプル数nに対して,$n^{-1/4}$オーダーのガウス近似境界が,凸距離において確立された。
- ソフトベルマン再帰の線形化と,主要なマルチンゲール項のガウス近似を組み合わせることでこの結果を得た。
交換不可能なパネルデータに対するオンライン適合予測 [stat.ML, cs.LG, stat.ME]目的:非交換可能なパネルデータに対するオンライン適合予測手法
- 科学技術において,時間経過とともに繰り返し観測されるパネルデータは広く存在する。
- 従来の適合予測は交換可能性を仮定するため,時間依存性や単位異質性が存在するパネルデータには適用が難しい。
- 時間依存性や単位異質性を考慮した,パネルデータ向けのオンライン適合予測手法を開発すること。
- 提案手法では,予測対象単位に関連する単位の同時期の結果を校正パネルとして活用する。
- 過去のデータに基づいた類似性重みと適応的な不適合率を用いることで,段階的なカバレッジ保証を実現した。
- シミュレーションおよび実データ分析の結果,最悪のカバレッジを示す対象単位に対するカバレッジが向上した。
特徴学習は関数空間をいかに再構築するか [stat.ML, cs.LG]目的:ニューラルネットワークにおける特徴学習が関数空間に与える影響の定量的評価
- 機械学習の発展において,ニューラルネットワークの機能は重要であり,その根底にあるメカニズムの解明が求められている。
- 特徴学習がニューラルネットワークの性能向上に不可欠であることは認識されているが,それが関数空間に及ぼす影響は未解明な点が多い。
- 本研究は,ニューラルネットワークの勾配降下法による学習過程における関数空間の変化を精密に解析し,そのメカニズムを明らかにすることを目的とする。
- 高次元の比例的条件において,学習後の特徴分布はターゲットに依存したスパイク付きガウス共分散で近似できることが示された。
- この結果は,データ適応的なカーネルの導入と解釈でき,関数空間を再構築し,そのスペクトル構造を変化させることを示唆する。
- 特徴学習は,パラメータ空間または入力空間における分布変換として理解でき,ターゲットに合致した方向の固有値を増幅し,主要な固有関数を混合する。
日中先物データにおける逐次構造:MNQにおけるLSTMと勾配ブースティングの比較 [q-fin.TR, cs.LG, q-fin.CP, q-fin.ST]目的:マイクロE-ミニNasdaq 100先物(MNQ)の日中方向性予測における勾配ブースティングとLSTMアーキテクチャの比較
- 金融市場の予測精度向上は,リスク管理や収益機会の最大化に不可欠であるため,重要な研究分野である。
- 既存の機械学習モデルは,金融時系列データの複雑な変動やノイズの影響を受けやすく,予測精度が低い場合がある。
- 本研究は,日中先物データの逐次構造を捉え,より安定した予測モデルを構築することを目指す。
- 2021年から2025年までの944取引日を対象とした厳格な拡張ウィンドウウォークフォワード検証の結果,いずれの構成も51.8%を超える有意な予測精度は得られなかった。
- 勾配ブースティングの精度は50.00%から50.89%の範囲であり,LSTMは50.59%であった。
- 置換検定の結果,最良の勾配ブースティングモデルのp値は0.135,LSTMは0.515であり,有意な予測優位性を示さなかった。
深層ネットワークのための統計量化子最適化:StatQAT [stat.ML, cs.LG]目的:深層ネットワークの低精度化における最適な量子化パラメータの選択
- 深層学習モデルの効率的な推論を実現するためには,計算コストとメモリ使用量の削減が不可欠である。
- 量子化パラメータの選択は依然として困難であり,特に学習および推論時の多様なデータ分布への対応が課題である。
- 様々なデータ分布に対応可能な,誤差の少ない量子化手法を開発し,低精度ニューラルネットワークの学習を改善すること。
- 本研究では,一様量子化および浮動小数点量子化に関する統計的誤差解析フレームワークを提案し,理論的な洞察を提供した。
- 任意のデータ分布に適応する反復量子化子と,ガウス分布に類似した重みに適した解析量子化子を開発した。
- 量子化を意識した学習にこれらの量子化子を組み込み,整数形式および浮動小数点形式の両方で精度と安定性の向上が確認された。
線形幅二層ネットワークにおける特徴学習:二段階と一段階の勾配降下 [stat.ML, cs.LG]目的:線形幅二層ニューラルネットワークにおける特徴学習の理論的解明
- 深層学習の理論的理解は,その性能向上と応用展開に不可欠である。
- 従来の理論では,勾配降下法の単一ステップ更新に限界があり,情報指数が1に限定されていた。
- 本研究は,二段階の勾配降下法による特徴学習を解析し,情報指数が1を超える方向の学習可能性を示す。
- 二段階の勾配降下法において,更新された重みは複数の外れ値を持つスパイク付きランダム行列として振る舞うことが示された。
- 外れ値の数は,学習率のパラメータ$\alpha_1$と$\alpha_2$によって決定され,$\lfloor \frac{\alpha_2}{1/2 - \alpha_1} \rfloor$で表される。
- バッチ再利用は,情報指数が1を超える方向の学習を可能にし,有限幅ネットワークにおける利点が線形幅限界においても維持されることが確認された。
スパイク共分散モデルにおけるスペクトル収縮推定量の自己蒸留が最適である [math.ST, cs.LG, stat.ME, stat.ML, stat.TH]目的:スパイク共分散モデルにおけるスペクトル収縮推定量の最適性
- 高次元データ分析において,共分散行列の推定精度は重要であり,統計的推論や機械学習の性能に大きく影響する。
- 従来の共分散行列推定方法では,高次元データにおけるノイズの影響やスパイクの存在により,推定精度が低下する課題があった。
- 自己蒸留法を用いて,スパイク共分散モデルにおけるスペクトル収縮推定量の最適解を導き,その性能向上を目指す。
- スパイク共分散行列において,sステップの自己蒸留がスペクトル収縮推定量の中で最適な性能を発揮することが示された。
- 自己蒸留のステップ数をs未満にすると,推定性能が厳密に低下することが明らかになった。
- 等方性共分散の場合,最適化されたリッジ回帰がスペクトル収縮推定量の中で最も優れていることが示された。
拡散モデルにおけるパス測度上の逐次モンテカルロによる単純な近似と微分不要な推論時間スケーリング [stat.ML, cs.CV, cs.LG, cs.NA, math.NA, math.PR]目的:拡散モデルの推論時間におけるスケーリング手法の開発
- 拡散モデルは高品質なサンプル生成に貢献するが,計算コストが高い点が課題。
- 既存の推論時間ガイダンス手法は勾配計算が必要で,バイアスや計算負荷が大きい。
- 勾配計算を不要とし,計算効率と生成品質を両立するスケーリング手法を提案する。
- 提案手法URGEは,ギルサノフ変換を用いたパスごとの重要度重み付けにより,微分不要な推論時間スケーリングを実現する。
- パスごとのスケーリングと粒子ごとのSMCの等価性を理論的に証明し,バイアスのない終端分布を保証する。
- 合成テストと拡散モデルのベンチマークにおいて,既存手法を上回り,より高品質な生成結果を得た。
壁面乱流における3次元長期間予測:CTA-Swin-UNetと分解能解析 [physics.flu-dyn, cs.LG]目的:壁面乱流の3次元長期間予測手法の開発
- 流体現象の予測は,工学設計や気象予報など様々な分野で重要である。
- 機械学習による長期間予測は,誤差の累積と計算コストが課題となっていた。
- 誤差蓄積を抑制しつつ,計算コストを抑えた長期間予測を実現すること。
- CTA-Swin-UNetは,LSTMやFNOといった既存モデルよりも,予測精度と長期安定性で優れている。
- MTFC戦略を導入することで,予測可能な期間を最大300ステップまで延長することに成功した。
- 分解能解析に基づくSLSE再構成により,予測された平面データから3次元流れ構造を復元できた。
ハイブリッドAI学習・推論のための量子サイドカーアーキテクチャ:状態保持型保護レジスタ,ステートレスなリセット・再準備回路,および量子重み状態の展望 [quant-ph, cs.AI]目的:ハイブリッドAI学習・推論のための量子サイドカーアーキテクチャ群
- AIの発展に伴い,計算資源の需要が急増しており,その効率的な利用が重要となっている。
- 既存のAIモデルは古典計算資源に依存しており,量子計算による加速が期待される一方,課題が多い。
- 量子サイドカーアーキテクチャによる,古典AIモデルの効率的な学習・推論支援を目指す。
- 量子サイドカーは,古典モデルパイプラインに接続されたコプロセッサとして機能し,最適化器側のサンプリングを支援する限定的な信号生成器としての役割を果たす。
- 状態保持型モードでは,保護レジスタが再利用可能な量子資源を格納し,QNDスタイルの読み出しを行うことで,効率的な計算を実現する可能性を示唆した。
- ステートレスモードでは,タスクに応じた量子回路を準備し,候補信号を測定することで,モデルの適応や専門家選択への応用が期待される。
リアルタイム多計測器を用いた新規相変化メモリ材料の自律的探索 [cond-mat.mtrl-sci, cs.LG, physics.app-ph]目的:新規相変化メモリ材料の探索
- 材料開発において,より高性能なメモリ材料の探索は重要である。
- 複数の計測器から得られる異質なデータを統合し,リアルタイムで分析することが困難である。
- 複数の計測器データを統合し,実験中に迅速に材料探索を行うことを目指す。
- マルチ計測器自律的探索(MAD)フレームワークを構築し,構造特性マッピングと機能特性最適化を同時に行うことに成功した。
- Mn-Sb-Te三元系において,結晶構造分布の知識を最大化しつつ,電気抵抗値が最大となる組成を特定した。
- 従来の実験と比較して,7倍の速度で相変化メモリ材料の合成-プロセス-構造-特性関係(SPSPR)を明らかにした。
F\"ollmer過程とノイズ除去拡散確率モデルの間の関係についての考察 [stat.ML, cs.LG, math.PR]目的:F\"ollmer過程とノイズ除去拡散確率モデルの関係性の明確化
- 近年の生成モデリングにおいて,拡散モデルは重要な役割を担っている。
- 拡散モデルのサンプリング誤差解析は重要だが,離散化手法の選択が課題である。
- F\"ollmer過程の離散化が拡散モデルのサンプリングに与える影響を解明する。
- F\"ollmer過程の離散化は,拡散モデルのサンプラーのハイパーパラメータ設定に自然な指針を与える。
- 既存の研究結果を体系的に再構成し,拡散モデルのサンプリング誤差の上限をわずかに改善することに成功した。
- F\"ollmer過程は,ノイズ除去拡散確率モデルの逆確率微分方程式を時間圧縮した拡張版と解釈できる。
ノイズ除去拡散確率モデルに対するFöllmer過程を通じたWasserstein距離の限界 [stat.ML, cs.LG, math.PR, math.ST, stat.TH]目的:ノイズ除去拡散確率モデル(DDPM)におけるサンプリング誤差の限界
- 深層学習モデルの生成性能評価において,Wasserstein距離は重要な指標である。
- DDPMのサンプリング誤差の厳密な限界は未だ十分に解明されていない。
- DDPMのサンプリング誤差をWasserstein距離で厳密に評価する手法を確立する。
- スコア関数のLipschitz条件の下で,次元とステップ数に関して最適な上限を導出した。
- DDPMが,対数Sobolev不等式と二次輸送コスト不等式を満たすことを証明した。
- 一般的な対数凹型ターゲット分布において,二次輸送コスト不等式なしでも最適なWasserstein誤差限界が達成可能であることを示した。
4量子ビットEWL量子ゲーム回路によるクワドプルヘリックス破壊的イノベーションレコメンダーシステム [quant-ph, cond-mat.stat-mech, cs.AI, econ.EM, econ.TH]目的:クワドプルヘリックスイノベーションエコシステムにおける破壊的・漸進的イノベーション傾向の予測
- イノベーションは経済成長の重要な原動力であり,その促進は社会経済的発展に不可欠である。
- 既存のレコメンダーシステムは,複雑な社会経済的生態系における破壊的イノベーションの予測に課題がある。
- 量子ゲーム理論と量子回路を組み合わせ,破壊的イノベーションの予測精度向上を目指す。
- 提案する量子ゲーム回路は,22ゲート,深さ11で構成され,NISQデバイスでの実装に適している。
- ヨーロッパ委員会のCORDISデータベースのデータを用いた数値実験により,回路の有効性が実証された。
- 本研究は,量子ゲーム理論,パラメター化された量子回路,相対論的経済成長モデルを統合し,イノベーション政策に貢献する。
