arXiv雑要約

AI - 2026/02/03 公開

  • 国境を越える偏り:多言語LLMにおける政治的イデオロギーの評価と制御 [cs.CL, cs.AI]目的:多言語LLMにおける政治的偏りの評価と制御
    • LLMは世界的な議論を形成するため,公平性と中立性が不可欠である。
    • 既存研究は主に欧米言語に集中しており,多言語間の整合性や安全な緩和策が不足している。
    • 多言語における政治的偏りを評価し,言語を越えた整合性を確保する。
    • 大規模な多言語評価により,50カ国33言語における政治的偏りが明らかになった。
    • Cross-Lingual Alignment Steering (CLAS)フレームワークは,言語間のイデオロギー表現を整列させ,介入強度を動的に調整する。
    • 経済および社会軸の両方において,回答の質を維持しつつ,偏りを大幅に削減できることが示された。

    Link: https://arxiv.org/abs/2601.23001

  • エントロピー正則化構造推論における過早な崩壊の回避:適応的アニーリング [cs.LG, cs.AI]目的:構造予測における微分可能なマッチング層の安定化
    • 構造予測は,複雑なデータ間の関係性を明らかにする上で重要な役割を果たす。
    • エントロピー正則化最適輸送を用いた離散的な置換の回復は不安定でありやすい。
    • 推論プロセスの安定性を監視し,効率的なスケジュールアルゴリズムを提案すること。
    • 過早なモード崩壊というメカニズムを特定し,Sinkhorn固定点マップの非正規ダイナミクスを分析した。
    • 線形安定則を適用することで,スペクトル診断のオーバーヘッドを大幅に削減する適応的スケジュールアルゴリズム(Efficient PH-ASC)を提案した。
    • 提案手法は,従来の指数冷却よりも安定的に推論軌道を誘導し,性能向上を示すことが確認された。

    Link: https://arxiv.org/abs/2601.23039

  • 言語モデルにおける選好と確信度のバランス:CATTO [cs.LG]目的:言語モデルの確信度と予測の正確性の較正
    • 大規模言語モデルは自然言語処理の発展に不可欠であり,その性能向上が求められている。
    • 言語モデルの確信度は必ずしも予測の正確性を反映しておらず,誤った自信や過小評価が生じやすい。
    • 選好に基づく調整で確信度と正確性の乖離が拡大するため,その較正が重要な課題となっている。
    • CATTOは,DPOと比較して,分布内・分布外データで期待較正誤差(ECE)を減少させる。
    • 確信度改善はタスク精度を損なわず,複数選択形式の質問応答において精度を維持または向上させる。
    • トークン確率を活用するConfidence@kにより,ベイジアン最適選択による出力トークンの選定が可能となる。

    Link: https://arxiv.org/abs/2601.23096

  • 遠くを見るために近くを見る:長期時系列の進化予測 [cs.LG, cs.AI]目的:長期時系列予測における進化予測パラダイムの確立
    • 長期時系列予測は,需要予測や資源管理など,様々な分野で不可欠な技術である。
    • 従来の直接予測法は,予測対象の地平線ごとに再学習が必要であり,計算コストが高いという課題がある。
    • 本研究は,短い地平線で学習したモデルを進化予測によって活用し,長期予測の精度向上を目指す。
    • 進化予測パラダイムを用いることで,長い地平線で直接学習したモデルよりも,短い地平線で学習したモデルが優れた性能を示すことが示された。
    • この成功は,直接予測法に固有の最適化の病理を軽減することに起因すると考えられる。
    • 進化予測は,直接予測法を包含する統一的な生成フレームワークとして確立された。

    Link: https://arxiv.org/abs/2601.23114

  • MeshGraphNet-Transformer:固体力学のためのスケーラブルなメッシュベースの学習シミュレーション [cs.LG]目的:固体力学におけるメッシュベースの学習シミュレーション手法
    • 現実世界の物理現象を正確に予測するためには,高度なシミュレーション技術が不可欠である。
    • 従来のメッシュベースの手法では,大規模かつ高解像度なメッシュにおける長距離情報の伝播に課題があった。
    • 本研究では,効率的な長距離情報伝播を実現し,大規模メッシュでの学習シミュレーションを可能にすることを目指す。
    • MeshGraphNet-Transformer(MGN-T)は,Transformerのグローバルモデリング能力とMeshGraphNetの幾何学的誘導バイアスを組み合わせた新しいアーキテクチャである。
    • MGN-Tは,標準的なMGNが抱える,大規模メッシュにおける反復的なメッセージパッシングによる非効率な長距離情報伝播の問題を克服している。
    • MGN-Tは,インパクトダイナミクスなどの工業規模の課題において,従来のMGNよりも高い精度と効率を示すことが示された。

    Link: https://arxiv.org/abs/2601.23177

  • TEON:大規模言語モデル事前学習のための層別正準化を超えたテンソル正準化 [cs.LG, cs.AI]目的:大規模言語モデルの事前学習における勾配の構造化
    • 大規模言語モデルは自然言語処理の発展に不可欠であり,高性能な学習手法が求められている。
    • 既存の最適化手法では,勾配の次元が増大するにつれて学習が不安定になる課題がある。
    • TEONは,層別正準化の限界を克服し,より安定した学習を実現することを目指す。
    • TEONは,Muonの層別正準化を一般化し,勾配を高階テンソルとしてモデル化することで,理論的な収束性の向上を保証する。
    • GPTおよびLLaMAモデルの実験結果から,TEONはモデル規模に関わらず,学習および検証のパープレキシティを改善することが示された。
    • 様々な近似SVDスキームにおいても,TEONは高いロバスト性を示すことが確認された。

    Link: https://arxiv.org/abs/2601.23261

  • 在庫方針に関するVC理論 [stat.ML, cs.LG]目的:在庫管理における最適化手法の一般化性能評価
    • 需要変動の大きい現代において,適切な在庫管理は企業の収益に大きく影響する。
    • 従来のデータ駆動型手法は需要分布の推定精度に依存し,複雑な状況に対応が困難である。
    • 強化学習と古典的な最適化手法を組み合わせることで,よりロバストな在庫方針を導出することを目指す。
    • VC理論を用いることで,一定期間の動的在庫モデルにおける方針の一般化性能に保証を与えることができた。
    • 非定常ベースストックレベルの方策クラスは,期間数Tに関わらず一般化誤差が増加しないことが示された。
    • 2パラメータの(s, S)方策クラスは,一般化誤差がTの対数的に増加することが明らかになった。

    Link: https://arxiv.org/abs/2404.11509

  • 地球システムモデル降水量のダウン スケーリングとバイアス補正のための条件付き拡散モデル [physics.geo-ph, cs.AI, cs.LG, physics.ao-ph]目的:地球システムモデル降水量のダウン スケーリングとバイアス補正のための機械学習フレームワーク
    • 気候変動による極端な気象現象の増加は社会経済的損害を招くため,高解像度な降水シミュレーションが不可欠である。
    • 既存の地球システムモデルは小規模なダイナミクスを解決できず,バイアスを抱えるという課題がある。
    • 空間構造の改善や不安定な学習といった既存手法の課題を克服し,高精度なダウン スケーリングとバイアス補正を実現する。
    • 提案手法は,既存の統計的および深層学習手法と比較して,特に極端な気象現象において優れた性能を示す。
    • 観測データのみを用いて学習を行うことで,再学習の必要なく,任意の地球システムモデルの降水量を補正・ダウン スケーリングすることが可能となる。
    • 観測データと地球システムモデルデータを共通の埋め込み空間にマッピングし,条件付き拡散モデルを用いてマッピングを逆変換することで,統計的忠実性と空間パターンを保持する。

    Link: https://arxiv.org/abs/2404.14416

  • ニューラル情報処理システムにおける動的計算の時空間的視点 [q-bio.NC, cs.NE]目的:ニューラル活動の時空間的流れと動的計算の理論的枠組み
    • 脳の活動パターン理解は,認知機能解明に不可欠である。神経活動のダイナミクスは,情報処理の根幹をなす。
    • 神経活動の時空間的流れの機能的役割は未だ不明確。既存の理論では説明がつかない現象も存在する。
    • 時空間的な流れを考慮した理論的枠組みを提示し,効率的で汎化性能の高い情報処理メカニズムを解明する。
    • 本研究は,神経回路の再帰的結合を通じて,入力信号の時空間的な流れを忠実に表現することが,安定した情報処理に不可欠であることを示した。
    • 信号が流れを持つ状況下において,ニューラルネットワークが構造的等変性を持つためには,再帰的な波動状のダイナミクスが必要であることが証明された。
    • 脳が波動状のダイナミクスを好むのは,時空間的に構造化された世界に適応するための本能的な誘導バイアスであると考えられる。

    Link: https://arxiv.org/abs/2409.13669

  • 胸部・肝臓シネMRIにおけるPCA呼吸運動モデルを用いた将来フレーム予測:Transformerと動的訓練再帰型ニューラルネットワークの比較 [eess.IV, cs.CV, cs.LG, cs.NE]目的:胸部および肝臓のシネMRIにおける将来フレーム予測の精度向上
    • 放射線治療において,呼吸による腫瘍位置の変化は正確な照射を困難にするため,その補正が重要である。
    • 呼吸パターンは個人差が大きく,既存手法では変化への適応が課題であった。
    • 呼吸パターン変化に対応可能なフレーム予測手法を開発し,治療計画の精度向上を目指す。
    • 線形回帰は短い予測時間(h=0.32秒)で高い精度(ETH Z\"urichデータで1.3mmの幾何学的誤差)を示した。
    • RTRLとSnAp-1は,中・長時間の予測において他のアルゴリズムを上回り,それぞれETH Z\"urichおよびOvGUデータで1.4mmと2.8mm以下の幾何学的誤差を達成した。
    • 予測フレームは概ね正解データに類似していたが,横隔膜付近や面外運動の影響を受ける領域で誤差が見られた。

    Link: https://arxiv.org/abs/2410.05882

  • 低ランク確率質量テンソルの同時ベイズパラメータおよびモデル次数推定 [stat.ML, cs.LG, eess.SP]目的:共同確率質量関数推定の低ランクCPDモデルにおけるパラメータと次数推定
    • 統計的信号処理や機械学習において,確率変数の同時確率質量関数は重要な役割を果たす。
    • 既存手法では,低ランクCPDモデルのランク(次数)を事前に指定する必要があった。
    • 本研究では,観測データから低ランク確率質量テンソルのパラメータとランクを同時に推定する。
    • 提案手法は,ベイズ推論フレームワークに基づき,事前分布を用いることでクロスバリデーションを回避する。
    • 変分推論(VI)を用いて決定的な解を導出し,モデルパラメータの事後分布を近似する。
    • 実験結果から,提案手法は推定精度,自動ランク検出,計算効率において優れていることが示された。

    Link: https://arxiv.org/abs/2410.06329

  • ポリアークのヘビーボール法がポリアーク・ロヤシェヴィッツ不等式下で加速された局所収束率を達成 [math.OC, cs.LG]目的:ポリアークのヘビーボール法の収束性
    • 最適化問題において,効率的な解法は不可欠であり,特に非凸関数の取り扱いは重要である。
    • ヘビーボール法は広く利用されているが,非凸関数の収束性に関する理論的保証は十分ではない。
    • ポリアーク・ロヤシェヴィッツ不等式を満たす関数に対するヘビーボール法の局所収束を解析し,加速効果を示す。
    • ポリアーク・ロヤシェヴィッツ不等式が成り立つ条件下で,ヘビーボール法は強凸関数に対する収束率を回復する。
    • この手法は,最小値の近傍に入ると,ハイパーパラメータの範囲が広く,局所的に収束することが示された。
    • 従来の Lyapunov型議論ではなく,ポリアーク・ロヤシェヴィッツ不等式の新しい幾何学的視点を利用した。

    Link: https://arxiv.org/abs/2410.16849

  • グラフ最大シフト:グラフクラスタリングのための丘登り法 [stat.ML, cs.LG]目的:グラフクラスタリング手法
    • グラフ構造データは,複雑な関係性を表現でき,様々な分野で活用が期待されている。
    • 既存手法では,大規模グラフにおける効率的なクラスタリングが課題となっていた。
    • 密度勾配流の引力盆地に基づいたパーティションの一貫性を実現する。
    • 本研究で提案するグラフ最大シフト法は,グラフ上のノードを次数が最大の隣接ノードへ反復的に移動させる。
    • ランダム幾何グラフにおいて,この手法は漸近的に一貫性があることが示された。
    • この一貫性は,密度勾配流の引力盆地によって定義される密度サポートの分割に関するものである。

    Link: https://arxiv.org/abs/2411.18794

  • カロリメトリーのための量子再アップロード:拡張された表現力を持つ最適化されたアーキテクチャ [quant-ph, cs.LG]目的:カロリメトリー分類タスクにおける量子再アップロードユニット(QRU)の性能評価
    • 量子機械学習は,表現力,最適化,ハードウェア制約のバランスが重要である。
    • 従来の変分量子回路(VQC)では,パラメータ数と表現力のトレードオフが存在する。
    • 量子再アップロードユニット(QRU)を用いて,より効率的な量子回路の設計を目指す。
    • QRUは,同じパラメータ数において,従来のVQCよりも高い精度を達成した。
    • 深さの浅い層で効果が大きく,深くなるほど改善の幅が小さくなることが示された。
    • データ再エンコーディングにより,周波数成分のサポートが拡大し,学習コストとのバランスが重要であることがわかった。

    Link: https://arxiv.org/abs/2412.12397

  • ラベルなしデータを用いた自己整合性損失によるロバストな償却型ベイズ推論 [stat.ML, cs.LG]目的:ラベルなしデータを利用した償却型ベイズ推論のロバスト性向上
    • ベイズ推論は不確実性を定量化でき,確率的逆問題を解決する上で重要である。
    • 従来のベイズ推論は計算コストが高く,実用上の制約がある。
    • 訓練データ範囲外のデータに対する推論のバイアスを軽減し,ロバスト性を高める。
    • ラベルなしデータを用いた半教師あり学習により,シミュレーション外での償却型ベイズ推論のロバスト性が大幅に向上した。
    • 提案手法は,自己整合性というベイズ的性質を利用し,厳密な適切な損失関数を設計することで実現した。
    • 訓練データからかけ離れた観測値に対しても,高い精度を維持することが確認された。

    Link: https://arxiv.org/abs/2501.13483

  • 自己整合性,分散最大化,およびカントロビッチ優越性によるデータノイズ除去 [stat.ME, cs.LG, math.PR, math.ST, stat.TH]目的:データノイズ除去のための新しい枠組み
    • 現代社会では,データは意思決定や科学的発見に不可欠であり,その品質が重要である。
    • データにはノイズが含まれることが多く,分析結果の信頼性を損なう可能性がある。
    • 既存手法の安定性や計算効率を改善し,より実用的なノイズ除去を実現する。
    • 本研究では,マルチンゲール最適輸送に触発された新しい枠組みを提案し,ノイズの少ない分布を見つける。
    • この枠組みは,データの凸順序優越性の下で,指定された領域内の分布の分散を最大化することに帰着する。
    • さらに,カントロビッチ優越性を用いた新しいノイズ除去問題を提案し,安定性と計算効率の向上を示す。

    Link: https://arxiv.org/abs/2502.02925

  • UniZyme:酵素活性部位知識を用いた統合的タンパク質切断部位予測モデル [q-bio.QM, cs.AI, cs.LG]目的:タンパク質切断部位の予測
    • タンパク質切断は生命機能に不可欠であり,医薬品開発や酵素設計に貢献する。
    • 既存モデルは特定の酵素に限定され,汎用性や新規酵素への対応が課題である。
    • 多様な酵素間で共通する知識を活用し,未知の酵素への予測を可能にすること。
    • UniZymeは,多様なプロテアーゼにおける切断部位を高精度に予測可能である。
    • 酵素活性部位の知識と生化学的情報を組み込んだ新しいモデル構造を採用している。
    • 未学習の酵素に対しても高い予測精度を示し,汎用性の高さが確認された。

    Link: https://arxiv.org/abs/2502.06914

  • ピンチングアンテナシステム(PASS)のための同時送信とピンチングビームフォーミング:最適化ベースか学習ベースか [eess.SP, cs.IT, cs.LG, math.IT]目的:ピンチングアンテナシステム(PASS)を用いた下り多重入出力シングル出力(MISO)フレームワークの最適化
    • 電波の利用効率向上が求められる現代において,ビームフォーミング技術は重要な役割を担う。
    • 従来のMIMOシステムでは,アンテナ数が増加するとコストや複雑性が増大する課題がある。
    • ピンチングアンテナシステム(PASS)を利用し,低コストで高性能なビームフォーミングを実現する。
    • 提案するPASSフレームワークは,少数のピンチングアンテナでも従来のMIMOシステムを大きく上回る性能を示す。
    • KDL-Transformerアルゴリズムは,MM-PDDアルゴリズムと比較して20%以上のシステム性能向上を達成する。
    • KDL-Transformerは,最新のGPU上でミリ秒レベルの応答速度を実現する。

    Link: https://arxiv.org/abs/2502.08637

  • EquiNO:マルチスケールシミュレーションのための物理情報に基づくニューラル演算子 [quant-ph, cs.CC, physics.comp-ph, cs.LG]目的:マルチスケール問題に対する物理制約を組み込んだ高精度な代替モデルの開発
    • 物理学におけるマルチスケール問題は普遍的であり,その解析は重要である。
    • 高解像度シミュレーションは計算コストが高く,多くのクエリ処理が困難である。
    • 物理制約を組み込みつつ,計算効率を向上させる代替モデルを開発する。
    • 提案手法EquiNOは,従来の数値シミュレーション手法と比較して8000倍以上の高速化を達成した。
    • EquiNOは,PODを用いた発散のない基底関数への射影により,平衡条件を厳密に満たす。
    • 有限要素法と演算子学習を統合したFE-OLアプローチが,限られたデータセットでも高精度な解を得ることを示した。

    Link: https://arxiv.org/abs/2504.07976

  • DOLCE:オフポリシー評価/学習を遅延効果と即時効果に分解する [math.OC, cs.RO, cs.SY, eess.SY, stat.ML, cs.LG]目的:オフポリシー評価と学習におけるバイアス軽減
    • 行動データを用いて最適な方策を導く分野であり,その精度が重要である。
    • ログデータとターゲットポリシー間の行動の重複が不十分だと,推定値にバイアスが生じる。
    • ログデータのみを用いてバイアスを打ち消し,よりロバストな評価/学習を実現すること。
    • DOLCEは,遅延コンテキストを利用して重要度重みを構成し,オフポリシー評価/学習を分解する。
    • 報酬モデルの残差が遅延コンテキストと行動によって条件付き平均ゼロである場合,バイアスが相殺される。
    • 実験により,サポート違反の割合が高い状況で,オフポリシー評価と学習が大幅に改善されることが示された。

    Link: https://arxiv.org/abs/2505.00961

  • ランダムゼロ次オラクルを用いた準星状凸関数の最小化 [math.OC, cs.AI, cs.LG, cs.NA, math.NA]目的:準星状凸関数および強準星状凸関数の最小化
    • 機械学習など最適化問題は広く存在する。効率的な最適化手法の確立が重要である。
    • 導関数が利用できない状況下での最適化は困難であり,効率的な手法が求められている。
    • ゼロ次オラクルを用いた準星状凸関数の最小化アルゴリズムの理論的保証と実用性を示す。
    • 本研究では,準星状凸関数および強準星状凸関数の最小化において,ランダムガウス平滑化ゼロ次オラクルスキームの収束性と複雑性を確立した。
    • 制約付き問題に対しては,近接準星状凸性の新たな概念を導入し,同様の結果を証明した。
    • 線形ダイナミクスシステム識別や一般化線形モデルなど,準星状凸性が自然に発生する機械学習問題への応用可能性を示した。

    Link: https://arxiv.org/abs/2505.02281

  • グラフを用いない輸送可能性:s-許容バックドア集合を識別するベイジアンアプローチ [stat.ML, cs.LG]目的:集団間の因果効果輸送可能性の識別
    • 臨床意思決定において,集団間の因果情報の輸送は不可欠である。
    • 因果推論では因果グラフの知識が必要だが,現実には得ることが困難である。
    • 因果グラフを必要とせずに輸送可能性を識別し,因果効果推定のバイアスを軽減すること。
    • 提案手法は,実験データと観察データを用いてs-許容バックドア集合を識別する。
    • 集合が存在する場合,結果変数のマルコフ境界内で探索範囲を絞り込むことが可能である。
    • シミュレーションと準合成データにおいて,輸送可能性バイアスの識別性能と因果効果推定の精度が確認された。

    Link: https://arxiv.org/abs/2505.12801

  • 核の経路:過パラメータ化された2層二次ネットワークにおけるERMの鋭い漸近的性質 [stat.ML, cond-mat.dis-nn, cs.IT, cs.LG, math.IT]目的:過パラメータ化された2層二次活性化関数を持つニューラルネットワークにおける経験的リスク最小化の漸近的性質
    • 深層学習の理論的理解は,その成功を支える重要な課題である。
    • 過パラメータ化されたニューラルネットワークの汎化性能の理論的解析は困難である。
    • 学習された特徴マップの低ランク構造に着目し,汎化閾値を精密化する。
    • 経験的リスク最小化問題を,核ノルム正則化を用いた凸行列センシング問題にマッピングすることで,鋭い漸近的性質を導出した。
    • そのようなネットワークにおける容量制御は,学習された特徴マップの低ランク構造から生じることが明らかになった。
    • ターゲット関数の幅が学習可能性をどのように決定するかを示す汎化閾値を正確に示した。

    Link: https://arxiv.org/abs/2505.17958

  • 離散潜在的因果グラフモデルの理論的識別可能性について [stat.ML, cs.LG]目的:潜在的因果グラフモデルの識別可能性
    • 因果推論は,データから原因と結果を解明し,予測や介入の根拠を与えるため重要である。
    • 潜在変数存在下での因果グラフモデル識別は難しく,既存条件は厳しすぎる場合が多い。
    • より緩やかな識別条件を確立し,複雑な現実世界のデータへの適用を目指す。
    • 提案する二重三角グラフ条件は,従来の純粋な子条件を緩和し,識別可能性を保証する。
    • 必要条件も確立し,識別可能性の根本的な限界に関する洞察を提供する。
    • シミュレーション研究により,条件を満たす潜在構造がデータから正確に推定できることが確認された。

    Link: https://arxiv.org/abs/2505.18410

  • 大規模言語モデルは(本当に)統計的基盤を必要とするのか [stat.ME, cs.LG, stat.AP]目的:大規模言語モデルの発展と応用における統計学の貢献の必要性
    • 非構造化データの処理において,大規模言語モデルは新たなパラダイムであり,幅広い分野に応用されている。
    • 大規模言語モデルの規模や複雑さから,解釈可能性が低く,理論的な分析が困難である。
    • 大規模言語モデルの性能向上と信頼性確保のために,統計学的なアプローチを導入し,課題解決を目指す。
    • 大規模言語モデルはデータ依存性と確率的生成プロセスを持つため,本質的に統計モデルである。
    • アラインメント,ウォーターマーキング,不確実性定量化など,統計手法が不可欠な研究分野が複数存在する。
    • 統計学研究は,単一の統一理論からではなく,多様な専門分野のモザイクとして発展する可能性が高い。

    Link: https://arxiv.org/abs/2505.19145

  • AI駆動の低高度経済:スペクトル,移動性,そして検証 [eess.SP, cs.LG]目的:低高度経済ネットワークにおけるAI技術の導入と検証
    • 次世代の空移動手段として期待される低高度経済は,技術的発展の鍵となる。
    • 従来のルールベースのアプローチでは,低高度経済の密度,移動性,多様性に対応できない。
    • AI技術を用いて,低高度経済ネットワークの実用化に向けた課題を解決すること。
    • AIを活用したスペクトルセンシングと共存技術が,低高度経済ネットワークの分散型特性を生かすことを提案。
    • 強化学習に基づいたリソース割り当てと軌道最適化による,効率的な移動性の実現可能性を示した。
    • AERPAW等の実験プラットフォームを通じた検証が,現実的な空域条件でのモデル検証に不可欠であることを強調した。

    Link: https://arxiv.org/abs/2506.01378

  • 制御された確率的ダイナミクスの安全な学習 [stat.ML, cs.LG]目的:制御された確率的ダイナミクスの安全な学習手法
    • ロボティクス,金融,医療など,安全性が重要な応用分野において,システムの安全性を保証する学習が不可欠である。
    • 従来の学習手法では,安全領域外への探索や危険な状態への遷移が発生する可能性があり,安全性を確保することが困難である。
    • 初期の安全な制御集合を拡張することで,安全な探索と効率的なダイナミクス推定を可能にし,安全性を保証する。
    • 提案手法は,カーネルに基づく信頼区間を利用して,安全な制御集合を反復的に拡張し,安全な探索を実現する。
    • 学習されたモデルは,システムのダイナミクスを予測し,任意の制御に対する安全性を検証することを可能にする。
    • 実験評価により,提案手法が安全性,推定精度,計算効率において実用的な有効性を示すことが示された。

    Link: https://arxiv.org/abs/2506.02754

  • PaceLLM:長文理解のための脳に触発された大規模言語モデル [q-bio.NC, cs.CL, cs.NE]目的:長文理解における大規模言語モデルの性能向上
    • 大規模言語モデルは様々な分野で高性能を示すが,長文処理能力に限界がある。
    • 長文入力時のニューラル活性の消失と,意味的な断片化が課題となっている。
    • 脳のワーキングメモリと皮質モジュール性を模倣し,長文理解能力の向上を目指す。
    • PaceLLMは,LongBenchのMulti-document QAで6%の性能向上を達成した。
    • Infinite-Benchタスクでは12.5-17.5%の性能向上を示し,NIAHテストでは20万トークンまでの文脈長を測定できた。
    • 本研究は,脳に触発されたLLM最適化の先駆的な試みであり,既存手法と相補的な関係にある。

    Link: https://arxiv.org/abs/2506.17310

  • 大きな幅の極限におけるテンソル重みと創発的なフェルミオンWick則を持つニューラルネットワーク [hep-th, cond-mat.dis-nn, cs.LG, hep-ph]目的:ニューラルネットワーク量子場理論におけるテンソル値の隠れ層から出力層への重みを持つ複素数値ニューラルネットワークの研究
    • 量子場理論と機械学習の融合は,物理現象の新たな理解と効率的な数値計算手法の創出が期待される。
    • 既存の研究では,ニューラルネットワークの表現力に限界があり,複雑な量子現象の記述が困難であるという課題がある。
    • 本研究は,ニューラルネットワークにおけるフェルミオン的な性質の導入により,量子場理論との対応関係を拡張することを目指す。
    • 大きな幅の極限において,ネットワーク出力の相関関数にフェルミオンのような符号構造が現れることを示した。
    • 等数の生成演算子と消滅演算子を持つ相関関数は,フェルミオンWick則に従い,スカラーのユークリッドカーネルを用いて表現できる。
    • この結果は,ニューラルネットワーク量子場理論をボソン場を超えて拡張し,フェルミオンのような対称性の符号化への道筋を提供する。

    Link: https://arxiv.org/abs/2507.05303

  • パターンごとの手法が有効となる場合:欠損値を持つロジスティックモデルに関する理論的・実証的考察 [math.OC, cs.DM, physics.soc-ph, cs.SI, stat.ML, cs.LG]目的:欠損値を持つデータのロジスティックモデルにおける予測精度向上
    • データ分析において,欠損値は頻繁に発生し,適切な処理が重要である。
    • ロジスティックモデルでは,欠損値に対する最適な予測手法が閉形式で不明である。
    • 欠損メカニズムに依存せず,高い予測精度を達成する手法を確立すること。
    • パターンごとの学習(PbP)戦略が,ガウス混合モデルの下でベイズ確率を正確に近似することが証明された。
    • PbPは,欠損メカニズムがMCAR,MAR,MNARのいずれの場合でも有効であることが示された。
    • サンプルサイズが小さい場合は平均代入,大きい場合はPbPが適している場合がある。

    Link: https://arxiv.org/abs/2507.13024

  • 共形予測のための多変量標準化残差 [stat.ML, cs.AI, cs.LG, stat.ME, stat.OT]目的:共形予測における条件付きカバレッジの改善
    • 信頼性の高い不確実性定量には,周辺カバレッジよりも条件付きカバレッジが重要である。
    • 異分散性設定下では,単純な共形スコアは条件付きカバレッジが低いという問題がある。
    • 出力間の相関と局所的な分散を標準化することで,条件付きカバレッジを向上させる。
    • 提案手法では,学習された局所共分散行列によって誘導されるマハラノビス距離を非適合度スコアとして使用する。
    • これにより,出力間の相関と異分散性を捉える効率的なメカニズムが提供され,既存手法よりも計算コストが低い。
    • 合成データおよび実データでの実験により,提案手法が既存の多変量ベースラインよりも条件付きカバレッジを大幅に改善することが示された。

    Link: https://arxiv.org/abs/2507.20941

  • 量子フローマッチング [quant-ph, cs.AI, cs.LG]目的:量子密度行列間の効率的な補間
    • 古典的生成モデリングの効率的な手法として注目されている。量子系への応用が期待される。
    • 量子状態の生成や観測量の推定には,計算コストが高い回路設計が必要となる場合がある。
    • 密度行列間の補間を可能にし,量子系の生成モデリングを容易にすること。
    • 量子フローマッチング(QFM)は,2つの密度行列間の補間を実現する量子回路である。
    • QFMを用いることで,所望の磁化やエンタングルメントエントロピーを持つ状態の生成が可能となった。
    • 非平衡自由エネルギー差の推定や超拡散の研究への応用も実証された。

    Link: https://arxiv.org/abs/2508.12413

  • RDDM:実世界の画像復元のためのRAWドメイン拡散モデルの実践 [eess.IV, cs.AI, cs.CV]目的:実世界の画像復元におけるRAWドメイン拡散モデルの有効性
    • 画像処理技術は,多様な分野で不可欠であり,その品質向上は重要課題である。
    • 従来の画像復元はsRGBデータに依存し,RAWデータの利点を活かせていない点が存在する。
    • RAWデータを直接処理することで,より高画質でアーティファクトの少ない画像復元を目指す。
    • 提案手法RDDMは,sRGBドメインの拡散モデルと比較して,より高い忠実度で画像を復元できる。
    • RAWドメインでのVAE(RVAE)とLoRAモジュール(CMB)により,異なるドメイン間の分布の違いに対応し,様々なRAWパターンに適応する。
    • 既存のsRGBデータセットからRAWデータのペアを合成するデータ合成パイプラインを開発し,大規模な学習を実現した。

    Link: https://arxiv.org/abs/2508.19154

  • 高次元におけるシングルヘッドAttention:汎化,重みスペクトル,スケーリング則の理論 [stat.ML, cond-mat.dis-nn, cs.IT, cs.LG, math.IT]目的:高次元シーケンスタスクにおけるシングルヘッドAttention層の学習と汎化に関する理論的解明
    • 近年,Transformerモデルが自然言語処理等の分野で目覚ましい成果を上げているため,その構成要素の理解が重要である。
    • Attention層の重みスペクトルには特異な構造が見られるものの,その起源と汎化への影響は未だ不明な点が多い。
    • Attention層の重みスペクトルと汎化性能の関係を理論的に明らかにし,スケーリング則の成立メカニズムを解明すること。
    • Attention層の重みスペクトル(低ランク崩壊,スペクトル外れ値など)は,学習データ生成モデルと密接に関連することが示された。
    • ランダム行列理論等のツールを用いて,学習・テスト誤差,閾値,およびキー・クエリ行列のスペクトルを高次元で厳密に特徴づけた。
    • パワーロースペクトルを持つターゲットに対しては,スペクトル回復を通じてスケーリング則が出現することが理論的に示された。

    Link: https://arxiv.org/abs/2509.24914

  • テスト時学習は非線形関数の文脈内学習を強化する [stat.ML, cs.LG]目的:非線形関数の文脈内学習におけるテスト時学習の効果
    • 機械学習モデルの汎化性能向上は,実世界の問題解決において不可欠である。
    • テストデータへの適応が困難であり,特に非線形モデルでは理論的理解が十分ではない。
    • テスト時学習と文脈内学習の組み合わせによる適応能力の理論的解明を目指す。
    • テスト時学習は,特徴ベクトルとリンク関数への適応を可能にし,文脈内学習のみでは困難なリンク関数のシフトに対応する。
    • 単層Transformerモデルにおいて,テスト時学習を用いることで予測リスクの上限を確立した。
    • 文脈サイズとネットワーク幅を大きくすることで,予測誤差をノイズレベルに近づけることができる。

    Link: https://arxiv.org/abs/2509.25741

  • BALLAST:時空間ベクトル場下における海流標識の軌跡に対するベイジアン能動学習と前方展望修正 [stat.ML, cs.LG]目的:時空間ベクトル場の推論のためのラグランジュ観測点の配置指針
    • 海洋学,海洋科学,海洋工学において,時間依存性のあるベクトル場を把握することは重要課題である。
    • 既存の配置手法は,空間充填設計や専門家の経験則に頼ることが多く,最適配置とは言えない場合がある。
    • 本研究では,海流標識が連続的に移動するため,将来の軌跡を考慮した配置戦略を確立する。
    • BALLASTを用いた逐次的な観測点配置戦略は,合成モデルと高精度な海洋モデルの両方で効果が確認された。
    • GP事後サンプリング効率を向上させる新規GP推論法であるVanilla SPDE Exchange (VaSE)を開発した。
    • BALLASTは,時空間ベクトル場の推論における能動学習の応用の可能性を広げた。

    Link: https://arxiv.org/abs/2509.26005

  • ゲームタイム:音声言語モデルにおける時間的ダイナミクスの評価 [eess.AS, cs.AI, cs.CL]目的:音声言語モデルの時間的ダイナミクス評価
    • リアルタイムな音声対話システムの重要性が増しており,より自然なコミュニケーションが求められている。
    • 現在の音声言語モデルは,タイミング,テンポ,同時発話といった時間的要素の扱いに課題がある。
    • 時間的制約下での音声言語モデルの性能を客観的に評価し,改善の方向性を示す。
    • 新たに「Game-Time Benchmark」を開発し,時間的ダイナミクスを体系的に評価できる枠組みを提示した。
    • 最先端モデルは基本的なタスクには対応できるものの,時間的制約下では性能が著しく低下することが示された。
    • 本Benchmarkは,時間認識能力と全二重対話能力の向上に向けた今後の研究を促進する基盤となる。

    Link: https://arxiv.org/abs/2509.26388

  • ST_GCNアテンションを用いたAIベースの脳卒中リハビリテーション在宅評価システム [eess.IV, cs.AI, cs.CV]目的:脳卒中患者の在宅リハビリテーション評価とフィードバック
    • 脳卒中後の機能回復には継続的なリハビリテーションが不可欠である。
    • 従来の評価は専門家による対面が必要で,継続的な評価が困難である。
    • AIを活用し,在宅での客観的かつ継続的な評価を実現すること。
    • 提案システムは,RGB-Dカメラとウェアラブルセンサーで運動を捕捉し,AIモデルRAST-G@を用いて評価を行う。
    • RAST-G@は,空間-時間グラフ畳み込みネットワークとTransformerアテンションを組み合わせ,運動品質を評価する。
    • KIMOREおよびNRCデータセットでの実験結果から,RAST-G@はベースラインモデルよりも高い精度を達成した。

    Link: https://arxiv.org/abs/2510.00049

  • μPにおける学習率の転移に関する証明 [stat.ML, cs.AI, cs.CL, cs.LG]目的:μPでパラメータ化された線形多層パーセプトロンにおける学習率の転移
    • 深層学習の性能向上には適切な学習率の選択が不可欠であり,その理論的理解が求められている。
    • 学習率の転移が理論的に説明されておらず,異なるネットワーク幅における学習率の決定に課題があった。
    • 無限幅極限における特徴学習を最大化するμPパラメータ化の下での学習率転移を理論的に証明する。
    • μPパラメータ化の下では,最適な学習率がネットワーク幅が無限大に近づくにつれて非ゼロ定数に収束することが示された。
    • この結果は,学習率の転移を理論的に説明する根拠となる。
    • SPやNTPといった他のパラメータ化では,この特性は成立しないことが示された。

    Link: https://arxiv.org/abs/2511.01734

  • 金融時系列予測のための多期間学習 [q-fin.ST, cs.AI, cs.LG]目的:金融時系列予測の性能向上
    • 金融分野において,時系列予測は重要な役割を担う。市場の動向を把握し,投資判断に役立てる上で不可欠である。
    • 既存の予測モデルは,単一期間の入力に限定されるか,多期間の特徴に対応するための工夫が不足している。
    • 本研究は,多期間の入力データを効果的に活用し,予測精度と効率性を向上させることを目指す。
    • 提案手法MLFは,金融時系列予測において,短期的な世論と中長期的な政策や市場トレンドを考慮した多期間入力を可能にする。
    • IRF,LWI,MAPモジュールを導入することで,期間間の情報冗長性を除去し,予測のバイアスを軽減し,精度向上を実現した。
    • Patch Squeezeモジュールにより,自己注意モデルの効率化を図り,計算コストの削減にも貢献する。

    Link: https://arxiv.org/abs/2511.08622

  • QUASAR:高次元数値最適化を加速する進化アルゴリズム [math.OC, cs.LG, cs.NE]目的:高次元数値最適化の加速
    • 科学計算において,複雑な最適化問題は不可欠であり,効率的な手法が求められている。
    • 高次元問題では次元の呪いの影響を受け,従来の最適化手法では性能が低下しやすい。
    • 次元の呪いを克服し,複雑な高次元最適化問題を効率的に解決することを目指す。
    • QUASARは,CEC2017ベンチマークにおいて,DEやL-SHADEを凌駕する性能を示した。
    • 最終解の質はDEと比較して約3.85倍,L-SHADEと比較して約2.07倍向上した。
    • 最適化速度もDEの1.40倍,L-SHADEの5.16倍と,大幅な高速化を実現した。

    Link: https://arxiv.org/abs/2511.13843

  • 反復写像とBPTTによるMLIPの微調整について [math.CO, cs.CG, math.MG, cond-mat.mtrl-sci, cs.AI, cs.LG]目的:MLIPの微調整手法
    • 材料設計において,正確な構造緩和が不可欠である。
    • 第一原理計算は計算コストが高いため,MLIPの開発が求められている。
    • 事前学習済みのMLIPの性能を,直接最終構造を最適化することで向上させる。
    • 提案手法は,評価したすべての事前学習済みモデルにおいて性能を安定的に向上させる。
    • 予測誤差の平均で約32%の減少が確認された。
    • 緩和設定の変更に対して頑健であり,結果への影響は軽微である。

    Link: https://arxiv.org/abs/2512.01067

  • シミュレータの忠実度をモデルフリーで評価するquantile曲線 [stat.ME, cs.AI, cs.LG]目的:シミュレータの忠実度評価方法
    • 生成AIの活用拡大に伴い,現実世界システムのシミュレーション精度評価が重要になっている。
    • シミュレーションと現実の出力分布の差を定量化する手法が確立されていない。
    • 限られたサンプルデータからシミュレータの忠実度を統計的に評価する。
    • 提案手法はモデルに依存せず,カテゴリカルデータや多次元センサデータなど,様々な出力に対応する。
    • シミュレータの出力分布のずれをquantile曲線を用いて包括的に評価できる。
    • WorldValueBenchデータセットを用いて,主要なLLM4モデルと人間の価値観との整合性を評価した。

    Link: https://arxiv.org/abs/2512.05024

  • 肺がんセグメンテーションにおける分布外検出のための腫瘍アンカー型深層特徴ランダムフォレスト [eess.IV, cs.CV, cs.LG]目的:肺がんセグメンテーションにおける分布外入力の検出
    • 肺がんの治療計画や効果評価において,正確な腫瘍領域の特定は不可欠である。
    • 既存のモデルは分布外入力に対して誤ったセグメンテーションを行うリスクがあり,臨床応用上の課題となっている。
    • 腫瘍領域を基準とした深層特徴を利用し,分布外検出の信頼性を向上させることを目指す。
    • 提案手法RF-Deepは,近接分布外データセットにおいて93.50以上のAUROCを達成し,既存手法を大幅に上回る性能を示した。
    • 遠隔分布外データセットにおいては,ほぼ完璧な検出性能(99.00以上のAUROC)を実現した。
    • RF-Deepは様々なネットワーク構造や事前学習戦略に対して安定した性能を維持し,汎用性の高さを示した。

    Link: https://arxiv.org/abs/2512.08216

  • 生成ビデオ圧縮:ビデオ伝送のための0.01%圧縮率へ [econ.GN, cs.SI, q-fin.EC, eess.IV, cs.AI, cs.MM]目的:極めて低い圧縮率でのビデオ伝送の可能性
    • ビデオ通信は現代社会において不可欠であり,その効率化は重要課題である。
    • 従来のビデオ圧縮技術では,極端な圧縮率を達成することが困難であった。
    • 生成モデルを用いてビデオを効率的に圧縮し,低帯域幅環境での通信を可能にすること。
    • 生成ビデオ圧縮(GVC)フレームワークを提案し,0.02%という極めて低い圧縮率を達成した。
    • GVCは,伝送負荷を軽減し,受信側での再構成に重点を置くことで,計算資源と圧縮率のトレードオフを実現する。
    • AI Flowフレームワーク上でGVCを実装し,低スペックGPUでの高速推論を可能にすることで実用性を高めた。

    Link: https://arxiv.org/abs/2512.24300

  • FastSLM:効果的な音声モダリティ適応のための階層的フレームQ-Former [physics.soc-ph, cs.DL, eess.AS, cs.AI, cs.SD]目的:長尺音声に対する大規模マルチモーダル言語モデルのスケーラビリティ向上
    • 視覚,言語,映像理解において優れた能力を示す大規模マルチモーダル言語モデルの応用範囲拡大が期待される。
    • 長尺音声への適用は,入力トークン数の爆発的な増加により計算資源の制約を受ける。
    • 極端な時間圧縮によりトークン数を削減し,長尺音声の効率的な処理を実現する。
    • 提案手法FastSLMは,階層的フレームクエリTransformer(HFQ-Former)を用いて音声情報を効率的に圧縮する。
    • これにより,標準的なフレームレベルアダプターと比較して93%のトークン削減を達成し,計算コストを大幅に削減する。
    • 長尺ベンチマークにおいて,最新モデルと同等の性能を,より少ない計算量で実現した。

    Link: https://arxiv.org/abs/2601.06199

  • ホワイトペーパーの主張は市場行動を予測するか?暗号資産ファクター分析からの証拠 [q-fin.CP, cs.LG]目的:暗号資産のホワイトペーパーにおける主張と,実際の市場行動との整合性
    • 暗号資産市場は成長を続けるが,投資判断の根拠となる情報が不足している。
    • ホワイトペーパーの主張と市場の動きの乖離が,投資リスクを高めている可能性がある。
    • ホワイトペーパーの内容と市場データとの関係性を分析し,投資判断に役立つ指標を提供する。
    • ホワイトペーパーの主張と市場統計,およびホワイトペーパーの主張と潜在的ファクターとの間には,弱い相関が認められた。
    • 市場統計と潜在的ファクター間には有意な相関が見られ,分析手法の妥当性が確認された。
    • NEAR,MKR,ATOMはポジティブな相関を示したが,ENS,UNI,Bitcoinは大きく乖離していた。

    Link: https://arxiv.org/abs/2601.20336

  • 最大エントロピー遠隔サンプリングに対する拡張NLP境界 [math.OC, cs.IT, cs.LG, math.IT]目的:最大エントロピー遠隔サンプリング問題における上限の算出
    • 不確実性の下での情報抽出は,機械学習や統計的推論の根幹をなす重要な課題である。
    • 既存の上限算出手法は,計算量が多く,大規模問題への適用が困難であった。
    • より厳密かつ効率的な上限算出手法を開発し,問題解決の精度向上を目指す。
    • 拡張NLP境界は,既存のNLP境界を厳密に上回る条件が理論的に示された。
    • ランク落ちした共分散行列に対しても上限を導出可能であり,適用範囲が拡大された。
    • 対角スケーリング技術と組み合わせることで,ベンチマーク問題において最先端の結果を達成した。

    Link: https://arxiv.org/abs/2601.20970

  • 拡散的分類損失:エネルギーベース生成モデル学習のための [stat.ML, cs.LG]目的:エネルギーベース生成モデルの学習における課題解決
    • 生成モデルは,画像生成など多様な分野で重要な役割を担う。
    • 既存手法では,モード崩壊や計算コストの問題が存在する。
    • 効率的かつ高精度なエネルギーベース生成モデルの学習を目指す。
    • 提案手法であるDiffCLFは,EBM学習をノイズレベルにおける教師あり分類問題として捉える。
    • DiffCLFは,標準的なスコアベース目的関数と組み合わせることが可能である。
    • 実験結果から,DiffCLFは既存手法よりも高精度かつ広範な応用可能性を持つEBMを実現できることが示された。

    Link: https://arxiv.org/abs/2601.21025