arXiv雑要約
AI - 2026/03/26 公開
RadioDiff-FS:少数サンプル拡散モデルにおける物理情報に基づく多様体アラインメントによる高精度電波マップ構築 [eess.SY, cs.LG, cs.SY]目的:高精度な電波マップの構築
- 次世代通信(6G)のネットワーク計画において,空間的な伝搬特性を把握する電波マップは不可欠である。
- 厳密な電磁界解析は計算コストが高く,データ駆動型モデルは大量のラベルデータと汎化性能の課題がある。
- 本研究は,少数の高精度なサンプルを用いて,多様な環境下での電波マップ構築の精度向上を目指す。
- RadioDiff-FSは,従来の拡散モデルと比較して,静的電波マップにおけるNMSEを59.5%削減した。
- 動的電波マップにおいても,NMSEは74.0%削減され,SSIMは0.9752,PSNRは36.37dBを達成した。
- 物理的に妥当な伝搬方向に沿った拡散スコアの更新を制約することで,低データ状況下での位相不整合なアーティファクトを抑制した。
LeWorldModel:ピクセルからの安定したエンドツーエンドなジョイント埋め込み予測アーキテクチャ [cs.CL, cs.LG, cs.AI]目的:世界モデルの学習フレームワーク
- コンパクトな潜在空間での世界モデル学習は,AI研究において重要な課題である。
- 既存手法は,表現崩壊を防ぐために複雑な損失関数や事前学習が必要であり,安定性に課題がある。
- 本研究は,エンドツーエンドで安定的に学習可能な世界モデルアーキテクチャを開発し,その問題を解決する。
- LeWorldModelは,わずか2つの損失項(次の埋め込み予測損失とガウス分布正則化項)のみを用いて,ピクセルからエンドツーエンドで安定的に学習できる。
- 既存のエンドツーエンド代替案と比較して,調整可能な損失ハイパーパラメータを6つから1つに削減することに成功した。
- LeWorldModelは,基礎モデルベースの世界モデルと比較して,最大48倍高速に計画を実行でき,多様な2D/3D制御タスクで競争力がある。
MRMS-NetとLMRMS-Net:時系列分類のためのスケーラブルな多表現多スケールネットワーク [cs.LG]目的:時系列分類のための,多表現と多スケール構造を統合したスケーラブルな畳み込みフレームワーク
- 時系列データは,金融,医療,センシングなど様々な分野で広く利用されており,その分析は重要である。
- 既存の時系列分類手法は,入力表現の多様性が不十分であり,性能向上の限界がある。
- 多表現多スケール学習によって,時系列分類の精度,キャリブレーション,効率を改善することを目指す。
- LiteMVは最高の平均精度を達成し,MRMS-Netは優れた確率的キャリブレーション(最低NLL)を示した。
- LMRMS-Netは,精度と効率の最適なトレードオフを提供する。
- 多表現多スケールモデリングは,精度重視,キャリブレーション重視,リソース制約など,柔軟な設計空間を提供する。
二段階学習ダイナミクス:ニューラルネットワーク学習における集団的視点 [cs.LG, math.AP, stat.ML]目的:ニューラルネットワーク学習における集団学習ダイナミクスの理論的枠組み
- 深層学習の性能向上には,効率的な最適化手法が不可欠であり,集団学習はその有力なアプローチの一つである。
- 集団学習の学習ダイナミクスを記述する一般的な数学的表現が未だ確立されていない。
- 二段階の時間スケールに基づく集団ダイナミクスの理論的解明を通じて,集団学習の最適化を促進すること。
- 集団学習を,パラメータの高速な勾配更新とハイパーパラメータの低速な選択・突然変異ダイナミクスからなる二段階モデルとして定式化した。
- 大規模集団の極限において,パラメータとハイパーパラメータの同時分布を導出し,ハイパーパラメータ密度に対する選択・突然変異方程式を導いた。
- この解析により,集団平均が最適なハイパーパラメータへと向かう条件や,ノイズと多様性の役割が明らかになった。
サイバーセキュリティリスク管理のためのエージェント型マルチエージェントアーキテクチャ [eess.SY, cs.AI, cs.CR, cs.SY]目的:中小企業向けサイバーセキュリティリスク評価の自動化
- サイバーセキュリティリスク管理は,組織の資産保護において不可欠である。
- 中小企業は,高コストと専門家不足によりリスク評価を敬遠しがちである。
- 本研究は,低コストで高精度なリスク評価を可能とする。
- 提案システムは,CISSP専門家による評価と85%の合意率を示した。
- リスク特定率は92%に達し,評価時間は15分未満だった。
- ドメイン特化型モデルは,汎用モデルでは検出できない脅威を特定した。ただし,コンテキストウィンドウ容量がボトルネックとなった。
アライメント・ホエック・ア・モール:大規模言語モデルにおけるファインチューニングが著作権保護された書籍の逐語的想起を活性化する [cs.RO, cs.CL, cs.CL, cs.AI, cs.CY]目的:大規模言語モデルにおける著作権保護された書籍の逐語的想起の活性化
- AI技術の発展に伴い,著作権問題が重要性を増している。
- LLMが学習データを記憶している可能性と,その保護メカニズムの脆弱性が懸念されている。
- ファインチューニングによる著作権侵害リスクを検証し,そのメカニズムを解明する。
- ファインチューニングによって,GPT-4o,Gemini-2.5-Pro,DeepSeek-V3.1が著作権保護された書籍の最大85-90%を再現することが示された。
- 特定の作家の作品のみでファインチューニングした場合でも,他の30人以上の作家の著作物を逐語的に再現することが可能となった。
- モデルの重みに著作権保護された書籍のコピーが保存されている証拠となり,既存のフェアユースの判断の前提を覆す可能性がある。
DeepXplain:XAI誘導による多段階APTキャンペーンに対する自律的防御 [cs.CY, cs.HC, cs.CR, cs.AI]目的:多段階APTキャンペーンに対する自律的な防御機構
- サイバー攻撃は高度化の一途を辿っており,企業や国家安全保障への脅威が増大している。
- 従来の防御システムでは,新たな攻撃手法への迅速な対応が困難である。
- 説明可能性のある自律防御システムを構築し,セキュリティ担当者の意思決定を支援すること。
- DeepXplainは,説明可能性のある強化学習フレームワークであり,APT攻撃の段階を考慮した防御を可能にする。
- 実験結果から,DeepXplainはF1スコアと成功率を向上させ,説明の信頼性,忠実性,簡潔性も高めることが示された。
- 本研究は,強化学習と説明可能性を統合することで,自律的なサイバー防御の効果と信頼性を向上させることを示した。
ドメイン知識と事例推論を活用したドメイン特化型コード生成 [cs.AI, cs.SE]目的:ドメイン特化型コード生成の性能向上
- ソフトウェア開発において,ドメイン知識は高品質なコード生成に不可欠である。
- 汎用LLMはドメイン知識に乏しく,実世界への適用時に性能が低下することが課題である。
- 知識グラフと事例推論を組み合わせ,LLMのドメイン適応能力を高めることを目指す。
- DomAgentは,知識グラフ推論と事例ベース推論を統合したDomRetrieverを搭載し,ドメイン知識の取得と活用を効率化する。
- データサイエンスのベンチマークデータセット(DS-1000)と実世界のトラックソフトウェア開発タスクにおいて,DomAgentは優れた性能を示した。
- 小規模なオープンソースモデルでも,DomAgentを用いることで大規模なプロプライエタリLLMに匹敵する性能を達成可能となった。
大規模言語モデルを活用した学際的なソフトウェア開発のワークフロー最適化:自動車産業における事例研究 [cs.SE, cs.AI]目的:学際的なソフトウェア開発におけるワークフロー最適化
- 自動車産業を含む複雑なシステム開発では,多様な専門知識の融合が不可欠である。
- 専門家と開発者の間の知識の断絶や,非互換的な形式主義がボトルネックとなっている。
- 大規模言語モデルを用いてワークフローを自動化し,開発効率の向上を目指す。
- 提案手法は,自動車APIシステムにおいて93.7%のF1スコアを達成した。
- APIごとの開発時間を約5時間から7分未満に短縮し,979時間のエンジニアリング時間を削減した。
- 専門家と開発者双方からコミュニケーション効率に対する高い満足度が得られた。
mSFT:マルチタスクSFTにおける異種データセット過学習への対処 [cs.CL, cs.MA, cs.LG, cs.AI]目的:マルチタスクSFTにおけるデータセット混合時の過学習問題に対する解決策
- 言語モデルの性能向上は,多様なデータセットを用いた学習が不可欠である。
- 従来のマルチタスクSFTは,全てのサブデータセットに対して均一な計算資源を割り当て,過学習や学習不足が生じやすい。
- mSFTは,過学習を意識した反復的な探索により,マルチタスクSFTの学習効率と性能を最大化する。
- mSFTは,10のベンチマークと6つのベースモデルにおいて,4つのベースラインと比較して一貫して優れた性能を示した。
- データセットサイズやタスクの粒度に関わらず,mSFTは堅牢な性能向上を維持し,新たなハイパーパラメータにも影響を受けにくいことが確認された。
- 特に計算資源が限られている場合,mSFTは性能向上とともに学習に必要なFLOPsを削減できる。
スペクトル融合による降水短時間予報の予測範囲拡大:レーダー観測と基礎モデルの事前知識の活用 [cs.MA, cs.LG, cs.AI]目的:降水短時間予報の予測範囲拡大
- 災害軽減や航空安全において,降水短時間予報は不可欠な情報である。
- レーダーのみのモデルでは,大規模な気象状況の把握が難しく,予測時間が長くなるほど精度が低下する。
- レーダー画像と気象データの表現の異質性を解消し,より長期間の信頼できる予報を可能にすること。
- 提案手法PW-FouCastは,Pangu-Weatherの予報をスペクトル事前知識として活用する周波数領域融合フレームワークである。
- 周波数変調,周波数メモリ,逆周波数注意という3つの主要な革新により,予測精度を向上させている。
- SEVIRとMeteoNetのベンチマークにおいて,最先端の性能を達成し,予測範囲を効果的に拡大している。
関節トルク空間摂動注入によるヒューマノイド歩行制御方針のシミュレーションから実世界への転移 [cs.RO, cs.AI]目的:ヒューマノイド歩行制御方針のシミュレーション環境から実世界への転移
- ロボットの自律的な動作を実現するには,現実世界でのロバスト性が不可欠である。
- シミュレーション環境と現実世界の間には誤差が存在し,学習済みの方針が実世界でうまく機能しない場合がある。
- 複雑な現実世界のギャップに対応できる,ロバストな制御方針の学習を目指す。
- 本研究では,入力関節トルクに状態依存的な摂動を注入することで,パラメータの乱数化よりも広範な現実世界のギャップに対応可能であることを示した。
- ニューラルネットワークを柔軟な摂動生成器として用いることで,非線形なアクチュエータ特性や接触コンプライアンスといった複雑な不確実性を表現できる。
- シミュレーションと実環境の両方において,提案手法が既存手法よりも優れたロバスト性を示すことが確認された。
チンチラアプローチ2の問題点2:IsoFLOP放物線近似の系統的バイアス [cs.LG, cs.CL, stat.ML]目的:ニューラルスケーリング則の近似
- AIモデルの性能向上には,計算資源の効率的な配分が不可欠である。
- 既存手法では,計算量とパラメータ数の最適な関係を正確に推定できない場合がある。
- Chinチラアプローチ2のバイアスを解消し,より正確な計算資源配分を実現する。
- チンチラアプローチ2の放物線近似には,計算量最適化における系統的なバイアスが存在することが示された。
- Llama 3のデータ分析から,このバイアスにより,訓練予算の6.5%が無駄になる可能性が示唆された。
- チンチラアプローチ3はバイアスを解消できるが,実装の困難さが課題であった。本研究では,その懸念は根拠がないか,解決可能であることを示した。
堅牢な太陽光発電量予測のためのクラウド・エッジ協調大規模モデル [cs.LG, cs.NI]目的:太陽光発電量予測の精度向上,気象変動への頑健性,厳格な遅延制約のバランス
- 再生可能エネルギーの普及において,安定した電力供給は不可欠であり,精度の高い発電量予測が重要である。
- 既存モデルは通常時こそ性能を発揮するものの,急激な変動や予期せぬ気象変化には対応が難しい。
- クラウドのみに依存する方式の遅延問題を解決し,実用的なグリッド環境での迅速かつ効率的な予測を実現する。
- 提案手法CAPEは,ルーチン予測,エッジ側推論,クラウドベース検索モデルを組み合わせることで,予測精度と頑健性を向上させた。
- 不確実性,分布外リスク,気象変化,モデル不一致を評価するスクリーニングモジュールと,最適な推論経路を動的に決定するルーティング戦略が有効であった。
- 実データを用いた実験により,CAPEが予測精度,頑健性,ルーティング品質,システム効率において優れた性能を示すことが確認された。
潜在検証器による推論時スケーリングの微小化 [cs.CV, cs.AI, cs.MM]目的:生成モデルの推論時スケーリングによる性能向上
- 生成モデルの性能向上が求められており,推論時の効率化が重要である。
- 従来の検証器は計算コストが高く,推論時間の増加を招いていた。
- 拡散モデルの中間表現上で検証を行い,計算コストを削減する。
- 提案手法VHSは,従来のMLLM検証器と比較して,推論時間,FLOPs,VRAM使用量をそれぞれ大幅に削減した。
- わずかな推論予算でも,VHSはより効率的な推論時スケーリングを可能にする。
- GenEvalの評価において,同等の推論時間予算で+2.7%の性能向上を達成した。
言語モデルはステアリングによって視覚的特徴を説明できる [eess.SY, cs.SY, cs.CV, cs.AI]目的:視覚モデルにおける特徴の説明
- 深層学習モデルの解釈可能性は,モデルの信頼性と安全性を高める上で重要である。
- 視覚モデルの特徴を人間が介入せずに説明することは困難な課題である。
- 言語モデルを用いて,視覚特徴が表す概念を自動的に説明することを試みる。
- ステアリングという手法により,入力例に基づく従来のアプローチを補完するスケーラブルな説明が可能となった。
- 言語モデルの規模が大きいほど,説明の質が向上することが示された。
- ステアリングと入力例に基づく手法を組み合わせたSteering-informed Top-kが,最先端の説明品質を達成した。
拡散に基づく手術用煙除去のための物理・意味論誘導相対方策最適化 [cs.RO, cs.AI]目的:手術用煙の除去手法
- 手術中の視覚情報が重要であり,煙は視認性を著しく低下させるため。
- 既存手法はペアデータへの依存度が高く,実手術環境での改良が困難である。
- 限られたペアデータ下での,堅牢な拡散ベース復元技術の確立。
- 提案手法PhySe-RPOは,物理と意味論を考慮した方策最適化により,手術用煙を効果的に除去する。
- 照明と色の整合性を物理報酬で,そしてCLIPに基づく概念報酬で解剖学的構造の維持を促す。
- 合成データと実際のロボット手術データセットにおいて,臨床的に解釈可能な結果が得られた。
サブネットワーク修正を用いた二重教師蒸留によるブラックボックスドメイン適応 [cs.CV, cs.LG]目的:ブラックボックスドメイン適応のためのモデル
- 現実的な応用が多く,データやモデルが利用できない状況でのドメイン適応は重要である。
- 既存手法はノイズの多い教師データやViLの潜在能力の不十分な活用に課題がある。
- ブラックボックスモデルとViLの知識を統合し,より正確なドメイン適応を実現する。
- 提案手法は,ブラックボックスモデルとViLの予測を統合し,信頼性の高い擬似ラベルを生成する。
- サブネットワーク駆動の正則化により,ノイズによる過学習を抑制する。
- 擬似ラベルとViLプロンプトの反復的な改善により,適応精度を高める。
心拍数に注意!クロウのバックグラウンド実行は,本質的にサイレントなメモリ汚染を可能にする [cs.CR, cs.AI, cs.SI]目的:クロウ型パーソナルAIエージェントにおけるセキュリティ脆弱性の特定
- AIエージェントの利用拡大に伴い,そのセキュリティ確保は重要性を増している。
- AIエージェントのメモリ汚染に対する対策は十分ではなく,悪意のある情報による影響が懸念される。
- クロウ型AIエージェントのバックグラウンド実行メカニズムに起因するメモリ汚染を明らかにし,その影響を軽減する。
- クロウ型AIエージェントは,心拍数に基づいたバックグラウンド実行中に外部情報を取り込み,ユーザーの知らないうちにメモリを汚染する可能性がある。
- ソーシャルな信頼性の手がかりが短期的な行動に強い影響を与え,誤解を招く割合は最大61%に達する。
- メモリ保存の習慣が短期的な汚染を長期メモリに移行させ,セッションを跨いだ行動に影響を与える割合は最大76%に達する。
DAK-UCB:LLMおよび生成モデルのための多様性を考慮したプロンプトルーティング [cs.LG]目的:生成AIモデル選択における多様性と忠実度を両立させる手法
- 生成AIの発展により,ユーザーの要求に応じた最適なモデル選択が重要になっている。
- 既存手法は忠実度のみを重視し,生成される出力の多様性を考慮できていない。
- 多様性を考慮したモデル選択により,より豊かな生成結果を目指す。
- DAK-UCBは,忠実度と多様性の両方を考慮した文脈バンディットアルゴリズムである。
- プロンプトと出力のペア間の二標本に基づく期待値を用いて,多様性スコア関数を設計した。
- 実験結果は,DAK-UCBが多様性を促進しつつ,生成の忠実度を維持することを示した。
ビッグデータとLLMの視点からの企業財務リスク分析に関する包括的調査 [q-fin.RM, cs.AI, cs.LG]目的:企業財務リスク分析手法の体系的調査
- 企業財務は経済活動の根幹であり,その健全性が社会全体の安定に不可欠である。
- 既存研究は財務・経営学の観点に偏り,ビッグデータやLLMの最新動向が十分に網羅されていない。
- ビッグデータとLLMの視点を取り入れ,企業財務リスク分析の新たな方向性を示す。
- 本調査は,リスクの種類,粒度,知能レベル,評価指標といった企業財務リスクの定式化を提示する。
- 既存研究を比較分析し,企業財務リスクモデリングにおける影響力の大きい研究を明らかにする。
- 現在の研究の限界を特定し,将来の研究に向けた5つの有望な方向性を提案する。
心臓MRIのための汎用的な深層学習システム [eess.IV, cs.CV, cs.LG]目的:心臓MRIにおける広範な心血管疾患と健康状態の表現
- 心臓MRIは心筋の構造,機能,組織特性を総合的に評価でき,臨床的に重要である。
- 従来の深層学習モデルは,大量のラベル付きデータが必要であり,汎用性に欠ける場合がある。
- 自己教師あり学習を用いて,少ないデータで高精度な診断を可能にすることを目指す。
- 本研究で開発した深層学習システムは,39種類の心臓疾患の診断において高い精度を示した。
- UK BioBankを含む複数のデータセットで検証され,優れた汎化性能が確認された。
- 既存の手法と比較して,少ない学習データで同等の性能を達成できることが示された。
ベイズLOO交差検証のための摂動適応重要度サンプリング [stat.ME, cs.AI, cs.LG, math.SP, math.ST, stat.TH]目的:ベイズモデルのLOO交差検証における効率的な代替手法
- ベイズ統計は不確実性を定量化する上で重要であり,モデル評価も不可欠である。
- LOO交差検証は計算コストが高く,モデルの再適合が必要となる場合が多い。
- 重要度サンプリングの分散を軽減し,計算効率を向上させること。
- 適応変換により,重要度サンプリングの分散問題を解決できることが示された。
- 偏モーメントマッチング,尤度降下,勾配フローなどの変換手法が提案された。
- 提案手法は,分類,カウント回帰,生存分析の問題で有効であることが確認された。
特徴学習のハミルトニアン力学:リーキーResNetにおけるボトルネック構造 [stat.ML, cs.AI, cs.LG]目的:リーキーResNetにおける表現空間の測地線と,それらに基づくハミルトニアン力学的な表現
- 深層学習の理論的理解は,モデルの性能向上と設計指針の確立に不可欠である。
- ResNetのような深層ネットワークにおける特徴表現の学習メカニズムは未だ十分には解明されていない。
- ボトルネック構造の発生原理を解明し,それを利用した学習法の改善を目指す。
- 無限層の極限において,表現空間の測地線が,ネットワークのパラメータノルムを最小化する連続的な経路として導出された。
- 運動エネルギーとポテンシャルエネルギーのバランスが,ResNetにおける特徴学習の本質を説明する鍵となることが示唆された。
- 大きな有効深度においてポテンシャルエネルギーが支配的になり,高次元入力から低次元表現への急速な遷移と,その後の低次元空間内での緩やかな移動が観察された。
校正された機械学習予測に基づくアルゴリズム [stat.ML, cs.DS, cs.LG]目的:予測に基づくアルゴリズムにおける性能向上
- 実世界の問題解決において,機械学習の活用が不可欠となっている。
- 機械学習予測の信頼性評価が難しく,適切な信頼度設定が課題である。
- 予測レベルの不確実性評価に基づいた,校正によるアルゴリズム改善を目指す。
- 校正された予測を用いることで,スキーレンタル問題においてほぼ最適な性能を達成した。
- 高分散環境下では,校正された予測が不確実性評価において有効であることが証明された。
- ジョブスケジューリング問題において,校正された予測を用いることで既存手法を上回る性能改善が確認された。
ニューラル輸送による並列焼きなまし法の加速 [stat.ML, cs.LG]目的:高次元,多峰性,複雑なターゲット分布からのサンプリング効率向上
- 統計計算において,正規化されていない確率分布からのサンプリングは重要である。
- 従来の並列焼きなまし法は,隣接する分布の重複が少ない場合に効率が低下する。
- ニューラルサンプラーを活用し,計算コストを抑えつつ効率的なサンプリングを実現する。
- 本研究では,ニューラルサンプラーを用いることで,並列焼きなまし法のサンプリング品質を向上させた。
- 従来の並列焼きなまし法と比較して,計算コストを削減できることが示された。
- 自由エネルギー/正規化定数の効率的な推定が可能となった。
教師・生徒設定における狭い単隠れ層ネットワークの汎化性能 [cond-mat.dis-nn, cs.LG, math.PR, math.ST, stat.TH]目的:単隠れ層ネットワークにおける汎化性能の理論的特徴付け
- ニューラルネットワークの性能向上は,現実のデータセットへの応用において重要である。
- 汎化性能の理論的理解が,単純な分布におけるニューラルネットワークの挙動解明を阻んでいる。
- 教師・生徒設定における単隠れ層ネットワークの汎化性能を厳密に解明することを試みる。
- ネットワーク幅が入力次元よりも大幅に小さい場合でも,汎化性能を記述する閉形式表現を導出した。
- サンプル数がネットワークパラメータ数に比例して増加すると,隠れニューロンが教師の特徴に特化する相転移が起こる。
- 回帰・分類タスクにおける理論的予測と実験結果が整合することを示し,理論の妥当性を検証した。
FLOWR.root:構造を意識した3Dリガンド生成と親和性予測のためのフローマッチング基盤モデル [math.OC, cs.SY, eess.SY, q-bio.BM, cs.LG]目的:ポケットを考慮した3Dリガンド生成,およびそのポテンシーと結合親和性の予測と信頼性推定
- 創薬において,標的タンパク質への結合親和性が高い化合物を効率的に探索することは重要である。
- 既存の手法では,構造に基づいた合理的設計と,予測精度の向上が課題となっていた。
- 構造情報を活用し,親和性を予測することで,効率的な化合物設計を可能にすること。
- FLOWR.rootは,無条件の3D分子生成と,ポケット条件付きのリガンド生成において,最先端の性能を達成した。
- HiQBindデータセットにおいて,親和性予測の精度が向上し,FEP+/OpenFEベンチマークでは,Boltz-2を凌駕する速度と精度を示した。
- 選択的なCK2$\alpha$リガンド生成において,予測された結合エネルギーと量子化学計算の結果との間に有意な相関が認められた。
分布的収縮 I:ツイーディーの公式を超える普遍的なノイズ除去器 [stat.ML, cs.LG, math.ST, stat.TH]目的:ノイズ分布が不明な状況下におけるノイズ除去手法
- 信号処理において,ノイズ除去はデータの質を向上させるために不可欠である。
- 従来のノイズ除去手法は,ノイズ分布の知識に依存しており,分布が不明な場合には性能が低下する。
- ノイズ分布に依存しない普遍的なノイズ除去手法を開発し,性能向上を目指す。
- 提案手法は,ツイーディーの公式に基づく最適ベイズ除去器と比較して,分布回復において大幅な改善を達成する。
- 提案手法は,一般化されたモーメントおよび密度において,それぞれO(σ⁴)およびO(σ⁶)の精度で分布を収縮させる。
- 最適な輸送理論に基づき,モンジュ-アンペール方程式を高精度で近似し,スコアマッチングを介して効率的に実装可能である。
深層学習を計算の凸パラダイムとして:ResNetによる回路サイズの最小化 [stat.ML, cs.CC, cs.LG]目的:深層ニューラルネットワークの回路サイズ最小化
- 近年,深層学習の成功が注目されており,その理論的根拠の解明が求められている。
- 従来の統計的手法では説明できない深層学習の汎化性能の高さが課題となっていた。
- 深層学習が持つ本質的な計算原理を明らかにし,その成功要因を解明すること。
- 深層ニューラルネットワークは,データに適合する最も単純なアルゴリズムを見つける「オッカムの剃刀」の原理に基づいていると考えられる。
- ある種の関数空間において,回路サイズとResNetのパラメータの複雑さの間に,密接な関係が示された。
- ResNetのパラメータを最小化することは,データに適合するほぼ最小限のノード数を持つ回路を見つけることに相当する。
分布的縮小II:高階スコアがブレニエ写像を符号化 [math.ST, cs.LG, stat.ML, stat.TH]目的:ブレニエ写像の符号化における高階スコア関数の役割
- 確率モデルの理論は,統計的推論や機械学習の基盤であり,データ解析の精度向上に不可欠である。
- 未知の信号からノイズが加わったデータを扱う場合,ノイズ除去の効率と精度が課題となる。
- 高階スコア関数を用いて,より高精度なノイズ除去と,最適輸送写像の推定を目指す。
- 高階スコア関数は,ブレニエ写像を符号化することが示された。
- 部分ベル多項式を用いた再帰により,この階層構造が完全に特徴付けられた。
- サンプル数nからのスコア推定に関する収束レートが,2つの戦略において確立された。
機械学習モデルが極端な値を系統的に過小評価する理由 II:LatentNNによる修正方法 [astro-ph.IM, astro-ph.SR, cs.LG, stat.ML]目的:回帰係数の減衰バイアス
- 天文学データの分析において,機械学習モデルの精度向上が不可欠である。
- 入力変数の測定誤差により,回帰係数が系統的に過小評価される問題が存在する。
- LatentNNを用いて,ニューラルネットワークにおける減衰バイアスを軽減すること。
- LatentNNは,ネットワークパラメータと潜在入力値を同時に最適化することにより,減衰バイアスを低減する。
- この手法は,一次元回帰,多変量入力,恒星分光データなど,様々な応用で有効性が確認された。
- 特に,低信号対雑音比の環境において,標準的なニューラルネットワークよりも優れた推論が可能となる。
ナノフォトニクスにおける効率的な逆設計のための勾配情報に基づくベイジアンおよび内部点最適化 [math.OC, cs.MS, physics.optics, cs.LG]目的:ナノフォトニクスデバイスの逆設計手法
- 高性能なナノフォトニクスデバイス開発において,形状最適化は不可欠である。
- 既存の最適化アルゴリズムは,収束が遅いか,局所最適解に陥りやすい。
- 局所最適解回避と効率的な勾配利用による最適設計を実現する。
- BONNIは,ニューラルネットワークアンサンブルによる代理モデルと内部点最適化を組み合わせることで,効率的な最適化を可能にする。
- 分散ブラッグ反射鏡の設計において,平均スペクトル誤差を7.8%から4.5%に低減することに成功した。
- ブロードバンド導波管テーパやフォトニック結晶導波管トランジションの設計にも適用可能であることが示された。
到達可能性から学習可能性へ:量子ニューラルネットワークの幾何学的設計原理 [quant-ph, cs.LG, hep-ex, hep-ph, stat.ML]目的:量子ニューラルネットワークにおける特徴学習能力の幾何学的設計原理
- 深層学習の成功は,データの幾何学的変形能力に起因する。量子ニューラルネットワークにおいても同様の能力が重要。
- 量子ニューラルネットワークでは,深さや状態の到達可能性だけでは,特徴学習能力が保証されないという課題がある。
- データと学習可能な重みの間の適切な依存関係を確立することで,幾何学的な柔軟性を実現することを目指す。
- 古典-リー代数マップ(CLA)とほぼ完全な局所選択性(aCLS)の基準を導入し,幾何学的柔軟性の条件を提示した。
- データ独立な学習可能なユニタリー変換は完全だが選択性に欠け,データエンコーディングのみでは選択的だが調整不可能であることが示された。
- aCLSを満たすデータ再アップロードモデルは,調整不可能なスキームよりも高性能でありながら,ゲート操作数を削減できることが確認された。
恥じらいのないベイズ:予測推論における許容性幾何学 [stat.ML, cs.LG, math.ST, stat.TH]目的:予測推論における許容性幾何学の分類と特徴付け
- 意思決定理論において,最適な推論手順の選択は重要課題である。
- 許容性基準が複数存在し,それらの関係性が明確でなかった。
- 異なる許容性幾何学の相互関係を解明し,各基準の特性を明らかにする。
- 4種類の許容性幾何学が相互に包含関係を持たないことが示された。
- 各幾何学は,最適な手順を証明するための異なる根拠(事前分布,マルチンゲールなど)を持つ。
- 許容性は基準に依存すること,および共通の枠組みで解釈できることが示唆された。
人間とLLMの協調によるコラッツ力学の探求 [math.CO, cs.DM, physics.soc-ph, cs.SI, math.DS, cs.AI, cs.HC]目的:コラッツ写像のモジュラーダイナミクス,評価統計,および軌道のバーストとギャップへの組み合わせ分解に関する構造的・定量的な枠組み
- コラッツ予想は,数学における未解決問題であり,その構造は複雑で,多くの数学者の興味を引いている。
- 既存の研究では,コラッツ軌道の収束に関する厳密な証明は得られておらず,解析的な進展が限定的である。
- 本研究は,コラッツ軌道の収束条件を明確化し,予想の構造的側面を部分的に解決することを目的とする。
- コラッツ写像の奇数から奇数へのダイナミクスにおいて,アフィンスクランブル構造が確立された。
- 軌道に沿った剰余情報の構造的減衰と,拡張された原始族の軌道ごとの寄与に関する定量的な上限が導出された。
- 時間平均とアンサンブル期待値のtruncated observableに対する一致,および末尾消失条件の下で,軌道の収束が示された。
ニューラルネットワークにおける局所から大域への計算 [math.AT, cs.LG, math.DS]目的:ニューラルネットワークの計算構造の数学的表現
- 深層学習の理論的理解は,モデルの性能向上や解釈可能性を高める上で重要である。
- 従来のニューラルネットワークの解析は,その複雑さから困難を伴う場合がある。
- 本研究は,新たな数学的枠組みを用いてニューラルネットワークの計算を厳密に解析することを目指す。
- ReLUニューラルネットワークを,頂点と辺を持つ「層状束」として構築した。
- 層状束上のラプラシアンが正定値となることを示し,正則化された計算を保証した。
- 層状束上の熱方程式が,順伝播の出力に指数関数的に収束することを確認した。
ミニマックス汎化クロスエントロピー [math.OC, cs.MS, cs.SY, eess.SY, stat.ML, cs.LG]目的:分類問題における損失関数の最適化
- 教師あり学習において,損失関数はモデルの性能を大きく左右するため,その重要性は高い。
- 従来の汎化クロスエントロピーは,分類マージンに関して非凸な最適化となり,複雑なデータセットで性能が低下しやすい。
- 分類マージンに関する凸最適化を実現し,複雑なデータセットにおける性能改善を目指す。
- 提案手法であるミニマックス汎化クロスエントロピーは,分類マージンに関して凸な最適化を可能にする。
- 理論的に,MGCEは分類誤差の上限を提供できることが示された。
- ベンチマークデータセットにおいて,MGCEは高い精度,高速な収束,そして優れたキャリブレーション性能を示す。
PRISM: 長文コンテキストLLM推論におけるO(n)メモリ壁の打破 - O(1)光ブロック選択による [physics.optics, cs.AI, cs.AR, cs.CL, cs.LG]目的:長文コンテキストLLM推論におけるKVキャッシュのスキャンによるメモリ帯域幅コスト
- LLMの性能向上には,計算能力だけでなく,メモリ効率の改善が不可欠である。
- 従来のLLM推論では,コンテキスト長に比例してメモリ使用量が増大し,ボトルネックとなっている。
- 光ブロック選択により,メモリ効率を改善し,長文コンテキスト処理の性能向上を目指す。
- PRISMは,薄膜リン酸リチウム(TFLN)を用いた類似性エンジンであり,KVブロック選択を高速化する。
- Qwen2.5-7Bを用いた評価により,4Kから64Kトークンにおいて100%の精度を維持し,64Kコンテキストでは16倍のトラフィック削減を達成した。
- 実用的なコンテキスト長(n >= 4K)において,GPUベースラインと比較して4桁のエネルギー効率向上を実現した。
