arXiv雑要約
AI - 2025/10/14 公開
ORN-CBF: ハイパーネットワークを用いた観測条件付き残差ニューラル制御バリア関数学習 [cs.RO, cs.LG, cs.SY, eess.SY]目的:自律システムの安全制御のための観測条件付きニューラル制御バリア関数の設計
- 安全性が重要な自律システムの制御において,CBFは有効な手法として注目されている
- CBFの設計は困難であり,最適な安全集合や部分的に観測可能な環境への適用が課題である
- 観測データに基づいた安全集合を推定し,安全性を保証する制御手法を開発すること
- 提案手法は,Hamilton-Jacobi到達可能性解析に基づき,最大の安全集合を近似的に復元する
- ハイパーネットワーク構造を用いることで,観測条件付きの安全フィルタ設計に適している
- シミュレーションと実機実験の結果,既存手法と比較して成功率と汎化性能が向上した
プロンプト最適化と部分空間表現学習による少サンプル分布外検出 [cs.LG, cs.AI, cs.CV]目的:分布外入力検出の性能向上
- AIシステムの信頼性は,未知の入力に対する検出能力に左右される。実世界での応用には不可欠。
- 既存のプロンプト学習法はソフトマックス確率に依存し,VLMsが学習した特徴量の識別力を活かせていない。
- 特徴量の部分空間表現学習とプロンプト調整を組み合わせ,ID-OOD分離性を高めることを目指す。
- 提案手法は,プロンプトベクトルにID特徴を投影し,ID無関係な特徴を直交空間に投影することで,ID-OOD分離性を向上させる。
- エンドツーエンド学習基準を設計し,高いOOD検出性能とID分類精度を両立させた。
- 実世界のデータセットにおける実験により,提案手法の有効性が確認された。
FedIA:ノード分類のためのドメインロバストな連合グラフ学習における重要度を考慮した勾配プルーニング集約手法 [cs.LG]目的:ドメインシフト下における連合グラフ学習の安定性と有効性の向上
- 連合グラフ学習は,分散データを利用可能にし,プライバシー保護に貢献する重要な技術である。
- ドメインの偏りがある環境下では,クライアントモデルが互換性のない表現を獲得し,集約が不安定になるという課題がある。
- 本研究では,勾配ノイズを事前に除去することで,より安定した連合グラフ学習を実現することを目的とする。
- 提案手法FedIAは,重要度の高い上位5%の勾配座標のみを保持し,外れ値クライアントの影響を抑制する。
- FedIAは,追加のアップリンクトラフィックやサーバーメモリをほとんど必要とせず,容易に導入可能である。
- 実験結果から,FedIAは既存の強豪手法と比較して,よりスムーズで安定した収束と高い最終精度を達成することが示された。
オペレーションズ・リサーチにおける大規模言語モデル:手法,応用,課題 [cs.AI]目的:オペレーションズ・リサーチへの大規模言語モデルの応用
- 複雑なシステムにおける意思決定を支援する基盤技術であり,輸送,サプライチェーン,生産計画など幅広い分野で活用されている。
- 専門家によるモデリングや手動パラメータ調整に依存するため,大規模かつ動的な問題への対応が困難であり,スケーラビリティとリアルタイム性が課題である。
- 大規模言語モデルを活用し,問題記述から数理モデルや実行コードを生成することで,これらの課題を克服し,新たな最適化システムを開発すること。
- 大規模言語モデルは,意味理解,構造化生成,推論制御の能力により,オペレーションズ・リサーチの分野に新たな可能性をもたらす。
- 既存の研究を自動モデリング,補助最適化,直接解決の3つの経路に分類し,大規模言語モデルの応用状況を体系的にレビューした。
- 意味から構造への不安定なマッピング,研究の断片化,汎化・解釈性の限界,評価システムの不足,産業展開の障壁などが課題として挙げられている。
離散時間拡散モデルによる音声合成 [cs.LG, eess.AS]目的:音声合成のための離散時間拡散モデルの探求と新規バリアントの提案
- 近年,音声合成技術の重要性が増しており,高品質かつ効率的な合成手法が求められている。
- 従来の拡散モデルは連続時間処理に基づき,学習と推論の間に不整合が生じやすいという課題があった。
- 本研究は,連続時間処理の課題を克服し,より効率的かつ一貫性のある音声合成を目指す。
- 提案手法は,主観評価および客観評価において,広く利用されている連続時間拡散モデルと同等の音声品質を実現した。
- 離散時間処理により,学習と推論の効率性が向上し,より少ないステップ数で高品質な音声合成が可能になった。
- 加法ガウスノイズ,乗法ガウスノイズ,ブラーリングノイズなど,多様なノイズ処理手法が有効であることが示された。
ナガメーズ語におけるCRFを用いた品詞タグ付け [cs.CL, cs.AI]目的:ナガメーズ語の品詞タグ付け
- 自然言語処理において,品詞タグ付けは言語理解の基礎となる重要な技術である。
- ナガメーズ語はリソースが乏しく,品詞タグ付けに関する研究は未着手であった。
- ナガメーズ語における品詞タグ付けの実現可能性と精度向上を目指す。
- ナガメーズ語の16,112トークンからなるアノテーション済みコーパスを構築した。
- 条件付き確率場(CRF)を用いて品詞タグ付けを行い,全体精度85.70%を達成した。
- 適合率,再現率,F1スコアはいずれも86%と高い結果が得られた。
LLMエージェント強化学習のための木探索 [cs.LG, cs.AI]目的:大規模言語モデルエージェントの強化学習手法
- 近年,LLMエージェントの能力向上は著しい。複雑なタスク遂行には,強化学習が不可欠である。
- 従来の強化学習は,報酬が希薄な環境で学習が困難であるという課題があった。
- 木探索により,効率的な学習を可能にし,報酬の希薄性問題を解決することを目指す。
- 提案手法Tree-GRPOは,木構造を利用し,限られた計算資源で多くの試行回数を実現する。
- 木構造により,最終報酬のみから中間段階の学習信号を生成することが可能となる。
- 11のデータセットと3種類のQAタスクで,既存手法を上回る性能が確認された。
質問駆動分析と統合:LLMを用いた解釈可能なテーマツリーの構築とテキストクラスタリングおよび制御可能な生成 [cs.CL, cs.AI]目的:テキストデータの解釈可能なテーマ構造の構築
- テキストデータの分析は知識発見に不可欠であり,その重要性は増している。
- 従来のトピックモデルは解釈が難しく,特にデータが少ない場合に課題がある。
- 本研究は,LLMを活用し,解釈可能なテーマツリーを構築することでこの課題を解決する。
- 提案手法RTPは,キーワードリストよりも解釈しやすい質問駆動型の階層構造を構築できる。
- RTPによって構築されたクラスタは,下流タスクにおける分類性能を向上させる強力な特徴量となる。
- RTPのテーマパスは,生成モデルの制御可能なプロンプトとして活用でき,一貫性のある生成を可能にする。
暗黙的反復オイラー法による効率的な数値Transformer [cs.LG, cs.CL]目的:Transformerの効率性と性能向上
- 自然言語処理や画像認識等の分野でTransformerの重要性が増している。
- 高次の数値解法は計算コストが増加し,効率と性能のトレードオフが生じる。
- より最適化可能なODEに基づくTransformerアーキテクチャを開発すること。
- IIETは,バニラTransformerと比較して平均精度を2.65%向上させた。
- 効率的な変種E-IIETは,推論オーバーヘッドを55%削減しつつ,元のタスク精度を99.4%維持した。
- 最も効率的なIIET変種は,同程度の速度でバニラTransformerと比較して平均1.6%以上の性能向上を達成した。
トラストレジオン報酬最適化と近接逆報酬最適化アルゴリズム [cs.LG, cs.AI]目的:専門家のデモンストレーションを説明する報酬関数の学習
- 強化学習において,報酬関数の設計は性能に大きく影響するため重要である。
- 従来の逆強化学習手法は学習が不安定になることが多いという課題がある。
- 安定性を保証しつつ,報酬関数の学習を効率的に行うことを目指す。
- 本研究では,報酬関数の尤度を単調増加させるトラストレジオン報酬最適化(TRRO)フレームワークを提案する。
- TRROの具体的な実装である近接逆報酬最適化(PIRO)は,MuJoCoやGym-Roboticsのベンチマークで最先端手法と同等またはそれ以上の性能を示す。
- PIROは,実際の動物行動モデリングタスクにおいても高いサンプル効率でポリシーの模倣に成功している。
協調には単純化が必要:自然・人工知能における多目的妥協の熱力学的限界 [cs.AI, cond-mat.stat-mech, cs.MA, nlin.AO, physics.soc-ph]目的:多目的協調における熱力学的制約
- 複雑なシステムにおける協調は,効率的な意思決定や問題解決に不可欠である。
- 既存の研究では,協調の成立条件や最適化戦略が十分に解明されていない。
- 多目的協調の熱力学的限界を明らかにすることで,協調のメカニズム解明を目指す。
- 協調的焦点点となりうる解は,正確性よりも発見可能性に対する選択圧力が高いことが示された。
- 協調プロトコルの記述長は,エージェント数や目的の数,精度に応じてスケールすることが導かれた。
- この枠組みは,ニューラルネットワークから官僚機構まで,様々なシステムにおける協調現象を説明可能である。
プロンプトをグラフ化せよ [cs.LG, cs.AI, cs.CV]目的:モデル予測から得られる関係グラフ構造を学習プロセスに注入するフレームワーク
- 深層学習は強力だが,特徴表現がノイズを含む場合があり,精度の向上が課題である。
- クラス間の類似関係が,モデルの予測セマンティクスと矛盾することがある。
- モデル自身の出力を利用し,内部構造を改善することで,より意味のある特徴表現を獲得する。
- 提案手法GCRは,クラスを意識したセマンティックな特徴表現を促進し,汎化性能を向上させる。
- GCRは,グラフの不一致の大きさから層の重要度を学習し,信頼性の高い層を優先することで,特徴品質を高める。
- GCRはモデルに依存せず,軽量であり,様々なネットワークやデータセットで効果が確認された。
マルチモーダル方策合意によるマルチモーダル操作 [cs.RO, cs.AI, cs.LG]目的:ロボット操作における多様な感覚モダリティ統合
- ロボットの高度な操作能力実現には,様々な感覚情報を有効活用することが不可欠である。
- 特徴量連結では,視覚などの強いモダリティが触覚などの重要な情報を圧迫し,柔軟性に欠ける。
- モダリティ間の協調を学習し,新たなモダリティへの適応性を高めることを目指す。
- 提案手法は,各モダリティに特化した拡散モデルと,それらを統合するルーティングネットワークを用いる。
- シミュレーション環境および実環境における実験で,特徴量連結ベースラインを大幅に上回る性能を示した。
- 物理的な摂動やセンサー破損に対するロバスト性も確認され,モダリティ間の適応的な重み変化が示唆された。
知識レベル整合性強化学習:長文生成における二重事実整合性 [cs.CL, cs.AI, cs.LG]目的:長文生成における事実に基づいた整合性の向上
- 大規模言語モデルの信頼性確保は重要である。誤った情報を生成しないことが求められる。
- 既存手法では,モデルの内部知識の限界が見過ごされ,幻覚(ハルシネーション)が発生しやすい。
- モデルが持つ知識と基盤モデルの知識の一貫性を高め,事実の再現率と精度を向上させる。
- 提案手法KLCFは,知識レベルの一貫性を重視した強化学習フレームワークである。
- KLCFは,事前学習済みの知識境界を活用し,事実チェックリストを構築することで,事実の網羅性と再現率を改善する。
- 基盤モデルの内部知識に基づく自己評価モジュールにより,生成時の事実精度が向上し,幻覚が軽減される。
迷路の攻略:大規模言語モデルを用いたパス依存型ユニットテスト生成 [cs.SE, cs.AI]目的:ユニットテストの自動生成
- ソフトウェア品質を保証する上で,ユニットテストは不可欠である。
- 既存の手法はパス非依存であり,複雑な制御フロー構造を考慮できない。
- 深い制御フロー構造を考慮した高カバレッジなテスト生成を目指す。
- JUnitGenieは,コード知識とLLMのセマンティック能力を組み合わせることで,パス依存型ユニットテスト生成を実現した。
- 10のJavaプロジェクトにおける2,258個の複雑なメソッドを対象に評価した結果,JUnitGenieは既存手法と比較してブランチカバレッジを平均29.60%,行カバレッジを平均31.00%向上させた。
- 生成されたテストケースによって実際にバグが発見され,開発者によって修正されたことを示した。
エージェント型強化学習におけるGRPO報酬の誤校正の再考 [cs.AI]目的:エージェント型強化学習における報酬の誤校正問題の解明と改善策の提案
- 長期的な実世界タスクをこなせる自律エージェント開発は重要であり,その鍵となるのが報酬設計である。
- 結果に基づく報酬設定は,不完全な中間ステップに誤って正の報酬を与え,悪影響を及ぼす可能性がある。
- 本研究は,報酬設計の理論的誤解を解き,勾配結合の問題を軽減する手法を提案する。
- 結果に基づく報酬は,実際には不完全な中間ステップに対して負の利点を保証することが示された。
- 類似サンプル間の勾配結合が,エージェント型強化学習における重要な課題であることが特定された。
- 良し悪しのアクションを分類することで勾配干渉を軽減するアクターの訓練法が提案され,有効性が実験的に確認された。
2025年OpenAIの安全性フレームワークは,AIリスク軽減の実践を保証しない:AI安全ポリシーのアフォードンス分析による概念実証 [cs.CY, cs.AI]目的:AI安全ポリシーのアフォードンス分析
- AI技術の急速な発展に伴い,その安全性確保が喫緊の課題となっている。
- AI企業が策定する自主的な安全性フレームワークは,その実効性が不明確である。
- 安全性フレームワークが実際にどのようなAI開発・展開を可能にするかを明らかにすること。
- OpenAIの安全性フレームワークは,ごく一部のAIリスク評価のみを要求している。
- 中程度の能力を持つシステム展開を許可することで,深刻な被害(1000人以上の死亡または1000億ドル以上の損害)を招く可能性がある。
- OpenAIのCEOが,より危険な能力を持つシステム展開を許可していることが判明した。
LaMoGen:ラバン・ムーブメントに基づいたテキストからモーション生成拡散モデル [cs.CV, cs.AI]目的:テキストに基づくモーション生成における表現力と制御性の向上
- モーション生成は,コンピュータビジョン,HCI,アニメーション等の分野で重要性が増している。
- 既存モデルでは,モーションの多様性不足と自然言語での定量的な表現の難しさから,繊細なモーション制御が困難である。
- ラバンの理論を活用し,モーション生成モデルを制御することで,解釈可能かつ表現豊かなモーション生成を目指す。
- 提案手法は,事前学習済みの拡散モデルのテキスト埋め込みを更新することで,追加のモーションデータなしにラバンの要素を制御する。
- 目標とするラバンのタグに従ってモーション属性を操作することで,多様な表現力豊かなモーション品質を実現した。
- モーションの同一性を維持しつつ,モーション属性をターゲットのラバンタグに沿って操作できることを示した。
一般化後の専門化:基盤モデルにおけるテスト時学習の理解に向けて [cs.LG, cs.AI]目的:テスト時学習の効果とメカニズムに関する理解
- 基盤モデルの性能向上は,多様なタスクへの適応能力に依存するため重要である。
- テスト時学習が有効な条件や,その効果の理由が十分に解明されていない。
- 基盤モデルの潜在的な専門化能力を引き出し,テスト時の性能改善メカニズムを解明する。
- テスト時学習は,モデルがテストデータに特化した専門性を獲得するための手段となりうる。
- 線形表現仮説に基づき,テスト時学習がデータ分布内でのテストエラーを大幅に低減することをモデル化し,検証した。
- スパースオートエンコーダを用いた実験で,意味的に関連するデータ点が少数の概念で説明されることを確認し,モデルの仮説を裏付けた。
SANA-Video:ブロック線形拡散Transformerによる効率的な動画生成 [cs.CV, cs.AI]目的:高解像度かつ長時間の動画の効率的な生成
- 動画生成技術は,コンテンツ制作やコミュニケーションにおいて重要な役割を担う。
- 既存の動画生成モデルは計算コストが高く,リソースに制約がある環境での利用が難しい。
- 低コストで高品質な動画生成を実現し,幅広い環境で利用可能にすることを目指す。
- SANA-Videoは,線形注意機構と定数メモリKVキャッシュを用いることで,効率的かつ長時間の動画生成を可能にした。
- MovieGenの訓練コストの1%で訓練を完了し,Wan 2.1-1.3BやSkyReel-V2-1.3Bといった既存モデルと同等の性能を16倍の速さで実現した。
- RTX 5090 GPU上でのデプロイメントも可能であり,5秒の720p動画生成時間を71秒から29秒に短縮することに成功した。
Retro*: 推論集約型ドキュメント検索のためのLLM最適化 [cs.CL, cs.CL, cs.IR, cs.AI, cs.CL]目的:推論集約型ドキュメント検索におけるLLM最適化
- LLMエージェントやRAGの普及に伴い,タスク解決に不可欠なドキュメント検索が重要になっている。
- 既存のIR技術は,タスクとドキュメントの間の微妙な関連性を評価する推論能力に課題がある。
- 明示的な基準に基づく関連性スコアリングにより,高精度かつ解釈可能なドキュメント検索を実現する。
- Retro*は,ルーブリックベースの関連性スコアリングメカニズムを導入し,タスクとドキュメントの関係を明確に評価する。
- テスト時のスケーリングを可能にするため,複数の推論経路をスコア統合により組み合わせ,信頼性の高い関連性推定を実現する。
- BRIGHTベンチマークにおいて,既存のドキュメント検索手法を上回り,最先端の性能を達成した。
関数f(x)とg(x)からf(g(x))へ:LLMはRLで既存のスキルを組み合わせて新しいスキルを獲得する [cs.AI, cs.CL]目的:LLMにおけるRLを通じたスキル獲得のメカニズムの解明
- LLMの能力向上には,事前学習に加えて追加学習が不可欠である。その有効な手法としてRLが注目されている。
- RLによるLLMの学習が,本当に新しいスキルを習得しているのか,既存スキルの再重み付けに過ぎないのか,議論がある。
- 既存のスキルを組み合わせることで,LLMが未知のスキルを獲得できる可能性を示す。
- RLによって,LLMは事前に学習した関数fとgの合成関数h(x)=g(f(x))を学習できることが示された。
- この合成能力は,RLトレーニング中に見たことのない2つ以上の関数の合成にも一般化される。
- あるタスクで獲得した合成スキルは,別のタスクへ転移し,そのタスクにおける基本的なスキル知識があれば十分である。
予算と活性化を考慮した低ランク因子分解によるファインチューニング不要なモデル圧縮手法BALF [cs.LG]目的:ニューラルネットワークのモデル圧縮
- 近年,深層学習モデルの巨大化が課題であり,効率的なモデル圧縮が求められている。
- 既存の圧縮手法は,高コストなファインチューニングや探索が必要となる場合が多い。
- ファインチューニングなしで,柔軟な圧縮ターゲット設定を可能とする手法を開発する。
- 提案手法BALFは,ResNet-20からResNeXt-101,Vision Transformerまで幅広いモデルで有効性を示した。
- ResNeXt-101において,計算量を45%削減しつつ,top-1精度を1%ポイントの低下に抑えた。
- 活性化情報を考慮した因子分解と,スケーラブルな予算配分が,圧縮性能の向上に貢献している。
降水短時間予報に対する時系列モデルの有効性:PWVデータを取り入れた包括的ベンチマーク [cs.LG, cs.AI, physics.ao-ph, stat.ML]目的:降水短時間予報のためのベンチマークデータセットと,その評価手法の開発
- 災害軽減やリアルタイム対応計画において,降水予報は不可欠である。気象現象の予測精度向上は,社会の安全性に直結する。
- 既存の気象予測ベンチマークは,周期性の強い変数に偏っており,降水のような複雑な現象の予測能力を評価するには不十分である。
- 降水特有の課題(ゼロインフレ,時間的減衰,非定常性)に対応した評価と,予測性能の改善を目指す。
- RainfallBenchは,15分間隔で観測された6変数(PWVを含む)の5年間のデータから構築された,降水短時間予報に特化したベンチマークである。
- 20以上の最先端モデルをRainfallBenchで評価した結果,既存モデルが抱える課題が明確になった。
- Bi-Focus Precipitation Forecaster (BFPF)は,ゼロインフレと時間的減衰の問題に対処し,降水時系列予測の精度を向上させるモジュールである。
実環境における強化学習:LLM展開におけるRLVR訓練の特性評価 [cs.AI, cs.DC, cs.LG]目的:LLM展開におけるRLVR訓練のシステム的課題の特性評価
- 大規模言語モデルの活用が広がる中で,その能力向上は重要課題である。
- RLVR訓練は複雑なデータフローと多様なタスクにより,システム負荷が高くなりがちである。
- 本研究は,RLVR訓練におけるシステムボトルネックを特定し,改善策の検討を促す。
- GPUのアイドル状態や,シーケンス長分布の偏りが課題として特定された。
- 動的に変化するワークロードに対する並列処理戦略やデータ管理の非効率性が指摘された。
- PolyTraceベンチマークスイートが提案され,現実的なワークロードに対する94.7%の精度を示すことが確認された。
スケーラブルな中間トレーニングRLによる行動抽象化としての推論学習 [cs.AR, cs.LG, cs.AI, cs.CL, stat.ML]目的:行動抽象化を通じた推論能力の獲得
- 大規模言語モデルの性能向上には,強化学習との組み合わせが重要である。推論能力は,複雑な問題を解決する上で不可欠。
- 中間トレーニング段階において,有効な行動空間の特定と効率的な選択が課題となっている。行動空間が広すぎると学習が困難になる。
- 中間トレーニングにおける行動抽象化によって,効率的な推論と迅速な収束を実現し,モデルの性能を向上させる。
- 提案手法RA3は,HumanEvalとMBPPの平均スコアをそれぞれ8点,4点改善した。ベースモデルや次のトークン予測と比較して優れた性能を示した。
- RA3は,HumanEval+,MBPP+,LiveCodeBench,CodeforcesのRLVRにおいて,より高速な収束と高い漸近性能を達成した。
- 中間トレーニングは,決定空間がコンパクトで有効な地平線が短い場合に最も効果的であることが示唆された。
深層ニューラルネットワークアーキテクチャへの平衡伝播のスケーリング [cs.NE, cs.LG]目的:深層ニューラルネットワークの学習
- 脳の学習メカニズムの解明と,それを模倣した効率的な学習アルゴリズムの開発が重要である。
- 平衡伝播は生物学的な妥当性を持つが,バックプロパゲーションと比較して精度が低いという課題がある。
- 残差結合を導入した新しいアーキテクチャにより,より深層のネットワークの学習を可能にすることを目指す。
- 提案されたHopfield-Resnetアーキテクチャは,平衡伝播の層数を大幅に増加させた。
- Hopfield-Resnet13はCIFAR-10で93.92%の精度を達成し,従来の最高結果を3.5%上回った。
- バックプロパゲーションで学習したResnet13と同等の性能を示すことができた。
嗜好に基づく強化学習を用いた行動クローニングポリシーの微調整 [cs.CL, cs.AI, cs.LG]目的:ロボティクス等における安全かつ効率的な行動獲得
- ロボティクス等の分野で強化学習の利用が期待されるが,報酬設計が困難である。
- 従来の強化学習は,探索過程で危険な状態に陥るリスクや,大量のデータが必要となる。
- 専門家の模倣データと人間の嗜好データを用いて,安全かつ効率的な学習を実現する。
- 本研究では,まず専門家の模倣データから安全な初期ポリシーを学習し,次に人間の嗜好データで微調整する二段階フレームワークを提案した。
- 提案手法BRIDGEは,不確実性を考慮した目的関数を用いて,オフラインとオンラインのデータを統合する。
- 理論的な後悔限界を導出し,オフラインデータの量とオンライン学習効率の関連性を示した。シミュレーション実験で,既存手法よりも優れた性能が確認された。
SecureBERT 2.0:サイバーセキュリティインテリジェンスのための高度言語モデル [cs.CR, cs.AI, cs.LG]目的:サイバーセキュリティにおける言語モデルの高度化
- サイバーセキュリティ分野では,脅威の早期発見と対応が不可欠であり,情報分析の効率化が重要である。
- 汎用的な言語モデルでは,専門用語や複雑な構造を正確に解釈できず,精度に課題がある。
- サイバーセキュリティ特有の知識を組み込み,より高精度な分析を実現する言語モデルを開発する。
- SecureBERT 2.0は,既存のモデルよりも大規模なデータセットで事前学習されており,その性能は大幅に向上している。
- 脅威インテリジェンスのセマンティック検索,セマンティック分析,固有表現認識において,最先端の結果を達成した。
- コード内の脆弱性検出においても,サイバーセキュリティ分野における自動化された脆弱性検出能力が向上した。
近傍情報に基づく識別潜在拡散モデルによるプライバシー保護ドメイン適応 [cs.LG]目的:プライバシー保護ドメイン適応のための識別潜在拡散モデルの構築
- ドメイン適応は,異なるデータ分布を持つ環境下での機械学習モデルの性能維持に不可欠である。
- ソースデータへのアクセスなしに行うドメイン適応は困難であり,プライバシー保護の観点からも重要視されている。
- ソースデータにアクセスせずに,知識伝達を可能にする新しいフレームワークを提案し,性能向上を目指す。
- 提案手法であるDVDは,既存の最先端手法と比較して,標準的なSFDAベンチマークにおいて優れた性能を示す。
- 潜在拡散モジュールは,ソース分類器の精度向上にも貢献し,教師あり学習やドメイン汎化性能も向上させる。
- DVDは,潜在拡散モデルをプライバシー保護に配慮した知識伝達の手段として再解釈し,ソースフリードメイン適応における課題を解決する。
ダウングレードによるアップグレード:オプティマイザの簡素化がLLMアンラーニングの堅牢性を高める [cs.LG]目的:LLMアンラーニングにおける堅牢性の向上
- 大規模言語モデルの普及に伴い,プライバシーや安全性の確保が重要課題となっている。
- 既存のアンラーニング手法は,量子化やファインチューニングといった後処理によって効果が打ち消されやすい。
- オプティマイザの簡素化によって,アンラーニング後の脆弱性を克服し,堅牢性を高める。
- オプティマイザの「グレード」が,アンラーニングの堅牢性に強く関連することを示した。
- 特に,0次オプティマイザ(勾配不要法)や圧縮勾配法を用いることで,堅牢性が向上することが確認された。
- 1次と0次の更新を組み合わせたハイブリッドオプティマイザを提案し,その有効性を実験的に検証した。
アリストテレス:IMOレベルの自動定理証明 [cs.AI, cs.CL]目的:IMOレベルの問題に対する自動定理証明
- 数学的思考の自動化は,科学技術の発展に不可欠である。
- 高度な数学問題を自動で証明することは依然として困難である。
- IMOレベルの問題を解決可能な定理証明システムの構築。
- アリストテレスは,形式検証と非形式的推論を組み合わせたAIシステムである。
- 2025年の国際数学オリンピック問題において,金メダル相当の成績を達成した。
- Leanの証明探索,非形式的推論システム,専用の幾何ソルバーを統合している。
AIReg-Bench:AI規制遵守を評価する言語モデルのベンチマーク [cs.AI]目的:AI規制遵守評価における言語モデルの性能評価
- AI規制の必要性が高まる中で,AIシステムの法規制遵守を効率的に評価する方法が求められている。
- AI規制遵守評価を言語モデルに委ねる場合,その性能を客観的に評価する基準が存在しない。
- EU AI Actへの適合性を評価する言語モデルの性能を測るためのベンチマークデータセットを構築する。
- AIReg-Benchは,AIシステムの技術文書を生成し,法律専門家がAI Act違反の有無を注釈したデータセットである。
- 最先端言語モデルによるAI規制遵守ラベルの再現性を評価し,その限界と可能性を示した。
- 本データセットは,将来の言語モデルの性能比較のための基準点となる。
TetriServe:多様な画像生成のための効率的なDiTサービング [cs.LG, cs.DC]目的:拡散Transformer(DiT)モデルの効率的な画像生成
- 高品質画像生成において,拡散Transformerモデルが注目されている。
- 高解像度画像生成時の計算コストが高く,厳格なSLAを満たすことが課題。
- ステップレベルの並列処理により,SLA達成率を向上させることを目指す。
- TetriServeは,リクエストの締め切りに応じて並列度を動的に調整するステップレベルのシーケンス並列処理を導入。
- ラウンドベースのスケジューリング機構により,SLA達成率を向上させ,GPU時間の消費を最小限に抑える。
- 最先端のDiTモデルでの評価により,既存のソリューションと比較して最大32%高いSLA達成率を達成。
ビジョン・言語・行動モデルにおけるコントラスト表現正則化 [cs.RO, cs.LG]目的:ビジョン・言語・行動モデルの表現学習の改善
- ロボット操作において,ビジョン・言語モデルの活用が重要視されている。
- ロボット固有の情報(制御行動や固有受容感覚)への感度が低い点が課題である。
- ロボットの状態情報を活用し,表現学習のギャップを埋めることを目指す。
- 提案手法であるロボット状態を考慮したコントラスト損失(RS-CL)により,ロボットの固有受容感覚との表現の整合性が向上した。
- RS-CLは,既存のVLAモデルの性能を向上させ,RoboCasa-Kitchenのピッキング配置タスクで成功率を30.8%から41.5%に向上させた。
- 実ロボット操作タスクにおいても,RS-CLは成功率を45.0%から58.3%に向上させ,正確な把持と配置を可能にした。
平衡マッチング:暗黙的エネルギーベースモデルによる生成モデリング [cs.LG, cs.AI, cs.CV]目的:生成モデリングにおける新しいフレームワーク
- 画像生成の分野は,現実世界の多様性を捉える上で重要な課題である。
- 拡散モデルやフローベースモデルは計算コストが高く,最適化が難しいという課題がある。
- 平衡状態に着目することで,より効率的で柔軟な生成モデルを開発することを目指す。
- 平衡マッチング(EqM)は,拡散モデルやフローベースモデルを上回る生成性能を示すことが実証された。
- ImageNet 256$\times$256において,FIDスコア1.90を達成し,データ多様性の学習とサンプリングが理論的に正当化された。
- 部分的にノイズ化した画像の復元,外れ値検出,画像合成など,多様なタスクへの応用が可能である。
大規模言語モデルの現実世界におけるプライバシー意識の測定:評価ベンチマーク [cs.CR, cs.AI]目的:大規模言語モデル搭載エージェントの現実世界におけるプライバシー意識の定量化
- LLMが現実世界で活用される場面が増加しており,プライバシー保護は不可欠である。
- 既存の評価方法は自然言語処理が中心で,現実世界との乖離がある。
- 現実世界におけるプライバシー意識の評価基準を確立し,LLMの改善を図る。
- EAPrivacyベンチマークを用いてLLM搭載エージェントのプライバシー意識を評価した結果,既存モデルに課題が残ることが示された。
- 最上位モデルであるGemini 2.5 Proでも,環境変化に対応したシナリオで59%の精度しか達成できなかった。
- プライバシー制約とタスク遂行のバランスにおいて,モデルはタスク遂行を優先する傾向が強く,特に86%のケースで制約を無視した。
多波長・ハイパースペクトル衛星データの融合による深層学習を用いた有害藻類ブルームモニタリング [cs.LG, cs.AI]目的:有害藻類ブルームの重症度と種分類
- 水質汚染や生態系への影響が懸念されるため,有害藻類ブルームのモニタリングは重要である。
- 従来のモニタリングは,ラベル付きデータの取得が困難であり,手法の適用範囲が限られていた。
- ラベル付きデータに依存しない自己教師あり学習により,有害藻類ブルームの広範囲なモニタリングを実現する。
- 提案手法SIT-FUSEは,複数の衛星データを融合し,有害藻類ブルームの重症度と種分類を高い精度で実現した。
- メキシコ湾および南カリフォルニアの現地データとの比較により,その有効性が検証された。
- 自己教師あり学習によるスケーラブルなモニタリングは,グローバルな水質評価に貢献する。
カール降下:符号多様性可塑性による非勾配学習ダイナミクス [cs.LG]目的:符号多様性可塑性による非勾配学習ダイナミクスの解析
- 脳型神経回路網の学習メカニズム解明は,人工知能の発展に不可欠である。
- 従来の勾配降下法に偏った研究が多く,生物学的妥当性に疑問が残る。
- 非勾配学習ダイナミクスが,損失関数最適化にどのように貢献するかを解明する。
- カール項は,阻害性・興奮性結合やHebbian/anti-Hebbian可塑性を持つネットワークに自然発生する。
- 小さなカール項は,解多様体の安定性を維持し,勾配降下法と同様の学習ダイナミクスを示す。
- 強いカール項は解多様体を不安定化させ,学習のchaosを引き起こす場合があるが,サドル点からの脱出を促し学習を加速する場合もある。
HAVIR:CLIP誘導型汎用拡散を用いた階層的視覚から画像再構成 [cs.CV, cs.AI]目的:脳活動からの視覚情報再構成
- 脳科学とコンピュータビジョンの融合に不可欠であり,脳の可視化技術の発展に貢献する。
- 複雑な視覚刺激の正確な復元が困難であり,低レベル特徴の異質性や高レベル特徴の意味的絡み合いが課題である。
- 視覚皮質の階層的表現理論に基づき,構造と意味情報を分離することで再構成精度を向上させる。
- HAVIRは,構造的および意味的品質の両方を向上させ,複雑なシーンにおいても既存モデルを上回る再構成性能を示す。
- 空間処理ボクセルから構造情報を抽出し,意味処理ボクセルからCLIP埋め込みを生成する二つの階層的領域を設ける。
- Versatile Diffusionモデルを通して両者を統合し,最終的な画像を合成する。
多層ナラティブ洗練と知識蒸留によるXAIナラティブの強化 [cs.LG]目的:XAIナラティブの改善
- 深層学習の意思決定プロセスを理解することは,AIの信頼性と透明性を高める上で不可欠である。
- カウンターファクチュアル説明は有用だが,専門知識がないと解釈が難しい場合がある。
- 言語モデルを活用し,より分かりやすいカウンターファクチュアル説明ナラティブを生成することを目指す。
- 大規模言語モデルと小規模言語モデルを組み合わせることで,小規模モデルが大規模モデルと同等の推論能力を持つことを可能にした。
- 知識蒸留とナラティブ洗練メカニズムにより,小規模モデルの性能と実用性が向上した。
- 提案手法は,生成されたナラティブが事実とカウンターファクチュアルな根拠と一致しているかを検証する評価方法によって支持されている。
PDE-Transformer: 配列モデリングに対する連続力学系の利用 [cs.LG, cs.AI]目的:Transformerの順伝播を,変分エネルギー汎関数から導出された連続反応拡散系の数値離散化として捉えること。
- 系列モデリングは,自然言語処理,音声認識など,様々な分野で重要な役割を担う技術である。
- Transformerは高性能だが,長距離依存関係のモデル化には計算コストが高いという課題がある。
- 連続的な偏微分方程式を用いてTransformerの効率性と性能を向上させることを目指す。
- 本研究では,Transformerの順伝播を連続反応拡散系の数値離散化として解釈する新たなパラダイムを提案する。
- 適応的な偏微分方程式拡散層を設計し,特徴空間における局所的な平滑性を線形時間計算量で実現した。
- Long Range Arenaベンチマークにおいて,埋め込み層直後に本層を配置することで,平均精度が4.1pp向上した。
LegalWiz:法的文書における矛盾検出のためのマルチエージェント生成フレームワーク [cs.AI, cs.MA]目的:法的文書における矛盾検出のためのベンチマークフレームワーク
- 法務分野では,正確性と信頼性が極めて重要であり,大規模言語モデルの利用が拡大している。
- 既存の矛盾検出ベンチマークは現実的でなく,法的文書の複雑な矛盾に対応できない。
- 法的文書に特化した矛盾検出と解決を評価するための信頼性の高いリソースを構築する。
- マルチエージェントによるフレームワークLegalWizを開発し,法的文書に6種類の矛盾を組み込んだ。
- 矛盾の自動抽出と人間による検証を組み合わせ,生成される文書の妥当性と信頼性を保証した。
- 本ベンチマークは,法的RAGパイプラインにおける矛盾認識評価のための構造化されたリソースを提供する。
トークン隠れ報酬:グループ相対深層強化学習における探索・活用の舵取り [cs.LG, cs.CL]目的:グループ相対政策最適化におけるトークンレベルの影響量の定量化と,それを利用した探索・活用の制御
- 大規模言語モデルの推論能力向上には,検証可能な報酬を用いた強化学習が有効である。
- 強化学習において,探索と活用を明示的に制御する方法は未解決の課題である。
- トークン隠れ報酬を用いて,強化学習における探索と活用を動的に制御することを目指す。
- トークン隠れ報酬(THR)は,正の値が正しい出力への信頼を高め活用を促進し,負の値が代替出力の確率質量を維持し探索を可能にする。
- THRをガイドとした重み付けアルゴリズムにより,グループ相対政策最適化の学習シグナルを調整し,探索または活用を明示的にバイアスできる。
- このアルゴリズムは,貪欲デコーディングの精度向上(活用重視)とPass@K精度の向上(探索重視)の両方において有効性が確認された。
コントラストノイズ最適化による多様なテキスト画像生成 [cs.GR, cs.AI, cs.CV, cs.LG]目的:テキスト画像生成における多様性の向上
- 近年,テキストから画像を生成する技術は目覚ましい発展を遂げている。
- 生成される画像がテキストの指示に強く依存し,多様性に欠けるという課題がある。
- 初期ノイズを調整することで,生成画像の多様性を高めることを目指す。
- コントラストノイズ最適化は,初期ノイズを調整することで,生成画像の多様性を促進する。
- Tweedieデータ空間におけるコントラスト損失を導入し,ノイズラテントを最適化する。
- 複数のT2Iモデルで,品質と多様性のバランスにおいて優れた結果が得られた。
多用者大規模MIMOにおける決定木を用いた悪意のあるパイロット汚染の検出 [cs.CR, cs.IT, cs.LG, eess.SP, math.IT]目的:悪意のあるパイロット汚染の検出
- 5G/6G等の現代無線通信システムにおいて,大規模MIMOは不可欠な技術である。
- 大規模MIMOは,アクティブな盗聴攻撃に脆弱であり,特にパイロット汚染攻撃は深刻な問題となる。
- 本研究は,基地局におけるパイロット汚染攻撃の検出手法を確立し,その有効性を検証することを目指す。
- 決定木を用いた手法は,古典的な尤度比検定よりも優れた検出性能を発揮することが示された。
- 特に,ノイズの多い環境や,悪意のあるユーザが低出力で送信する場合において,その効果が顕著である。
- 決定木は,尤度比検定が要するノイズ電力や信号電力に関する事前知識を必要としない。
雷雨による停電の早期警告:二段階機械学習モデル [cs.LG]目的:雷雨に起因する停電の早期警告モデルの開発
- 電力供給の安定性確保は社会インフラ維持に不可欠であり,自然災害対策が重要である。
- 雷雨による停電予測は,気象状況の不安定性やデータの不完全性により困難である。
- 公開データを用い,停電発生の兆候を捉え,早期警告を実現することを目的とする。
- 二段階モデルは,既存モデルと比較して,より多くの停電ピークを検出し,F1スコアも向上した。
- ピーク発生前後では,予測精度の改善が見られたが,時間帯によっては軽微な低下も確認された。
- SHAP分析により,湿度輸送や風速変化が停電の重要な前兆であることが示唆された。
抑制された擬似ラベル生成:現実的な長尾型半教師あり学習へ [cs.CV, cs.LG]目的:長尾型分布に対する信頼性の高い擬似ラベルの生成と活用
- 機械学習において,ラベル付きデータが不足する状況での性能向上は重要な課題である。
- 既存手法は,ラベルなしデータの分布を仮定しており,現実のデータ分布との乖離が問題となる。
- 未知のデータ分布に対してもロバストな半教師あり学習フレームワークを構築する。
- 提案手法(CPG)は,動的なフィルタリングにより信頼性の高い擬似ラベルを選択的に組み込むことで,既知の分布を維持したラベルデータセットを更新する。
- logit調整に基づいたBayes最適分類器を構築し,より信頼性の高い擬似ラベルの識別を可能にする。
- 複数のベンチマークデータセットにおいて,最先端手法を最大15.97%上回る精度を達成した。
マルチモーダルマルチタスク意味通信:分散情報ボトルネックの視点 [cs.IT, cs.LG, math.IT]目的:マルチモーダルマルチタスク意味通信における効率的な意味伝達
- 通信効率の向上とインテリジェントな通信システムの実現が求められている
- 既存方式では,送信側が全モーダルデータを活用し,受信タスク全てに参加する必要がある
- 物理的制約下での冗長な伝送を抑制し,通信レートと推論品質のトレードオフを最適化する
- 提案手法PoM$^2$-DIBは,分散情報ボトルネック理論を拡張し,最適なモーダル選択を実現する。
- PoM$^2$-DIBは,物理的制約を考慮しながら,タスク参加に必要なモーダルのみを選択する。
- 実験結果から,PoM$^2$-DIBはフル参加型ベースラインと比較して高い推論品質を達成することが示された。
深層における感情の解読:LLMにおける感情の表現,保持,そして表現に関する体系的研究 [cs.AI]目的:LLMにおける感情の内部表現の解明
- 人間との自然な対話を実現するためには,LLMが感情を理解し,適切に表現することが不可欠である。
- LLMが感情を模倣できることは示されているが,その内部メカニズムは未解明な点が多かった。
- LLMが感情をどのように符号化し,保持しているかを明らかにし,より透明で安全なAI開発に貢献する。
- LLMは,モデルの規模が大きくなるにつれて,明確に定義された感情の内部幾何学を発展させていることが示された。
- 感情信号は最終層でのみ現れるのではなく,ネットワークの初期段階で出現し,中間層でピークを迎えることが明らかになった。
- LLMの内部状態は変化しやすく,単純なシステムプロンプトによって影響を受ける一方で,初期の感情的なトーンは数百トークンも持続的に検出可能である。