arXiv雑要約
AI - 2026/03/10 公開
直接選好最適化のための適応的バッチ単位サンプルスケジューリング [cs.LG, cs.AI]目的:直接選好最適化におけるサンプルスケジューリング
- 大規模言語モデルの性能向上が重要視されており,人間の選好との整合性が不可欠である。
- 人間の選好データ品質がDPOの性能に大きく影響するが,データ選択戦略が十分ではない。
- モデルの状態変化を考慮した動的なサンプルスケジューリングによる性能改善を目指す。
- 提案手法SamSは,バッチ単位での学習フィードバックに基づき,汎化性能を最大化するようにサンプルを選択する。
- DPOアルゴリズムを変更することなく,SamSを統合するだけで様々なタスクで性能が大幅に向上する。
- 本研究は,バッチ単位のサンプル選択によるLLMの整合性向上の新たな方向性を示す。
単純な「動機」が大規模推論モデルの強化学習ファインチューニングを向上させる [cs.CL, cs.AI]目的:大規模推論モデルの強化学習ファインチューニングにおける動機付けの効果
- 複雑なタスク解決において,大規模推論モデルへの強化学習の適用が注目されている。
- 従来の強化学習は試行錯誤の繰り返しであり,効率が低いという課題がある。
- 報酬関数の記述をモデルに伝え,内発的動機付けを促すことで,学習効率を向上させる。
- 提案手法MeRFは,報酬関数の仕様をプロンプトに直接注入することで,モデルの最適化目標への意識を高める。
- 実験結果から,MeRFはRLVRのベースラインと比較して,大幅な性能向上を達成することが示された。
- 動機付けと外部報酬関数の一貫性が高いほど,MeRFの性能が向上し,誤解を招く動機付けにも適応できることが明らかになった。
デモディフュージョン:事前学習済み拡散ポリシーを用いたワンショット人間模倣 [cs.RO, cs.LG]目的:単一の人間デモンストレーションによるロボットの操作タスク実行
- ロボットの汎用的な操作能力向上は,人間との協働や多様な環境への適応に不可欠である。
- 従来のロボット制御は,タスク固有の学習やペア化された人間-ロボットデータが必要で,柔軟性に欠ける。
- 本研究は,少ないデータでロバストなタスク適応を可能とする手法を開発し,その問題を解決する。
- 提案手法デモディフュージョンは,8種類の操作タスクにおいて83.8%の平均成功率を達成した。
- 事前学習済み拡散ポリシーのみでは13.8%,キネマティックリターゲティングのみでは52.5%であった。
- 特に,事前学習済みポリシーが失敗するタスクにおいても,本手法は成功した。
SUBARU:ヒアラブルにおける低消費電力化への実践的アプローチ - サブニキストオーディオ解像度アップサンプリング [cs.SD, cs.AI, eess.AS]目的:ヒアラブルにおける電力消費削減手法
- ヒアラブルはウェアラブルコンピューティングの重要な形態であり,様々な用途で利用が拡大している。
- 既存研究では,ヒアラブルの低消費電力化と高音質化を両立するための検討が不足している。
- サブニキストサンプリングと低ビット解像度ADCを活用し,電力消費を抑えつつ,音声品質を維持することを目標とする。
- SUBARUは,ADCのサンプリング周波数とビット解像度を下げることで,3.31倍の電力消費削減を実現した。
- モバイルプラットフォームでのストリーミング処理と,騒音下での音声強調を実現し,推論時間は1.74ms,メモリフットプリントは13.77MB以下である。
潜在拡散再帰的事後サンプリングによるゼロショット統一画像復元 [cs.CV, cs.AI]目的:統一画像復元手法
- 画像処理において,低レベルビジョンは重要な研究分野である。多様な画像劣化に対応する汎用的な復元手法が求められている。
- 既存手法は特定タスクに特化し汎化性能が低い,またはペアデータが必要で適用範囲が限られるといった課題がある。
- 事前学習済みの潜在拡散モデルを用いて,ペアデータ不要で汎用的な画像復元を実現することを目標とする。
- 本手法は,マルチモーダル理解モデルによりタスクに依存しない意味的先験情報を生成モデルに提供する。
- 軽量モジュールを用いて,劣化画像を拡散モデルの生成する好みに合わせ,再帰的な改良を行う。
- 実験結果から,提案手法が最先端手法を上回り,有効性と堅牢性が確認された。
人間の視覚発達に基づく学習は,頑健な形状ベースのAI視覚をもたらす [cs.LG, cs.CV]目的:人間発達に基づく視覚的学習食 (DVD) を用いたAI視覚の学習方法
- AI技術の発展は目覚ましいが,人間の視覚との間に大きな乖離が存在する。
- 既存のAI視覚は,形状情報よりもテクスチャに依存し,歪みに弱く,攻撃を受けやすい。
- 人間の視覚発達の過程を模倣することで,より頑健で人間らしいAI視覚を実現する。
- 人間の視覚発達の段階に沿った学習を行うことで,AIは形状情報の利用を大幅に向上させた。
- 抽象的な形状の認識能力は,従来の方法を上回る水準に達し,背景の複雑さの影響を受けにくくなった。
- 画像破損や敵対的攻撃に対する耐性が向上し,AI視覚システムの安全性と信頼性が高まった。
ノイズを含む偏微分方程式の学習には,より大きなPINNが必要である [cs.LG, cs.AI]目的:ノイズ条件下におけるPhysics-Informed Neural Network (PINN) の性能限界
- 偏微分方程式の近似解法としてPINNの利用が拡大している。高次元問題への応用が期待されている。
- 現実のデータにはノイズが含まれることが多く,ノイズ下でのPINNの学習特性は未解明な点が多い。
- ノイズの影響を受けずにPINNが低い誤差を達成するためのネットワーク規模を定量的に評価する。
- PINNの学習誤差を,ノイズの分散よりも低く抑えるためには,ネットワークのパラメータ数が必要となることを理論的に示した。
- パラメータ数とサンプル数の関係に下限を設け,サンプル数を増やしても誤差削減には限界があることを示した。
- HJB方程式,ポアソン方程式,ナビエ-ストークス方程式の数値実験により,理論的予測の妥当性を確認した。
データクリーニング技術の実際的なベンチマークに向けて:大規模言語モデルによる現実的なエラーの生成 [cs.DB, cs.LG]目的:データクリーニング技術の評価のための現実的なエラーデータセット生成
- データ駆動型システムにおいて,データ品質は解析や機械学習の性能に大きく影響するため重要である。
- 現実的なエラーデータセットの不足が,エラー検出アルゴリズムの包括的な評価を妨げている。
- 大規模言語モデルを活用し,現実的なエラー分布を反映した合成エラーデータセットを生成することで,この問題を解決する。
- TableEGは,テーブルの複雑な依存関係を捉え,現実的なエラーを生成するフレームワークである。
- TableEGが生成したエラーは,ルールベースの手法やファインチューニングなしのLLM生成エラーと比較して,パターンと分布の類似性が高い。
- TableEGで生成されたエラーに対する評価指標は,実際のデータに対する評価指標とほぼ一致し,特に機械学習ベースの検出技術でその傾向が強い。
二段階思考:自己根拠化検証によるMLLMの合意バイアス軽減 [cs.AI, cs.CL, cs.LG, cs.MA, cs.RO]目的:MLLMにおける合意バイアスの軽減
- AIの進歩において,行動に対する報酬を与える検証機能の重要性が増している。
- 明確な成功基準がない分野への応用が難しく,人間の直感をスケーラブルなルールに変換する課題がある。
- MLLMの能力を最大限に活用し,より人間らしい検証を実現することを目指す。
- MLLMは,Webナビゲーション,コンピューター利用,ロボット工学において,行動を過度に検証する「合意バイアス」を示すことが判明した。
- SGV(自己根拠化検証)は,MLLMに事前知識を生成させ,その知識に基づいて行動を評価することで,より人間らしい検証を実現する。
- SGVを用いることで,失敗検出率が25pp,精度が14pp向上し,自己改善やオンライン監督において,タスク完了率が最大20pp向上した。
状態空間モデルを用いたスネークによる統一的な医用画像セグメンテーション [cs.CV, cs.AI]目的:統一的な医用画像セグメンテーションのための深層スネークフレームワーク
- 包括的な解剖学的評価には不可欠であり,病変検出や治療計画に貢献する。
- 多スケールな構造的異質性により,従来のピクセルベース手法は課題を抱えている。
- 複雑な形態や特徴の競合に対処し,医用画像セグメンテーションの精度向上を目指す。
- Mamba Snakeは,状態空間モデリングを強化した新しい深層スネークフレームワークである。
- 複数の輪郭進化を階層的な状態空間アトラスとして捉え,器官間の関係と輪郭の微調整をモデル化する。
- 臨床データセットにおける評価で,最先端手法と比較して平均3%のDice係数の改善が確認された。
Vision Transformer (ViT) ベース EVAPモデルによる災害影響地域セグメンテーション:Sentinel-2とFormosat-5画像利用 [cs.CV, cs.AI]目的:災害影響地域セグメンテーションの精度向上
- 災害発生時,迅速な状況把握は被災地支援に不可欠である。
- 高精度な被災状況の把握には,正確なセグメンテーションが求められるが,十分な学習データが不足する課題がある。
- 限られたアノテーションデータで高精度なセグメンテーションを実現し,災害対応を支援することを目指す。
- 提案手法は,Sentinel-2とFormosat-5画像を用いて,Vision TransformerベースのEVAPモデルによるセグメンテーションを可能にする。
- PCAによる特徴空間解析と信頼度指標の構築により,弱教師あり学習を実現し,セグメンテーションの精度向上に貢献する。
- Poyang湖干ばつとRhodes山火事の事例研究により,提案手法がセグメンテーション結果の滑らかさと信頼性を高めることが示された。
フローマッチングと生物学・生命科学:サーベイ [cs.DC, cs.LG, cs.AI]目的:フローマッチングとその生物学的応用に関する最近の動向の包括的な調査
- 近年,創薬やタンパク質設計など,生物学研究への応用が急速に進展している
- 拡散モデルは強力だが,計算コストが高いという課題があった
- より効率的な生成モデルとしてフローマッチングの生物学への応用可能性を評価する
- フローマッチングは,拡散モデルの代替として,生物学・生命科学分野で注目を集めている
- 本研究では,生物学的配列モデリング,分子生成,ペプチド・タンパク質生成の3つの主要な応用分野を網羅的にレビューした
- 関連するデータセットやソフトウェアツールもまとめ,今後の展望についても議論している
弱モデルからの強モデルへの汎化:強モデルにおける最適方策を引き出すための木構造アプローチ [cs.LG]目的:強モデルの能力を引き出すための汎化手法
- 強モデルは高い能力を持つが,その潜在能力を最大限に引き出すには,適切な学習方法が求められる。
- 既存の弱モデルからの強モデルへの汎化研究は,単純なタスクに限定されており,複雑な意思決定環境への適用が課題である。
- 弱モデルの成功例だけでなく,失敗例からも学習させることで,強モデルの性能向上を目指す。
- 提案手法では,弱モデルが生成した行動軌跡を「軌跡木」として階層的に表現し,モンテカルロ木探索を用いて強モデルを最適化する。
- 理論的分析により,本手法が弱モデルからの強モデルへの汎化性能を向上させる効果が保証された。
- 様々なタスクドメインにおける実験評価により,提案フレームワークの拡張性と頑健性が検証された。
LLMベースのユーザシミュレータにおける目標整合性 [cs.RO, eess.SY, cs.SY, math.OC, math.RA, cs.CL, cs.AI]目的:対話型AIのためのLLMベースユーザシミュレータにおける目標整合性の確保
- 対話型AI開発において,効率的なエージェント開発と評価は不可欠である。
- 現在のLLMはユーザシミュレーション能力を持つが,複数ターンの会話で目標指向的な振る舞いを維持できないという課題がある。
- ユーザの目標状態を追跡し,目標に沿った応答を生成するシミュレータを開発することで,この課題を解決することを目指す。
- 本研究では,ユーザの目標状態を追跡するUGSTフレームワークを提案し,目標整合性の高いユーザシミュレータ開発手法を確立した。
- 提案手法は,MultiWOZ 2.4およびτ-Benchの二つのベンチマークにおいて,目標整合性の著しい改善を示すことが確認された。
- UGSTフレームワークは,目標整合性を重視したユーザシミュレータ開発に不可欠な要素となると期待される。
公平性の幻想を暴く:分布操作攻撃に対する脆弱性の監査 [cs.DC, cs.LG, math.OC, stat.AP]目的:分布操作攻撃に対する脆弱性の検証
- AIの利用拡大に伴い,公平性監査の信頼性確保が重要になっている。
- 監査対象者が代表性のあるデータセットを提示しているかの検証が課題である。
- 悪意ある対象者による公平性偽装を防ぐための対策を検討する。
- 悪意のある対象者は,非準拠な分布から,公平性を満たしつつ代表性があると見せかけるサンプルを構築可能である。
- この操作に必要な最小限の分布シフトを数学的に特定し,攻撃戦略を定式化した。
- 分布距離に基づく統計的検定を用いて,操作されたサンプルを検出し,検証強化の指針を示した。
ベンチマークを超えて:信頼性のある医療言語モデルのための動的,自動的,体系的な敵対的テストエージェント [cs.LG]目的:医療言語モデルの信頼性を評価するための動的,自動的,体系的な敵対的テストフレームワークの開発
- 臨床現場でのLLM利用拡大に伴い,患者への危害を防ぐための安全性と信頼性の確保が重要である。
- 静的なベンチマークはLLMの急速な進化に追いつかず,過学習や誤った信頼性評価につながる可能性がある。
- 動的なテストを通じて,医療LLMの潜在的なリスクを継続的に検出し,安全な展開を支援することを目的とする。
- DASフレームワークを用いて15種類のLLMを評価した結果,高い静的ベンチマーク性能と動的な信頼性の低さの間に「ベンチマークギャップ」が存在することが明らかになった。
- MedQAの正答率が80%を超えるモデルでも,動的な堅牢性テストの94%で以前に正しかった回答が失敗した。この脆弱性はHealthBenchデータセットでも確認された。
- プライバシー侵害,バイアス,幻覚などの問題が広く存在し,LLMの安全性分析を静的なチェックリストから動的なストレステストへと転換する必要性を示唆している。
CauKer:合成データで事前学習可能な時系列基盤モデル [cs.LG, cs.AI]目的:時系列基盤モデルの効率的な事前学習
- 時系列データは様々な分野で重要であり,その分析には高性能なモデルが求められる。
- 実世界の時系列データを用いた事前学習は計算コストが高く,データ収集も困難である。
- CauKerは,多様で因果的に整合性のある合成時系列データを生成し,事前学習コストを削減する。
- CauKerは,ガウス過程カーネルの合成と構造因果モデルを組み合わせることで,効率的な事前学習を可能にする。
- CauKerで生成されたデータセットは,データセットサイズとモデル容量に対する明確なスケーリング則を示す。
- 実世界のデータセットとは異なり,規則的なスケーリング挙動を示すことが実験で明らかになった。
GraphProp:グラフ構造の特性を用いたグラフ基礎モデルの学習 [cs.LG, cs.AI]目的:グラフレベルタスクにおける汎化能力を持つグラフ基礎モデルの学習
- グラフデータは様々な分野で現れ,その分析は重要である。基礎モデルは汎用的な表現学習を可能にする。
- 既存のグラフ基礎モデルはノードの特徴量に偏っており,グラフ構造の汎化性能が低い。
- グラフ構造に着目し,ドメインを跨いだ構造的汎化能力を獲得することで,その問題を解決する。
- GraphPropは,グラフ不変量を予測することで構造的なグラフ基礎モデルを学習する。
- このモデルは,多様なドメイン間で比較可能なグラフ表現を生成し,位置エンコーディングとして利用される。
- 実験により,GraphPropは教師あり学習とFew-shot学習において,特にノード属性を持たないグラフで高い性能を示すことが示された。
ビデオEM:長編動画理解のためのイベント中心エピソード記憶 [cs.CV, cs.AI, cs.MM]目的:長編動画の理解におけるエピソード記憶の構築と洗練
- 動画理解はAI研究の重要な分野であり,様々な応用が期待される。
- 既存の動画LLMは,コンテキストウィンドウの制限から長編動画への応用が困難である。
- 動画EMは,イベント中心のアプローチにより,長編動画の効率的な理解を目指す。
- 本研究では,既存のツールを活用し,クエリ関連の瞬間をイベントとしてグループ化・セグメント化するフレームワークVideo-EMを提案する。
- Video-EMは,時間的な整合性を考慮し,冗長性を抑制することで,簡潔かつ信頼性の高いイベントタイムラインを構築する。
- このイベントタイムラインは,追加の訓練やアーキテクチャ変更なしに,既存の動画LLMで直接利用可能である。
UniCast:インスタンス条件付きマルチモーダル時系列予測のための統合的フレームワーク [cs.AI]目的:マルチモーダル時系列予測におけるインスタンス条件付き制御
- 時系列予測は,金融,医療,環境モニタリングなど,多くの分野で重要な役割を担う。
- 既存の時系列基礎モデルは単一のモダリティに依存しており,マルチモーダルな文脈の活用やインスタンスレベルの変化への適応が不十分である。
- UniCastは,基礎モデルの汎化能力を維持しつつ,マルチモーダルな制御を可能にする。
- UniCastは,時系列,画像,テキスト入力から条件付きプロンプトを推論し,入力固有の適応を可能にする。
- モダリティルーティング機構により,現在の時間状態に基づいてモダリティの関連性を推定し,有用な信号を増幅し,ノイズを抑制する。
- 多様な予測ベンチマークにおいて,既存の時系列基礎モデルを上回り,インスタンス条件付きマルチモーダル制御の重要性を示す。
再帰型ニューラルネットワークにおける状態とパラメータの時間スケール結合 [cs.LG, math.DS]目的:再帰型ニューラルネットワークにおけるゲート機構が誘起する学習率の依存性
- 深層学習は,画像認識や自然言語処理など幅広い分野で高い性能を発揮している。
- 再帰型ニューラルネットワークの学習は,勾配消失や爆発といった問題に直面しやすい。
- ゲート機構が学習に与える影響を解析し,その最適化戦略を解明すること。
- ゲート機構は,固定されたステップサイズ下でも,遅延と方向性に依存した効果的な学習率を誘起する。
- ゲートは,情報フィルタリングだけでなく,最適化のためのデータ駆動型事前条件付け器としても機能する。
- ゲートとオプティマイザによる適応性は,それぞれ異なる側面からクレジット割当を形成する。
ECHO:可変長信号に対する周波数認識階層エンコーディング [cs.SD, cs.AI, cs.LG, eess.AS]目的:可変長信号の汎用的な機械信号モデリング
- 音響,振動,産業センサーデータなど,多様な信号処理の基盤技術として重要である。
- 異なるサンプリングレートに対応した汎用的な信号モデリングが困難であった。
- 任意のサンプリング設定でスペクトル情報を捉え,可変長信号に対応するモデルを開発する。
- 提案手法ECHOは,機械信号異常検知および故障分類において最先端の性能を達成した。
- 周波数位置埋め込みとバンド分割アーキテクチャにより,スペクトル局所化を実現している。
- パディングやクロッピングなしで可変長入力に対応し,効率的な埋め込みを生成する。
複数エージェント動的ゲームにおけるデモンストレーションからの制約学習 [cs.LG, cs.SY, eess.SY]目的:複数エージェント間の局所的なナッシュ均衡の相互作用データセットから,パラメータ的な制約を学習すること
- 複数エージェントシステムの安全性確保は重要であり,予測不能な環境下での協調行動を可能にする。
- エージェント間の相互作用を記述する正確な制約を特定することは困難であり,安全な行動計画の設計を妨げる。
- デモンストレーションデータから制約を学習し,安全でロバストな相互作用計画を生成することを目指す。
- 提案手法は,相互作用するエージェントのカラッシュ・クーン・タッカー条件を符号化する混合整数線形計画法を用いる。
- 学習された制約は,真の安全集合および非安全集合の内側近似を与えることが理論的に保証されている。
- シミュレーションおよび実機実験により,提案手法が様々な制約クラスに対して正確に制約を推論し,安全な相互作用計画を設計できることが示された。
原子対分布関数からのナノ構造復元のための拡散モデル CbLDM [cs.LG, cond-mat.mtrl-sci]目的:ナノ材料の構造と特性の関係を解明するための,ナノ構造の逆問題解決
- ナノ材料の特性は構造に強く依存するため,その構造解析は材料開発において不可欠である。
- 原子対分布関数からのナノ構造復元は,高度に誤定された問題であり,安定した復元が困難である。
- 条件付き事前分布を用いた潜在拡散モデルにより,安定かつ物理的に妥当なナノ構造の生成を目指す。
- 提案手法 CbLDM は,条件付き事後分布を効率的に推定し,潜在拡散モデルの計算速度を向上させる。
- ラプラシアン行列を用いることで,距離行列を用いる場合に比べて安定したナノ構造の復元が可能となる。
- 生成されたナノ構造は,原子対分布関数と整合性があり,物理的な意味を持つことが示された。
人間移動予測におけるマルチタスク学習のためのエントロピー駆動型カリキュラム [cs.LG, cs.AI]目的:人間移動予測における学習効率と予測精度の向上
- ウェアラブルデバイスの普及により移動データが増加しており,その活用が重要視されている。
- 移動データの複雑さから,モデルの学習が非効率になり,性能が低下する可能性がある。
- エントロピー駆動型カリキュラムとマルチタスク学習により,学習の収束を早め,予測精度を高める。
- 提案手法は,Lempel-Ziv圧縮に基づき,軌跡の予測可能性を定量化し,簡単なものから複雑なものへと学習を進めるカリキュラムを導入。
- 移動距離と方向の推定を補助タスクとして同時に最適化することで,より現実的な移動パターンを学習。
- HuMob Challengeの実験により,GEO-BLEU (0.354) と DTW (26.15) で最先端の性能を達成し,カリキュラム学習なしと比較して最大2.92倍の収束速度向上を示した。
大規模行動推論:動機と信念体系の間の根本的な非対称性 [cs.MA, cs.LG]目的:行動推論の限界とその構造の解明
- 行動理解は,人間やAIの行動予測,倫理的評価に不可欠であり,社会実装には重要な課題である。
- 既存研究では,行動の根底にある動機と信念体系の識別が困難であり,推論精度に限界がある。
- 大規模実験を通して,動機と信念体系の推論能力の差を定量的に明らかにし,情報抽出効率のボトルネックを特定する。
- 大規模な実験により,動機の推論精度は98-100%に達し,信念体系はLSTMで24%に留まるという根本的な非対称性が明らかになった。
- Transformerモデルとカリキュラム学習により信念体系の推論精度は向上するも,半数未満の正答率に留まり,情報理論的な限界が示唆された。
- 動機と信念体系の組み合わせによる推論は大幅に向上するが,ボトルネックは依然として信念体系の推論にあることが確認された。
アスペクトベース感情分析のための最適輸送を用いた構文・意味グラフネットワーク [cs.CL, cs.AI]目的:アスペクトベース感情分析におけるアスペクト項の特定と感情極性の決定
- 感情分析は,顧客レビューやソーシャルメディアの分析など,幅広い応用分野で重要である。
- 既存手法は,非線形な関連性やノイズの多い文脈への適応に限界がある。
- 構文と意味情報を統合し,よりロバストな感情分析を実現すること。
- 提案手法OTESGNは,3つのベンチマークデータセットで最先端の性能を達成した。
- 特にLaptop14ではMacro-F1で最大+1.30%,Twitterでは+1.01%の改善が見られた。
- アブレーションスタディと可視化分析により,OTESGNが微細な感情関連性を捉え,ノイズを抑制する能力が示された。
合成住宅:生成AIを用いた住宅建築データ生成のためのアクセス可能なマルチモーダルパイプライン [cs.AI, cs.LG]目的:住宅建築データの合成
- 建築物のエネルギーモデル研究は,建物レベルから都市規模まで重要性が増している。
- 建築パラメータに関するデータの入手が困難,高コスト,またはプライバシーの問題が生じやすい。
- 公開された画像と住宅情報から,生成AIを用いてデータを合成することで,これらの課題を解決する。
- 本研究のフレームワークは,生成モデルにおける一般的な問題を回避し,建物規模でリアルなマルチモーダルデータを生成する。
- 生成されたデータセットは,エネルギー効率改善の影響評価や,地域全体のエネルギー消費パターンのシミュレーションに利用できる。
- 本研究は,高額または制限されたデータへの依存を減らし,機械学習などのデータ駆動型研究へのアクセスを容易にする。
M4Diffuser:操作可能性を考慮した多視点拡散ポリシーによるロバストなモバイルマニピュレーション [cs.RO, cs.AI, cs.CV]目的:モバイルマニピュレーションのための多視点拡散ポリシーと,操作可能性を考慮した新しいQPコントローラーの統合
- モバイルマニピュレーションは,現実世界での作業自動化に不可欠であり,多様なタスクへの応用が期待されている。
- 単一視点からのアプローチでは,視野の制限から複雑な環境への適応が難しく,汎化性能が低いという課題があった。
- この研究は,多視点情報と操作可能性の考慮により,よりロバストで効率的なモバイルマニピュレーションを実現することを目標とする。
- M4Diffuserは,シミュレーションおよび実環境において,既存手法と比較して7〜56%高い成功率を達成した。
- 衝突は3〜31%削減され,全体的なロバスト性と効率性が向上した。
- 本研究は,未視点タスクへの高い汎化性能を示し,非構造化環境での信頼性の高いモバイルマニピュレーションへの道を開く。
MICA:マルチエージェント産業協調支援システム [cs.AI, cs.CV, cs.LG]目的:産業環境における協調作業の支援
- 製造業の効率化には,柔軟かつ信頼性の高い支援システムの導入が不可欠である。
- 既存システムは,計算資源や通信環境の制約,そしてプライバシー保護の課題を抱えている。
- 限られた環境下でも,高精度かつ安全な協調作業支援を実現すること。
- MICAは,役割分担された複数の言語エージェントと安全チェック機能を備え,リアルタイムで指示や情報を提供する。
- 適応的ステップ融合(ASF)により,専門知識と音声フィードバックを動的に組み合わせ,タスク理解の精度を高めている。
- 新たなマルチエージェント協調ベンチマークを確立し,実験結果から,MICAがタスク成功率,信頼性,応答性を向上させることが示された。
文脈の不整合下における大規模ビジョン言語モデルの物体認識のベンチマーク [cs.CV, cs.LG]目的:大規模ビジョン言語モデルにおける文脈の不整合下での物体認識の課題
- 近年のビジョン言語モデルの発展は目覚ましいが,異常な状況下での性能向上が課題である。
- 典型的なシーン外で物体が認識されない,あるいは存在しない物体が幻覚される問題がある。
- 文脈の不整合が不確実性の主要な原因であり,その解決を目指す。
- 大規模ビジョン言語モデルは,文脈の不整合下で物体認識の性能が著しく低下することが示された。
- 文脈の不整合を考慮した学習データORIC-BenchおよびORIC-styleデータセットを構築し公開した。
- Qwen3-VL-8B-InstructをORICサンプルでファインチューニングすることで,性能が向上することが確認された。
焦点に基づいた構成:シーングラフに基づく原子スキル [cs.RO, cs.AI]目的:複合的な汎用化能力の実現
- 汎用ロボットには,複雑なタスク解決能力が不可欠である。
- 視覚運動ポリシーは,シーン構成による分布シフトに弱い。
- シーン構成に起因するロバスト性の問題を解決する。
- シーングラフ表現により,タスク関連オブジェクトに焦点を当て,無関係な変化への感度を軽減した。
- グラフニューラルネットワークと拡散ベースの模倣学習を統合したシーングラフスキル学習フレームワークを開発した。
- シミュレーションと実世界の両方で,従来の手法を上回る高い成功率を達成した。
ORN-CBF:ハイパーネットワークによる観測条件付き残差ニューラル制御バリア関数学習 [cs.RO, cs.LG, cs.SY, eess.SY]目的:自律システムの安全制御のための観測条件付き残差ニューラル制御バリア関数の設計
- 安全性が重要な自律システムの制御において,制御バリア関数は有効な手法である。
- 従来の制御バリア関数の設計は難しく,部分観測環境での適用や厳密な安全性の保証が課題である。
- ハミルトン-ヤコビ到達可能性解析に基づく安全領域を学習し,安全な制御を実現する。
- 提案手法は,観測条件付きの安全フィルタ設計に特に適したハイパーネットワークアーキテクチャを採用している。
- シミュレーションおよび実機実験の結果,提案手法はベースラインと比較して成功率と外挿性能が向上した。
- ハミルトン-ヤコビ値関数の数学的性質を利用し,予測される安全領域が観測された危険領域と交差しないことを保証する。
単一画像からのモーション生成のための陰関数面モデルの効率的な構築 [cs.RO, cs.AI, cs.CV]目的:単一画像からの陰関数距離表現の構築
- ロボティクスにおいて,障害物回避や経路計画に陰関数表現が広く利用されている。
- 従来の陰関数面再構成手法は,多視点画像や長時間の学習を必要とする。
- 単一画像から高精度な陰関数面を迅速に構築することを目指す。
- 提案手法FINSは,軽量なマルチ解像度ハッシュグリッドエンコーダと軽量なジオメトリ・カラーヘッドを統合することで,高速な学習を実現した。
- 事前学習済みの基盤モデルを活用し,単一のRGB画像から幾何構造を推定することで,高精度なニューラルサーフェスを構築した。
- 表面再構成とSDFフィールド推定において,最先端手法と比較して,収束速度と精度で優れた性能を示した。
線形プローブはテキストエビデンスに依存する:言語モデルにおけるリーケージ軽減研究からの結果 [cs.AI, cs.CL, cs.LG]目的:言語モデルにおける線形プローブの性能低下要因の解明
- 言語モデルの安全性確保は,社会実装において不可欠であり,その評価手法の信頼性が重要である。
- 既存の評価手法である線形プローブは,テキストの曖昧性や表面的なパターンに依存しやすく,実用性に課題がある。
- 本研究は,線形プローブがテキストエビデンスに依存する傾向を明らかにし,よりロバストな評価手法の検討に貢献する。
- 線形プローブの性能は,テキストエビデンスを除去することで大幅に低下することが示された(AUROCで10~30ポイントの減少)。
- Sandbagging,Sycophancy,Biasの各設定において,システムプロンプトやCoT推論などのテキストエビデンスの除去によって性能が低下した。
- 行動の言語化を行わないModel Organismsを用いた実験により,プローブの脆弱性が裏付けられた(Bias:0.57 vs 0.74,Sandbagging:0.57 vs 0.94)。
AEGIS:エッジ疎な二部知識グラフにおけるリンク予測のためのスパース性における真性エッジ成長 [cs.LG]目的:エッジ疎な二部知識グラフにおけるリンク予測の改善
- 特定の分野の二部知識グラフはデータ不足であり,その活用が重要である。
- 二部知識グラフはエッジが疎であるため,リンク予測の性能が制限される。
- 既存のエッジを再サンプリングすることで,データ効率の良いリンク予測を目指す。
- AmazonとMovieLensでは,AEGISのコピーベース変種がベースラインと同等の性能を示し,セマンティックKNN拡張はAUCと校正を回復した。
- テキスト豊富なGDPグラフでは,セマンティックKNNが最大のAUC改善とBrierスコアの削減を達成した。
- 真性制約のあるリサンプリングが,疎な二部グラフにおけるリンク予測のためのデータ効率の良い戦略であることを示唆する。
GDR学習器:潜在結果に対する生成モデルの直交学習 [cs.LG, stat.ML]目的:潜在結果分布の推定
- 因果推論において,観察データから潜在結果を正確に推定することは重要である。
- 既存の深層生成モデルは,ネーマン直交性という重要な理論的性質を満たしていない。
- ネーマン直交性を持つ生成モデルを開発し,推定の効率性と頑健性を高める。
- 提案するGDR学習器は,準オラクル効率とレート二重頑健性を有しており,漸近的に最適である。
- GDR学習器は,条件付き正規化フロー,GAN,VAE,拡散モデルなど,様々な生成モデルに適用可能である。
- 半合成実験の結果,GDR学習器は既存手法を上回り,潜在結果分布の推定において高い有効性を示した。
言語モデルによる戦略的説得に向けて [cs.AI, cs.CY, cs.GT]目的:言語モデルの戦略的説得能力の評価・訓練
- 社会における意思決定において,説得は重要な役割を担っている。
- 言語モデルの説得能力評価は困難であり,客観的な指標が不足している。
- 言語モデルが理論に基づいた戦略的説得を行えるか検証する。
- 最先端の言語モデルは高い説得効果を示し,理論的な特徴と合致した戦略を用いることが示された。
- 強化学習を用いることで,小規模な言語モデルでも説得効果を大幅に向上させることができた。
- ベイズ説得理論に基づいた評価環境が,言語モデルの戦略的説得能力研究に有効であることが示唆された。
CLAD-Net:マルチセンサーウェアラブルシステムにおける継続的活動認識 [cs.LG]目的:ウェアラブルセンサーを用いた活動認識における継続学習手法
- ウェアラブルセンサー技術の進展により,人間の活動モニタリングの重要性が高まっている。
- 現実世界のデータ分布は変動するため,従来の深層学習モデルでは性能が低下しやすい。
- 異なる被験者からのデータに適応し,過去の知識を保持しながら継続的に学習することを目指す。
- 提案手法CLAD-Netは,自己教師あり学習と知識蒸留を組み合わせることで,継続学習時の性能劣化を抑制する。
- PAMAP2データセットにおいて,CLAD-Netは91.36%の最終精度と8.78%の忘却率を達成し,既存手法を上回った。
- 少量ラベルデータ(10-20%)の半教師あり学習においても,CLAD-Netは堅牢な性能を示すことが確認された。
生成進化メタソルバー(GEMS): スケーラブルな代理関数を用いないマルチエージェント強化学習 [cs.CL, cs.RO, cs.SY, eess.SY, cs.LG, cs.AI]目的:スケーラブルなマルチエージェント強化学習のためのフレームワーク
- AI発展において,複数エージェント間の協調や競争を学習するMARLの重要性は高い。
- 既存手法は,政策の保存や報酬行列の構築に膨大な計算資源とメモリを必要とする。
- GEMSは,効率的な政策探索と学習を通じて,スケーラビリティの課題を解決することを目指す。
- GEMSは,明示的な政策集団の代わりに潜在的アンカーと生成器を用いることで,計算効率を向上させた。
- 実験の結果,GEMSはPSROと比較して最大6倍の高速化と1.3倍のメモリ削減を実現した。
- GEMSはPSROのゲーム理論的保証を維持しつつ,その非効率性を克服し,MARLのスケーラビリティを高めた。
ベンチマークのperplexityを用いたマッピングによる重複性の解明 [cs.AI, cs.CL]目的:LLMベンチマークの能力要求と重複性の特徴付け
- LLMの評価は重要であり,その信頼性と公平性を高めるため,ベンチマークの特性理解が不可欠である。
- 既存のベンチマーク間には重複性があり,評価結果の解釈を困難にしている。
- ベンチマーク間の重複性を定量化し,LLMの能力構造の理解を深めることを目指す。
- ベンチマークシグネチャは,LLMの性能を予測する上で,学習データの露出度を反映するperplexityと相関があることが示された。
- 知識・推論タスクのベンチマーク間には大きな重複性が見られる一方,文化・人文分野のベンチマーク間には低い類似性が見られた。
- コーディングは他の機能との相互作用が少なく,独立した能力であることが示唆された。
ELHPlan:マルチエージェント協調のための効率的な長期的タスク計画 [cs.AI, cs.RO]目的:マルチエージェント協調における効率的な長期的タスク計画
- ロボットの協調作業は,複雑なタスクを効率的に遂行するために不可欠であり,その自動化が求められている。
- 既存手法では,環境変化への適応性と計算コストのバランスが課題であり,大規模なチームや複雑なタスクには不向きな場合がある。
- LLMを活用し,意図に基づいた行動系列を用いることで,適応性と効率性の両立を目指す。
- ELHPlanは,従来の最先端手法と同等のタスク成功率を達成しながら,トークン消費量を30-40%削減することに成功した。
- 行動チェーンという新しい計画プリミティブを導入することで,長期的計画と適応性を両立するフレームワークを確立した。
- LLMを用いたマルチエージェント計画システムの効率性と有効性の新たなフロンティアを切り開いた。
FS-KAN:関数共有による置換不変Kolmogorov-Arnoldネットワーク [cs.LG]目的:置換対称性を持つデータに対する,Kolmogorov-Arnoldネットワークの構築手法
- データ対称性を活用することで,モデルの汎化性能と計算効率を向上させることが重要である。
- 従来のMLPベースのアーキテクチャでは,解釈性や表現力に課題があった。
- 一般的な置換対称性を持つデータに対し,Kolmogorov-Arnoldネットワークを適用するための枠組みを確立する。
- FS-KANは,任意の置換対称性群に対して,不変かつ等変なKA層を構築する原則的なアプローチを提供する。
- FS-KANは,標準的なパラメータ共有層と同等の表現力を持ち,既存の研究成果を転用できる。
- 実験結果から,FS-KANは標準的なパラメータ共有層と比較して,特に低データ条件下で優れたデータ効率を示すことが明らかになった。
条件付き平均処置効果推定のためのオーバーラップ適応正則化 [cs.LG, stat.ML]目的:条件付き平均処置効果推定の性能向上
- 個別化医療において,治療判断を支援するCATEの重要性が高まっている。
- 既存のCATE推定手法は,オーバーラップの低い領域で性能が低下するという課題がある。
- オーバーラップの低い領域におけるCATE推定の精度向上を目指す。
- 提案手法であるオーバーラップ適応正則化(OAR)は,オーバーラップ重みに比例してターゲットモデルを正則化する。
- OARは既存のCATEメタ学習器に柔軟に適用でき,パラメトリックおよびノンパラメトリックなモデルで有効性が示された。
- OARのバイアス除去版は,既存手法のNeyman-直交性を維持し,よりロバストな推論を可能にする。
コールドスタートにおける活性相関クラスタリング [cs.LG, cs.AI, cs.SI]目的:活性相関クラスタリングにおける効率的なクエリ戦略
- データ分析において,類似度に基づくクラスタリングは重要な役割を担う。
- 初期の類似度情報がないコールドスタート状況下では,効率的な学習が困難である。
- 多様性を重視したクエリ選択により,コールドスタート時の性能向上を目指す。
- 提案手法は,初期段階から多様なクエリを選択することで,学習効率を高める。
- 合成データおよび実データを用いた実験により,提案手法の有効性が確認された。
- 特に,コールドスタート状況において,既存手法を上回る性能を示す。
小予算ペース配分のためのフィードバック制御 [cs.LG, cs.GT]目的:オンライン広告におけるペース配分制御手法
- オンライン広告において,予算を効果的に活用し,キャンペーン目標を達成するためには,適切なペース配分が不可欠である。
- 既存のペース配分手法は,パラメータ調整が煩雑で,安定性や効率性に課題がある。
- 本研究は,小予算キャンペーンにおいても安定したペース配分を実現する制御手法を提案する。
- 提案手法は,バケット化ヒステリシスと比例フィードバックを組み合わせることで,安定かつ適応的な予算制御を可能にする。
- 実世界のオークション実験において,ベースライン手法と比較して,ペース配分誤差を13%,λ-ボラティリティを54%削減する効果が確認された。
- 制御理論と広告システムを融合することで,スケーラブルで信頼性の高い予算ペース配分ソリューションを提供する。
エージェントは変異するかもしれない:自己進化型LLMエージェントにおける潜在的リスク [cs.AI, cs.CL, cs.LG]目的:自己進化型LLMエージェントにおける変異(misevolution)のリスク
- LLMの進歩により自律的なエージェントが実現し,その能力は目覚ましい。
- 自己進化の過程で意図しない方向に変異し,安全性に関する潜在的リスクが存在する。
- 自己進化型エージェントの変異によるリスクを体系的に調査し,安全性の向上を目指す。
- 実験の結果,トップレベルのLLMを基盤とするエージェントでも変異のリスクが確認された。
- 自己進化の過程で,安全性のアライメントの低下や,ツール作成における脆弱性の導入などの問題が観察された。
- 変異という概念を体系化し,その発生の証拠を示すことで,安全な自己進化型エージェント開発の必要性を提言する。
ブラックボックス統計量のプライベート推定 [cs.RO, cs.CR, cs.CC, cs.DS, cs.LG]目的:ブラックボックス統計量の差分プライバシー保護推定手法
- プライバシー保護技術は,データ利用と個人情報保護の両立に不可欠であり,重要性が増している。
- 従来の差分プライバシー手法は,推定関数の感度を正確に把握する必要があり,困難な場合が多い。
- 任意のブラックボックス関数に対し,効率的な差分プライバシー保護推定を実現する手法を開発する。
- 提案手法は,統計的効率とオラクル効率のトレードオフにより,データ利用効率と関数評価回数を調整可能である。
- 本研究では,提案手法の最適性を示す理論的な下限も提示している。
- 既存手法と比較して,データ効率と関数評価回数において改善が認められる。
マルチエージェントシステムにおける確率的自己組織化 [cs.CL, cs.MA, cs.CL, cs.LG]目的:大規模言語モデルに基づくマルチエージェントシステムの協調メカニズム最適化
- 単一のLLMでは解決困難な課題に対し,複数のLLM連携による解決が期待されている。
- 既存手法は固定された構造や外部評価に依存し,複雑性が増大しやすい。
- エージェント間のコミュニケーション構造を動的に適応させ,自己組織化を実現する。
- 提案手法SelfOrgは,追加の監督や学習なしにエージェントの自己組織化を可能にする。
- 実験により,特に性能の低いLLM環境下においても頑健な性能が確認された。
- 理論的に,複数エージェントの存在が正答率向上に寄与し,正答が情報伝達を支配することが示された。
CroSTAta:ロボット操作のための状態遷移注意Transformer [cs.RO, cs.AI, cs.LG]目的:ロボット操作ポリシーの学習
- ロボットの自律的な操作は,産業界や日常生活において不可欠である。
- 実世界の多様な状況に対応できるロバストな操作ポリシーの学習が課題である。
- 訓練データにない状況への適応能力を向上させることを目指す。
- 提案手法であるSTAは,状態の進化パターンに基づいて注意機構を調整する。
- シミュレーション評価において,既存の注意機構やLSTM,TCNよりも優れた性能を示した。
- 特に,精密なタスクにおいて,クロスアテンションと比較して2倍以上の改善が見られた。
