arXiv雑要約
AI - 2026/06/15 公開
知識追跡における漂流する識別力の回復:経験ベイズ縮小による項目バイアスの補正 [cs.CL, cs.LG, cs.AI]目的:知識追跡モデルにおける項目バイアスの補正
- 知識追跡は,学習者の知識状態を推定し,個別化された学習を可能にする重要な技術である。
- 既存の知識追跡モデルは,項目ごとの識別力にバイアスが生じやすく,予測精度を低下させる。
- 本研究は,項目固有の識別力バイアスを補正し,知識追跡の性能向上を目指す。
- 提案手法SLCは,ラプラス/IRLS変換とカルマン平滑化器を用いた経験ベイズ縮小により,項目バイアスを効果的に補正する。
- SLCは,4つのデータセット,5つのバックボーン,3つのシードでAUCを向上させ,NLLも3つのデータセットで改善した。
- スパースな項目において,SLCの優位性がより顕著に現れることが示された。
拡散画像編集における条件付けの重要性:反転と注意機構の安定化 [cs.CV, cs.AI]目的:拡散画像編集における反転精度と編集品質の向上
- 画像編集技術は,創造的な表現や実用的な応用において重要な役割を担う
- 既存手法では,反転精度と編集忠実性・背景維持のトレードオフが課題である
- テキスト条件付けの役割を明確にし,安定した反転と注意機構制御を実現する
- テキスト条件付けの精度が拡散過程の安定性に影響し,注意機構の一貫性を高めることが示された
- SimEditは,条件付けの改善とトークンごとの注意制御により,反転の質と編集性能を向上させる
- PIE-Benchを用いた実験により,SimEditが既存手法を上回る性能を示すことが確認された
安全なマルチエージェント強化学習のための契約に基づく構成的シールド [cs.LG, cs.MA]目的:マルチエージェント強化学習における安全な協調の実現
- 複数のエージェントが協調してタスクを達成する場面で,安全性の確保は不可欠である。
- 分散型システムでは,単独のエージェントだけでは全体の安全性を保証できない場合がある。
- 協調によってのみ安全性が担保される行動を,中央集権的な制御なしに実現すること。
- 提案手法では,エージェントが共有する安全性の仕様に基づき,局所的な義務を選択する。
- 選択された義務の組み合わせ全体が安全性を保証し,各エージェントは他のエージェントの義務を前提として行動する。
- 学習時には,報酬を最大化する義務の組み合わせを探索する多腕バンディットを用いることで,安全性を損なわずに最適なチーム行動を実現する。
拡散モデルのデカップルド潜在最適化による全波形反転 [eess.SY, cs.SY, cs.LG]目的:地下速度構造の復元
- 地震探査において,地下構造を正確に把握することは,資源開発や地盤評価等において重要である。
- 全波形反転は不安定な問題であり,現実的な地質構造を再現するのが困難である。
- 拡散事前分布を用いた手法ではデータ忠実性と事前分布の一貫性のバランスが課題となっていた。
- 提案手法DLOは,従来の正則化手法や既存の拡散ベース手法と比較して,クリーン,ノイズ,欠損データ条件下で優れた性能を示す。
- 70x70のOpenFWIモデルで学習した事前分布は,MarmousiやOverthrustベンチマークに直接適用可能である。
- DLOは複雑な断層構造を復元し,初期値のスムージングや測定ノイズに対して堅牢である。
動的音源のための時空間オーディオ言語モデル [cs.SD, cs.AI, cs.CL]目的:動的音源に関する時空間オーディオ質問応答
- 音響イベント理解は,ロボット工学や自動運転など,様々な分野で重要性を増している。
- 既存のモデルは,音響イベントの空間的・時間的な情報を十分に活用できていない。
- 音源の識別,位置,動きに関する質問応答を可能にするモデルの構築を目指す。
- 本研究では,時空間オーディオ質問応答データセットST-AudioQAを構築した。
- 提案するST-Audio Encoderは,音響イベントの意味と軌跡を同時に学習する。
- 実験により,提案手法が既存手法よりもセマンティックと位置情報のトレードオフを改善し,高い推論性能を示すことが示された。
大規模言語モデルに基づく生成型推薦における暗黙的推論 [cs.CL, cs.AI]目的:大規模言語モデルを用いた生成型推薦の性能向上
- 推薦システムは情報過多な現代において,ユーザーのニーズに合致した情報を提供する上で不可欠である。
- 大規模言語モデルを推薦システムに活用する際,モデルが事前学習時に未見のアイテムIDを扱うことが課題となっている。
- アイテムIDと自然言語の間のギャップを埋め,効率的かつ効果的な推薦を実現することを目指す。
- PauseRecは,従来の明示的なCoT手法と比較して,最大6.22%高い性能を示す。
- PauseRecは,トレーニングコストを最大65%削減し,推論速度を最大71.3%向上させる。
- PauseRecは,明示的な根拠生成に代わる軽量な選択肢として,より効果的で効率的な大規模言語モデルに基づく生成型推薦を可能にする。
カスケード適応結合器:多層ニューロンネットワークの生物学的に正確なモデルによるオンライン学習 [cs.CL, cs.NE]目的:生物学的に正確な多層ニューロンネットワークモデルによるオンライン学習メカニズム
- 脳神経回路の学習原理は,人工ニューラルネットワークの発展に示唆を与える重要な研究分野である。
- 従来の人工ニューラルネットワークモデルは,生物学的神経回路の複雑さを十分に捉えられていないという課題がある。
- 本研究は,生物学的妥当性と学習効率を両立する新しいニューラルネットワークモデルを提案し,その有効性を示す。
- 提案手法は,効率的なオンライン学習を可能にし,バックプロパゲーションの代替となる実用的な手法を提供する。
- 画像分類タスクにおいて,競争力のある分類性能を達成し,提案手法の潜在能力を示した。
- 本研究は,メカニズム的なニューロンモデルと機械学習を統合する新たなアルゴリズム開発への道を開く。
検証せよ,信頼せよ:事後的敵対的監査とマルチエージェントフィードバックループによる医療における幻覚の軽減 [cs.NI, cs.LG]目的:医療におけるLLMの幻覚軽減策
- 医療分野でのAI活用が進む中,その安全性確保が重要課題となっている。
- LLMは学習データに基づき誤った情報を生成する可能性があり,医療現場での利用に際してはリスクとなる。
- LLMが禁止された薬剤を推奨する誤りを検出し,マルチエージェントシステムでその発生率を低下させる。
- LLMは学習データに存在するパターンに基づき,禁止された薬剤を推奨する傾向が認められた。
- 開発したマルチエージェントアーキテクチャにより,幻覚エラー率を約53%削減できた。
- 本研究は,リアルタイムな規制データをLLMパイプラインに統合し,臨床意思決定を支援する実用的なアプローチを示す。
小規模LLM:剪定とゼロからの学習 [cs.LG, cs.CL]目的:小規模言語モデルの性能向上
- 大規模言語モデルの利用拡大のため,計算資源の少ない環境での活用が重要である。
- 小規模モデルは,性能面で大規模モデルに劣ることが課題である。
- 既存モデルの剪定とゼロからの学習を比較し,効率的なモデル構築を目指す。
- 剪定による初期化は,ランダム初期化よりも一貫して高い性能を示す。
- 訓練トークン数が増加すると,剪定の利点は小さくなる。
- 細粒度の剪定は,トークン予算が限られている場合に特に有効である。
マルチLLMエージェントシステムにおける文脈適応のためのグラフベースターゲット逆伝播 [cs.LG, cs.CL]目的:マルチLLMエージェントシステムにおける文脈適応手法
- 大規模言語モデルの活用が拡大する中,複雑なタスクを遂行するエージェントシステムの性能向上が重要である。
- 既存手法では,複数LLM間の貢献度評価が不正確であり,学習の収束が保証されないという課題がある。
- エージェントワークフローをグラフ構造でモデル化し,ターゲット逆伝播により文脈適応を安定化させることを目指す。
- 提案手法GTBPは,ワークフローグラフを通じて局所的な目標出力を逆伝播させ,目標と出力の差異に基づいて段階的なプロンプト更新を行う。
- 理論的に,GTBPの段階的プロンプト更新は反復ごとに安定化し,高性能なLLMオプティマイザーは全体的な目的関数を減少させることが示された。
- 実験的に,GTBPは3つのベンチマークで強力なベースラインを上回り,計算コストも同程度に抑えられた。
高カバレッジ識別的簡潔ルールセットの学習 [cs.LG, cs.AI]目的:高精度かつ解釈可能な分類ルールセットの構築
- AI研究において,解釈可能性は重要な要素であり,IF-THENルールはその実現に貢献する。
- 既存手法は予測精度を優先する傾向があり,ルールセットのカバレッジや簡潔性といった解釈可能性の指標が不足している。
- カバレッジの保証と,識別力と簡潔性を両立したルールセットの学習を目指す。
- 提案手法CDPRは,サブモジュール最大化に基づき,高いカバレッジと識別力,簡潔性を兼ね備えたルールセットを生成する。
- 実験結果から,CDPRによって学習されたルールセットは,既存手法と比較して高い精度と解釈可能性を示した。
- 平均カバレッジ率は,次善のアルゴリズムと比較して2.5倍以上の改善が確認された。
起原終点フローからの都市アクセスコストの学習:逆最適輸送によるアプローチ [cs.LG, cs.AI]目的:都市におけるアクセスコストの推定
- 都市計画において,住民の行動理解は,公共サービスの効率的な配置に不可欠である。
- 住民のアクセスコストは直接観測できず,その推定が課題となっている。
- 起原終点フローデータから,住民の潜在的なコスト関数を推定し,政策立案に役立てる。
- 学校選択のデータを用いて,距離と補助金の要素を考慮したアクセスコストを推定した。
- 補助金相当距離λ^(k) を算出し,補助金が交通コストに与える影響を定量化した。
- 行政データから得られる指標が,都市計画における補助金設計や施設配置に活用可能であることを示した。
タンパク質-リガンド結合親和性の予測における曲率誘導幾何学的表現 [cs.LG, q-bio.BM]目的:タンパク質-リガンド結合親和性予測の精度向上
- 創薬において,タンパク質とリガンドの結合親和性は重要な指標である。
- 既存手法は,局所的な幾何学的構造と分子間相互作用を同時に捉えきれていない。
- 複雑な結合メカニズムをモデル化し,予測精度と解釈可能性を高める。
- RicciBindは,曲率を考慮した階層構造学習と最適輸送を用いた表現フレームワークである。
- リッチ曲率を用いることで,分子構造内の局所的な相互作用の強さを捉え,構造認識を向上させている。
- PLAベンチマークおよびバーチャルスクリーニングにおいて,既存手法を上回る予測性能を示した。
生体ラマン分光法における機械学習:分光取得から臨床応用へ [cs.LG]目的:生体ラマン分光法パイプラインにおける機械学習の役割の検討
- ラマン分光法は,がん診断や分子分類など,生物学的システムの特徴付けに不可欠である。
- 生体ラマンスペクトルは高次元でノイズが多く,蛍光背景や取得変動の影響を受ける。
- 信頼性の高い計算分析を実現し,臨床応用に向けた課題を克服すること。
- 機械学習は,前処理,信号補正から診断,分子層別化,表現学習まで,ラマン分光法パイプライン全体で活用されている。
- データセットのサイズ,機器間変動,不十分な検証,ソフトウェアの共有不足などが,臨床応用への主な障壁となっている。
- 標準化,説明可能性,実用的な分析フレームワークにより,信頼性の高いラマンAIシステムの開発が期待される。
文脈を考慮したマルチモーダル属性グラフのモダリティ・トポロジー共アラインメント [cs.LG, cs.CV]目的:マルチモーダル属性グラフにおけるタスク適応的な信頼できる文脈とモダリティ保存的なアラインメントの学習
- 現実世界のエンティティをモデル化する上で,グラフ構造と多様な属性(テキスト,画像等)の統合が重要である。
- 既存手法は固定されたグラフ文脈や均一な表現に依存し,タスク固有の要求やモダリティ特有の情報を十分に活かせていない。
- タスクに適応した信頼できる文脈を学習し,モダリティを保持したアラインメントを行うことで,性能向上を目指す。
- 提案手法CoMAGは,マルチモーダルな意味的一貫性からエッジの信頼性を推定し,タスクに応じたゲートを用いて文脈を選択する。
- モダリティ特有の多段トラジェクトリを維持し,モダリティ間でのホップトークンをマッチングさせることで,共有表現と固有表現を分離する。
- 9つのOpenMAGデータセットでの実験により,グラフレベル予測,モダリティマッチング,グラフ条件付き生成の全てにおいて,CoMAGが最先端の性能を示すことが確認された。
VeriGeo:数値と解析による検証を用いた制御可能な幾何問題生成 [cs.AI]目的:制御可能な幾何問題生成フレームワーク
- AI支援教育やマルチモーダル数学推論への応用が期待され,幾何問題の自動生成の重要性が増している。
- 問題文,図,制約,解が相互に整合している必要があるため,信頼性の高い生成が困難である。
- ユーザー指定の制約を満たしつつ,整合性の高い幾何問題を生成することを目的とする。
- VeriGeoは,実行可能な推論トレースに基づき,問題と図を生成し,解を導出する。
- 3段階のパイプラインにより,数値的一貫性,解析的実現可能性,全体的な整合性を検証し,修正可能な失敗を回復する。
- 生成されたデータで教師ありファインチューニングを行うことで,GeoQAの性能が向上し,PGPS9KやMathVista-GPSでも良好な結果が得られた。
PINNとFEMソルバーのロビン・ノイマン結合:ステクロフ・ポアンカレ視点と流体構造連成への応用 [cs.CL, math.NA, cs.LG, cs.NA]目的:PINNとFEMソルバーの結合における理論的枠組みの確立
- 流体構造連成問題は,工学分野において重要な課題であり,高精度な数値解析が求められる。
- PINNとFEMの結合は利点がある一方,既存の手法は経験的な検証に留まり,理論的根拠が不足している。
- PINN-FEM結合における収束性を理論的に証明し,信頼性の高い数値解を得ることを目指す。
- PINNとFEMをステクロフ・ポアンカレ演算子として捉え,ロビン・ノイマン結合による収束性を証明した。
- PINNのスペクトルキャップを評価するフーリエモード界面プローブを導入し,その有効性を検証した。
- 流体構造連成問題への適用において,PINNは接触面の形状変化を自動的に処理し,高精度な接触反力を算出できることを示した。
Zeta:座標適応事前条件付けによる行列最適化のための二重白色化 [cs.LG]目的:行列最適化における効率化
- 大規模ニューラルネットワークの学習において,行列構造を活用した最適化手法が重要性を増している。
- 既存の行列対応型最適化手法は,入力条件に大きく依存するが,モーメンタム行列に座標ごとのスケール不均一性が存在する。
- 本研究は,スケール不均一性の解消が,収束速度と汎化性能の向上に繋がると仮説し,それを検証する。
- 提案手法Zetaは,座標白色化とスペクトル白色化を厳密な順序で適用する二重白色化最適化手法である。
- 座標白色化は,スペクトル白色化が信頼性を持って機能するための統計的等方性を確立する。
- 実験結果から,Zetaは言語モデリング,MoE,画像認識タスクにおいて,既存手法と同等またはそれ以上の性能を示すことが確認された。
頑健性におけるしわ:並列シミュレーションと頑健MPCによる認証可能な変形操作 [cs.RO, cs.AI, cs.LG, cs.SY, eess.SY, math.OC]目的:安全な変形物体の操作手法
- ロボットの応用範囲拡大には,変形物体の正確な制御が不可欠である。
- 変形物体の複雑な形状変化をリアルタイムに予測・制御することは困難である。
- モデル誤差やセンサノイズに強い,安全な操作手法の実現。
- GPU並列化による微分可能なシミュレータと,頑健MPCアルゴリズムを開発した。
- コンフォーマル予測を用いることで,視覚フィードバックの誤差範囲を補正し,安全性を向上させた。
- シミュレーションおよび実機実験において,安全性,速度,タスク成功率で既存手法を上回る結果を得た。
DRIVE:価値評価を用いた分布的・検索拡張入札 [cs.LG]目的:リアルタイム広告システムにおける入札戦略の最適化
- 広告配信において,限られた予算内で長期的なパフォーマンスを最大化する入札戦略は重要である。
- 既存手法は,複数の有効な戦略を平均化し,疎なデータやロングテールなトラフィックで性能が不安定になりがちである。
- 本研究は,分布的行動モデリングと検索拡張により,よりロバストな入札戦略の学習を目指す。
- DRIVEは,候補行動の生成と意思決定を分離したTransformerベースの統合フレームワークである。
- 質の高い過去の入札データを検索により活用し,価値評価に基づいて最適な入札額を選択する。
- AuctionNet等のベンチマークにおいて,既存のTransformerベースの手法と比較して,入札パフォーマンスが向上することが示された。
ハイブリッド古典・量子アルツハイマー分類:教師ありβ-VAEと量子カーネル [cs.DB, cs.CV, cs.LG]目的:アルツハイマー病のバイナリ分類
- アルツハイマー病は早期発見が重要であり,画像診断技術の進歩が求められている。
- 従来の古典的な手法では,アルツハイマー病の画像診断における特徴抽出に限界がある。
- 教師ありオートエンコーダと量子カーネルを組み合わせ,病気に特化した特徴量を学習し分類精度を向上させる。
- 提案手法は,308件のADNI-1データセットにおいて,ベースラインの精度67.2%とAUC 0.759を上回る,72.1%の精度と0.799のAUCを達成した。
- 安定性を向上させた変種では,交差検証の分散が半減し,頑健性も確認された。
- 3D Grad-CAMによる検証により,モデルがアルツハイマー病に関連する脳領域に焦点を当てていることが示された。
埋め込み潜在的変換演算子を用いた逐次ベイズフィルタリングにおける構造化ノイズ適応 [cs.LG, math.OC]目的:逐次状態推定のための構造化ノイズ適応手法
- 状態推定は,ロボティクスや制御,信号処理など広範な分野で不可欠な技術である。
- 従来のカルマンフィルタは,ノイズモデルの固定化により,非定常過程への適応が困難である。
- 埋め込み潜在的変換演算子を用いて,時間とともに変化するノイズモデルに対応する手法を開発する。
- 提案手法は,データ駆動型学習と動的なパラメータ適応を組み合わせることで,時間変動環境下での状態推定性能を向上させる。
- 構造化されたノイズパラメータ化により,最適な時間不変ノイズモデルを学習しつつ,動的な変化に対応できる。
- 実験結果は,提案手法がノイズが多く時間的に変動する環境において,従来のフィルタよりも優れた性能を示すことを示している。
OdysSim:人間行動シミュレーションのための基盤モデルの構築 [eess.SY, cs.SY, cs.CL, cs.AI, cs.LG]目的:人間行動の大規模シミュレーションを可能にする基盤モデル
- 人間行動の理解は,AIの社会実装や人間との協調に不可欠である。
- 大規模言語モデルは,有用性を重視する学習により,均質で迎合的なアシスタントになりがちである。
- 人間らしい多様な行動を再現し,現実世界への適応性を高める。
- OdysSimは,62のデータセットと23のベンチマークタスクを網羅する大規模な調査である。
- 構築されたOSimモデルは,23タスク中8つで最上位の性能を示し,特に会話および社会タスクで顕著な改善が見られた。
- モデルの出力は,長さ,書式,語彙の選択において人間により近く,実ユーザーとの反応整合性も高い。
エージェントの信頼度はいつ条件付きにすべきか:エージェント群におけるスキル条件付き評判の特性評価と攻撃 [cs.AI, cs.LG]目的:スキル条件付き信頼の有効性,情報共有の程度,およびその安全性に関する研究
- 多様なLLMエージェントがタスクを実行するオープンプラットフォームの普及に伴い,エージェントの信頼性評価が重要になっている。
- 従来の単一のグローバルな信頼スコアでは,エージェントのスキル特化性を考慮できず,最適なタスクルーティングが阻害される。
- スキルごとに信頼度を評価するスキル条件付き信頼の有効性を検証し,攻撃に対する脆弱性を明らかにすること。
- スキル条件付き信頼は,エージェントのスキル異質性が高く,スキルごとのエビデンスが少なく,スキル間に相関がある場合に有効であることが示された。
- 攻撃者が特定のスキルにおける低コストなエビデンスを利用することで,条件付きルーティングを乗っ取り,ルーティングの誤りを引き起こす可能性があることが示された。
- ゼロエビデンスによるゲートを設けることで攻撃を抑制できるものの,完全に排除することはできず,残存コストが特定された。
MeEvo:自然進化とメタ認知進化の組み合わせによる自動ヒューリスティック設計 [cs.DB, cs.NE, cs.AI]目的:自動ヒューリスティック設計の効率,安定性,および解の質向上
- 複雑な問題解決において,効率的な探索手法の確立が重要である。
- 既存手法では,推論過程の活用が不十分であったり,多様性の維持が困難であったりする。
- 自然進化とメタ認知進化を統合し,探索と洗練を相互に強化することを目指す。
- MeEvoは,自然進化による探索とメタ認知進化による洗練を循環的に組み合わせることで,既存手法よりも優れた性能を示す。
- 特に複雑な制約条件を持つ最適化問題において,性能と安定性が向上することが確認された。
- 推論過程を記録・活用することで,知識の継承と探索範囲の拡大を実現している。
プロンプトから応答へ:分割大規模言語モデルにおける二方向データ漏洩と防御 [cs.CL, cs.CR, cs.AI]目的:分割大規模言語モデルにおける二方向データ漏洩の脆弱性と,それに対する防御策
- プライバシー保護は重要であり,特に機密データを扱う応用において,データ漏洩リスクの軽減が求められている。
- 分割学習は計算コスト削減に有効だが,中間表現経由のプロンプト漏洩リスクが指摘されている。
- 本研究は,応答からも機密情報が漏洩する可能性に着目し,二方向からの漏洩を防ぐことを目指す。
- 提案手法PIDIにより,分割LLMにおける入力プロンプトと出力応答の両方からのデータ漏洩の脆弱性が明らかになった。
- 防御策ADMIは,アダプターベースのウォームアップと相互情報正則化により,高いプライバシー保護性能とタスク性能の両立を実現した。
- ADMIは,PIDIを含む様々な攻撃に対して有効であり,分割LLMのセキュリティ向上に貢献する。
リフレクションギャップの解消:エージェント型強化学習のための自由なキャリブレーションボーナス [cs.AI, cs.LG]目的:LLMエージェントのリフレクション精度とタスク精度向上
- LLMエージェントは環境との相互作用を通じて学習するため,自身の性能を正確に評価できる能力が不可欠である。
- LLMエージェントは,環境からのフィードバックに基づき自己評価する際に誤りが生じやすいという課題がある。
- 環境フィードバックに基づいた自己検証機能をLLMエージェントに付与し,性能向上を目指す。
- 提案手法RefGRPOは,エージェント自身の反省と実際の結果を比較することで得られるキャリブレーションボーナスを導入する。
- RefGRPOは,テキストSQLタスクにおいて,リフレクションのキャリブレーションとタスク精度を同時に向上させることを示した。
- キャリブレーションされたリフレクションは,自己改善や選択的予測において,外部からの監督なしに有効に機能する。
LapidaryEngine:完全対話型結晶生成 [cs.NI, cs.SY, eess.SY, cs.LG]目的:自然言語指示によるカスタム結晶材料の生成
- 材料開発において,目的に応じた材料設計が重要であり,効率化が求められている。
- 既存モデルは,構造化された入力や一方向生成に制限され,対話的な材料設計が困難である。
- LapidaryEngineは,自由な対話を通じて結晶材料を生成し,ユーザーの意図に合致させることを目指す。
- LapidaryEngineは,テキストと結晶構造間の双方向翻訳を可能にするピボット表現を導入した。
- 多様なタスクにおいて,ユーザーの意図に沿った材料生成と対話的な調整が可能であることが示された。
- 絶縁体探索,安定性最適化,組成変更,構造編集など,幅広い応用が期待される。
タンパク質-リガンド結合親和性の予測のための曲率情報に基づいたポテンシャルエネルギー表面 [cs.RO, cs.SY, eess.SY, cs.LG, q-bio.BM]目的:タンパク質-リガンド結合親和性の予測
- 構造ベース創薬において,タンパク質-リガンド結合親和性の正確な予測は不可欠である。
- 既存手法は静的な構造情報に依存し,分子の柔軟性や結合に伴う立体構造変化を考慮していない。
- ポテンシャルエネルギー表面の曲率情報を用いて,結合時の立体構造変化をモデル化し予測精度向上を目指す。
- 提案手法CPESは,ポテンシャルエネルギー表面のヘッセ行列から曲率スペクトル記述子を導出し,結合時の立体構造変化を捉える。
- CPESは,静的な構造特徴と曲率情報を融合することで,結合親和性を高精度に予測する。
- 複数のベンチマークデータセットでの評価により,CPESが既存手法を上回る予測性能と物理的な解釈性を持つことが示された。
ユニバーサル操作外骨格:リアルタイムトルクフィードバックを用いた全身コンプライアンスポリシーの学習 [cs.RO, cs.AI, cs.LG]目的:家庭環境における安全なロボット作業のための,全身コンプライアンスポリシーの学習
- ロボットが家庭環境で安全に動作するには,接触時のトルクと力への対応が不可欠である。
- 既存のデータ収集パイプラインでは,アクティブコンプライアンスポリシー学習に必要なトルクと力データの取得が困難である。
- リアルタイムトルクフィードバックと全身構成記録により,コンプライアンスポリシーの学習を可能にすること。
- 本研究では,リアルタイムの触覚トルクフィードバックを提供する上肢外骨格UMEを開発した。
- UMEは低コスト,軽量,ポータブルであり,多様なロボットの遠隔操作を可能にする汎用的なリターゲティングアルゴリズムを実装した。
- 学習されたロバストな自律ポリシーは,様々なタスクで高い成功率を示し,複雑な空間での操作を実現した。
UAV自律飛行のための選択的エージェントによる復旧:持続的なミッション実行時間 [cs.RO, cs.AI]目的:UAVの自律飛行における復旧メカニズムの改善
- UAVは危険な環境での活動に貢献するため,自律飛行技術の信頼性向上は重要である。
- 従来の自律飛行システムは,複雑な状況下で立ち往生したり,曖昧な状況に対応できない場合がある。
- 外部エージェントによる高度な復旧機能を効率的に利用し,ミッション成功率と実行効率を向上させる。
- 提案手法であるPMRは,外部エージェントの利用を必要に応じて行い,低遅延かつ安全な飛行を実現する。
- 学習されたCVIを用いることで,復旧が必要な状況を正確に判断し,エージェント呼び出し回数を削減する。
- シミュレーション実験の結果,PMRは従来の自律飛行システムと比較して,ミッション成功率を大幅に向上させた。
時系列基礎モデルのエラーコンテキスト学習:ブラックボックスオンライン適応 [cs.LG]目的:時系列基礎モデルのブラックボックスオンライン適応における学習対象
- 時系列予測の分野では,汎用的な基礎モデルの重要性が高まっている。
- 多くのオンライン適応手法は,モデル内部へのアクセスを前提としている。
- ブラックボックス環境下での効果的な適応手法の確立が求められている。
- 本研究では,ベースモデルのエラーが入力と出力の両方に依存するという洞察に基づき,ORCAを提案した。
- 実験の結果,ORCAは5つの最先端時系列基礎モデルと8つのデータセットで有効であることが示された。
- アダプター学習仮説の重要性を定量的に分析し,ブラックボックスオンライン適応性能への影響を評価した。
暗黙的変分拒否サンプリング [cs.LG]目的:複雑な事後分布の近似精度向上
- ベイズ機械学習において,事後分布の推定は重要な課題である。
- 従来の変分推論は平均場分解に依存し,複雑な事後分布の表現に限界がある。
- ニューラルネットワークと拒否サンプリングを組み合わせ,より高精度な近似を実現する。
- 提案手法IVRSは,ニューラルネットワークによる暗黙的提案分布と拒否サンプリングを統合する。
- 識別ネットワークを用いて密度比を推定し,近似精度を改善する。
- 実験結果から,IVRSが従来の変分推論手法を上回る性能を示すことが確認された。
いつ,そしてどの程度か:運転VLAのためのシナリオ固有の安全域 [cs.RO, cs.RO, cs.AI]目的:運転VLAの安全性認証におけるシナリオ固有の安全域の特定
- 自動運転技術の安全性確保は,社会実装において不可欠であり,その検証手法が求められている。
- 従来の安全性評価は,包括的な指標に依存しており,シナリオごとのリスクの違いを捉えきれていない。
- VLAの安全性評価において,状況に応じた適切な安全域を定義することで,より現実的な安全性を実現する。
- 大規模言語モデルを活用した運転VLAにおいて,安全域を単一の値で評価するのではなく,シナリオごとに二次元的な安全域を考慮する必要があることが示された。
- 特定のシナリオ(STOP_SIGNAL)では,許容されるノイズ閾値が大きいにも関わらず,高重度の障害発生率が高いことが明らかになった。
- 説明の変化を分析することで,同じ平均誤差を持つ摂動条件でも,高重度の障害の割合が大きく異なることが示された。
SkillAudit: 正確な正解データなしによるペア軌道監査を通じたスキル進化 [cs.AI]目的:エージェントスキルの進化
- LLMエージェントの活用が広がる中で,専門的なワークフローを効率化するスキルの重要性が増している。
- デプロイ後のスキルは,想定外の状況やAPI変更により陳腐化しやすく,改善が不可欠となる。
- 正解データなしで,既存のスキルを改善し,タスク遂行能力を高めることを目指す。
- SkillAuditは,同じタスクをスキルあり/なしで実行し,スキルの影響を分析することで,正解データ不要のスキル進化を可能にする。
- Process-Aligned Contrastive Evaluation (PACE)により,行動の差異をスキルの具体的な箇所と結び付け,編集の指針を提供する。
- 89のタスクで,SkillAuditは従来のスキルやスキルなしのエージェントよりも高いタスク報酬を達成し,効果を実証した。
物理的特性からのアフォーダンス推論の評価:Affordance20Q [cs.AI]目的:アフォーダンス推論能力の評価
- 人間は物理的理解に基づいて行動するため,そのメカニズム解明は重要である。
- 既存の評価基準はオブジェクトの情報を明示しており,物理特性に基づいた推論を妨げる。
- オブジェクトの情報を隠蔽し,物理的特性のみでアフォーダンスを推論できるか評価する。
- 新しいベンチマークAffordance20Qは,20Qゲーム形式でオブジェクトの正体を隠しつつアフォーダンス推論を評価する。
- 最先端のLLM15モデルを評価した結果,人間性能と比較して大きな差が認められた。
- 知識ベースに基づいたルール誘導パイプラインKARIを開発し,オープンソースLLMの性能を最大15.2ポイント向上させた。
ブラックボックス型薬物標的相互作用予測モデルが注目する箇所:手法横断的な解釈可能性 [cs.CL, cs.LG]目的:薬物標的相互作用予測モデルの解釈可能性の評価
- 創薬において,標的タンパク質と薬物の相互作用予測は不可欠であり,効率的な候補物質探索に貢献する。
- 既存の予測モデルは高性能だが,内部のメカニズムが不透明で,予測根拠の説明が困難である。
- 予測モデルの解釈可能性を高め,予測の妥当性を検証するための手法を確立することを目指す。
- 異なる解釈手法の組み合わせにより,モデルが利用する特徴量の重要度を評価した。
- モデルの挙動に,入力データや特殊トークンの影響,層ごとの協調的/抑制的な効果が認められた。
- 解釈可能性分析は,創薬パイプラインにおける実験検証の優先順位付けに役立つ仮説を提供する。
HarnessX:構成可能,適応可能,進化可能なエージェントハーネスファウンドリ [cs.AI]目的:エージェントハーネスの構築,適応,進化のための基盤
- AIエージェントの性能は,その動作環境に大きく依存する。
- 現在のハーネスは手作業で作成されることが多く,柔軟性に欠ける。
- 実行フィードバックに基づいたハーネスの自動改善を目指す。
- HarnessXは,多様なハーネスプリミティブを組み合わせ,構成することで柔軟なエージェント環境を実現する。
- AEGISという進化エンジンにより,実行履歴からハーネスを適応的に進化させ,性能向上を図る。
- 5つのベンチマークで平均14.5%の性能向上を達成し,既存手法が苦手なタスクで特に効果が認められた。
AdamとSGDの性能差に関する単一の説明を超えて [cs.RO, cs.RO, cs.CL, cs.LG]目的:AdamとSGDの性能差に影響する要因の相対的な重要度に関する理解
- 最適化アルゴリズムは,深層学習モデルの学習において不可欠であり,性能に大きな影響を与える。
- AdamとSGDの性能差の理由は特定されておらず,状況によって異なるため,汎用的な解釈が難しい。
- データとアーキテクチャの相互作用が性能差に与える影響を明らかにすること。
- AdamとSGDの性能差は単一の要因で説明できず,データ分布やアーキテクチャに依存することが示された。
- 特定の条件下ではAdamが有利になる一方,別の条件下ではSGDが有利になるという結果が得られた。
- バッチサイズに応じてAdamとSGDの優位性が入れ替わる「クロスオーバーバッチサイズ」が存在することが観察された。
ChronoID:生成推薦のためのセマンティックIDへの明示的な時間的信号の注入 [cs.IR, cs.AI]目的:生成推薦におけるセマンティックIDへの時間的情報の組み込み
- 推薦システムにおいて,ユーザーの嗜好は時間とともに変化するため,時間情報を考慮することが重要である。
- 従来のセマンティックID学習は時間情報を無視しており,時間的文脈が異なるインタラクションを同一の表現として扱う。
- 時間的信号をセマンティックIDに明示的に組み込むことで,より正確な推薦を目指す。
- ChronoIDは,時間的信号の設計空間を体系的に分析し,時間情報を考慮したセマンティックID学習のための統一的なフレームワークを提供する。
- 新しい時間明示的生成推薦ベンチマークを用いて,時間情報の効果的な注入方法,アーキテクチャ設計,および効果の源泉を検証した。
- 実験結果から,ChronoIDが時間情報を活用することで,推薦性能が向上することが示された。
力誘導学習による腕なし二足輪型ロボットの堅牢な転倒復帰 [cs.RO, cs.IR, cs.CL, cs.RO, cs.AI]目的:腕なし二足輪型ロボットにおける転倒復帰の実現
- 自律移動ロボットにおいて,転倒からの復帰は極めて重要な課題である。
- 腕や多脚を用いない二足輪型ロボットでは,転倒復帰が特に困難である。
- 本研究は,外部からの力誘導学習を通じて,自律的な転倒復帰戦略を確立する。
- 提案手法FTSRは,シミュレーション訓練中にロボットの高さと相関する外部補助力を導入し,制約最適化として明示的に定式化した。
- 制約付き強化学習により,力への依存を徐々に低減し,ロボットの高さの回復を促すことで,内部の復帰戦略を開発した。
- 実機実験の結果,多様かつ困難な条件下で堅牢かつ信頼性の高い転倒復帰が確認された。
DIFF-ERO:プロセスマイニングにおける深層学習のための適合性考慮損失 [cs.CL, cs.LG, cs.AI]目的:プロセスデータに対する深層学習モデルの適合性を考慮した損失関数
- プロセスマイニングは業務効率化に不可欠であり,データ駆動型のアプローチでプロセス改善を実現する。
- 従来の深層学習は局所的な予測精度に偏重し,プロセス全体の制御フロー構造を捉えきれない場合がある。
- 制御フロー情報を学習に組み込み,プロセスモデル構造を深層学習モデルに内在化させることを目指す。
- DIFF-EROは,エントロピーに基づく確率的適合性の微分可能な定式化であり,学習時に制御フロー情報を組み込む。
- 実験結果から,構造が重要なタスクにおいて予測性能が向上し,その他のタスクでは同等の性能を維持することが示された。
- 学習された確率的オートマトンは構造的な正解に収束し,ネットワークがプロセスモデル構造を内在化していることを示唆する。
階層的ODE:早期リンク故障検出のための連続時間物理プロトタイプ学習 [cs.LG, cs.AI]目的:時間経過データから連続的な物理プロトタイプを学習すること
- 時系列データ解析は,異常検知や故障予測において重要な役割を果たす。
- 離散的なモデルでは,ノイズと連続的な変動を分離することが難しく,未知の多様性への対応が困難。
- 連続時間モデルと階層構造を用いて,ノイズの影響を軽減し,柔軟なプロトタイプ抽出を実現すること。
- 提案手法は,ニューラル常微分方程式を用いて潜在状態の変化を連続的にモデル化することで,ノイズに強いプロトタイプ抽出を可能にした。
- 階層構造により,事前にプロトタイプの数を決定する必要がなく,データから自動的に適切な数を学習できる。
- 不規則にサンプリングされた時系列データを用いた実験により,早期リンク故障検出において高い性能が確認された。
AgentCyberRange:現実的なサイバー射程における最先端AIシステムのベンチマーク [cs.CR, cs.AI, cs.LG]目的:最先端AIシステムの自律的なサイバー攻撃能力の測定
- サイバーセキュリティは重要性が増しており,AI技術の活用が期待される分野である。
- AIシステムの攻撃能力評価は,現実的な環境での再現性とアクセス性に課題がある。
- 現実的なサイバー射程環境でのAI攻撃能力を評価し,新たなリスクを早期に発見すること。
- AgentCyberRangeは,15のWebアプリケーションと8つの企業環境を模したサイバー射程で構成され,110の脆弱性を含む。
- GPT-5.5 with Codexは,Web攻撃タスクの16.1%,ポストエクスプロイトタスクの31.7%を解決し,最も優れた性能を示した。
- 評価を通じて,一般的なプロジェクトの未知の脆弱性や,ホスト防御を回避するペイロードの変異が確認された。
Pix2Pix-Hybrid:多チャンネル条件付けと弱い属性監督によるハッジ群衆画像の構造誘導条件合成 [cs.CV, cs.AI]目的:ハッジ巡礼の群衆シーンにおける群衆数モデルの精度向上
- ハッジ巡礼のような特殊な状況における群衆解析は,安全管理や効率的な巡礼運営に不可欠である。
- ハッジ巡礼の群衆画像に対するアノテーション付きデータが不足しており,プライバシー保護の観点からデータ収集が困難である。
- データ不足とプライバシー問題を解決するため,合成データによるデータ拡張を目指す。
- 提案手法Pix2Pix-Hybrid(P2P-H)は,構造的特徴と文脈的属性を組み合わせることで,高品質なハッジ群衆画像の合成を可能にした。
- 合成データセットCrowdH(10,000枚)を構築し,既存手法(Pix2Pix, StyleGAN2-ADA)と比較して,構造保持能力と合成品質の向上が確認された。
- 合成データと実データ混合による学習データセット(CrowdH-Mix-469)を用いた実験により,群衆数推定モデルの精度向上効果が実証された。
CLIPのテスト時適応を駆動する要因:更新の観点からの制御された経験的研究 [cs.CV, cs.LG]目的:CLIPのテスト時適応における駆動要因の解明
- CLIP等の視覚言語モデルは画像認識の標準技術である。しかし,実環境での分布シフトに弱点がある。
- テスト時適応(TTA)は軽量な解決策として注目されているが,その適応メカニズムは未解明な部分が多い。
- 本研究は,TTA4CLIPの適応メカニズムを制御された実験により体系的に理解することを目的とする。
- 既存のTTA4CLIP手法を3つのパラダイムに分類し,更新内容に基づいて整理した。
- パラメータベース手法では,適応による性能向上は重い最適化よりもテスト時証拠や信頼できるプロキシに起因することが示された。
- TTAには万能な手法はなく,シフトの種類によって最適なパラダイムが異なることが示された。
思考の枠を超えて:認知包摂型生成AIのためのコンピュータサイエンスと産業デザインの架け橋 [cs.CL, cs.HC, cs.AI]目的:認知包摂型生成AIのインタラクションモデルの探索
- 生成AIの利用拡大のためには,多様な認知能力を持つ人々へのアクセシビリティが不可欠である。
- 現在の生成AIインタフェースはチャット形式に偏っており,認知負荷が高く,知的障害を持つ人々にとって利用が困難である。
- チャット形式に囚われない,認知アクセシビリティに配慮した新しいインタラクションモデルを提案すること。
- コンピュータサイエンスチームは,予測可能性と信頼性を重視した構造的支援に焦点を当てた。
- 産業デザインチームは,ペース配分や注意誘導などの体験的支援を重視した。
- 両分野の成果を統合することで,チャット中心ではない認知アクセシビリティの高い生成AIインタラクションの設計空間が拡大する。
プロパティグラフの合成可能なクエリによるスキーマ変換 [cs.DB, cs.AI, cs.LO]目的:プロパティグラフのスキーマ変換に伴う出力スキーマの推論
- データ品質の保証が重要であり,スキーマはデータの構造と制約を定義する
- グラフ変換後のスキーマが不明確であり,データ提供者と消費者の間の契約が曖昧になる
- 入力スキーマと変換クエリから出力スキーマを推論することで,スキーマの整合性を保つ
- 入力スキーマと変換クエリから出力スキーマを推論するための推論手続きを提案。
- ProGSとG-COREを用いて,RDFへの再表現,SHACLへのマッピング,SPARQL CONSTRUCTへの変換を行う。
- 推論されたスキーマ制約の健全性と,マッピングされたスキーマとクエリの等価性に関するメタ理論を開発。
プロアクティブLLMエージェントのためのコミュニケーションポリシーの進化 [cs.DB, cs.AI]目的:LLMエージェントにおけるコミュニケーションポリシー
- LLMエージェントの自律性が高まる中で,人間との効果的なコミュニケーションは不可欠である。
- ユーザーとエージェント間には情報格差が存在し,効率的な情報交換が課題となっている。
- 情報非対称性下におけるプロアクティブエージェントのコミュニケーション戦略を最適化すること。
- テキストベースの対話はタスク遂行に有効である一方,構造化UIは応答品質とペルソナ遵守を向上させる。
- 両者の利点を組み合わせたハイブリッド手法が,それぞれの単独利用よりも優れた結果をもたらす。
- コミュニケーションポリシー進化(CPE)フレームワークにより,プロンプトレベルでの改善のみで高いタスク成功率を達成した。
知識グラフデータ生成による正確なテキスト・ツー・サイファーの実現 [cs.CL, cs.AI]目的:テキスト・ツー・サイファーの性能向上
- 異種データソースを表現するデータベースフレームワークとしてプロパティグラフの利用が拡大している。
- プロパティグラフ内の情報への正確なアクセスには,テキスト・ツー・サイファー解析に基づいた対話インターフェースが必要である。
- 大規模モデルに匹敵する性能を小型LLMで実現し,ローカル環境での利用を可能にすること。
- 本研究では,自動的な合成データ生成手法を提案し,小型LLMのファインチューニングに活用した。
- 主要なテキスト・ツー・サイファーベンチマークにおいて,提案手法による性能向上が確認された。
- データ主権の確保と高精度な解析を両立させ,コストのかかるアノテーション作業を削減できる。
