arXiv雑要約
AI - 2026/04/22 公開
RaBitQとTurboQuantの再検討:手法,理論,実験の対称的比較 [cs.LG, cs.AI, cs.DB]目的:RaBitQとTurboQuantの比較分析
- 大規模言語モデルの量子化は,推論速度向上とメモリ使用量削減に不可欠である。
- 量子化手法の性能評価には再現性と公平性が課題となっていた。
- RaBitQとTurboQuantの比較を通して,公平な性能評価を確立すること。
- TurboQuantは,直接比較可能な設定においてRaBitQに対して一貫した改善を示さなかった。
- 多くの設定でTurboQuantはRaBitQよりも性能が劣る結果となった。
- TurboQuant論文に報告された実行時間と再現率の結果の一部は,再現できなかった。
推論時確率的注意による科学的基盤モデルの較正 [cs.LG, cs.CE, stat.ML]目的:科学的基盤モデルにおける予測不確実性の較正
- 科学的予測の信頼性確保は,社会実装において不可欠である。
- 既存モデルは決定論的な出力であり,不確実性の定量化が困難である。
- 推論時の確率的注意機構により,再学習なしに較正された不確実性を実現する。
- 提案手法である確率的注意は,再学習を必要とせず,既存手法と同等以上の較正性能を達成した。
- 較正パラメータの調整は数分で完了し,既存手法のような数日間の再学習は不要である。
- 気象予測や時系列予測を含む複数のタスクにおいて,シャープな予測区間が得られた。
BEAT:均一な時間ステップによる音楽のトークン化と記号生成 [cs.SI, math.ST, stat.TH, cs.SD, cs.AI]目的:音楽のトークン化と記号生成に関する研究
- 音楽生成の分野は,多様な表現形式を扱う必要があり,効率的かつ高品質なモデルが求められている。
- 既存のトークン化手法は,時間間隔が不均一になりやすく,音楽構造の捉え方に課題があった。
- 均一な時間ステップを基本単位とする新たなトークン化手法を提案し,音楽構造のより効果的な表現を目指す。
- 提案手法は,音楽の継続生成および伴奏生成タスクにおいて,既存の手法と比較して,より高品質で構造的に一貫性のある音楽を生成することが示された。
- 時間ステップによる明示的なグルーピングにより,効率性が向上し,長距離パターンをより効果的に捉えることが確認された。
- この研究は,音楽の記号表現におけるトークン化の新たな可能性を示唆している。
サイバーディフェンスベンチマーク:SecOpsにおけるLLMのためのエージェント型脅威ハンティング評価 [cs.CR, cs.AI]目的:LLMエージェントの脅威ハンティング能力の測定
- サイバー攻撃は高度化の一途をたどっており,セキュリティ専門家の負担が増大している。
- 脅威ハンティングは熟練した分析官に依存しており,自動化が困難である。
- LLMを活用し,脅威ハンティングの自動化と効率化を目指す。
- サイバーディフェンスベンチマークを構築し,LLMエージェントの脅威ハンティング性能を評価した。
- 評価した5つの最先端モデルはいずれも低い性能を示し,平均検出率は3.8%にとどまった。
- どのモデルも,自律的なSOC運用に必要なレベルに達していないことが示された。
人間活動における能動的リスク管理のための,異常検知をエージェントAIに統合すること [cs.RO, cs.HC, cs.AI, cs.HC, cs.MA]目的:人間活動におけるリスク管理のための,異常検知に基づくエージェントAIの統合
- 高齢化社会において,転倒事故は深刻な問題であり,生活の質を低下させるだけでなく,医療費の増大にもつながる。
- 既存の転倒予測・検知システムは,複雑な現実環境への対応,誤検知の多さ,ノイズ,データ不足といった課題を抱えている。
- 本研究は,異常検知をエージェントAIに組み込むことで,より柔軟で効果的なリスク管理を実現することを目指す。
- 転倒検知と予測を異常検知問題として捉えることで,エージェントAIによる早期リスク識別が可能となる。
- 提案するフレームワークは,状況に応じて最適なツールを選択し,適応的な意思決定ワークフローに統合することで,リスク管理の効率を高める。
- このアプローチは,狭義の定義されたシナリオに合わせた静的な設定に依存するのではなく,動的なリスク管理を可能にする。
メッシュメモリプロトコル:マルチエージェントLLMシステムのセマンティックインフラ [cs.MA, cs.AI]目的:マルチエージェントLLMシステムにおけるセッションを跨いだ認知的な協調
- LLMエージェントのチームによる長期的な共同作業の重要性が増している
- エージェント間での認知状態の共有,評価,統合が困難である
- セッション再開後も関連性を保つメモリ管理手法を確立すること
- 本研究では,エージェントがピアからどの情報を採用するかをフィールド単位で決定するプロトコルを提案する
- 提案するメッシュメモリプロトコル(MMP)は,各主張の出所を追跡可能にし,以前の思考の反響として認識させる
- MMPは既に3つの実運用環境で稼働しており,各セッションは独自のアイデンティティとメモリを持つ自律エージェントとして機能している
DT2IT-MRM: 多様なモード報酬モデリングのためのバイアス除去された選好構築と反復学習 [cs.MA, cs.HC, cs.AI]目的:多様なモード報酬モデルの性能向上
- 大規模言語モデルと画像を組み合わせたMLLMの性能は,人間の選好との整合性に大きく依存する。
- 既存の選好データセットは,選好の強さの粒度が粗い,テキストスタイルに偏りがある,信頼性の低いシグナルを含むなどの課題がある。
- 既存のノイズの多いデータセットを効果的に改善し,報酬モデルの性能を向上させることを目指す。
- DT2IT-MRMは,バイアス除去パイプライン,テキスト-画像データのリフォーマット,反復学習フレームワークを統合する。
- 主要な3つのベンチマーク(VL-RewardBench, Multimodal RewardBench, MM-RLHF-RewardBench)において,最先端の性能を達成した。
- 既存の選好データセットの品質向上に貢献する有効かつスケーラブルなキュレーション手法を提供する。
エージェントにおけるActor-Observer非対称性の弁証的整合による制御 [cs.CL, cs.CL, cs.AI, cs.CY]目的:Actor-Observer非対称性
- LLMエージェントの信頼性向上は重要であり,多エージェントフレームワークが注目されている。
- 役割を演じることで専門知識を活用する一方で,認知バイアスが発生する。
- 視点に依存しない推論を促し,帰属の一貫性を高めることを目指す。
- Ambiguous Failure Benchmarkを用いて,モデルの20%以上でActor-Observer非対称性が発生することが確認された。
- ReTASは,弁証法的な思考とグループ相対的方策最適化を統合することで,客観的な合意形成を導く。
- ReTASは帰属の不整合を軽減し,曖昧な状況下での誤り解決率を大幅に向上させる。
極端な高温下における建設作業員の安全確保:ウェアラブル技術を用いた機械学習による予測的健康分析アプローチ [cs.AI, cs.CL, cs.LG]目的:建設作業員の熱ストレス予測
- 建設業界における労働災害防止は重要であり,特に高温環境下での熱中症対策は喫緊の課題である。
- リアルタイムな生理データを活用した熱ストレスの予測システムが不足しており,作業員の安全管理が困難である。
- ウェアラブルデバイスから得られる生理指標を用いて,熱ストレスを正確に予測し,安全管理を支援することを目的とする。
- 注意機構付きLSTMモデルは,ベースラインのLSTMモデルと比較して,95.40%のテスト精度を達成した。
- 偽陽性・偽陰性の数を大幅に削減し,予測性能が向上した。
- 本アプローチは,IoT対応の安全システムやBIMダッシュボードへの統合に適しており,建設業界におけるプロアクティブな安全管理に貢献する。
汎化の分析における幾何学と確率の分離 [cs.LG, math.OC, stat.ML]目的:汎化の分析における幾何学的構造と確率的仮定の関係性の解明
- 機械学習は未知データに対する予測誤差の最小化を目指すため,汎化性能の理解は不可欠である。
- 従来の汎化分析はi.i.d.の確率的仮定に依存しており,その検証は原理的に困難である。
- 最適化問題の解の摂動に対する感度分析を通して,確率的仮定に依らない汎化限界の導出を試みる。
- 本研究では,汎化性能を評価する上で,入力データにおける幾何学的構造が重要な役割を果たすことを示した。
- 最適化問題に対する摂動の影響を分析することで,入力データ間の距離を定量化し,汎化限界を導出した。
- 得られた汎化限界は,入力データの分布に関する統計的仮定を後付けで加えることで,より厳密に評価することが可能である。
大規模言語モデルにおけるデータ汚染の検出 [cs.AI]目的:大規模言語モデルの学習データに含まれる文書のメンバーシップ推論
- LLMの性能向上には大量のデータが不可欠であり,その利用における権利関係が重要である。
- 学習データに著作権保護されたデータが混入している場合があり,その検出が課題である。
- ブラックボックス環境下でのメンバーシップ推論手法の比較と,新たな手法開発を試みる。
- 既存のメンバーシップ推論手法はいずれもLLMにおけるメンバーシップを確実に検出できないことが示された。
- より高度なLLMほど高い真陽性率と偽陽性率を示し,LLMの推論能力の高さを示唆する。
- 新たに提案したFamiliarity Rankingは,ブラックボックスMIAsへのアプローチの可能性を示す。
構造に基づいた分子設計:対照的な3Dタンパク質-リガンド学習 [cs.LG]目的:3Dタンパク質-リガンド相互作用の正確な捉え方と,合成可能な化合物の探索
- 創薬において,タンパク質の立体構造情報は重要な手がかりとなる。
- 大規模な化合物空間から,合成可能な有望な候補化合物を効率的に見つけることが課題である。
- 3D構造情報と分子生成モデルを統合し,創薬の効率化を目指す。
- 対照学習によるSE(3)変換器は,ゼロショットバーチャルスクリーニングで競争力のある結果を示した。
- マルチモーダル化学言語モデル(MCLM)は,ポケットまたはリガンド構造に基づいて標的特異的な分子を生成する。
- 学習されたデータセットトークンにより,出力は標的となる化学空間へと導かれ,良好な結合特性を持つ候補化合物が得られた。
EgoSelf:記憶からのパーソナライズされた一人称視点アシスタント [cs.CV, cs.AI]目的:パーソナライズされた一人称視点アシスタントの実現
- 一人称視点データは,ユーザーの行動や状況を捉え,パーソナライズされたサービス提供に不可欠である。
- 長期的なユーザーデータを効果的に統合し,パーソナライズを実現することが課題である。
- 過去の観察から構築されたグラフベースのインタラクションメモリを活用し,パーソナライズを可能にする。
- EgoSelfは,インタラクションイベントとエンティティ間の時間的・意味的関係を捉えたグラフベースのインタラクションメモリを構築する。
- このメモリからユーザー固有のプロファイルが導き出され,個々のユーザーの過去の行動を予測する学習タスクが用いられる。
- 実験の結果,EgoSelfがパーソナライズされた一人称視点アシスタントとして有効であることが示された。
推論時に注意マップを用いて音声LLMのハルシネーションを検出 [cs.CL, cs.AI, cs.LG]目的:音声LLMにおけるハルシネーションの検出
- 音声LLMの活用が拡大する中で,生成される情報の信頼性確保が重要となっている。
- ハルシネーションの検出には,正解データが必要であり,その取得コストが高いという課題がある。
- 注意パターンに着目し,軽量な分類器で効率的なハルシネーション検出手法を開発する。
- 提案手法は,Qwen-2-AudioおよびVoxtral-3Bを用いた実験で,既存手法を最大+0.23 PR-AUCで上回った。
- 約100の注意ヘッドを用いることで,ドメイン外のASR設定への汎化性能が向上した。
- 注意パターンは,音声LLMのハルシネーション検出に有用なツールとなりうることを示した。
LLMを用いた視覚的意味算術 [cs.IR, cs.CL, cs.AI]目的:視覚的意味算術における大規模言語モデルの推論能力向上
- ロボティクス分野において,現実世界の複雑な環境下での意味関係の推論は重要である。
- 画像から簡潔な概念を抽出することの難しさから,視覚的意味算術の性能は低い。
- 画像と記号的な推論を結びつけ,ロボットの意思決定や道具の適応性を高めることを目指す。
- 画像関係ペアデータセット(IRPD)を構築し,二項減算と三項演算の新たなタスクを提案した。
- 検証可能な関数とグループ相対方策最適化(GRPO)を用いた意味算術強化学習ファインチューニング(SAri-RFT)を提案した。
- IRPDとVisual7W-Tellingデータセットにおいて,最先端の結果を達成した。
Q学習に対する直接スイッチング理論: Lyapunov認証付き [cs.LG, cs.AI, cs.SY, eess.SY]目的:Q学習の収束性解析
- 強化学習は,自律的な意思決定システムの構築に不可欠な技術である。
- Q学習の収束性保証は難しく,特に複雑な環境下ではその評価が課題である。
- 直接スイッチングシステム表現を用いることで,より厳密な収束性条件を導き出す。
- Q学習誤差を,確率的スイッチングシステムとして正確に表現することに成功した。
- スイッチングファミリーの共同スペクトル半径(JSR)を利用したLyapunov関数を構築し,有限時間収束限界を導出した。
- JSRに基づいた計算可能な二次証明を提供し,Q学習の収束性を検証する手段を提示した。
大規模言語モデルがAI分野トップ会議の査読意見に与える影響:詳細な視点からの証拠 [cs.CL, cs.AI, cs.DL, cs.IR]目的:査読報告書の言語的特徴,評価焦点,および推奨に関するシグナルの変化
- 学術コミュニケーションにおいて査読は重要であり,論文の質向上に不可欠である。
- 大規模言語モデルの登場により,査読プロセスが変化している可能性が指摘されている。
- 大規模言語モデルが査読の本質的な評価機能に与える影響を明らかにすること。
- 大規模言語モデルの登場後,査読テキストはより長くなり,流暢さが増した。
- 要約や表面的な明確さへの言及が増加し,特に自信の低い査読者において,標準化された言語パターンが見られた。
- 一方で,独創性,再現性,詳細な批判的思考といった深い評価次元への注意が低下した。
オンライン学習からマルチキャリブレーションへの効率的なブラックボックス還元と,Φ後悔最小化への新たな経路 [cs.LG, cs.GT]目的:オンライン学習とオンラインマルチキャリブレーション間の還元
- 機械学習における予測精度向上は重要であり,特に外部後悔最小化は基本的な目標である。
- マルチキャリブレーションは,高次元データにおける精度の保証が難しい。
- 効率的なマルチキャリブレーション手法を確立し,Φ後悔最小化への新たな道を開く。
- オンライン学習とオンラインマルチキャリブレーション間のブラックボックス還元が実現可能であることが示された。
- この還元により,既存のオンラインマルチキャリブレーションアルゴリズムの分析が統一され,新たなアルゴリズム開発に貢献する。
- 高次元オンラインマルチキャリブレーションからΦ後悔最小化への還元により,複雑な固定点解析を回避し,より簡潔な結果と改善されたレートが得られた。
ルーマニア語法務分野における文法誤り検出・修正データセット:RoLegalGEC [cs.CL, cs.AI, cs.LG]目的:ルーマニア語法務分野における文法誤り検出と修正のためのデータセット
- 法文書の明瞭性と正確性は不可欠であり,法務専門家支援ツールの性能向上は重要である。
- ルーマニア語,特に法務分野において,手動アノテーションされたデータが不足している。
- 本研究は,ルーマニア語法務分野における文法誤り検出・修正のためのデータセットを提供し,その有効性を検証する。
- RoLegalGECは,35万件の法務文章における文法誤りとアノテーションを含む,初のルーマニア語データセットである。
- 知識蒸留Transformerやシーケンスタグ付けアーキテクチャなど,複数のニューラルネットワークモデルを評価し,検出と修正の性能を検証した。
- 本データセットとモデル群は,ルーマニア語の研究資源を豊かにすると考えられる。
AI生成エクササイズ処方の一貫性:3つの大規模言語モデルにおける反復生成研究 [eess.SY, cs.SY, cs.CL, cs.AI]目的:大規模言語モデルによるエクササイズ処方の反復生成の一貫性
- 近年,AIを活用したヘルスケアのニーズが高まっており,特に個別化された運動処方の自動生成が注目されている。
- 大規模言語モデルの出力は確率的であり,同じ入力に対して異なる結果を生成する可能性があるため,一貫性の評価が課題となっている。
- 異なる大規模言語モデルの出力特性を比較し,信頼性の高い運動処方システムの開発に資する知見を得る。
- GPT-4.1は最も高い意味的類似度を示したが,その出力は完全にユニークであり,一貫した内容を維持していた。
- Gemini 2.5 Flashは高い類似度を示したが,テキストの重複が原因であり,一貫した推論によるものではなかった。
- モデル選択は技術的な判断ではなく臨床的な判断であり,反復生成時の出力特性が信頼性評価の重要な基準となる。
AblateCell:仮想細胞リポジトリのための再現・アブレーションエージェント [cs.AI, cs.MA]目的:AI仮想細胞における性能向上要因の特定
- AI技術を生物学に応用する上で,仮想細胞は重要な研究基盤となる。
- 既存の生物学的リポジトリは標準化が不十分で,実験の再現が困難である。
- リポジトリの検証と,性能に影響する要素の特定を効率化すること。
- AblateCellは,環境設定,依存関係の解決,評価の再実行を通じて,報告されたベースラインを再現することに成功した。
- 3つのシングルセル摂動予測リポジトリにおいて,88.9%のワークフロー成功率,93.3%の真の重要な要素の復元精度を達成した。
- これにより,生物学的コードベースに対するスケーラブルな検証と要因分析が可能となる。
SAGE:厳しいアップリンク予算下におけるエッジクラウド推論のための学習不要な意味的証拠の合成 [cs.RO, cs.CL, cs.LG, cs.CV, eess.SP]目的:厳しいアップリンク予算下でのエッジクラウド推論における意味的証拠の合成手法
- エッジコンピューティングの普及に伴い,低遅延かつ高効率な推論が求められている。
- アップリンク帯域制限下では,送信データ量を削減することが課題となる。
- 意味的証拠の選択を通じて,限られた帯域で高精度な推論を実現すること。
- 従来の注意機構に基づく方法では,厳しい予算下で性能が制限されることが示された。
- 提案手法SAGEは,意味的情報と多様性を考慮した証拠選択により,高精度を達成する。
- ImageNet-1Kにおいて,SAGEは既存手法を大幅に上回り,サーバーの性能に匹敵する精度を実現した。
金融応用における時系列拡張生成 [cs.AI, cs.CE]目的:金融時系列分析におけるLLMエージェントの推論能力の厳密な評価
- 金融分野では,複雑な定量分析にAIを活用する需要が高まっている。
- 既存のベンチマークでは,LLMの純粋な推論能力を正確に評価することが困難である。
- 金融時系列分析に特化した,より信頼性の高いLLM評価フレームワークの確立を目指す。
- 大規模な実験により,高性能なエージェントは,ツール利用の精度をほぼ完璧に達成し,幻覚を最小限に抑えられることが示された。
- ツール拡張パラダイムの有効性が検証され,信頼性の高い金融AI研究を促進するための標準化された評価基盤が提供された。
- 本研究で開発されたTSAGフレームワークとベンチマークは,公開されており,今後の研究に貢献することが期待される。
チャンク単位の相互連結によるストリーミングターゲットスピーカー抽出 [cs.SD, cs.AI]目的:ストリーミングターゲットスピーカー抽出の実現
- 音声処理分野において,ターゲットスピーカー抽出は重要な技術であり,様々な応用が期待される。
- 生成モデルは高い性能を示すものの,ストリーミング処理には向いておらず,低遅延での運用が困難である。
- チャンク単位の相互連結により,ストリーミング環境下でも性能劣化なくターゲットスピーカー抽出を実現する。
- 提案手法は,低遅延時においても100%の安定性と高い明瞭度を維持し,オフラインベースラインと同等以上の性能を示す。
- 消費者向けGPU上で0.248のリアルタイムファクター(RTF)を達成し,低遅延アプリケーションへの適用可能性を示した。
- 本研究は,チャンク単位の相互連結パラダイムにより,生成モデルが遅延に敏感なアプリケーションにも有効であることを実証した。
SafetyALFRED:マルチモーダル大規模言語モデルの安全配慮型計画の評価 [cs.AI, cs.CL, cs.RO]目的:マルチモーダル大規模言語モデルにおける安全性評価
- ロボットやエージェントが現実世界で活躍するためには,安全性確保が不可欠である。
- 既存の安全性評価は,状況認識に偏っており,実際の行動における安全対策が不十分である。
- 現実世界の危険を考慮した,行動計画の安全性を評価する新たなベンチマークの必要性。
- 既存モデルは,質問応答形式での危険認識は高いが,実際の行動計画における危険回避は低い。
- 静的な質問応答形式の評価では,物理的な安全性を十分に評価できないことが示された。
- 身体性を伴う環境での是正行動を重視した評価パラダイムへの転換が求められる。
ワールドモデルを用いたオンラインリーマン最適化による安全性重視の文脈的制御 [eess.SY, cs.AI, cs.SY]目的:安全性重視の文脈的制御におけるタスク目的の最適化
- 複雑化する現実世界制御において,安全性と効率性の両立が重要課題となっている。
- ブラックボックスなシミュレータからの情報のみでは,安全性を保証した制御が困難である。
- 文脈情報を活用し,シミュレータの出力から安全な制御を導出することを目指す。
- 提案手法である文脈的PPCは,環境の変化にもロバストな性能を示すことが確認された。
- シミュレーション結果から,文脈的PPCは周辺密度モデルや固定密度モデルを大幅に上回ることが示された。
- バリア曲率が収束速度と安全マージンを制御し,未知のダイナミクスのリプシッツ定数を置き換えることが示された。
CoCo-SAM3:オープンボキャブラリセマンティックセグメンテーションにおける概念衝突の活用 [cs.CL, cs.RO, cs.CL, cs.CV, cs.AI]目的:オープンボキャブラリセマンティックセグメンテーションにおける概念衝突の軽減
- 画像認識技術は,自動運転や医療診断など幅広い分野で重要性が増している。
- 既存手法では,異なるカテゴリのプロンプト間で一貫した比較が難しく,セグメンテーション精度が低下しやすい。
- CoCo-SAM3は,概念の一貫性とクラス間の競争を明示的に分離し,セグメンテーションの安定化を目指す。
- CoCo-SAM3は,同義語プロンプトからのエビデンスを統合することで概念の一貫性を強化する。
- 統一された比較可能なスケール上でクラス間競争を行うことで,ピクセル単位での直接比較を可能にする。
- 追加の学習なしに,8つのオープンボキャブラリセマンティックセグメンテーションベンチマークで一貫した性能向上を達成した。
環境音のディープフェイク検出のための深層学習フレームワーク [cs.SD, cs.AI]目的:環境音のディープフェイク検出
- 音声情報の信頼性確保は,社会生活や安全保障において重要である。
- 近年,音声の偽装技術が高度化しており,検知が困難になっている。
- ディープフェイク音声の検知技術を確立し,その被害を軽減すること。
- 環境音シーンと音イベントのディープフェイク検出は,個別のタスクとして扱うべきである。
- 事前学習済みモデルのファインチューニングが,スクラッチからの学習よりも効果的である。
- 提案手法は,EnvSDDテストセットで98%の正解率,ESDD-Challenge-TestSetで88%の正解率を達成した。
合成軌跡生成器に関する二面的考察:有用性フレームワークとプライバシー脆弱性 [cs.AI]目的:合成軌跡生成器における有用性とプライバシーのトレードオフ評価
- 都市計画や公衆衛生など,人間の移動データは多岐にわたる分野で活用されている。
- 移動データには,宗教や政治的信条などの機微な情報が含まれる可能性があり,プライバシー保護が課題である。
- 生成モデルを活用した新しいプライバシー保護手法の有用性とプライバシー保護のバランスを評価する。
- 本研究では,有用性評価のための新しいフレームワークを提案し,その応用を行った。
- 生成モデルの一部のカテゴリに対し,従来の想定よりも脆弱性があることを実証した。
- EU規制に準拠した敵対的評価によるプライバシー評価の重要性を指摘した。
ユーザーデータを保護するためのAIエージェント実行環境 [cs.DC, cs.CL, cs.CR, cs.AI, cs.OS]目的:AIエージェントにおけるユーザーデータの機密性保証
- AIエージェントは普及が期待されるが,個人情報保護が課題となる。
- AIモデルへの攻撃や悪意のある提供者による情報漏洩リスクが存在する。
- ユーザーデータの利用許諾に基づき,機密性を保証する実行環境を開発する。
- GAAPは,ユーザーの許可仕様に基づき,AIエージェントのデータ開示を厳格に管理する。
- 情報フロー制御と新たなデータ管理技術により,複数タスクにわたる情報伝播も追跡可能。
- 評価実験の結果,GAAPはあらゆるデータ漏洩攻撃を阻止し,エージェントの有用性を損なわない。
損傷と動作変動の分離:出力のみ構造損傷識別のためのラベルなし自己教師あり表現学習フレームワーク [cs.LG]目的:構造損傷識別のための,頑健な振動ベースの表現学習フレームワーク
- 構造物の健全性監視は,安全性確保や維持管理において不可欠であるため重要性が高い。
- 振動データには,損傷以外の要因による変動が混入しやすく,正確な損傷識別を妨げる。
- 損傷と変動を分離し,損傷に特有な特徴量を抽出することで,より信頼性の高い識別を目指す。
- 提案手法は,ラベルなし自己教師あり学習により,振動加速度信号から直接表現を学習する。
- Variance-Invariance-Covariance Regularization (VICReg)により,動作・環境変動に対する不変性を獲得する。
- 実世界の橋梁とギアボックスのデータを用いた検証により,頑健性と汎化性能が確認された。
トップ1からトップKへ:レコメンダシステムにおける反事実説明の再現性とベンチマーク研究 [cs.IR, cs.LG]目的:レコメンダシステムにおける反事実説明手法の再現性と公平な比較
- レコメンダシステムは現代社会において重要な意思決定支援ツールであり,その透明性と説明可能性が求められている。
- 既存の反事実説明手法は,評価プロトコルが統一されておらず,再現性や公平な比較が困難である。
- 統一されたベンチマークフレームワークを構築し,既存手法の性能を多角的に評価することで,反事実説明の信頼性を高める。
- 11の最先端反事実説明手法を再現・再実装・再評価した結果,手法の性能は評価設定に大きく依存することが明らかになった。
- 特に明示的な説明形式において,有効性とスパース性のトレードオフが顕著であり,既存研究の結論を修正する必要がある。
- グラフベースの説明手法は,大規模なレコメンダグラフにおいてスケーラビリティに限界があることが示された。
Chat2Workflow:自然言語による実行可能なビジュアルワークフロー生成のためのベンチマーク [cs.IR, cs.CL, cs.AI, cs.CV, cs.LG, cs.MA]目的:実行可能なビジュアルワークフローの自然言語による生成
- 実世界の産業利用において,信頼性と制御性に優れたビジュアルワークフローが主流となっている。
- 現状では,ワークフロー構築が手作業に頼るため,コストと時間がかかり,エラーが発生しやすい。
- 大規模言語モデルによるワークフロー自動化の可能性を探るためのベンチマークとして,本研究は開発された。
- 最先端の言語モデルは高レベルな意図は捉えやすいものの,正確で安定した実行可能なワークフロー生成には苦戦している。
- 提案するエージェントフレームワークは解決率を最大5.34%向上させるが,実用的な自動化には課題が残る。
- Chat2Workflowは,産業グレードの自動化を推進するための基盤を提供する。
HardNet++:ニューラルネットワークにおける非線形制約の強制 [cs.LG]目的:ニューラルネットワークの出力における制約充足の強制
- 制御や意思決定において,安全性,信頼性,物理的整合性が重要であり,制約充足は不可欠である。
- 既存手法は線形制約に限定されるか,推論時に制約が保証されないという課題がある。
- 非線形制約を強制する汎用的な手法を開発し,実世界の複雑な問題に対応することを目指す。
- HardNet++は,線形および非線形制約を同時に充足する制約強制手法である。
- ネットワーク出力を減衰付き局所線形化によって反復的に調整し,微分可能なエンドツーエンド学習フレームワークを実現する。
- 特定の条件下では,任意の許容誤差で非線形制約を強制できることを理論的に示す。
人間とロボットの協働における多周期空間・時間適応 [cs.RO, cs.AI]目的:人間とロボットの協働計画の最適化
- ロボットを人間の作業空間に実用的に導入するためには,効果的な人間とロボットの協働が不可欠である。
- 個々の人間の能力や好みをモデル化することの難しさから,協働計画の最適化は課題となっている。
- タスクレベルと動作レベルの適応を統合し,効率と近接性の両面から最適化を図ることを目指す。
- 提案手法RAPIDDSは,人間の空間的行動(経路)と時間的行動(タスク完了時間)を多周期的にモデル化し,タスクスケジューリングとロボット動作の調整を同時に行う。
- シミュレーションと実機実験の結果,RAPIDDSは既存手法と比較して,効率と近接性の両方において優れた性能を示すことが確認された。
- ユーザースタディ(n=32)においても,客観的指標と主観的指標の両方において,適応システムの方が改善が見られた。
予算制約下でのオンライン影響力最大化 [cs.LG, stat.ML]目的:オンライン影響力最大化における予算制約下での戦略
- ソーシャルメディアは情報伝達に不可欠であり,効果的な広告戦略が重要である。
- 従来の戦略は影響範囲に偏重し,広告予算を考慮した最適化が課題であった。
- 広告予算を最適に配分し,費用対効果の高い影響力最大化を目指す。
- 本研究では,独立カスケード拡散モデルとエッジレベルの半バンディットフィードバックを仮定したアルゴリズムを提案する。
- 提案手法は,従来のカーディナリティ制約下においても,最新のレグレット限界を改善する。
- 広告キャンペーンの総費用を考慮することで,現実世界の広告戦略に適合したモデルを構築した。
不確実性下における高精度インコンタクト操作のためのハイブリッド制御ポリシー学習 [cs.RO, cs.AI, cs.LG]目的:不確実性下での高精度インコンタクト操作のためのハイブリッド制御ポリシー
- ロボットの繊細な操作性能向上は,製造業や医療などの分野で不可欠である。
- 従来の姿勢ベース制御は,力制御が不十分であり,繊細な部品の破損リスクがある。
- ハイブリッド制御によって,状況に応じて力制御と位置制御を使い分け,安全かつ高精度な操作を実現する。
- 提案手法MATCHは,極端な位置推定誤差下でも,姿勢制御ポリシーを大幅に上回る成功率を示した。
- MATCHは,姿勢制御ポリシーと同程度のデータ効率を維持しながら,より複雑な行動空間で学習を可能にした。
- シミュレーションから実機への移行実験において,MATCHはノイズ環境下で姿勢制御ポリシーの2倍の成功率を達成し,平均力を30%削減した。
PREF-XAI:嗜好に基づいたブラックボックス機械学習モデルのパーソナライズされたルール説明 [cs.RO, cs.LG]目的:ブラックボックス機械学習モデルの説明における,嗜好に基づいたパーソナライズ手法
- 説明可能なAIは,モデルの透明性を高め,信頼性を向上させる上で重要である。
- 既存の説明手法は,ユーザーの多様なニーズや嗜好に対応できていない場合がある。
- ユーザーの嗜好を学習し,個々のユーザーに最適な説明を生成することを目指す。
- 提案手法は,ユーザーの限られたフィードバックから嗜好を正確に再構築できることを示した。
- ユーザーにとって関連性の高い説明を特定し,ユーザーが当初考慮していなかった新しいルールを発見できる。
- XAIと嗜好学習の関連性を示し,インタラクティブで適応的な説明システムの新たな方向性を示唆する。
A-MAR:ファイングレインドな美術作品理解のためのエージェントベースのマルチモーダル美術作品検索 [cs.CL, eess.SY, cs.SY, cs.AI]目的:美術作品のファイングレインドな理解
- 美術作品の理解には,視覚的情報と文化的・歴史的背景知識が必要である。
- 既存のマルチモーダル大規模言語モデルは,根拠の明示が難しく解釈性に課題がある。
- 構造化された推論計画に基づいた検索により,根拠に基づいた説明を可能にすること。
- A-MARは,推論計画に基づいて検索を行うエージェントベースのマルチモーダル美術作品検索フレームワークである。
- 新しい診断ベンチマークArtCoT-QAを用いて,マルチステップ推論能力を評価した結果,A-MARは既存手法を上回る性能を示した。
- 本研究は,知識集約的なマルチモーダル理解において,推論に基づく検索の重要性を示唆する。
エントロピー正則化マルコフ決定過程とゲームにおける計画 [cs.LG]目的:エントロピー正則化マルコフ決定過程と二人零和ゲームにおける価値関数推定
- 強化学習は,環境との相互作用を通じて最適な行動戦略を獲得する重要な手法である。
- 従来の強化学習アルゴリズムは,最悪の場合,サンプル複雑度が保証されない場合がある。
- エントロピー正則化を利用し,サンプル複雑度を理論的に保証する計画アルゴリズムを開発する。
- 提案手法SmoothCruiserは,環境の生成モデルを用いて,エントロピー正則化されたマルコフ決定過程とゲームにおける価値関数を効率的に推定する。
- SmoothCruiserは,ベルマン演算子の滑らかさを利用することで,目標精度εに対して,サンプル複雑度O~(1/ε^4)を達成する。
- これは,正則化されていない設定における既存のアルゴリズムと比較して,問題に依存しないサンプル効率の向上を示す。
モンテカルロ積分への決定論的点過程の2つの利用法 [cs.LG, math.ST, stat.TH]目的:モンテカルロ積分の分散削減
- 高次元積分計算において,モンテカルロ法は広く用いられている手法である。
- 従来のモンテカルロ法は,分散がサンプル数に反比例するため,高精度な計算には課題がある。
- 決定論的点過程を用いることで,モンテカルロ法の分散を改善し,効率的な積分計算を目指す。
- 決定論的点過程に基づく推定量の分散が,DPPの適応方法によって変化することが示された。
- Bardenet & Hardy (2020) の推定量は滑らかな関数に対して$\mathcal{O}(N^{-(1+1/d)})$のレートを持つ。
- Ermakov & Zolotukhin (1960) の推定量は不偏であり,従来のモンテカルロ法と同程度のレートを持つが,関数にDPPを適合させる。
超計量OGP - パラメータ的RDT対称二値パーセプトロン接続 [cs.LG, cond-mat.dis-nn, cs.IT, math.IT, math.PR, stat.ML]目的:統計的計算ギャップ(SCG)の特性評価
- 機械学習の理論において,学習可能性を評価する上で重要な研究分野である。
- 学習問題の難易度を正確に評価する指標が確立されていない。
- OGPとパラメータ的RDTの関係を解明し,学習閾値の理解を深める。
- 超計量OGPの制約密度の上限を厳密に導出し,数値評価を行った結果,既存のパラメータ的RDT推定値と高い一致性が見られた。
- 第1,第2レベルの超計量OGPにおける上限値は,それぞれパラメータ的RDT推定値の第3,第4リフティングレベルとほぼ一致した。
- 超計量OGPとパラメータ的RDTの間には,完全な同型関係が存在する可能性が示唆され,今後の研究への展望が開かれた。
適応型MSD分割:傾いた連続属性に対するC4.5とランダムフォレストの強化 [cs.LG, cs.AI]目的:傾いた連続属性に対する決定木誘導における効率と精度向上
- 決定木は,データから知識を抽出する強力な手法であり,多くの分野で利用されている。
- 連続値属性の離散化は計算コストが高く,特に大規模データセットではボトルネックとなる。
- 偏ったデータに対する情報損失を抑制し,決定木の性能を向上させることを目指す。
- 適応型MSD分割(AMSD)は,標準的なMSD分割と比較して2~4%の精度向上を示した。
- AMSDは,標準的なMSD分割と同等の計算量削減効果を維持している。
- ランダムフォレストへの統合(RF-AMSD)により,最先端の精度を低い計算コストで実現した。
Vision Transformerにおける敵対的学習における良性過学習 [cs.LG, cs.AI]目的:Vision Transformerにおける敵対的学習のロバスト性に関する理論的分析
- ViTは画像認識で高い性能を示すが,敵対的攻撃に脆弱である点が課題となっている。
- 敵対的学習は有効な防御策だが,ViTにおけるそのロバスト性の理論的根拠は不明であった。
- 特定の条件下での敵対的学習が,ViTにほぼゼロのロバスト損失と汎化誤差をもたらすことを示す。
- 敵対的学習によってViTは,信号対雑音比の条件と許容可能な摂動範囲内で,過学習状態でも高い汎化性能を発揮する。
- この現象はCNNにおける良性過学習と同様であり,ViTにおいても敵対的学習が同様の効果をもたらすことを示した。
- 合成データと実データを用いた実験により,理論的結果が検証された。
VLA Foundry: ビジョン-言語-行動モデルの訓練を統合する統一フレームワーク [cs.RO, cs.AI, cs.CV, cs.LG, cs.SE]目的:ビジョン-言語-行動モデルの訓練のための統一的なフレームワークの提供
- 近年の大規模言語モデル(LLM)の発展は,様々なマルチモーダルタスクへの応用を促進している。
- 既存のVLA研究は,多くの場合,アクション訓練段階に特化しており,互換性のない事前学習パイプラインを組み合わせている。
- 言語事前学習から行動専門家による微調整まで,エンドツーエンドで制御可能な訓練スタックを提供すること。
- 本フレームワークを用いて,完全にゼロから訓練したモデルと,Qwen3-VLバックボーンを用いたモデルを訓練し,公開した。
- ゼロから訓練したモデルは,既存の非公開モデルと同等の性能を示し,Qwen3-VLバックボーンを用いることで,多様なタスクにおいてベースラインを大幅に上回る性能を達成した。
- フレームワークのコードベースおよびモデルの重みは,公開されており,誰でも利用可能である。
FB-NLL:パーソナライズされた連合学習におけるノイズラベルへの特徴量に基づくアプローチ [cs.LG, cs.IT, eess.SP, math.IT]目的:ノイズラベルを含む連合学習における,特徴量に基づくユーザークラスタリングとラベル修正
- データ分布の偏りが大きい連合学習において,各クライアントに特化したモデル構築が重要である。
- 既存手法では,学習過程におけるモデル更新の変動に影響されやすく,ノイズラベルに弱いという課題がある。
- 特徴量の構造に着目し,学習ダイナミクスに依存しない,ロバストなユーザーグルーピングを実現する。
- 提案手法FB-NLLは,特徴量の共分散行列のスペクトル構造を利用し,ユーザー間のタスクの一貫性を識別する。
- 本手法は,学習前のワンショットでクラスタリングを行うため,通信コストと計算コストを削減できる。
- 実験結果から,FB-NLLが既存手法よりも高い精度と安定性を実現することが示された。
FASTER:価値に基づくサンプリングによる高速強化学習 [cs.LG, cs.AI]目的:拡散モデルに基づく方策のテスト時スケーリングの効率化
- 強化学習は,複雑なタスクを自動で学習する上で重要であり,ロボット工学などへの応用が期待されている。
- 高性能な強化学習アルゴリズムは,計算コストが高く,実用上の制約となる場合がある。
- テスト時スケーリングの計算コストを削減し,効率的な学習を実現することを目的とする。
- FASTERは,ノイズ除去過程における行動候補の価値を予測し,早期にフィルタリングすることで,計算コストを削減する。
- オンラインおよびバッチオンライン強化学習の難しい操作タスクにおいて,FASTERは既存の方策を改善し,最高の性能を達成した。
- 事前学習済みのVLAに適用した場合,FASTERは同じ性能を維持しつつ,学習および推論に必要な計算量を大幅に削減した。
UniT:人間からヒューマノイドへのポリシー学習とワールドモデリングのための統一的な物理言語へ [cs.RO, cs.AI]目的:人間とヒューマノイド間の知識転移を可能にする,統一的な物理言語の確立
- ヒューマノイドロボットの能力向上には大量の学習データが不可欠であり,人間由来のデータ活用が鍵となる。
- 人間とヒューマノイドは運動学的構造が異なるため,人間データをそのまま利用することが困難である。
- この研究は,運動学的差異を克服し,人間データを効果的にヒューマノイドに応用することを目指す。
- UniTは,視覚的アンカーを介した統一的な潜在行動トークナイザーを用いて,人間とヒューマノイド間の知識を橋渡しする。
- ポリシー学習において,UniTは人間データを活用し,シミュレーションと実世界の両方で優れたデータ効率と汎化性能を実現した。
- ワールドモデリングにおいては,UniTは人間のアクションをヒューマノイドに直接転移させ,より制御性の高いビデオ生成を可能にした。
非定常環境における安全な継続的強化学習 [cs.LG]目的:非定常環境下での安全な継続的強化学習アルゴリズムの調査
- 物理モデルが不明な複雑なシステム制御に強化学習を活用する重要性が高まっている。
- 従来の強化学習手法は定常性を仮定しており,現実の非定常環境への対応が困難である。
- 安全性制約を維持しつつ,環境変化に適応する継続的強化学習法の開発を目指す。
- 安全制約の維持と破滅的忘却の防止の間にはトレードオフが存在することが示された。
- 既存手法は,非定常な動的環境下において,両方の目標を同時に達成することが難しい。
- 正則化に基づく戦略が,このトレードオフを部分的に軽減する可能性が示唆された。
安定性の限界における汎化性能 [cs.LG, cs.AI, cs.CV, stat.ML]目的:現代のニューラルネットワークにおける汎化性能のメカニズム
- 深層学習の性能向上は,汎化性能に大きく依存する。
- 汎化性能向上の要因が不明であり,理論的な理解が不足している。
- カオス的な最適化における汎化性能の理論的解明を目指す。
- 不安定な最適化動的系は,フラクタルアトラクタに収束することが示された。
- 新たに「シャープネス次元」を導入し,汎化性能の上界を導出した。
- 汎化性能はヘッセ行列のスペクトル全体と部分行列式の構造に依存することが明らかになった。
