arXiv雑要約
AI - 2026/03/02 公開
HumanMCP:MCPツール検索性能評価のための人間らしいクエリデータセット [cs.HC, cs.CL, cs.IR, cs.HC, cs.IR, cs.AI, cs.IR]目的:MCPツール検索性能の評価用人間らしいクエリデータセット
- LLMと外部システム連携の重要性が増す中で,MCPサーバーの活用が不可欠である。
- 既存データセットは人間らしいクエリが不足しており,実際の利用状況を正確に評価できない。
- 多様なユーザーの要求を反映したデータセットを構築し,MCPツールの汎用性を高める。
- 本研究では,308のMCPサーバーに存在する2800のツールに対応する多様なユーザークエリデータセットを構築した。
- 多様なユーザーペルソナを生成し,明確な要求から曖昧な探索的なコマンドまで,現実的な意図レベルを捉えた。
- これにより,既存のベンチマークの信頼性向上と,MCPサーバーのツール利用状況のより正確な評価が可能となる。
キーワード検索だけで十分:エージェントによるツール利用でベクトルデータベースなしでRAGレベルの性能を達成 [cs.IR, cs.AI]目的:質問応答における,ベクトルデータベースを用いないエージェントによるキーワード検索の性能評価
- 知識ベースを活用した応答の精度向上は重要であり,RAGはその代表的な手法である。
- RAGは,検索品質への依存性,統合の複雑さ,コストが課題として挙げられる。
- エージェントによるツール利用で,ベクトルデータベース不要のRAGと同等の性能を目指す。
- エージェントによるキーワード検索は,従来のRAGシステムと比較して,90%以上の性能指標を達成した。
- 本手法は,実装が容易で費用対効果が高く,知識ベースの頻繁な更新が必要な場合に特に有効である。
- ベクトルデータベースを使用しなくても,エージェントのツール利用によってRAGと同等の性能が期待できる。
理由の対比:カスケード型マルチモーダル検索フレームワーク [cs.IR, cs.AI, cs.CL]目的:マルチモーダル検索性能の向上
- マルチモーダルな情報検索は,多様なデータ形式を扱えるため重要である。
- 従来の検索システムは埋め込み次元数に依存し,性能向上の限界があった。
- 追加トークンによる推論を活用し,モデルサイズに依存しない性能向上を目指す。
- 提案手法TTE-v2は,推論ステップを追加することで検索性能を向上させている。
- MMEB-V2ベンチマークにおいて,TTE-v2-7Bは最先端の精度75.7%を達成した。
- TTE-v2-2Bは,より大規模なデータで学習された7Bモデルと同等またはそれ以上の性能を示した。
超長文書に対する汎用的な意味チャンク化:識別的フレームワーク [cs.CL, cs.AI, cs.IR]目的:超長文書におけるトピックセグメンテーション手法
- 情報検索や文書理解において,長文書のトピック分割は重要な役割を担う。
- 従来の方式は超長テキストにおいて課題が残されており,文書全体の意味構造を捉えにくい。
- 大規模言語モデルは強力だが,推論コストが高く,長文書への対応が難しい点を克服する。
- Qwen3-0.6Bを基盤とした識別的セグメンテーションモデルを提案し,超長文書の段落境界検出を実現した。
- ウィンドウ間コンテキスト融合層と境界分類ヘッドを追加し,オーバーラップするスライディングウィンドウ戦略と組み合わせた。
- WIKI-727Kデータセットで,Qwen2-0.5Bベースの生成モデルと比較して,F1スコアが向上し,推論速度が大幅に向上した。
インドの法廷推論のためのドメイン分割型ハイブリッドRAG:モジュール型で説明可能な法的AIへ [cs.IR, cs.AI, cs.CL]目的:インドの法廷推論のためのモジュール型で説明可能な法的AIシステムの基盤
- インドの法務調査は,法律,憲法,刑法,判例など多岐にわたる文書を扱うため,高度な情報検索が不可欠である。
- キーワード検索や埋め込みのみの検索システムでは,構造化された法廷推論を十分にサポートできないという課題がある。
- ドメイン分割とナレッジグラフを活用し,インドの法務調査における複雑な推論と情報検索の課題を解決する。
- 提案システムは,最高裁判例,法律・憲法,インド刑法を対象とした3つの専門的なRAGパイプラインを統合することで,ドメイン特化型の検索を実現した。
- 構築されたLegal Knowledge Graphは,事件,法律,IPC条項,裁判官,引用間の構造的な関係を捉え,関係推論を可能にした。
- 評価実験では,ハイブリッドアーキテクチャが70%の合格率を達成し,RAGのみのベースライン(37.5%)を大幅に上回る結果が得られた。
グラフRAGの民主化:多段質問応答のための線形CPU専用グラフ検索 [cs.IR, cs.AI, cs.CL]目的:多段質問応答のためのグラフ検索手法
- 複雑な質問応答において,知識の構造化が重要であるため,グラフ構造を利用したRAGが注目されている。
- 既存のグラフRAGシステムは,LLMやGPUに依存しており,コストが高く,利用が限定されている。
- CPU環境でも効率的に動作する,軽量なグラフ検索手法を開発し,グラフRAGの利用を促進すること。
- 提案手法SPRIGは,LLMに頼らず,NERに基づいた軽量なグラフ構築とPPRを用いることで,線形時間でグラフ検索を実現した。
- SPRIGは,GPUを必要とせず,Recall@10の低下を最小限に抑えながら,multi-hop recallを28%向上させた。
- CPUフレンドリーなグラフ検索が有効な状況と,RRFで十分な状況を明らかにし,グラフRAGの民主化への道筋を示した。
AMLコンプライアンスにおける不利なメディアスクリーニングのためのエージェントLLMフレームワーク [cs.AI, cs.CL, cs.IR]目的:金融機関におけるAMLおよびKYCコンプライアンスプロセスにおける不利なメディアスクリーニングの自動化
- 金融犯罪防止において,顧客の身元確認とリスク評価は重要であり,AMLコンプライアンスは不可欠である。
- 従来のキーワード検索は誤検知率が高く,手動レビューに多大な労力が必要となるという課題がある。
- LLMを活用し,高リスクと低リスクの個人を区別することで,スクリーニングの精度と効率を向上させる。
- 本システムは,LLMエージェントがウェブを検索し,関連文書を処理することで,不利なメディアスクリーニングを自動化する。
- OpenSanctionsや学術情報に基づいたデータセットを用いて評価した結果,高リスクと低リスクの個人を識別できることが示された。
- 不利なメディア指数(AMI)スコアを算出することで,より客観的なリスク評価が可能となる。
Higress-RAG:デュアルハイブリッド検索,適応ルーティング,CRAGによるエンタープライズ検索拡張生成のための包括的最適化フレームワーク [cs.IR, cs.AI, cs.CL]目的:エンタープライズにおける検索拡張生成の最適化
- LLMの活用が進む中で,企業知識管理システムへのRAG導入が重要視されている。
- 複雑なクエリに対する検索精度,生成時の幻覚,リアルタイム処理の遅延が課題となっている。
- RAGシステムのボトルネックを解消し,スケーラブルで幻覚に強いエンタープライズAIを実現する。
- Higress RAG MCP Serverは,適応ルーティング,セマンティックキャッシュ,ハイブリッド検索,CRAGにより,フルリンク最適化を実現した。
- 構造を意識したデータ取り込み,RRFによる検索結果の融合,動的閾値を持つ50msのセマンティックキャッシュ機構を実装した。
- 技術ドキュメントとブログでの実験により,システムアーキテクチャの堅牢性と,検索ライフサイクル全体の最適化による効果が確認された。
見える化された責任あるAI:初期段階のヘルスケアイノベーションのためのダッシュボード設計 [cs.HC, cs.HC, cs.HC, cs.AI, cs.CY]目的:初期段階のヘルスケアイノベーションにおける責任あるAIガバナンスダッシュボードの設計
- ヘルスケア分野へのAI導入は,倫理的配慮と事業目標のバランスが重要であり,その実現が求められる。
- 責任あるAIの実践が抽象的で,初期段階のイノベーションの現実と整合していないという課題がある。
- ヘルスケア分野におけるAIイノベーションの多様性と包容性を高めるため,ガバナンスダッシュボードの設計指針を提示する。
- ステークホルダーとの共同創造,組織の成熟度との整合,多様な役割とタスクのサポートが,効果的なダッシュボード設計に不可欠である。
- 本研究は,責任あるAIガバナンスダッシュボードの設計に関する具体的な指針を提供し,初期段階のヘルスケアイノベーションにおける意思決定と説明責任を支援する。
- エコシステムレベルでの連携が,ヘルスケア分野におけるよりスケーラブルで多様なAIイノベーションを促進する可能性がある。
Hello-Chat:リアルなソーシャルオーディオインタラクションに向けて [cs.SD, cs.AI, cs.CL, eess.AS]目的:リアルなソーシャルシナリオに適したオーディオ言語モデルの実現
- 対話型AIの発展には,人間らしい自然な音声表現が不可欠である。
- 既存のオーディオ言語モデルは,感情や抑揚が乏しく,機械的な話し方になりがちである。
- 人間らしい自然な音声生成と,感情に寄り添うAIエージェントの開発を目指す。
- Hello-Chatは,大規模な会話データとモダリティインターリーブ学習により,人間らしい音声生成を達成した。
- 音声理解タスクにおいて最先端の性能を発揮し,既存モデルを上回る自然さと感情的な一致を実現した。
- 共感的なAIエージェントの実現に向けた道を開く成果である。
タスクレンズ:低リソースインド言語におけるクロス・タスク有用性に基づく音声データセットプロファイリング [cs.CL, cs.AI, cs.SD, eess.AS]目的:低リソースインド言語における音声データセットのクロス・タスク有用性プロファイリング
- 包括的な音声技術の需要増加に伴い,NLP研究のための多言語データセットの必要性が高まっている。
- 低リソース言語における既存のタスク固有リソースの認知度が低く,研究の妨げとなっている。
- 既存データセットのクロス・タスク活用を評価し,データ不足の課題を緩和することを目指す。
- 50のインドの音声データセット(26言語)を9つの下流タスクに対して評価するクロス・タスク調査「Task-Lens」を提案した。
- 多くのデータセットには,複数のタスクをサポート可能な未活用メタデータが含まれていることが判明した。
- クロス・タスクの繋がりとギャップを明らかにすることで,既存データセットの応用範囲を拡大し,データ作成の優先順位付けを支援する。
グラフ強化学習による意見の分極化ペースの制御 [cs.SI, cs.LG]目的:オンラインソーシャルネットワークにおける意見の分極化制御
- 社会の結束や民主的プロセスへの深刻なリスクがあるため,意見の分極化抑制は重要である。
- 既存手法は線形設定に特化し,閉形式の定常状態解析に依存するため,拡張性や適用範囲に限界がある。
- ネットワーク介入を通じて,適応的な介入方針を確立し,多様なシナリオに対応することを目指す。
- PACIFIERは,ネットワーク介入を通じて,意見の分極化を段階的に抑制するグラフ強化学習フレームワークである。
- PACIFIERは,定常状態の再計算なしに,予算や意見の偏りを考慮した介入を可能にする。
- 実世界のネットワークを用いた実験により,PACIFIERの優れた性能と拡張性が確認された。
表現消去に基づく嗜好性最適化によるLLMの無毒化 [cs.LG]目的:大規模言語モデルにおける有害な出力の抑制
- LLMの安全性確保は,実用化における重要な課題である。
- 既存の防御策は,敵対的プロンプトや再学習攻撃に脆弱である。
- 表現層における有害な情報を除去し,モデルの安全性と汎用性を両立する。
- 表現消去に基づく嗜好性最適化(REPO)は,有害な出力を抑制する上で,既存手法を上回る堅牢性を示す。
- REPOは,毒性に関連するニューロンに対して,局所的かつ深い編集を加えることで,モデル全体の有用性を維持する。
- 再学習攻撃や高度な脱獄攻撃を含む,様々な脅威に対して有効であることが実証された。
U-CAN:生成推薦における効率的な学習解除のためのユーティリティを考慮したコントラスト的減衰 [cs.LG]目的:生成推薦におけるプライバシー保護とユーティリティ維持を両立する学習解除手法
- 推薦システムはユーザーの嗜好を学習するが,個人情報保護が重要課題となっている。
- 既存の学習解除手法は,モデルの汎用性とプライバシー保護のトレードオフに陥りやすい。
- U-CANは,低ランクアダプター上で精密な学習解除を行い,ユーティリティの低下を最小限に抑える。
- U-CANは,活性化のコントラストを比較することでリスクを定量化し,忘却セットに敏感で保持セットでは抑制されるニューロンに焦点を当てる。
- 保持セットの活性化ノルムと重み大きさを組み合わせたユーティリティを考慮した較正メカニズムにより,保持性能に大きく貢献する次元に高いユーティリティスコアを割り当てる。
- 実験結果から,U-CANは強力なプライバシーの忘却,ユーティリティの保持,計算効率を実現することが示された。
脱個別化ニューロン:連続的対称性が動的トポロジーを可能にする [cs.NE, cs.LG]目的:動的ネットワークにおける新規手法
- 脳の構造や機能は複雑であり,その理解はAI研究の根幹である。
- 既存のニューラルネットワークは静的構造であり,タスクに応じた柔軟な変化が難しい。
- タスク需要に応じてネットワーク構造をリアルタイムに変化させる手法を開発すること。
- 等方性活性化関数を用いることで,ニューロンの成長と縮小を可能にし,ネットワーク構造の変化に対する不変性を実現した。
- 層の対角化により,影響の強いニューロン間通信とそうでないものを特定し,不要なニューロンを削除できることを示した。
- 等方性密結合ネットワークは,機能性を維持しつつ最大50%の疎性を達成可能であることが示された。
トークンレベルの報酬による安全なコード生成学習 [cs.CR, cs.AI, cs.SE]目的:安全なコード生成のための手法
- 近年のLLMはコード生成能力が高いが,セキュリティ脆弱性の問題が残る。
- 質の高いセキュリティデータが不足しており,報酬信号が粗雑である点が課題。
- LLMの自己反省を利用し,高信頼な修正ペアを構築し,トークンレベルの報酬を用いることで,セキュリティ向上を目指す。
- PrimeVul+データセットとSRCode訓練フレームワークにより,生成コードのセキュリティ脆弱性が大幅に減少した。
- SRCodeは,従来のインスタンスレベルの報酬スキームよりも局所的なセキュリティ実装の最適化を精密に行える。
- 複数のベンチマークにおいて,セキュリティ向上と同時にコード品質全体の改善が確認された。
量子機械学習における長距離周波数調整 [cs.LG, cs.AI, cs.ET, quant-ph]目的:量子機械学習モデルにおける周波数調整手法の改良
- 量子機械学習は,古典的な機械学習では困難な問題を解決する可能性を秘めている。
- 従来の周波数エンコーディングは,回路の深さが大きくなるという課題があった。
- 学習可能な周波数アプローチの実現可能性を向上させること。
- 学習可能な周波数アプローチでは,周波数係数の学習範囲が限られていることが判明した。
- 三進エンコーディングを用いたグリッド初期化により,周波数到達範囲の制限を克服した。
- 合成データセットおよび実際のフライト乗客データセットで,提案手法が従来の初期化手法を上回る性能を示した。
脳-OF:fMRI,EEG,MEGに対応する多機能基盤モデル [cs.LG, cs.AI, eess.SP, q-bio.NC]目的:fMRI,EEG,MEGの統合的学習による脳基盤モデルの構築
- 脳科学研究の発展において,大規模データと多様な解析手法の活用が重要となっている。
- 既存の脳基盤モデルは単一モダリティに限定され,異なる計測手法間の統合が困難である。
- 複数の脳波計測法を統合し,より包括的な脳活動理解を目指す。
- Brain-OFは,fMRI,EEG,MEGの単独および複合入力に対応する統一的なフレームワークを構築した。
- Any-Resolution Neural Signal Samplerにより,異なる時間空間分解能の脳信号を共有の潜在空間に投影することが可能となった。
- Masked Temporal-Frequency Modelingという新たな事前学習手法により,時間・周波数領域双方で脳信号の再構成を実現した。
EvoX:自動発見のためのメタ進化 [cs.LG, cs.CL, cs.NE]目的:自動最適化におけるメタ進化戦略
- LLMと進化探索の組み合わせが,プログラムやアルゴリズムの改善に有効であることが示されている。
- 既存手法は固定的な探索戦略に依存し,タスクの変化や時間経過に伴う適応が困難である。
- EvoXは探索戦略自体を最適化し,動的に探索方法を変化させることでこの問題を解決する。
- EvoXは,候補解と,それらを生成する探索戦略を同時に進化させる。
- その結果,200近い現実世界の最適化タスクにおいて,既存のAI駆動型進化法を上回る性能を示した。
- EvoXは進捗状況に応じて探索戦略を動的に変化させ,最適化プロセスを改善する。
DesignSense:グラフィックレイアウト生成のための人間の選好データセットと報酬モデリングフレームワーク [cs.HC, cs.SI, math.DS, nlin.AO, physics.soc-ph, cs.CV, cs.AI]目的:グラフィックレイアウト評価のための人間の選好データセットと報酬モデル
- 視覚コミュニケーションにおいて,グラフィックレイアウトは重要な役割を担う。そのため,高品質なレイアウト生成が求められる。
- 既存のレイアウト生成モデルは,人間の微妙な美的判断に合致しない場合が多く,汎用的なモデルでは十分な性能が得られない。
- 人間の選好に基づいた,より高品質なグラフィックレイアウト生成を可能にするためのデータセットと報酬モデルを開発すること。
- DesignSense-10kは,10,235組の人間の選好ペアを含む大規模なデータセットである。
- DesignSenseは,既存のオープンソースおよびプロプライエタリモデルを大幅に上回り,Macro F1で最良のプロプライエタリベースラインより54.6%向上した。
- DesignSenseを報酬モデルとして利用することで,レイアウト生成器の勝率が約3%向上し,推論時のスケーリングでさらに3.6%改善された。
人間による監督が情報ボトルネックとなる:人間によるガイダンス付き学習におけるエラーフロアの統一理論 [cs.CL, cs.IR, cs.LG, cs.AI]目的:人間によるガイダンス付き学習におけるエラーフロアの構造的性質
- 大規模言語モデルは人間データに依存。性能向上のため,人間の質の高いフィードバックが不可欠である。
- 人間のフィードバックはノイズや主観,言語表現の限界により,モデルの精度向上を妨げるエラーフロアを生む。
- 人間による監督チャネルの限界がエラーフロアの原因を解明し,解決策を提示すること。
- 人間の監督チャネルが評価対象に対して不十分な場合,情報損失が生じ,学習者の過剰リスクフロアが確定的に発生する。
- エラーフロアは,注釈ノイズ,好みゆがみ,意味圧縮という構造分解から生じる。
- 十分な情報を持つ補助的な非人間信号は,監督能力を高め,エラーフロアを解消する可能性がある。
BiKA:コルモゴロフ・アーノルド・ネットワークに着想を得た超軽量ニューラルネットワークハードウェアアクセラレータ [cs.CL, cs.DL, cs.AR, cs.AI]目的:エッジデバイス向けニューラルネットワークハードウェアアクセラレータの設計
- リソースと電力制約のあるエッジデバイスにおいて,軽量なニューラルネットワークアクセラレータは不可欠である。
- 量子化や二値化はある程度の軽量化に貢献するが,従来のANN計算パターンに依存している。
- コルモゴロフ・アーノルド・ネットワークの利点を活かし,ハードウェア実装のコストを削減する。
- BiKAは,非線形関数をバイナリ化された学習可能な閾値に置き換えることで,乗算を必要としないアーキテクチャを実現した。
- FPGAプロトタイプの結果,BiKAは二値化および量子化されたニューラルネットワークシストリックアレイアクセラレータと比較して,ハードウェアリソース使用量をそれぞれ27.73%と51.54%削減した。
- BiKAは,精度を維持しつつ,エッジデバイスにおけるハードウェアフレンドリーなニューラルネットワーク設計の有望な方向性を示す。
自動前処理によるグローバルな解釈可能性:精神医学的質問票に着想を得たフレームワーク [cs.RO, cs.LG, q-bio.QM, stat.ML]目的:精神医学的質問票データにおける,将来の症状重症度予測の解釈可能性向上
- 精神疾患の診断・治療には,症状の変化を正確に予測することが不可欠である。
- 精神医学的質問票は文脈依存性が高く,予測精度が低い場合が多い。
- 非線形モデルの解釈性を損なうことなく,予測精度を向上させること。
- 提案手法REFINEは,非線形処理を前処理段階に限定し,予測段階では線形モデルを用いることで,グローバルな解釈性を確保している。
- REFINEは,他の解釈可能な手法と比較して,予測性能を向上させつつ,精神医学的および非精神医学的な縦断的予測タスクにおいて,予測因子の明確なグローバルな帰属性を維持している。
- 質問票データの前処理と予測を分離することで,安定した項目値を推定し,将来の重症度予測に利用する。
5次根の分類における解釈可能な機械学習の限界について [cs.CY, math.NA, cs.LG, cs.NA]目的:5次までの多項式の根の構成の分類を通じた,機械学習による解釈可能な数学構造の自律的な復元可能性の検証
- 機械学習は,データからパターンを学習し予測を行う強力なツールである。その応用範囲は広く,様々な分野で活用されている。
- 現代の機械学習モデルは高い予測性能を示す一方で,その判断根拠が不透明であるという問題がある。解釈可能性の欠如は,信頼性や安全性への懸念を引き起こす。
- 本研究は,機械学習が,データから明示的な構造を自律的に学習できるか,また,その限界を明らかにすることを目的とする。
- ニューラルネットワークは,5次多項式の分類において高い性能(84.3%)を示したが,決定木は低かった(59.9%)。
- 臨界点における符号変化を特徴量として与えた場合,決定木はニューラルネットワークと同等の性能(84.2%)を示し,明示的な分類規則が得られた。
- この単一の不変量が,決定木の構造の97.5%を説明することから,幾何学的近似ではなく,記号的不変性の重要性が示唆された。
ライフロングマルチエージェントパスファインディングにおける混合ガイダンスグラフのエッジ方向と重みの最適化 [cs.MA, cs.AI, cs.RO]目的:ライフロングマルチエージェントパスファインディングにおける混合ガイダンスグラフの最適化
- 複数のエージェントが効率的に経路探索することは,ロボット工学や物流など様々な分野で重要である。
- 従来のガイダンスグラフ最適化では,エッジの重みによるソフトなガイダンスのみでは厳密な経路制御が難しい。
- エッジの方向と重みの両方を最適化することで,より厳密な経路誘導を実現し,効率的なパスファインディングを可能にする。
- 本研究では,混合ガイダンスグラフ最適化(MGGO)という新しい手法を提案し,エッジ方向と重みの両方を最適化する2つのアプローチを提示した。
- 1つ目のアプローチは,エッジ方向と重みを2段階で最適化するものであり,もう1つは,ニューラルネットワークを用いてエッジ方向と重みを生成する品質多様性アルゴリズムを適用するものである。
- また,エッジの方向に関連する交通パターンを考慮することで,エッジ方向を意識したガイダンスグラフの生成を可能にした。
シーケンシャル推薦の改善に向けた表現知識の転移 [cs.DB, cs.IR, cs.LG]目的:シーケンシャル推薦システムの性能向上
- ユーザーの行動履歴の系列依存性を捉えることが重要であり,推薦システムの精度向上に不可欠である。
- 従来のモデルでは,アイテム間の複雑な関係性を十分に考慮できていないという課題があった。
- TransformerとGraph Neural Networkを組み合わせ,アイテム間の構造的依存性と動的な変化を同時に捉える。
- 提案手法は,既存のシーケンシャル推薦やグラフベースの手法,および両者を組み合わせた最新手法と比較して,推薦精度において一貫して優れた性能を示した。
- Transformerで系列依存性を捉えつつ,Graph Neural Networkでアイテム間の関係性を明示的にモデル化することで,推薦精度が向上した。
- 構造的依存性とその動的変化を同時エンコードすることで,より精度の高い次アイテム予測が可能となった。
概念ボトルネックモデルに対する不確実性を考慮した言語ガイダンス [cs.HC, cs.RO, cs.SY, eess.SY, cs.CL, cs.CL, cs.HC, cs.LG]目的:概念ボトルネックモデルにおける言語ガイダンス手法
- 解釈可能性が求められる機械学習において,概念ボトルネックモデルは重要な役割を担う。
- 概念の人間による理解可能なアノテーションには専門知識と労力がかかる。
- 大規模言語モデルの不確実性を考慮し,信頼性の高い概念学習を目指す。
- 本研究では,大規模言語モデルがアノテーションした概念ラベルの不確実性を厳密に定量化する手法を提案した。
- 提案手法は,分布フリーな保証により不確実性を定量化し,概念ボトルネックモデルの学習過程に組み込む。
- 実世界のデータセットを用いた実験により,提案手法の有効性が確認された。
TaCarla:エンドツーエンド自律運転のための包括的なベンチマークデータセット [cs.HC, cs.RO, cs.AI]目的:エンドツーエンド自律運転研究を支援するための大規模データセット
- 自律運転技術は,安全性向上や効率化に不可欠であり,社会実装が期待されている。
- 既存のデータセットは,知覚と計画のデータが揃っていない,または行動の多様性に欠ける場合が多い。
- CARLA Leaderboard 2.0を用いた多様なシナリオに対応し,知覚と計画の両方を支援するデータセットを構築する。
- 本データセットは,285万フレーム以上のデータを含み,知覚,計画,予測,視覚言語行動モデルなど,多様なタスクに対応可能である。
- CARLA Leaderboard 2.0の多様なシナリオを網羅することで,自律運転のロングテール問題を解決するための開発プラットフォームとなる。
- データ内の状態の稀少度を数値化することで,モデルの学習におけるデータの重要性を評価できる。
スパイク状ランクとその剛性および回路への応用 [cs.HC, cs.CC, cs.LG]目的:スパイク状ランクの導入と,その応用可能性の提示
- 行列の複雑性を測ることは,計算効率の評価やアルゴリズム設計において不可欠である。
- 既存の行列ランク指標は,特定の構造を持つ行列に対して十分な性能を発揮できない場合がある。
- スパイク状ランクは,既存の指標の弱点を補い,より広範な行列に対して有効な複雑性指標となることを目指す。
- スパイク状ランクは,ブロック状ランクの拡張として定義され,線形代数的な柔軟性を加味することで,よりロバストな指標となる。
- スパイク状ランクの大きさは,行列の剛性と相関があり,また,深さ2のReLU回路の下限値を導出できることが示された。
- ランダム行列やハミング距離行列,スペクトル拡大子に対する具体的な下限値の導出フレームワークが開発された。
FedDAG:異質環境におけるグローバルなデータと勾配の統合によるクラスタ化された連合学習 [cs.LG, cs.AI, cs.DC]目的:異質環境における連合学習の性能向上
- プライバシー保護が重要視されるデータ活用において,連合学習は有効な手法である。
- クライアントデータの異質性が高い場合,連合学習の性能が低下する課題がある。
- データと勾配の両方を考慮したクラスタリングで,性能低下を抑制し,汎化性能を高める。
- FedDAGは,データと勾配の類似度を統合した重み付けのクラスごとの類似度指標を用いることで,より包括的なクライアントの類似度を評価する。
- 二重エンコーダアーキテクチャを採用することで,クラスタ間での特徴伝達を可能にしつつ,クラスタ固有の専門性を維持する。
- 多様なベンチマークとデータ異質性の設定において,既存のクラスタ化された連合学習手法を上回る精度を達成した。
臨床予測モデル開発のためのサンプルサイズ計算:概要とpmsims Rパッケージ [cs.LG, stat.AP, stat.ME]目的:臨床予測モデル開発における最小サンプルサイズの推定
- 医療現場での意思決定に予測モデルが活用される機会が増加しており,その信頼性が重要である。
- 適切なサンプルサイズが不足すると,過学習や汎化性能の低下,予測バイアスが生じる可能性がある。
- 多様なモデルや指標に対応し,変動性を考慮した効率的なサンプルサイズ推定手法を確立する。
- 既存手法と比較して,pmsimsは柔軟性,効率性,解釈性に優れたサンプルサイズ推定を提供する。
- pmsimsは,学習曲線,ガウス過程最適化,確実性原理を統合したシミュレーションベースの手法を用いる。
- 本研究の枠組みとソフトウェアは,臨床予測モデリングにおけるサンプルサイズ算出手法を進歩させる。
ニューロモルフィックデータセットのモデル化とシミュレーション:コンピュータビジョンにおける異常検知への応用 [cs.CV, cs.AI, cs.LG]目的:コンピュータビジョンにおける異常検知のためのニューロモルフィックデータセットのモデル化とシミュレーション
- 脳型コンピュータビジョンは,低消費電力かつ高速処理が可能であり,リアルタイムな画像処理への応用が期待される。
- 動視覚センサー(DVS)の入手が困難であり,ニューロモルフィックビジョン研究の進展を妨げている。
- 既存のデータセットのサンプル数やシナリオの少なさを解消し,多様なデータセットを生成可能にすること。
- 本研究では,Unityエンジンを用いて,抽象的で設定可能な3Dシーンをシミュレーションする「ANTShapes」を開発した。
- ANTShapesは,オブジェクトの動きや回転といった属性をランダムに生成し,異常な動作をするオブジェクトを統計的にラベル付けする。
- これにより,研究者は目的に応じたカスタムデータセットを容易に作成でき,データ不足の問題を克服できる。
Lap2:主要化理論による高次元におけるラプラスDP-SGDの再検討 [cs.CR, cs.LG]目的:高次元におけるラプラスDP-SGDの性能向上
- 深層学習におけるプライバシー保護は重要であり,差分プライバシーが主要な技術。
- ラプラスDP-SGDはL1ノルムクリッピングに依存し,高次元モデルでは実用性に課題。
- L2クリッピングを可能にし,ラプラスDP-SGDの高次元での適用を容易にすること。
- Lap2は主要化理論と座標ごとのモーメント境界を利用し,データに依存しないタイトな上限を構築。
- この手法により,ラプラスDP-SGDのプライバシー会計がモデル次元に対してうまくスケール。
- 実験結果は,Lap2がガウスDP-SGDと同等またはそれ以上の性能を発揮することを示している。
V-MORALS:学習された潜在空間における吸引領域の推定を視覚的なモルグラフで支援 [cs.RO, cs.CV, cs.LG]目的:ロボット工学における安全な状態と危険な状態の識別
- ロボットの安全性を保証するためには,到達可能性解析が不可欠である。
- 既存手法は,システムダイナミクスや大規模データセットが必要,計算コストが高い,状態情報の完全な把握が前提となる。
- センサーデータのみから吸引領域を推定し,状態情報の制約を克服すること。
- V-MORALSは,画像ベースの軌跡データから潜在空間を学習し,到達可能性解析を可能にする。
- 学習された潜在空間上でモルグラフを生成し,様々なシステムやコントローラに対する吸引領域を計算する。
- V-MORALSは,状態情報に依存せず,高レベルなセンサーデータのみを用いて,従来のMORALSと同等の機能を提供する。
ニューラル演算子は機能的なクラスタを発見できる [eess.SY, cs.SY, cs.LG, cs.CE, stat.CO, stat.ML]目的:機能的データのクラスタリング
- 科学計算において,無限の問題群に対する推論を効率化する演算子学習の重要性が増している。
- ニューラル演算子は回帰問題で理解が進んでいるが,分類やクラスタリングに関しては未解明な点が多い。
- 有限個のクラスを近似的に表現するニューラル演算子に基づくクラスタリング手法を開発し,理論的根拠を示す。
- サンプルに基づくニューラル演算子は,穏やかなカーネルサンプリング仮定の下で,無限次元の再生核ヒルベルト空間において,有限個のクラスを学習できることが証明された。
- 任意のK個の閉じたクラスは,閉集合上のクラトフスキー上部位相において,ニューラル演算子によってパラメータ化されたクラスによって任意の精度で近似できる。
- 常微分方程式の軌跡データに対する実験により,提案手法が古典的な手法が失敗する領域でも潜在的な動的構造を復元できることが示された。
劣加法集合関数学習における加法誤差最小化のための能動的価値問い合わせ [cs.LG]目的:劣加法集合関数の近似精度向上
- 計算経済学や機械学習などに応用され,組み合わせ最適化問題解決に不可欠な研究分野である。
- 集合関数の値を全ての部分集合に対して指定するには指数関数的なコストがかかる点が課題である。
- 部分集合の値が欠損する場合に,最小・最大補完間の距離を効率的に縮小することを試みる。
- 劣加法集合関数の様々なクラスにおける最小・最大補完とその距離に関する詳細な分析を行った。
- 事前分布が既知の場合の関数クラスにおける距離を最小化する手法を,オフラインおよびオンラインで開発した。
- 実用的なシナリオにおけるアルゴリズムの性能を実験的に示した。
深層強化学習を用いた部品中心配置 [cs.ET, cs.LG]目的:プリント基板上の部品配置の自動化
- 電子機器の小型化が進む中,プリント基板の設計効率が重要である。
- 部品の大きさのばらつきや制約条件などから,最適な配置を見つけるのが困難である。
- 部品中心配置と強化学習を活用し,配置空間を削減し効率的な配置を目指す。
- 提案手法は,9種類の実際のプリント基板において,配線長と実現可能性の点で,人間の配置に匹敵する性能を示した。
- 主たる部品を中心部に固定し,受動部品をそのピンの近くに配置することで,探索空間を効果的に削減した。
- 受動部品と電圧源の近接性を事前知識として活用することで,無駄な探索を回避した。
反実境データからの因果関係特定:完全性と限界に関する結果 [cs.AI, cs.LG]目的:反実境データからの因果クエリの識別
- 因果推論は,政策決定や科学的発見において重要な役割を果たすため,その重要性は高い。
- 反実境分布からのデータ取得は困難と考えられており,因果推論の範囲を制限していた。
- 近年,実験的に推定可能な反実境分布が定義され,その範囲での因果識別の可能性を追求する。
- CTFIDU+アルゴリズムにより,任意の反実境分布からの反実境クエリの完全な識別が可能となった。
- 物理的に実現可能な分布からの反実境識別の理論的限界が明らかになった。
- 識別不可能な反実境量に対して,反実境データを用いた新たな解析的限界が導出され,シミュレーションにより有効性が確認された。
分布シフト下における因果的POMDPによる計画 [cs.AI]目的:分布シフト下での計画問題に対する理論的枠組み
- 現実世界の計画立案において,環境の変化への対応は重要である。
- 環境分布やダイナミクスの変化により,既存の戦略が機能しなくなる場合がある。
- 環境変化下でも計画の実行可能性を維持するための手法を確立すること。
- 因果的知識を用いてPOMDPを定式化することで,環境の変化を介入として表現可能にした。
- 潜在状態と基盤となるドメインに対する信念を維持・更新する方法を提示した。
- 信念空間における価値関数の区分的線形凸性(PWLC)が保持されることを証明し,計画の実行可能性を維持する。
人間とLLMは確率的推論において異なる [cs.CL, cs.AI]目的:確率的推論の評価
- 人間の思考には不確実性があり,確率的な判断が不可欠であるため。
- LLMの推論能力は進歩しているが,確率的推論の評価は十分ではないため。
- 人間とLLMの確率的推論における違いを明らかにすること。
- 人間は確率的な判断を示す一方で,LLMは人間のような分布を生成できないことが示された。
- LLMは特定の推論パターンに依存する傾向があり,人間とは異なる推論経路をたどることが示唆された。
- 本研究は,LLMの推論評価において,決定論的設定を超えた評価の必要性を強調する。
Rudder:LLMエージェントを用いた分散GNNトレーニングにおけるprefetchingの舵取り [cs.LG, cs.AI, cs.DC, cs.MA, cs.PF]目的:分散GNNトレーニングにおける通信最小化のための自律的なprefetching
- 大規模グラフは様々な分野で出現しており,GNNによる効率的な解析が不可欠である。
- 分散環境でのGNNトレーニングは,不規則な通信による停滞が課題となっている。
- 本研究は,LLMエージェントを用いた適応的なprefetchingにより,この通信問題を解決する。
- Rudderは,AWS DistDGLフレームワークに組み込むことで,リモートノードのprefetchingを自動化する。
- NERSC Perlmutterスーパーコンピュータでの評価により,ベースラインDistDGLと比較して最大91%のトレーニング性能向上が確認された。
- また,静的prefetchingと比較して82%の性能向上,さらに通信量を50%以上削減することに成功した。
ユーザー選択下における学習のダイナミクス:過特化とピアモデルの探査 [cs.LG, cs.MA]目的:ユーザー選択環境下での機械学習における過特化現象とその解決策
- 機械学習は経済活動において不可欠であり,その性能向上が経済的価値に直結する。
- 複数のプラットフォームが同じユーザーデータにアクセスする場合,学習の偏りが生じやすい。
- 既存アルゴリズムでは,グローバルな性能劣化を招く過特化現象を回避できない。
- ユーザーが特定のプラットフォームを優先することで,プラットフォームは過特化し,他のユーザー層へのアピールが弱まる。
- ピアモデルの予測を探索するアルゴリズムを提案することで,過特化を防ぎ,グローバルな性能を改善できる。
- 探索源(市場リーダーなど)の情報量が十分であれば,安定した低リスクな状態に収束することが示された。
フローエット:グラフ構造生成のためのグラフレット事前情報を用いたフローマッチング [cs.LG, cs.AI]目的:グラフ生成における反復部分グラフモチーフの生成モデリング
- グラフ構造データは様々な分野で重要であり,その生成手法の確立が求められている。
- 複雑なグラフ構造を効率的に生成することは依然として困難な課題である。
- グラフ構造の事前知識を組み込むことで,より自然で構造的なグラフ生成を目指す。
- フローエットは,グラフ表現上の速度場を学習する連続フローマッチングフレームワークである。
- グラフレットという新たな確率的グラフ構造モデルを導入し,構造的事前情報を組み込むことに成功した。
- 合成データ及び小分子グラフ生成タスクにおいて,フローエットは一貫した性能向上を示した。
$(1+1)$進化アルゴリズムに対する全ての変異率 $c/n$ [cs.DB, cs.NE]目的:変異率の最適性
- 進化計算は,複雑な最適化問題への強力なアプローチである。
- 適切な変異率は,進化計算の性能に大きく影響する。
- $(1+1)$進化アルゴリズムにおける最適な変異率の範囲を特定すること。
- 任意の$c \geq 1$と$\varepsilon > 0$に対し,最適な変異率 $p_n$ は $p_n \approx c/n$を満たす関数が存在する。
- 変異率 $c/n$ が$(1+1)$進化アルゴリズムにとって最適となる$c$の集合は,$[1, \infty)$において稠密である。
- この結果は,新たに定義されたHillPathJump関数によって示された。
証拠に基づくニューラル放射場 [cs.CV, cs.AI, cs.LG]目的:三次元シーンモデリングにおける不確実性の理解
- 安全性が求められる応用において,三次元シーンの正確な理解は不可欠である。
- 既存のニューラル放射場は高い精度を持つが,不確実性の推定が欠如している。
- 本研究は,アレオリック不確実性とエピステミック不確実性の両方を定量化することを目指す。
- 提案手法は,ニューラル放射場のレンダリングプロセスにシームレスに統合され,単一のフォワードパスで両方の不確実性を直接定量化する。
- 標準的なベンチマーク3つにおいて,提案手法は最先端のシーン再構成精度と不確実性推定品質を示す。
- 既存の不確実性定量化手法と比較して,レンダリング品質を損なうことなく計算コストも抑えられる。
サイクルBEV:ビューサイクル整合性によるビュー変換ネットワークの正則化 [cs.CV, cs.AI]目的:鳥瞰視点セマンティックセグメンテーションのためのビュー変換ネットワークの正則化
- 自動運転における環境認識の精度向上は,安全な走行に不可欠である。
- 透視図から鳥瞰図への変換は,深度曖昧性とオクルージョンにより困難である。
- サイクル整合性損失を用いて,ビュー変換ネットワークの学習を安定化させる。
- 提案手法サイクルBEVは,既存のビュー変換モデルの性能を向上させる。
- nuScenesデータセットを用いた実験で,可航可能領域,車両,歩行者クラスにおいてそれぞれ最大0.74,4.86,3.74 mIoUの改善が見られた。
- 推論時の計算コストは増加せず,学習時のみ逆変換ネットワークを使用する。
ハイブリッド量子時間畳み込みネットワーク [cs.RO, cs.CL, cs.LG]目的:時系列データに対する量子機械学習モデルの効率的な設計
- 時系列データ解析は,金融,医療,環境科学など,多岐にわたる分野で重要である。
- 複雑な多変量信号を扱う際,既存の量子機械学習モデルはスケーラビリティに課題がある。
- パラメータ数を削減しつつ,長距離依存性を捉えることのできるモデルを開発する。
- 提案手法HQTCNは,古典的な時間窓処理と量子畳み込みニューラルネットワークを組み合わせる。
- 合成NARMA系列と高次元EEG時系列データを用いた評価で,多変量タスクにおいて古典的な手法を上回る性能を示した。
- データが限られた状況下でも高い性能を維持し,パラメータ効率の良さが確認された。
強化学習を用いた最小最大多旅行者セールスマン問題に対する構築,統合,求解,適応手法 [cs.AI, cs.LG]目的:最小最大多旅行者セールスマン問題に対する高性能な解法
- 配送計画や経路最適化において重要な問題であり,効率的な物流システムの構築に貢献する。
- 多旅行者セールスマン問題は計算困難であり,特に最小最大版は負荷分散の最適化が難しい。
- 強化学習と厳密最適化を組み合わせ,大規模問題においても高品質な解を効率的に探索する。
- 提案手法RL-CMSAは,ランダムインスタンスおよびTSPLIBインスタンスにおいて,最良解またはそれに近い解を安定的に発見した。
- 比較対象となる最先端のハイブリッド遺伝的アルゴリズムを,特にインスタンス規模と旅行者数が増加した場合に,時間制限内で上回った。
- 強化学習による経路構築と厳密最適化のバランスにより,探索と活用を両立し,高い性能を実現した。
バイアス増幅の緩和:少数派グループデータ拡張による英語学習者の自動採点における公平性向上 [cs.CL, cs.AI]目的:英語学習者の自動採点におけるバイアス増幅の緩和
- 教育評価において,自動採点システムは重要性を増しており,公平性が求められる。
- 自動採点システムは,特に少数派グループ(英語学習者など)に対して,バイアスを増幅するリスクがある。
- 少数派グループのデータ不足によるバイアスを,データ拡張によって緩和することを目指す。
- 提案手法BRIDGEは,豊富な多数派グループのデータを活用し,少数派グループの高得点サンプルを合成することで,バイアスを削減する。
- 合成サンプルの品質を確保するため,識別モデルを導入している。
- カリフォルニア科学テスト(CAST)データセットを用いた実験により,BRIDGEは高得点英語学習者に対する予測バイアスを効果的に軽減し,全体的な採点性能を維持することが示された。
SDMixer:時系列予測のための疎な二重混合モデル [cs.LG, cs.AI]目的:多変量時系列予測における性能向上
- 交通,エネルギー,金融など幅広い分野で時系列予測が活用されており,その重要性は高い。
- 既存モデルは,多規模性,弱い相関,ノイズの影響を受けやすく,予測精度に限界がある。
- 周波数領域と時間領域の両方から特徴を抽出し,無効な情報をフィルタリングすることで,予測精度を改善する。
- 提案手法は,現実世界の複数のデータセットにおいて,最先端の性能を達成した。
- 二重ストリームの疎なMixerフレームワークが,グローバルな傾向と局所的な動的特徴を効果的に抽出することが示された。
- スパース性メカニズムが,変数間依存性のモデリングの精度向上に貢献している。
