arXiv雑要約
AI - 2026/03/06 公開
HiMAP-Travel:長期的制約付き旅行のための階層型マルチエージェント計画 [cs.AI, cs.CL]目的:長期的制約付き旅行計画における課題解決
- 旅行計画は複雑であり,予算や多様性の要件を満たすことが困難である。
- 逐次的なLLMエージェントでは,計画が長期的になるほど制約からの逸脱が生じやすい。
- 予算や多様性の制約を遵守しつつ,効率的かつ柔軟な旅行計画を実現すること。
- HiMAP-Travelは,戦略的コーディネーションと並列日次実行の階層型マルチエージェントフレームワークである。
- TravelPlannerデータセットにおいて,Qwen3-8Bを使用した場合,検証およびテストのFinal Pass Rate (FPR) はそれぞれ52.78%,52.65%を達成した。
- 並列化によりFlexTravelBenchの多段階シナリオにおいて遅延を2.5倍削減し,FPRも44.34% (2ターン),37.42% (3ターン) を実現した。
並行世界における検索エージェントの評価 [cs.AI]目的:検索エージェントの評価のための新たな枠組み
- LLMの能力拡張に不可欠なウェブ検索ツール活用だが,評価が困難。
- 既存の評価データは品質が低いか,時間経過で陳腐化しやすい。
- モデルの知識外の未来シナリオを想定し,信頼性の高い評価を実現。
- Mind-ParaWorld(MPW)は,現実世界のエンティティ名から未来のシナリオを合成し,モデルの知識cutoffを超える質問を生成。
- ParaWorld Law Modelが不可分なAtomic Factsを構築し,それに基づき一意の正解を生成する。
- MPW-Benchは19ドメイン,1,608インスタンスを含むインタラクティブなベンチマークであり,検索エージェントの課題を特定。
KindSleep:オキシメトリによる閉塞性睡眠時無呼吸症候群の知識に基づいた診断 [cs.HC, cs.LG]目的:閉塞性睡眠時無呼吸症候群の診断
- 閉塞性睡眠時無呼吸症候群は世界で約10億人に影響を及ぼし,心血管疾患リスクを高めるため,診断技術の重要性は高い。
- 従来の多眠検査はリソースを要し,普及が限られているため,正確かつ効率的な代替手段が求められている。
- オキシメトリと臨床データを用いて,より簡便かつ高精度な閉塞性睡眠時無呼吸症候群の診断を目指す。
- KindSleepは,オキシメトリ信号から臨床的に解釈可能な概念を学習し,AHI(無呼吸・低呼吸指数)を高精度に推定する。
- 3つの大規模な独立データセットで評価した結果,AHIの推定精度は高く,OSA重症度分類においても既存手法を上回った。
- 臨床的に意味のある概念に基づいた予測を行うことで,透明性と信頼性の高い診断ツールを提供する。
MOOSE エコシステム向けドメイン特化型AIエージェント:MOOSEnger [cs.AI, cs.CE, cs.SE]目的:MOOSE エコシステムにおける入力ファイル生成と検証の自動化
- 多物理現象シミュレーションは科学技術の発展に不可欠であり,MOOSEはその強力なプラットフォームである。
- MOOSEの入力ファイル記述は複雑であり,初期設定やデバッグに時間がかかるという課題がある。
- 自然言語による指示から実行可能な入力ファイルを生成し,シミュレーションの効率化を目指す。
- MOOSEngerは,自然言語による指示をMOOSEの入力ファイルに変換する会話型ワークフローを実現した。
- Retrieval-augmented generationとMOOSE固有の解析・検証ツールを組み合わせることで,高い精度を実現した。
- 125件のプロンプトによるベンチマークテストで,実行成功率は0.93と,LLMのみでは0.08と比較して大幅に向上した。
一つの積み重ねから:文脈窓拡張のための多階層自己注入 [cs.RO, cs.CL, cs.AI]目的:大規模言語モデルの文脈窓拡張手法
- 近年のLLM発展において,より長い文脈を扱えることが重要課題となっている。
- LLMの文脈窓の制限が,多様な分野への応用を妨げる大きな障壁となっている。
- データや計算コストを抑えつつ,LLMの文脈理解能力を向上させることを目指す。
- 本研究では,多階層の文脈圧縮とクエリ認識型情報取得に基づいた新しいフレームワークを提案した。
- 同じLLM層から派生した2つの短文脈LLMを積み重ねることで,128Kトークンを超える入力にも効果的に対応可能となった。
- 提案手法は,効率性と精度を両立し,メモリ使用量と推論速度を大幅に改善した。
GPT-5のマルチモーダル臨床推論能力評価:現状分析 [cs.RO, cs.RO, cs.SY, eess.SY, cs.RO, cs.MA, cs.CV, cs.AI, cs.LG]目的:GPT-5ファミリーの臨床推論能力
- 臨床医学は,曖昧な情報統合が不可欠であり,AIの汎用性向上は重要である。
- 既存のAIは特定のタスクに特化しており,臨床推論に必要な統合的思考が課題である。
- GPT-5の臨床的課題に対する推論能力を評価し,汎用AIの可能性を探る。
- GPT-5は,専門家レベルのテキスト推論で25%以上の絶対的改善を示した。
- マルチモーダル合成において,GPT-5は画像情報に基づき臨床的曖昧さを解消し,VQAベンチマークで好成績を収めた。
- 専門領域モデルと比較して,特に神経放射線学やマンモグラフィーでは改善の余地が残る。
ConTSG-Bench:条件付き時系列生成のための統一ベンチマーク [cs.LG]目的:条件付き時系列生成の評価のための標準化されたベンチマークデータセット
- 現実世界の応用において,データ不足を解消し,因果分析を可能にする上で重要である。
- 多様な条件における生成モデルの評価のための標準化されたフレームワークが存在しない。
- 多様な条件と抽象化レベルに対応した大規模データセットを提供し,生成モデルの評価を可能にする。
- ConTSG-Benchは,多様な条件付けモードと意味的抽象化レベルを網羅する大規模なデータセットである。
- 定量的なベンチマークと詳細な分析により,既存手法の特性と限界が明らかになった。
- 特に複雑な条件における正確な構造制御性とダウンストリームタスクの有用性が課題として示された。
不確実性認識型DRAMイコライザのための情報ボトルネックを用いた分布強化学習 [cs.LG]目的:高速メモリシステムにおける信号品質維持のためのイコライザパラメータ最適化
- 高速メモリシステムの性能向上には,高精度な信号伝送が不可欠であり,イコライザはその重要な役割を担う。
- 従来のイコライザ最適化手法は計算コストが高く,最悪の場合の性能を考慮せず,不確実性の定量化が困難である。
- 本研究は,不確実性を考慮した最悪の場合の性能を保証するイコライザ最適化手法を提案し,実用的な解決策を提供する。
- 情報ボトルネックを用いた信号圧縮により,従来のアイダイアグラム評価と比較して51倍の高速化を実現した。
- 分布強化学習と条件付きVaR最適化により,4タップおよび8タップのイコライザ設定でそれぞれ37.1%と41.5%の平均性能向上を達成した。
- 提案手法は,高信頼性分類において62.5%の精度を示し,手動検証の必要性を大幅に削減した。
DSA-SRGS:動的疎視点DSA再構築のための超解像ガウススプラッティング [cs.CV, cs.AI]目的:動的疎視点DSA再構築における超解像ガウススプラッティングの実現
- 脳血管疾患の診断・治療において,DSAは重要な役割を担う画像技術である。
- 既存手法は入力投影の解像度に制限され,単純なアップサンプリングでは画質劣化が生じる。
- 微細な血管構造の復元を可能にし,高精度な診断・治療への応用を目指す。
- 提案手法DSA-SRGSは,臨床DSAデータセットにおいて,既存手法を凌駕する定量評価と視覚的品質を示す。
- Multi-Fidelity Texture Learning Moduleにより,DSA特化型超解像モデルの高精度な事前知識を4D再構築に統合する。
- Confidence-Aware StrategyとRadiative Sub-Pixel Densificationにより,疑似ラベルによる誤りや画質劣化を抑制する。
MADCrowner:マージンを考慮したテンプレート変形と洗練による歯科クラウン設計 [cs.CV, cs.AI]目的:歯科クラウンの自動設計手法
- 歯の欠損治療において,適合性の高い歯科クラウン設計は重要である。
- 既存のCADシステムでは,手作業での調整が依然として必要とされる。
- 空間解像度,ノイズ,表面再構成の過剰な拡張といった課題を解決する。
- 提案手法は,解剖学的コンテキストに基づき初期テンプレートを変形させるCrownDeformRと,マージンを抽出するCrownSeggerから構成される。
- CrownDeformRは,歯頸部のマージンを制約条件として性能が向上し,過剰な領域の除去にも利用される。
- 大規模な口腔内スキャンデータセットを用いた実験により,既存手法と比較して幾何学的精度と臨床的実現可能性で有意に優れた結果が得られた。
TSEmbed:汎用マルチモーダル埋め込みにおけるタスクスケールの解禁 [cs.CL, cs.AI]目的:汎用マルチモーダル埋め込みにおけるタスクスケールの実現
- マルチモーダル大規模言語モデルは高度な推論能力を持つが,汎用埋め込みモデルへの応用は課題である。
- マルチモーダルモデルはタスク間の競合により,汎用的な埋め込み空間を学習することが難しい。
- タスク間の競合を解消し,より効果的なマルチモーダル埋め込み空間を構築することを目指す。
- TSEmbedは,MoEとLoRAを組み合わせ,タスク間の競合を明示的に分離する汎用マルチモーダル埋め込みフレームワークである。
- Expert-Aware Negative Sampling(EANS)により,セマンティック類似性を考慮したハードネガティブサンプリングを実現し,識別能力を向上させた。
- Massive Multimodal Embedding Benchmark(MMEB)と実世界のデータセットで最先端の性能を達成した。
線形非ガウス潜在変数環状因果モデルにおける分布的同値性:特徴づけと学習 [cs.NI, cs.HC, cs.NI, cs.LG, stat.ML]目的:潜在変数を含む因果構造の同値性に関する特徴づけ
- 因果推論は科学的発見や意思決定において重要であり,潜在変数を含むモデルは現実の問題に不可欠である。
- 既存手法は強い構造的仮定に依存しており,汎用的な構造的仮定のないアプローチが困難であった。
- 線形非ガウスモデルにおける分布的同値性の判定基準を確立し,構造的仮定のない因果探索法を開発すること。
- 本研究では,潜在変数とサイクルを持つグラフの分布的同値性を特徴づけるグラフ的基準を確立した。
- 新たなツールである「エッジランク制約」を導入し,潜在変数因果探索のツールボックスを拡充した。
- 同値クラス全体を探索する手順と,データから同値性までのモデルを復元するアルゴリズムを開発した。
文脈的慣性の打破:安定した多段階対話のための単一ターンアンカーを用いた強化学習 [cs.DC, cs.PF, cs.AI, cs.CL]目的:多段階対話における文脈的慣性克服と,安定した対話能力の獲得
- 大規模言語モデルの対話システム応用が期待される中,多段階対話の安定性が課題となっている。
- 逐次的に情報が提示される場合や,制約が更新される場合に,モデルが新しい情報を取り込めず性能が低下する。
- 過去の推論に固執する文脈的慣性を克服し,最新情報に基づいた自己調整能力をモデルに付与すること。
- 提案手法RLSTAは,標準的なファインチューニングやabstentionベースの手法と比較して,顕著に高い性能を示す。
- RLSTAは,数学からコードへのような異なるドメインへの汎化性能に優れ,外部検証器なしでも効果を発揮する。
- 単一ターンアンカーを安定した内部基準として活用することで,多段階対話における文脈的慣性を打破する。
条件付き近接方策最適化による拡散方策 [cs.DB, cs.RO, cs.SY, eess.SY, cs.NI, cs.LG, cs.RO]目的:多峰性行動のモデル化
- 強化学習はゲームやロボット工学など,様々な意思決定問題に活用されている。
- 拡散モデルを用いた強化学習では,行動の対数尤度計算が困難であるという課題がある。
- 効率的な拡散方策の学習を可能にし,性能向上を目指す。
- 提案手法は,単純なガウス確率の評価のみで拡散方策を学習可能にする。
- 方策反復を拡散過程と整合させることで,既存手法とは異なるパラダイムを提供する。
- IsaacLabとMuJoCo Playgroundのベンチマークタスクで優れた性能を示す。
Timer-S1:シリアルスケーリングによる10億規模の時系列基盤モデル [cs.AI]目的:大規模時系列データの予測性能向上
- 時系列データは,経済,気象,医療など広範な分野で重要であり,正確な予測は不可欠である。
- 既存の時系列モデルは,データ量やモデル規模のスケーラビリティに課題を抱えている。
- シリアルスケーリングによって,大規模な時系列データに対する高性能な予測モデルを構築することを目指す。
- Timer-S1は,83億パラメータの混合エキスパートモデルであり,11.5Kのコンテキスト長を持つ。
- シリアル・トークン予測(STP)という,時系列データの特性に合わせた学習手法を導入することで,長期予測の精度を向上させた。
- GIFT-Evalリーダーボードにおいて,最先端の予測性能を達成し,MASEとCRPSスコアで最高の性能を示した。
医療画像における適応的空間重み付け:拡散とセグメンテーションへの応用 [cs.CV, cs.AI]目的:医療画像の拡散モデルとセグメンテーションにおける空間的不均衡の解消
- 医療画像解析は正確なセグメンテーションに依拠し,新たな学習画像の生成を通じて精度向上が期待される。
- 病変領域は背景に比して小さく,空間的不均衡が課題となっている。拡散モデルでは病変の配置が不安定になりやすい。
- 計算資源を適切に配分することで,拡散モデルの生成性能とセグメンテーション精度を向上させる。
- LAW(学習可能な適応的重み付け)は,拡散学習におけるピクセルごとの損失変調を予測し,生成画像のFIDスコアを20%改善した。
- 合成データを用いた訓練により,セグメンテーションのDice係数が4.9%向上し,83.2%となった。
- ORDER(効率的な解像度を用いた最適領域検出)は,MK-UNetのDice係数を6.0%向上させ,パラメータ数を730分の1に削減した。
脳グリア腫イメージングにおける伝統的手法と深層学習の比較評価 [cs.CV, cs.AI]目的:脳グリア腫イメージングにおける伝統的手法と深層学習の比較
- 脳腫瘍治療において,正確な画像解析は,治療計画とモニタリングの精度向上に不可欠である。
- 従来の手法では,不均一な組織構造のため,正確かつ再現性のあるセグメンテーションが困難である。
- 深層学習を用いた手法が,脳グリア腫のセグメンテーションと分類において従来法を上回る性能を示すことを検証する。
- 本レビューでは,MRI画像取得後の効果的なセグメンテーションと分類技術を評価した。
- 畳み込みニューラルネットワーク(CNN)アーキテクチャが,これらのタスクにおいて従来の手法を上回ることが示された。
- 放射線科医による利用を考えると,半自動技術が精度と使いやすさのバランスに優れている。
線形LLM呼び出しを超えて:効率的かつ効果的な意味的フィルタリングパラダイム [cs.AR, cs.DB, cs.AI, cs.CL]目的:大規模データに対する意味的クエリ処理のための効率的なフィルタリング手法
- 大量のテキストデータから必要な情報を効率的に抽出することが重要である。
- 従来のフィルタリング手法は,大規模データセットにおいて計算コストが高いという課題がある。
- LLMの呼び出し回数を削減し,計算コストを抑制することで,より実用的なフィルタリングを実現する。
- 提案手法CSVは,最先端の手法と比較してLLMの呼び出し回数を1.28〜355倍削減できる。
- CSVは,AccuracyとF1スコアにおいて同等の有効性を維持しながら,LLM呼び出し回数を大幅に削減する。
- 曖昧なクラスタに対して再クラスタリングを行うことで,多様なデータセットに対する頑健性を確保する。
コントラスト信号による拡散再構成の誘導:バランスの取れた視覚表現のために [cs.CV, cs.AI, cs.LG]目的:視覚表現のバランス改善
- CLIPモデルの性能向上は,画像とテキストの理解において重要である。
- CLIPの視覚エンコーダの表現能力に限界があり,性能のボトルネックとなっている。
- 拡散モデルとコントラスト信号を組み合わせ,CLIPの視覚表現の限界を克服することを目指す。
- 本研究では,拡散再構成にコントラスト信号を統合するDiffusion Contrastive Reconstruction (DCR)を提案した。
- DCRは,再構成画像から得られるコントラスト信号を拡散プロセスに注入することで,識別能力と詳細知覚能力を同時に最適化する。
- 様々なベンチマークと大規模言語モデルにおける実験により,DCRの有効性が確認された。
注意の重力場:位置相関のべき乗則解釈 [cs.HC, cs.CL, cs.AI]目的:大規模言語モデルにおける位置関係とエンコーディングの原理
- 自然言語処理の発展において,文脈理解の精度向上が不可欠である。
- 既存の位置エンコーディングは,表現力や学習の安定性に課題が残る。
- 注意機構の解釈可能性を高め,モデル最適化の新たな道を開く。
- 注意の重力場(AGF)の概念を導入し,位置エンコーディングと意味埋め込みを分離した。
- AGFは学習曲線や安定性曲線と整合性を示し,ニュートンの万有引力の法則とも整合した。
- AGFに基づくモデルは,既存のエンコーディング手法よりも高い精度を達成した。
WhisperAlign:単語境界を意識したASRとWhisperXアンカー付きPyannoteによる長時間のベンガル語音声のダイアリゼーション [cs.HC, cs.SD, cs.LG]目的:長時間のベンガル語音声に対する自動音声認識と話者ダイアリゼーションの実現
- 音声認識と話者ダイアリゼーションは,音声データの利用を促進し,様々な応用を可能にする重要な技術である。
- 長時間の音声データでは,音声活動検出,重なり合った音声,文脈の維持が課題となる。
- ベンガル語音声における音声認識エラー率(WER)とダイアリゼーションエラー率(DER)の低減を目指す。
- Whisperのタイムスタンプを活用した音声チャンク分割により,高精度な音声認識を実現した。
- Pyannoteのセグメンテーションモデルをベンガル語データでファインチューニングすることで,複雑な話者境界を正確に解決した。
- インテリジェントなタイムスタンプ付きチャンク分割とターゲットを絞ったセグメンテーションのファインチューニングが,WERとDERの大幅な改善に繋がった。
脳腫瘍解析と欠損モダリティセグメンテーションのためのメタデータ対応アーキテクチャMeta-D [cs.DC, cs.CV, cs.AI]目的:脳腫瘍解析のための特徴抽出におけるメタデータ活用
- 医療画像解析は,疾患診断・治療において不可欠であり,高精度な解析が求められる。
- 医療画像の多様性により,モデルの汎化性能が課題となる場合がある。
- 欠損モダリティ下でのセグメンテーション精度向上を目指す。
- MRIシーケンスや断面方向などのメタデータを活用することで,腫瘍検出におけるF1スコアが最大2.62%向上した。
- Transformer Maximizerにより,メタデータに基づいたクロスアテンション機構を導入し,利用可能なモダリティに焦点を当てた。
- これにより,モダリティが極端に不足する場合でも脳腫瘍セグメンテーションのDiceスコアが最大5.12%向上し,モデルパラメータを24.1%削減した。
二次極性と正準ルジャンドル極性からの極性フェンケル・ヤングダイバージェンス [cs.CG, cs.LG]目的:二次極性による極性の一般化と,それを用いた極性フェンケル・ヤングダイバージェンスの定義
- 射影幾何学における基本的な双対性概念であり,情報幾何学の根幹をなす参照双対性の理解に重要である。
- 既存のフェンケル・ヤングダイバージェンスは,特定の条件下でのみ定義される場合がある。
- 二次極性を用いた新しい極性ダイバージェンスを定義し,参照双対性の理解を深めることを目指す。
- 二次極性関数は,変形ルジャンドル極性または変形凸体のルジャンドル極性として表現可能であることが示された。
- ルジャンドル極性を用いて定義される極性ダイバージェンスは,フェンケル・ヤングダイバージェンスを一般化する。
- 全ブレグマンダイバージェンスは,全極性フェンケル・ヤングダイバージェンスとして捉えられ,新しい参照双対性が示された。
EchoGuard:知識グラフメモリを用いた,長期間にわたる対話における操作的なコミュニケーション検出のためのエージェント的フレームワーク [cs.CL, cs.AI]目的:操作的なコミュニケーション検出のためのフレームワーク
- 人間関係における心理的な操作は深刻な問題であり,個人の幸福と安全に影響を与えるため,その検出が重要である。
- 既存のAIシステムは,文脈依存性の高い操作戦術を追跡するための構造化された長期記憶に欠けている。
- 本研究は,知識グラフを活用することで,操作的なコミュニケーションをより正確に検出し,個人の自律性を支援することを目指す。
- EchoGuardは,対話を知識グラフとして構造化し,操作パターンを検出する「ログ記録-分析-内省」のループを用いる。
- 実験の結果,本フレームワークは,ガスライティング,罪悪感,感情的な強制といった心理学的に裏付けられた6つの操作パターンを検出できることが示された。
- EchoGuardは,操作パターンに基づいたソクラテス式質問を生成し,ユーザーが自己認識を深めるのを支援する。
時間グラフ注意ネットワークによる港湾混雑予測に対するLLMに基づく説明可能性 [cs.AI]目的:港湾混雑予測と,それを裏付ける自然言語による説明生成
- グローバルサプライチェーンにおいて,主要港湾の混雑は大きな影響を及ぼすため,その予測は重要である。
- 既存の予測システムは,解釈可能性を欠き,実務上の意思決定に利用しにくいという課題がある。
- グラフモデルの証拠に基づき,LLMを用いて予測根拠を説明することで,解釈性と信頼性を向上させる。
- 提案手法AIS-TGNNは,ロサンゼルス/ロングビーチ港のAISデータにおいて,AUC 0.761,AP 0.344,リコール 0.504を達成した。
- 生成された説明の方向性一致率は99.6%であり,統計的証拠と整合性の高い説明を可能にしている。
- LLM生成をグラフモデルの証拠に基づき行うことで,予測性能を損なわずに解釈可能なリスク報告を実現した。
オープンセット埋め込み支援のためのデータの強みと弱み [cs.RO, cs.AI, cs.LG]目的:オープンセット埋め込み支援におけるデータの特性評価
- ロボティクス等の実世界において,埋め込み型基盤モデルの活用が広がっており,新たな応用への期待が高まる。
- 既存の支援モデルは,未知のユーザーやタスクへの汎化性能が課題であり,データ効率の良い汎化能力が求められる。
- 多様な対話型データを用いて,未知の状況への対応能力を備えた支援モデルの開発を目指す。
- 多様な対話型支援データでファインチューニングしたマルチモーダル基盤モデルの汎化性能を評価した結果,未知のユーザー行動や環境への適応が可能であることが示された。
- 特に,ユーザーの行動を観察し,修正行動や言語フィードバックを提供する「オープンセット修正支援」タスクにおいて,モデルの性能向上が確認された。
- 効果的な支援データセットは,マルチモーダルな情報,欠陥推論,多様なシナリオへの暴露を含むことが重要であることが示唆された。
パーソナライズされたLLMアライメントのためのシールド適応による価値注入(VISA) [cs.CL, cs.CY, cs.AI]目的:LLMにおける価値観の適合性向上
- LLMの社会実装には,人間の価値観との整合性が不可欠である。
- 既存手法では,詳細な価値観の適合が難しく,知識の劣化を招く。
- 価値観の適合性と知識保持の両立を目指す。
- 提案手法VISAは,価値検出,翻訳,書き換えの各モジュールを組み合わせることで,価値観の適合性を高める。
- グループ相対的方策最適化(GRPO)を用いた学習により,価値観の精度と意味整合性を同時に最適化する。
- 実験結果から,VISAは既存手法やGPT-4oと比較して,より正確な価値表現と事実の一貫性を実現することが示された。
インスタンス依存部分ラベル学習におけるインスタンス間の絡み合いの軽減 [cs.CV, cs.LG]目的:インスタンス依存部分ラベル学習におけるインスタンス間の絡み合い軽減
- 弱教師あり学習は,ラベル付けコストを削減し,実用的な応用を可能とする重要な手法である。
- 部分ラベル学習では,候補ラベルがインスタンスの特徴に影響を受け,クラス間の混同が生じやすい。
- 本研究は,インスタンス間の絡み合いを軽減することで,ID-PLLの性能向上を目指す。
- 提案手法CADは,クラス固有の特徴を増幅し,同じクラスのインスタンス間で一貫性を保つことで,クラス内の特徴を明確化する。
- CADは,曖昧なラベルに対するペナルティを大きくすることで,クラス間の距離を広げ,混同を低減する。
- 実験結果から,CADがインスタンス間の絡み合いを効果的に軽減し,ID-PLLの性能を向上させることが示された。
コルモゴロフ・アーノルド・ネットワークの多段階学習 [cs.DC, cs.LG, cs.AI, cs.NA, math.NA]目的:コルモゴロフ・アーノルド・ネットワークの学習高速化
- 近年の深層学習の発展に伴い,複雑な関数を効率的に学習する手法が求められている。
- 一般的なニューラルネットワークの学習は,関数合成に起因する構造の欠如により,学習速度が制限される場合がある。
- 本研究は,コルモゴロフ・アーノルド・ネットワークが持つ構造を活用し,学習を高速化する多段階学習法を提案する。
- コルモゴロフ・アーノルド・ネットワークとスプライン基底関数を用いた多チャネルMLPとの等価性が証明された。
- スプライン結び目の幾何学的影響を分析し,多段階学習アプローチの根拠を確立した。
- 提案手法は,従来の学習方法と比較して,物理情報ニューラルネットワークにおいて大幅な精度向上を達成した。
特徴帰属の説明における欠損バイアスの較正 [cs.CL, cs.LG]目的:特徴帰属の説明における欠損バイアスの較正
- AIの説明可能性は,モデルの信頼性と安全性を確保する上で重要である。
- 既存の特徴帰属手法は,欠損バイアスの影響を受けやすく,信頼性に欠ける場合がある。
- 本研究は,欠損バイアスをモデルの出力空間の表面的なアーティファクトとして扱い,低コストで修正することを目指す。
- 提案手法MCalは,既存のモデルを再学習することなく,線形ヘッドを微調整することで欠損バイアスを効果的に軽減する。
- MCalは,様々な医療ベンチマークにおいて,既存の複雑な手法と同等またはそれ以上の性能を示すことが確認された。
- 本研究は,欠損バイアスの修正が,モデルの再学習やアーキテクチャの変更を必要としないことを示した。
SCoUT:マルチエージェント強化学習におけるユーティリティ誘導型時間的グルーピングによるスケーラブルなコミュニケーション [cs.MA, cs.AI]目的:部分観測マルチエージェント強化学習における協調性の向上
- 複雑な環境下での協調行動を可能にするため,エージェント間のコミュニケーションが重要視されている。
- 誰に,いつコミュニケーションを取るかの判断が難しく,メッセージの効果測定が困難である。
- 時間的・エージェント抽象化により,効率的なコミュニケーション学習を目指す。
- SCoUTは,Gumbel-Softmaxを用いたソフトなエージェントグループの再サンプリングにより,スケーラブルなコミュニケーションを実現する。
- グループアウェアな批判器を用いることで,批判器の複雑さと分散を軽減し,より安定した学習を可能にする。
- カウンターファクチュアルコミュニケーション利点を用いて,送信者と受信者選択の双方への正確なクレジット割り当てを可能にする。
デザイン行動規範 (DBC): 大規模言語モデルのためのタクソノミー駆動型階層ガバナンスベンチマーク [cs.IR, cs.AI]目的:大規模言語モデルにおける構造化された行動ガバナンス層の有効性評価
- 大規模言語モデルの普及に伴い,その安全性と倫理的な利用が重要課題となっている。
- 既存の安全性対策は,モデルに依存したり,透明性に欠けたりする問題があった。
- モデル非依存で,法的要件に対応可能かつ監査可能なガバナンス層の構築を目指す。
- DBC層を導入することで,リスクエクスポージャー率(RER)が36.8%相対的に低減された。
- EU AI法への適合スコアはDBC層下で8.5/10に達し,コンプライアンスが向上した。
- Integrity Protectionクラスターが最も高いドメインごとのリスク低減効果を示した。
RLHFアライメントが浅いのはなぜか:勾配分析 [cs.RO, cs.LG, cs.CL]目的:LLMにおける安全アライメントの浅さを解明する研究
- LLMの安全性確保は,社会実装において不可欠であり,倫理的配慮が求められる。
- 既存のアライメント手法では,LLMの出力における有害性の判断箇所に偏った学習となりがちである。
- 有害性判断以降の箇所への学習勾配消失問題を解決し,より深いアライメントを実現する。
- 勾配ベースのアライメントは,有害性が決定される箇所に集中し,それ以降では消失することが証明された。
- KLダイバージェンスが初期トークンに集中する現象は,この勾配消失によって説明可能である。
- 全ての箇所に勾配信号を生成する損失関数を提案し,データ拡張技術の理論的根拠を与えた。
非パラメトリック構造事前知識による多段階定理予測について [cs.AI, cs.CV]目的:多段階定理予測の性能向上
- 自動推論はAIの重要な課題であり,定理予測はその核心である。
- 既存手法は汎化性能が低く,定理ライブラリの進化に対応できない。
- 構造的ドリフトに対処し,LLMによる構造化計画を可能にすること。
- 定理先行グラフを用いることで,LLMが勾配最適化なしに構造化されたプランナーとして機能する。
- FormalGeo7kベンチマークにおいて,89.29%の精度を達成し,ICLベースラインや教師あり学習モデルを上回る。
- 明示的な構造事前知識が,LLMベースの記号推論のスケーリングに有望な道を示す。
浸透蒸留:最小限のサンプルによるモデルの乗っ取り [cs.CR, cs.LG]目的:深層学習モデルに対する,最小限のサンプルを用いたモデル乗っ取り戦略
- 転移学習は,限られたデータと計算資源で新たなタスクを解決するために,事前学習済みモデルの知識を活用する。
- データセット蒸留により生成された合成データセットを利用した転移学習において,セキュリティ上の脅威が未発見である。
- 合成データセットに少数の悪意のあるサンプルを注入することで,モデルの乗っ取り攻撃を可能にする脅威を明らかにする。
- 提案手法Osmosis Distillation(OD)攻撃は,隠れたタスクで高い攻撃成功率を達成し,元のタスクにおけるモデルの有用性を維持する。
- 蒸留された浸透セットは,多様なモデルアーキテクチャにわたるモデルの乗っ取りを可能にし,優れた攻撃性能とモデルの有用性を実現する。
- 転移学習における第三者製の合成データセット利用に関する注意喚起が重要である。
理由による拡張された選好フィードバックからの因果的に頑健な報酬学習 [cs.PF, cs.AI, cs.LG, cs.RO]目的:選好に基づく報酬学習の因果的頑健性の向上
- 人間の選好を反映したエージェントの行動設計が重要視されている。
- 二値の疎なフィードバックが,因果関係の誤認を引き起こしやすい。
- 自然言語による理由付けを用いて,因果的シグナルを補完し,頑健性を高める。
- ReCouPLeは,自然言語の理由を埋め込み空間における投影軸として扱い,報酬モデルの学習を誘導する。
- 同じ理由が複数のタスクで再利用されるため,タスク間の知識転移を効率的に行うことができる。
- 分布シフト下で報酬精度が最大1.5倍,新規タスクにおけるポリシー性能が2倍向上した。
K-Gen:解釈可能なキーポイント誘導による軌道生成のためのマルチモーダル言語条件アプローチ [cs.AI]目的:自律走行シミュレーションにおける現実的かつ多様な軌道の生成
- 自動運転技術の発展には,現実世界の複雑な状況を再現するシミュレーション環境が不可欠である。
- 既存手法は,構造化データに依存し,視覚的な文脈の理解が不十分であるという課題がある。
- マルチモーダルな情報を統合し,解釈可能なキーポイントを用いて軌道生成の精度と多様性を向上させる。
- K-Genは,ラスタライズされたBEVマップとテキストによるシーン記述を統合し,意図を反映したキーポイントを生成する。
- T-DAPOという軌道認識型強化学習によるファインチューニングにより,キーポイント生成の性能がさらに向上した。
- WOMDおよびnuPlanにおける実験の結果,K-Genは既存手法を上回り,その有効性が示された。
時系列予測アルゴリズムの自律的コード生成のための自己進化エージェント SEA-TS [cs.AI]目的:時系列予測アルゴリズムのコード自動生成,検証,最適化
- 様々な分野における意思決定の基盤であり,精度の高い時系列予測の重要性は高い。
- 新しい環境への適応性や,データ不足,手動による反復の限界が課題となっている。
- 自己進化ループを通じて,時系列予測アルゴリズムのコードを自律的に最適化すること。
- SEA-TSは,Solar-Energyベンチマークにおいて,TimeMixerと比較してMAEを40%削減した。
- 独自のデータセットでは,太陽光発電予測においてWAPEを8.6%,住宅負荷予測において7.7%削減。
- また,物理情報に基づいた減衰ヘッドなど,新しいアルゴリズムのパターンを発見した。
放送3Dキネマティクスからの解釈可能な事前リリース・野球球種予測 [cs.CV, cs.AI, cs.LG]目的:野球の球種予測の可能性
- 野球における投球フォームの分析は,選手のパフォーマンス向上や怪我予防に不可欠である。
- 既存の研究では,球種予測にボールの軌道データに依存しており,フォームのみでの高精度な予測が課題であった。
- 本研究は,球種の軌道データを用いずに,投手のフォームから球種を高精度に予測することを目指す。
- 119,561投球のデータを用いて,フォームのキネマティクスのみで80.4%の精度を達成した。
- 予測において,上半身の動きが64.9%の情報を担い,下半身が35.1%を占めることが明らかになった。
- 手首の位置や胴体の傾きが特に重要な特徴量であり,フォームから球種を区別できる上限が約80%であることが示された。
二層ネットワークにおける差分プライバシー:DP-SGDが公平性とロバスト性を損なう仕組み [cs.LG, cs.CY]目的:差分プライバシー学習における性能低下,公平性の問題,および敵対的ロバスト性の低下のメカニズム解明
- プライバシー保護は重要である。特に,機密データを用いたモデル学習において,差分プライバシーは不可欠な技術である。
- 差分プライバシー学習は性能低下や公平性の問題を引き起こすことが経験的に示されているが,その理論的根拠は未解明である。
- 二層ReLU畳み込みニューラルネットワークにおけるDP-SGDの学習ダイナミクスを分析し,性能低下の要因を特定すること。
- 特徴量学習の質を測る指標である「特徴量-ノイズ比(FNR)」が,差分プライバシー学習の性能に大きく影響することが明らかになった。
- FNRのクラス間・サブグループ間での不均衡が,格差的影響(disparate impact)を引き起こすことが示された。
- 事前学習とプライベートなファインチューニングという一般的なパラダイムが,データセット間の特徴量分布のシフトが大きい場合には改善を保証しないことが判明した。
DeformTrace:リレー記号を用いた変形可能な状態空間モデルによる時間的フォレンジック局所化 [cs.CV, cs.AI, cs.MM]目的:時間的フォレンジック局所化における操作されたセグメントの正確な特定
- 動画や音声の改ざん検知は,セキュリティやフォレンジックにおいて重要な役割を果たす。
- 既存手法では,曖昧な境界,まばらな改ざん,長距離モデリングの限界が課題となっていた。
- 変形可能なダイナミクスとリレー機構により,これらの課題を解決し,より正確な局所化を目指す。
- 提案手法DeformTraceは,状態空間モデル(SSM)を強化し,より少ないパラメータで最先端の性能を実現した。
- Deformable Self-SSMとRelay Token Mechanismにより,時間的局所化の精度と長距離モデリング能力を向上させた。
- Deformable Cross-SSMは,改ざん以外の情報蓄積を減らし,まばらな改ざんに対する感度を高めた。
無限地平線における有界状態:ストリーミング対話における随時想起のためのプロアクティブな階層型メモリ [cs.AI]目的:ストリーミング対話における随時想起のためのプロアクティブな階層型メモリの提案
- 現実世界の対話は無限に続くため,限られた状態を維持するメモリ機構が不可欠である。
- 従来の読み込み・思考型メモリは,無限地平線下での随時メモリ想起をサポートできないという課題がある。
- 本研究は,ストリーミング対話における想起の忠実性と効率性のジレンマを解決することを目指す。
- 本研究で新たに構築したSTEM-Benchは,無限地平線下でのメモリ評価のための初のベンチマークである。
- 提案手法ProStreamは,マルチ粒度蒸留による連続ストリームの推論と,適応的な時空間最適化により,低遅延かつ高忠実性を実現する。
- 実験の結果,ProStreamは既存手法と比較して,精度と効率の両方で優れていることが示された。
FedAFD:敵対的融合と知識蒸留によるマルチモーダル連合学習 [cs.LG, cs.AI, cs.CV]目的:マルチモーダル連合学習における性能および効率の向上
- データプライバシー保護が重要視される中で,分散データを用いた機械学習へのニーズが高まっている。
- 既存手法では,クライアントごとの性能差や,モダリティ・タスク間の不一致,モデルの異質性が課題となっている。
- クライアントとサーバーの学習を強化し,上記課題を克服することで,連合学習の精度向上を目指す。
- 提案手法FedAFDは,敵対的アラインメントと粒度認識型融合モジュールにより,クライアントの学習を改善する。
- サーバー側では,類似度に基づいたアンサンブル蒸留により,モデルの異質性を緩和し,グローバルモデルを効率的に学習する。
- IIDおよびnon-IID設定下での実験により,FedAFDが既存手法を上回る性能と効率を示すことが確認された。
拡散言語モデルのための無料のランチ:低コスト多様サンプリング [cs.CL, cs.AI]目的:拡散言語モデルにおける生成多様性の向上
- 複雑な推論タスクにおいて,多様な出力は有効な探索に不可欠である。
- 既存のサンプリング手法は,反復的な失敗モードに計算資源を浪費しやすい。
- 拡散言語モデルのサンプリングプロセスを低コストで改善し,多様性を高める。
- 提案手法は,バッチ内の各サンプルを,先行サンプルの特徴空間から反発させることで冗長性を抑制する。
- HumanEvalおよびGSM8Kベンチマークにおいて,多様性とPass@$k$性能が大幅に向上した。
- 本手法は,追加学習やビームサーチを必要とせず,計算コストも軽微である。
差分プライバシーを考慮したマルチモーダル文脈内学習 [cs.AI]目的:差分プライバシーを保証するマルチモーダル文脈内学習のフレームワーク
- 画像とテキストを扱うモデルは医療や個人写真など,機密性の高い分野で活用が広がっている。
- 既存の差分プライバシー手法は,トークン数に比例してコストが増大するため,テキストのみの少数ショット学習に限られていた。
- アクティベーション空間でのコンパクトなタスクベクトルを用いて,多数ショットのマルチモーダル文脈内学習を可能にすること。
- DP-MTVは,大量のデモンストレーションをアクティベーション空間で集約し,コンパクトなタスクベクトルを生成することで,差分プライバシーを保ちながらマルチモーダル文脈内学習を実現した。
- 提案手法は,プライバシー保護のためのノイズ付加を一度のみ行うことで,無制限の推論クエリを可能にした。
- 8つのベンチマークで評価した結果,DP-MTVは$\varepsilon=1.0$において,VizWizで50%の精度を達成し,非プライベートなモデルの55%とゼロショットの35%と比較して,文脈内学習の利点を維持した。
オンデマンド認可:VLMsのための法的意識を備えた知的財産保護による動的認可 [cs.AI]目的:VLMsの知的財産保護のための動的認可フレームワーク
- 大規模言語モデルの普及に伴い,高価な事前学習済みモデルの知的財産保護が重要になっている。
- 既存手法は静的な定義に依存しており,動的な環境への対応や不正アクセスに対する透明性に課題がある。
- 本研究は,認可を必要とする場合にのみ認可を行い,法的意識を備えた知的財産保護を実現する。
- 提案手法AoD-IPは,軽量な動的認可モジュールにより,柔軟なユーザー制御を可能にする。
- AoD-IPは,ドメインの適応性と拡張性を向上させ,既存の静的アプローチの限界を克服する。
- 実験結果から,認可されたドメインでの性能維持と不正アクセスの信頼性向上,そして動的な環境での適応的なデプロイメントが確認された。
U-Parking:UWBアシストによる分散型自律駐車システム - 強固な局所化と知的な計画 [cs.CL, cs.LG, cs.NI]目的:UWBアシスト自律駐車システムの開発
- 駐車場不足の解消や高齢者・運転困難者の移動支援に貢献し得る分野である。
- 複雑な屋内環境下での正確な位置認識と,それに基づく安全な経路計画が課題である。
- LLMを活用した計画とロバストな局所化技術により,困難な環境下での自律駐車実現を目指す。
- U-Parkingは,UWBとLLMを活用した分散型自律駐車システムである。
- ロバストな局所化と軌道追跡により,困難な屋内環境下での信頼性の高い自動駐車を可能にした。
- 実車実験によって,その有効性が検証された。
EvoTool:LLMエージェントにおける非難を意識した突然変異と多様性を意識した選択による自己進化型ツール利用ポリシー最適化 [cs.AI]目的:LLMエージェントのツール利用ポリシー最適化
- 複雑なタスク解決において,LLMエージェントの有効性はツール利用ポリシーに依存する。
- 従来の最適化手法は,遅延した監督や長期間の軌跡における信用割当の困難さから課題を抱える。
- モジュール間の相互作用を考慮しつつ,効率的かつ汎用的なポリシー最適化を実現する。
- EvoToolは,プランナー,セレクター,コーラー,シンセサイザーの4つのモジュールにツール利用ポリシーを分解し,自己改善ループで反復的に改善する。
- 軌跡に基づいた非難帰属により,特定のモジュールへの失敗原因を特定し,自然言語による批判を通してそのモジュールのみを編集する。
- 多様性を意識した集団選択により,解の多様性を維持し,GPT-4.1とQwen3-8Bの両ベンチマークで強力なベースラインを5ポイント以上上回る性能を達成した。
エージェントワークフローにおける文脈的プライバシー評価:AgentSCOPE [cs.ET, physics.app-ph, cs.CR, cs.AI]目的:エージェントワークフローにおけるプライバシー侵害の評価
- エージェントシステムは普及が進んでおり,ユーザーのプライバシー保護が重要課題となっている。
- 既存のプライバシー評価は入力と出力に焦点を当てており,ワークフロー内の情報フローの評価が不足している。
- ワークフロー各段階でのプライバシー侵害を特定し,その発生源を明らかにすることを目指す。
- エージェントシステムの80%超で,ワークフロー内のどこかでプライバシー侵害が発生することが示された。
- 最終出力が問題なくても,APIからの応答段階で最も多くの侵害が発生することが明らかになった。
- 出力レベルのみでの評価では,エージェントシステムのプライバシーリスクを過小評価する可能性がある。
整列の逆効果:LLMマルチエージェントシステムにおける16言語にわたる安全性介入の言語依存的逆転 [cs.AI, cs.CL]目的:大規模言語モデルにおける安全性介入がもたらす構造的類似現象の解明
- 言語モデルの安全性確保は,社会への実装において不可欠である。
- 安全性介入の効果は言語に依存し,想定外の結果を生む可能性がある。
- 言語空間が安全性介入の結果を決定することを明らかにすること。
- 英語では安全性介入が有効だが,日本語を含む他の言語では逆効果となる「整列の逆効果」が確認された。
- この逆効果は,Power Distance Indexと相関し,文化言語的な差異が影響を及ぼすことが示唆された。
- 個別化介入は,病理と乖離の主要な原因となり,さらなる問題を引き起こすことが明らかになった。
