arXiv雑要約
AI - 2025/10/14 公開
タイプ導出を用いたコード生成における型正当性の保証学習 [eess.SY, cs.SY, cs.PL, cs.AI, cs.SE]目的:コード生成における型正当性の保証
- 近年,大規模言語モデルによるコード生成が注目されているが,型安全性は重要な課題である。
- 従来の制約付きデコーディングでは型エラーを減らせるが,モデル自身が型推論を学習しない点が課題である。
- 型システムをモデル内部に組み込み,型推論能力を向上させることでコード生成の性能改善を目指す。
- TyFlowは,型導出木とプログラム合成導出木を対応付け,合成決定シーケンスに基づく新たなコード表現を導入した。
- この手法により,モデルは型システムの学習負荷を軽減し,高水準のプログラム意味論に集中できるようになった。
- 実験の結果,TyFlowは型エラーを解消し,機能的な正当性も大幅に向上させた。
不確実性駆動型予測によるリアルタイム適応動作生成:UF-RNN [cs.RO, cs.AI]目的:不確実な状態下におけるロボットの効率的な動作
- ロボットが実世界で活躍するには,曖昧な状況への対応が不可欠である。
- 模倣学習は成功例に依存し,不確実性が高い失敗事例の学習が難しい。
- 不確実性に着目し,ロボットが自律的に探索行動を促すことを目指す。
- UF-RNNは,内部シミュレーションで未来の軌跡を予測し,不確実性の高い状況下でより効果的な行動選択を可能にする。
- ドア開閉タスクにおいて,UF-RNNは明示的な失敗例なしに,従来のRNNよりも高い成功率を示した。
- 潜在空間におけるカオス的ダイナミクスを活用することで,環境の曖昧さに応じた探索行動を促進する。
A3RNN:ロボットにおける発達的視覚注意のためのボトムアップとトップダウンプロセスの双方向融合 [cs.RO, cs.AI]目的:ロボット学習におけるトップダウン (TD) とボトムアップ (BU) 視覚注意間の発達的相互作用
- 人間の視覚注意メカニズムの理解は,ロボットの自律的な行動や認知能力の向上に不可欠である。
- 従来の視覚注意モデルは,ボトムアップまたはトップダウンのどちらか一方に偏りがちで,柔軟性に欠ける。
- TDとBUの相互適応を通じて,より構造化された人間らしい注意行動がどのように出現するかを解明する。
- 提案モデルA3RNNは,予測的なTD信号とサリエンシーに基づくBUキューを双方向の注意アーキテクチャで統合する。
- ロボット操作タスクの模倣学習実験により,注意行動が学習を通じてサリエンシー駆動型探索から予測駆動型指向へと進化することが示された。
- 本研究は,知覚と内部予測の相互作用による自己組織化された注意の重要性を示唆し,ロバストな注意形成に発達的メカニズムが貢献する可能性を示唆する。
LLMにおける相乗的なテスト時適応 [cs.CL, cs.AI, cs.LG]目的:LLMのテスト時適応による性能向上
- LLMは専門領域での活用が期待されるが,訓練データとの分布のずれが課題となる。
- 専門領域の高品質なラベル付きデータは高価であり,収集に時間がかかる。
- ラベルなしでLLMをテスト時に適応させ,ラベル不足の環境での活用を目指す。
- 提案手法SyTTAは,入力側のperplexityと出力側の予測エントロピーという2つの不確実性信号を活用する。
- SyTTAは様々なモデルやベンチマークで一貫した性能向上を示し,特に農業分野の質問応答で顕著な効果を発揮した。
- Qwen-2.5-7Bにおいて,わずか4トークンの追加でRouge-LSumを120%以上向上させた。
SGM:リスク制御された再帰的自己修正のための統計的ゲーデル機械 [cs.LG, cs.AI]目的:再帰的自己修正の安全性を保証する統計的安全性層
- 機械学習の自動化において,モデルの自己修正が重要性を増している。
- 自己修正の安全性を保証する枠組みが存在せず,誤った修正がリスクとなる。
- 統計的検定を用いて,リスクを制御しつつ安全な自己修正を実現する。
- SGMは,CIFAR-100において真の性能向上を検証し,ImageNet-100における誤った性能向上を拒否した。
- Confirm-Triggered Harmonic Spending (CTHS)により,有望な修正にエラー予算を集中させ,全体的なリスクを抑制した。
- 強化学習や最適化のベンチマークにおいても,SGMの堅牢性が確認された。
LLMの弱点:ごく少数のニューロンを改変すると言語能力が著しく低下する [cs.CG, cs.NI, cs.SY, eess.SY, cs.AI]目的:LLMにおける重要ニューロンの特定
- LLMは自然言語処理の基盤であり,多様な応用と研究を支えているため,その挙動解明が重要である。
- LLMの脆弱性や,少数の要素が全体に大きな影響を与える可能性は未解明な点が多い。
- LLMにおける重要ニューロンを特定し,その脆弱性と堅牢性を評価することを目的とする。
- LLMには極めて少数の重要ニューロンが存在することが明らかになった。これらのニューロンを破壊すると,モデルは完全に崩壊する。
- 重要ニューロンは均一に分布せず,特にMLP down_projコンポーネントの外層に集中する傾向がある。
- 重要ニューロンを破壊すると,性能劣化は緩やかな低下ではなく,急激な相転移を示す。
チベット高原における土壌水分時空間ダウン スケーリングのための漸進的スケール畳み込みネットワーク [cs.CL, cs.IR, cs.DB, cs.LG]目的:土壌水分の時空間ダウン スケーリング手法の提案
- 土壌水分は水文および気象プロセスにおいて重要な役割を担うため,高分解能な土壌水分情報の取得が求められる。
- 高分解能な土壌水分を得るためには補助変数との組み合わせが必要だが,時間スケールでの補助因子の不完全性が課題である。
- 本研究は,時間分解能の高いERA5-Land変数を活用し,土壌水分の時空間ダウン スケーリングの精度向上を目指す。
- 提案手法であるPSCNetは,チベット高原において高い精度を示し,既存手法を上回るR値0.881を達成した。
- 現地観測地点での検証においても,PSCNetはR値指標において上位3モデルに安定してランクインし,誤差の低減にも貢献した。
- ERA5-Land変数の有効性が確認され,時間分解能の高い変数を用いることで,ダウン スケーリングの性能が維持された。
分子特性予測のための推論強化大規模言語モデル [cs.LG, cs.AI]目的:分子特性予測
- 創薬や材料科学において分子特性予測は不可欠であり,効率的な研究開発を支える重要な技術である。
- 既存手法は,解釈性の低さ,タスク間の汎化性能の不足,化学的推論能力の欠如といった課題を抱えている。
- 化学的推論を取り入れることで,解釈性と汎化性能を向上させ,分子特性予測の精度を高めることを目指す。
- 提案手法MPPReasonerは,分子画像とSMILES文字列を統合し,化学的推論を組み込むことで,既存モデルを大幅に上回る性能を示した。
- 8つのデータセットにおける実験で,MPPReasonerは,分布内および分布外タスクにおいて,それぞれ7.91%,4.53%の性能向上を達成した。
- MPPReasonerは,タスク間の汎化能力に優れ,分子特性分析に関する貴重な洞察を提供する,化学的に妥当な推論経路を生成する。
グラフ拡散と階層的音楽分析による構造化音楽生成:ProGress [cs.SD, cs.LG, eess.AS]目的:構造化された音楽生成のためのフレームワーク
- 音楽生成AIは急速に発展しており,創造性支援や作曲の可能性を広げている。
- 既存のモデルは構造的な一貫性,特に和声・旋律構造が不十分である。
- 音楽理論に基づき,解釈可能で構造化された音楽生成を目指す。
- ProGressは,拡散モデルとシェンカー分析の概念を組み合わせた新しいフレームワークである。
- DiGressモデルを音楽生成用に改良し,フレーズ融合手法を新たに開発した。
- 人間実験の結果,既存の最先端手法よりも優れた性能が示唆された。
MRI画像を用いた脳腫瘍検出 [cs.CV, cs.AI, cs.LG]目的:脳腫瘍の自動検出とセグメンテーション
- 脳腫瘍の早期発見は,患者の予後改善に不可欠であるため,その効率化が重要である。
- MRI画像の読影には専門知識と時間が必要であり,医師の負担が大きいという課題がある。
- 深層学習を用いて脳腫瘍検出を自動化し,医師の診断支援を行うことを目指す。
- 深層学習モデル(ロジスティック回帰,CNN,ResNet)による分類において,脳腫瘍の検出精度向上が確認された。
- U-NetとEfficientDetを用いたセマンティックセグメンテーションおよびアンカーベースの物体検出により,腫瘍の局在化と識別が向上した。
- 本研究は,医療画像における深層学習の可能性を示唆し,臨床結果の改善に貢献し得る。
理解の監査:言語モデルにおける数学的推論のための事後制約推論 [cs.CL, cs.AI]目的:言語モデルにおける数学的推論の信頼性と正確性の向上
- 言語モデルは高度な推論能力を示す一方,誤った前提に基づいた誤謬が生じやすい
- 既存研究では,事実関係の誤りや事後検証に焦点が当たり,推論過程自体の誤謬は未解決の課題である
- 検証可能な前提に基づいて推論を制約することで,幻覚による誤りを抑制し,より信頼性の高い推論を実現する
- 提案手法「理解の監査(AoU)」は,クエリを前提候補に分解し,検証を経て妥当な前提のみに基づいて推論を行う
- 理論的な保証に加え,不完全な検証下での過剰リスク限界を確立し,計算可能性も分析した
- GSM8K,MultiArith,SVAMP等のデータセットにおいて,Chain-of-Thought等の既存手法を大幅に上回る精度向上を達成した
不透明度勾配駆動による密度制御:コンパクトかつ効率的な少数ショット3Dガウススプラッティング [cs.CV, cs.LG]目的:少数ショットにおける3Dガウススプラッティングの効率向上
- 3Dシーンの表現において,ガウススプラッティングは高品質かつ高速なレンダリングを可能にする。
- 少数ショット条件下では,過学習や冗長な再構成が問題となり,効率が低下しやすい。
- 不透明度勾配を利用した密度制御により,よりコンパクトで効率的な再構成を目指す。
- 本手法は,従来のFSGSと比較して,3-view LLFFデータセットにおいて40%以上コンパクトなモデルを実現した。
- Mip-NeRF 360データセットでは,約70%の削減を達成し,品質と効率のトレードオフにおいて新たな最先端性能を示した。
- 不透明度勾配による積極的な密度化と,抑制的なプルーニングスケジュールの組み合わせが,効率向上に貢献する。
継続学習による車両経路問題のサイズ汎化性能の向上 [cs.HC, cs.ET, cs.MM, cs.LG]目的:車両経路問題に対するサイズ汎化性能の向上
- 車両経路問題は現実社会の物流効率化に不可欠であり,機械学習による解決が期待されている。
- 既存の深層学習モデルは単一サイズのインスタンスで学習されるため,異なるサイズへの汎化性能が低い。
- 本研究は,様々な問題サイズへの汎化性能を高め,実用的な車両経路問題解決を目指す。
- 提案手法は,既存の最先端モデルと比較して,学習済みまたは未学習の問題サイズにおいて優れた性能を発揮する。
- タスク間正則化,タスク内正則化,経験再生の各要素が相乗効果を生み出し,モデルの性能向上に貢献する。
- 継続学習フレームワークにより,問題サイズが大きくなるにつれてモデルが知識を保持し,破局的忘却を軽減することが確認された。
マルチモーダル特徴量相関と教師なし学習によるゲーマータイプ解明 [cs.HC, cs.AI, cs.CY, cs.LG]目的:ゲーマータイプ(人物像)の特定
- ゲームデザインの適応,行動理解,デジタルウェルビーイング向上に不可欠な知見が得られるため。
- ゲーマーの多様性を捉えきれていない,客観的で再現性のあるゲーマープロファイリング手法が不足している。
- 行動データと心理的指標を統合し,データ駆動型アプローチでゲーマータイプを分類・分析することを目指す。
- 心理学的指標,行動分析,機械学習を組み合わせた統合的なフレームワークを構築し,ゲーマーの潜在的な人物像を明らかにした。
- 相関統計とネットワーク中心性を用いて特徴量を選択し,次元削減とクラスタリングを適用することで,最適なクラスタリング結果を得た。
- その結果,没入型ソーシャルストーリーシーカー,規律ある最適化者,戦略的システムナビゲーター,競争的チームビルダーの4つのタイプを特定した。
MetaBreak: 特殊トークン操作によるオンラインLLMサービスの脱獄 [cs.CR, cs.AI]目的:オンラインLLMサービスの安全対策の回避手法
- LLMは高度な自然言語処理能力を持つが,悪意のある利用によるリスクも存在する。
- LLMの安全性確保は重要だが,既存の対策では巧妙な攻撃を完全に防ぐことは困難である。
- 特殊トークンを悪用した新たな攻撃手法を解明し,その対策を検討する。
- 特殊トークンを操作することで,LLMの安全対策をバイパスし,コンテンツモデレーションを回避できることを示した。
- 従来のプロンプトエンジニアリング手法と比較して,コンテンツモデレーションが存在する場合に高い脱獄成功率を達成した。
- MetaBreakは既存手法と組み合わせることで,さらなる脱獄成功率の向上が期待できる。
X-VLA:スケーラブルなクロスエンボディメント視覚言語行動モデルとしてのソフトプロンプト変換器 [cs.RO, cs.RO, cs.AI, cs.CV]目的:多様なロボットプラットフォームにおける大規模なクロスエンボディメント異種データセットを用いた効果的な学習
- ロボット工学において,汎用的な視覚言語行動モデルの構築は,多様な環境への適応と応用を可能にする上で重要である。
- 異種ロボットデータはデータの形式や特性が異なるため,効果的に活用するための手法が課題となっていた。
- 本研究は,異なるデータソースに適応したソフトプロンプトによる学習手法を提案し,クロスエンボディメントにおける性能向上を目指す。
- 提案手法X-VLAは,標準的なTransformerエンコーダーとソフトプロンプトのみを利用することで,スケーラビリティと簡潔さを実現した。
- シミュレーションと実機ロボットの両方において,様々なベンチマークで最先端の性能を達成した。
- 柔軟な操作性と,エンボディメント,環境,タスクへの迅速な適応能力において,優れた結果を示した。
大規模言語モデルにおける情報検索要求から生じる「中間部情報の喪失」 [cs.LG, q-bio.NC]目的:大規模言語モデルにおける「中間部情報の喪失」現象の解明
- 大規模言語モデルは自然言語処理の基盤であり,その性能向上は様々な応用分野に不可欠である。
- 大規模言語モデルは長い文脈において,重要な情報が中間部に位置する場合,性能が低下しやすい。
- この性能低下がモデルの欠陥ではなく,学習時の情報検索要求への適応である可能性を探る。
- 実験の結果,長期間記憶と短期記憶の要求を模倣した学習パラダイムにおいて,U字型の性能曲線が確認された。
- 短期記憶の要求は直近の情報への注目と一致する一方,長期記憶の要求とモデルの自己回帰性,アテンションシンクが,初期の情報への注目を誘導する。
- この発見は,単純な記憶タスクだけでなく,より大規模言語モデルの事前学習に近いシーケンス補完タスクにも一般化されることが示された。
大規模言語モデルにおける臨床推論能力評価のための模擬口述試験シミュレーション [cs.LG, cs.AI]目的:大規模言語モデルにおける臨床推論能力の評価
- 医療現場では,限られた情報から仮説を立て,検証を繰り返す臨床推論が不可欠である。
- 既存の医療AI評価は知識の想起に偏っており,段階的な推論プロセスを評価できていない。
- 不確実性下での反復的な診断推論プロセスを評価し,AIの限界を明らかにすること。
- 新たなベンチマークVivaBenchを開発し,医師が作成した臨床シナリオを用いてLLMの推論能力を評価した。
- 現在のLLMは,詳細な情報があれば診断できるが,不確実性下では性能が低下することが示された。
- LLMの誤りパターンとして,初期仮説への固執,不適切な検査選択,早すぎる診断などが特定された。
ArtPerception:LLMに対するASCIIアートを用いた脱獄攻撃フレームワーク [cs.CL, cs.CR, cs.AI, cs.CL, cs.CV, cs.LG]目的:LLMのセキュリティ脆弱性
- LLMは様々な応用を可能にする一方,セキュリティ上の課題が顕在化している。
- 従来の安全性対策は意味解析に重点を置いており,非標準的なデータ表現に対する脆弱性が残る。
- ASCIIアートを用いてLLMのセキュリティ対策を回避する効率的な攻撃手法を確立する。
- ArtPerceptionは,ASCIIアートの認識能力を事前にテストし,最適パラメータを決定する二段階手法である。
- 四つのオープンソースLLMおよびGPT-4o,Claude Sonnet 3.7,DeepSeek-V3等の商用モデルに対して高い脱獄成功率を示した。
- LLMのセキュリティはテキストのみならず,多岐にわたる解釈空間に対する防御が必要であることを示唆する。
マルチモーダル推論における幻覚の軽減:機能的な注意制御によるアプローチ [cs.AI]目的:マルチモーダル大規模推論モデルにおける幻覚の軽減
- 近年,画像と言語の推論能力が向上し,クロスモーダル知能の基盤技術として重要性が増している。
- マルチモーダルモデルは,誤った推論過程や視覚情報の誤解釈といった幻覚の問題を抱えている。
- 注意機構における役割分担を制御することで,幻覚の根本原因である知覚バイアスと推論ドリフトを抑制する。
- 提案手法は,3つの実世界モデルで平均5%,最大15%の性能向上を達成した。
- 追加の計算コストは1%未満,遅延は9%の増加にとどまる。
- モデルに依存せず,既存のモデルの信頼性と解釈性を高め,安全な利用を可能にする。
コードレビューのための基盤AI:エンタープライズパイプラインにおけるリソース効率の高い大規模モデル提供 [eess.SY, cs.SY, q-bio.NC, cs.SE, cs.LG]目的:コンプライアンスが重視される環境における自動コードレビューの導入促進
- 高品質なソフトウェア開発において,コードレビューはバグの早期発見と品質向上に不可欠である。
- 静的解析ツールは大量の指摘を出すが,その根拠が不明確な場合が多く,LLMの幻覚やコストも課題である。
- 静的解析とASTを活用し,低コストで根拠のあるコードレビューを実現すること。
- 提案手法は,安全重視のC/C++標準において,高速なフィードバック(中央値59.8秒)を実現した。
- 大規模な独自モデルと比較して,違反削減率や違反発生率において遜色ない性能を示した。
- 小規模な調査の結果,提案手法はトリアージ作業の削減と,レビューの根拠に対する理解促進に貢献する可能性が示唆された。
プログラムからポーズへ:学習済みプログラムライブラリによる現実世界シーンの生成 [cs.CV, cs.AI]目的:現実世界シーンの生成手法
- 現実世界のシーンデータは取得が難しく,データ量が限られているため,高品質なシーン生成が求められている。
- 既存手法では,多様なオブジェクトポーズを持つ現実的なシーン生成が困難である。
- 学習済みプログラムライブラリと大規模言語モデルを活用し,現実世界に即したシーン生成を実現する。
- FactoredScenesは,部屋の構造を考慮し,実在するシーンからオブジェクトポーズの多様性を学習することで,現実的な3Dシーンを合成する。
- シーンを部屋のプログラムとオブジェクトポーズという階層的な概念に分解するファクチャード表現を導入した。
- 生成されたシーンは,現実のScanNetシーンと区別がつかないほどリアルであり,高い品質を持つことが示された。
マトリョーシカ思考:再帰的テスト時スケーリングによる効率的な推論 [cs.CL, cs.AI]目的:効率的な推論の実現
- 言語モデルの性能向上には,推論時の計算資源の活用が重要である。
- 既存手法は高い計算コストを伴い,効率性に課題がある。
- 計算コストを大幅に削減しつつ,高性能を維持することを目指す。
- 提案手法「マトリョーシカ思考」は,DeepConfの4%の計算量で,AIME2025で99.79のスコアを達成した。
- モデルの推論,検証,要約能力を再帰的に活用し,正解の保持率を高めることで効率化を実現した。
- 複数のオープンソースモデルやマルチモーダル推論ベンチマークで有効性が確認された。
アルゴリズム的制御器 [cs.CC, cs.AI, cs.IT, cs.SY, eess.SY, math.IT, q-bio.NC]目的:出力のアルゴリズム複雑度の削減を通じた制御器の性能評価
- 制御理論は,システムの安定性や効率的な動作を実現するために不可欠である。
- 従来の制御理論では,システムの内部モデルの重要性が認識されているが,厳密な証明が不足していた。
- アルゴリズム情報理論を用いて,制御器が世界モデルを内包することの必要性を定量的に示す。
- 制御器が良いアルゴリズム的制御器である場合,出力のアルゴリズム複雑度が低減されることが示された。
- 複雑度の差が大きいほど,相互アルゴリズム情報量の高い世界と制御器のペアが有利になる。
- この枠組みは,制御器が読み出しの条件付き記述長を最小化するように動作すると示唆している。
LMエージェントにおける事後再構成によるサンプル効率的なオンライン学習 [cs.DC, cs.LG, cs.AI, cs.CL]目的:言語モデルエージェントのサンプル効率向上
- 環境の変化に対応できるAIエージェントの実現は,実世界への応用において重要である。
- 言語モデルエージェントは,逐次的な相互作用から学習する際にサンプル効率が低いという課題がある。
- 過去の失敗事例から,達成可能であった代替目標を生成し,学習データとして活用する。
- ECHOは,XMiniGridおよびPeopleJoinQAにおいて,既存の言語モデルエージェントよりも最大80%高い性能を示した。
- XMiniGridでは,ReflexionやAWMといった高度なエージェントアーキテクチャと比較しても優位性が見られた。
- ECHOは,過去の経験をより効果的に活用することで,新しい環境への適応を加速させる。
未知への備え:データ変化へのAIOpsキャパシティ予測モデルの適応 [cs.SE, cs.AI]目的:AIOpsにおけるキャパシティ予測モデルのデータ変化への適応戦略
- ソフトウェア組織において,リソースの効率的な配分と運用需要への対応は不可欠である。
- 予測モデルの精度維持には継続的な再学習が必要だが,そのコストとスケーラビリティが課題となる。
- データ変化を検知した際の再学習が,精度と効率のバランス改善に寄与するかを検証する。
- ドリフトベースの再学習は,多くのケースで定期的な再学習と同等の予測精度を達成し,コスト効率が良い。
- データが急速に変化する場合には,予測精度を最大化するためには定期的な再学習が依然として有効である。
- これらの知見は,再学習オーバーヘッドを削減しつつ,堅牢な性能を維持するためのAIOpsシステム改善に役立つ。
ソフトウェア脆弱性検出のためのハイブリッドネットワークモデルによる意味と構造の架け橋 [cs.SE, cs.AI, cs.CR]目的:ソフトウェア脆弱性検出手法
- ソフトウェアの安全性確保は重要であり,脆弱性検出は不可欠な課題である。
- 従来の静的・動的解析では,脆弱性に影響する構造的な依存関係を見落とす場合がある。
- 本研究は,構造と意味の両方を考慮した新たな脆弱性検出アプローチを提案する。
- 提案手法は,Javaの脆弱性検出において93.57%の精度を達成した。
- これは,Graph Attention Networkベースの手法や大規模言語モデルと比較して大幅な改善である。
- また,重要なサブグラフの抽出と自然言語による説明により,解釈可能性も向上している。
知識グラフ拡張マルチエージェント基盤:物理環境とデジタル環境の連携 [cs.MA, cs.AI, cs.RO]目的:物理環境とデジタル環境の連携のための知識グラフ拡張マルチエージェント基盤
- サイバーフィジカルシステムは,産業界において重要な役割を担う。システムの複雑化が進んでいる。
- 既存手法は,柔軟性や意味的表現力に乏しく,自律的な連携が困難である。
- 知識グラフを用いて,物理・デジタルコンポーネント間の知的連携を実現し,拡張性と柔軟性を高める。
- 提案手法KG-MASは,知識グラフを共有世界モデルとして活用することで,物理環境とデジタル環境の連携を可能にする。
- エージェントは知識グラフから情報を取得して意思決定を行い,リアルタイムな状態情報を更新する。
- モデル駆動型アーキテクチャにより,セマンティック記述からエージェントを自動生成し,システム拡張を容易にする。
都市モビリティ知能のフロンティア:データ駆動型歩行者軌跡予測とシミュレーションの計量文献分析 [cs.CY, cs.AI]目的:データ駆動型歩行者軌跡予測と群衆シミュレーションの研究の知的進化と学際的構造
- 都市環境の安全性,応答性,人間中心性を向上させる上で,歩行者ダイナミクスの理解と予測が不可欠である。
- 解釈可能性,包容性,ドメイン間の転移可能性を確保することには,依然として課題が残されている。
- 都市ガバナンスを強化し,適応的で社会的に責任あるモビリティ知能の実現に貢献することを目的とする。
- 人工知能,都市情報学,群衆行動モデリングの融合が確認され,グラフニューラルネットワーク,Transformer,生成モデルがその推進力となっている。
- 技術的進歩に加え,都市モビリティ設計,公共安全計画,スマートシティのデジタルツイン開発への貢献が拡大している。
- 本研究は,方法論的な軌跡と都市応用を結びつけ,データ駆動型アプローチが都市ガバナンスを豊かにし,将来の都市における適応的なモビリティ知能を可能にする方法を示す。
カスタマーサポートのためのLLMに優しい知識表現 [cs.CL, cs.CL, cs.AI]目的:カスタマーサポートにおけるLLMの性能向上
- 顧客対応の効率化は,企業競争力維持に不可欠である。
- LLMは知識表現の形式に依存し,複雑な情報を処理しにくい。
- LLMが理解しやすい知識表現と学習データ構築を目指す。
- 提示手法は,LLMが処理しやすい「意図,状況,行動 (ICA)」形式への情報再構成を可能にする。
- 人間による介入を最小限に抑えた合成データ生成戦略により,費用対効果の高いLLMのファインチューニングを実現する。
- 社内実験の結果,ワークフローの再構成と合成データを用いたファインチューニングにより,LLMの性能が大幅に向上した。
ソフトアクタークリティックフレームワークを用いたダブル・アッカーマン操舵ロボットの安全な操縦 [cs.RO, cs.AI]目的:ダブル・アッカーマン操舵ロボットの安全かつ正確な操縦
- ロボットの自律走行は,物流や災害対応など様々な分野で重要性が増している。
- 従来の計画手法は,ダブル・アッカーマン操舵ロボットの複雑な運動制約により,障害物が多い環境で脆弱である。
- 本研究は,複雑な環境下におけるダブル・アッカーマン操舵ロボットの安全かつ効率的な操縦を可能とする。
- 提案手法は,Hindsight Experience ReplayとCrossQオーバーレイを活用し,障害物回避と操縦効率を両立している。
- シミュレーション結果から,学習されたポリシーは目標位置の97%に到達可能であり,障害物回避能力も高いことが示された。
- 本フレームワークは,手動で作成した軌道や専門家のデモンストレーションに依存しない。
倫理を超えて:包括的イノベーションが医療AIの経済的リターンを促進する [cs.DL, cs.RO, cs.AI, cs.CY]目的:医療AIにおける包括的デザインの経済的・戦略的価値の解明
- 医療AIの発展は,医療の質向上や効率化に不可欠であるため,社会的な重要性が高い。
- AI開発における多様性の欠如が,特定層への偏りや公平性の問題を引き起こしている。
- 多様な利用ケースを考慮したAI開発が,経済的利益と競争優位性をもたらすことを示す。
- 包括的イノベーションによって,地理的拡大や信頼獲得を通じた市場拡大が期待される。
- AI開発における是正コストや訴訟リスクの軽減により,リスク管理が強化される。
- 多様なデータセットを用いた学習により,汎化性能が向上し,技術的負債が削減される。
AI倫理評価とシステム属性,危険性,および損害の関連性測定 [cs.HC, cs.AI, cs.LG]目的:AI倫理評価指標とシステム要素,属性,危険性,損害との間の関連性
- AI技術の社会実装が進む中で,倫理的な問題への関心が高まっているため。
- 既存の倫理評価指標は断片的であり,AIシステム全体との関連性が不明確である。
- システムレベルでの損害発生メカニズムを捉え,より実効性のある評価手法を確立すること。
- 既存の約800のAI倫理評価指標を分析した結果,公平性,透明性,プライバシー,信頼の4原則に焦点が当てられていることが判明した。
- 多くの指標はモデルや出力に焦点を当てており,システム要素間の相互作用や,特定の損害に対する危険性の網羅性が低い。
- 指標が損害経験との関連性や,意味のある閾値設定の指針を欠いていることが,評価の断片化を招いている。
グラフタプルを用いた多視点グラフ学習 [cs.LG]目的:多視点グラフ学習のためのフレームワーク
- グラフニューラルネットワークは,疎なグラフに有効だが,高密度グラフの処理に課題がある。
- 既存手法では,単一のスケールでのみグラフを疎化するため,情報損失が生じる。
- 複数のスケールでの相互作用を捉え,表現力を向上させることを目指す。
- グラフタプルという枠組みにより,グラフを複数のサブグラフに分割し,様々なスケールの相互作用を捉える。
- 非可換演算子の理論に触発されたヘテロなメッセージパッシングアーキテクチャを導入し,表現力の向上を理論的に証明した。
- 分子特性予測と宇宙論的パラメータ推論において,既存手法を上回る性能を示した。
固定基底空間における係数写像を通じた演算子の学習 [cs.RO, cs.DB, math.NA, cs.LG, cs.NA]目的:偏微分方程式等の解作用素を近似するための演算子学習手法
- 物理現象のシミュレーションにおいて,高精度かつ高速な解法の実現が重要である。
- 従来の演算子学習は,点対点写像に依存し,計算コストが高いという課題がある。
- 基底関数の選択とネットワーク学習を分離することで,学習効率を高め,汎化性能を向上させる。
- 提案手法FB-C2CNetは,固定された基底関数空間における係数写像を学習することで,高精度な演算子学習を実現した。
- 基底関数の選択が近似精度に与える影響を体系的に分析し,係数空間の特性が汎化性能に重要であることを明らかにした。
- ダシー流れ,ポアソン方程式,弾性問題など,多様な問題に対して,高い精度と計算効率を示した。
物体を投げて回転させる学習 [cs.RO, cs.LG]目的:目的の姿勢での物体の着地
- 物流作業の効率化に貢献する動的manipulation技術の重要性が高まっている。
- 従来のロボットによる物体投擲は着地点に焦点が当たり,着地姿勢の制御が困難であった。
- ロボットが目的の姿勢で物体を着地させる「スロー・フリップ」を実現することを目指す。
- 提案手法は,インパルス・運動量原理に基づき,寄生回転を抑制する投擲軌跡を設計することで,到達可能な着地姿勢の範囲を拡大した。
- 物理モデルと回帰学習を組み合わせ,モデル化されていない影響を考慮することで,高い精度を実現した。
- 実機実験により,提案手法が数十回の試行で($\pm$5 cm, $\pm$45 degrees)の誤差範囲内で物体を投げて回転させられることを実証した。
Ortho-Fuse:中間光流推定による疎な高解像度作物健康マップ向けオルソモザイク生成 [cs.CV, cs.AI]目的:疎な航空画像データセットからのオルソモザイク生成
- 精密農業において,作物の健康状態を迅速かつ低コストで把握する重要性が高まっている。
- 従来のオルソモザイク生成には高い画像重複率が必要で,資源制約下では精度が低下する。
- オルソモザイクの生成において必要な重複率を低減し,より少ないデータでも高精度なマップ作成を可能にする。
- 提案手法Ortho-Fuseは,中間光流推定を用いて画像間の特徴点数を人工的に増やし,オルソモザイクの精度向上を実現した。
- 実験により,従来のオルソモザイク生成に必要な最小重複率を20%削減できることが示された。
- 精密農業における導入障壁分析を通じて,AI駆動型モニタリングシステムの統合に向けた道筋を提示した。
トランスフォーマーモデルが1晩の睡眠から抗うつ薬服用を検出,アドヒアランスのバイオマーカーを解き明かす [cs.LG]目的:抗うつ薬服用状況の検出
- 抗うつ薬の非アドヒアランスは再発や自殺リスクを高めるため,客観的なアドヒアランス評価が重要である。
- 既存の方法は侵襲的,または間接的で不正確であり,日常的なアドヒアランス評価には適さない。
- 本研究は,睡眠データから抗うつ薬服用を非侵襲的に検出するバイオマーカーを開発し,アドヒアランス監視の改善を目指す。
- トランスフォーマーモデルは,消費者向けウェアラブルデバイスや無線センサーからの睡眠データを用いて,抗うつ薬の服用状況を推測することが可能となった。
- 6つのデータセット(2万人以上,1800人の抗うつ薬使用者)を用いて評価した結果,AUROCは0.84を達成し,薬剤の種類や投与量,併用薬の影響を受けずに汎化することが示された。
- 継続的なモニタリングにより,抗うつ薬の開始,減量,およびアドヒアランスの低下をリアルワールドで捉えることができた。
Vision4PPG:バイタルサイン(血圧など)のPPG解析におけるVision Foundation Modelsの潜在能力 [cs.CV, cs.LG]目的:ウェアラブル・臨床機器におけるPPGセンサーを用いたバイタルサイン推定手法の開発
- ウェアラブルデバイス等の普及により,非侵襲的なバイタルサインモニタリングの重要性が高まっている。
- 既存のPPG解析手法は,特定のタスクに特化している場合が多く,汎用性に課題がある。
- Vision Foundation Modelsを活用し,汎用的なPPG解析能力を獲得することで,この課題を解決する。
- Vision Foundation Models (VFM)をPPG信号の画像変換に適用したVision4PPGは,血圧推定において最先端の性能を達成した。
- DINOv3やSIGLIP-2等の最新VFMを用いることで,他のバイタルサインや血液検査測定タスクにおいても有望な結果が得られた。
- Parameter-Efficient Fine-Tuning (PEFT)技術により,計算効率が高く,臨床科学者にとって有用なツールとなる。
多群平均推定のための探索不要アルゴリズム [cs.LG, stat.ML]目的:多群平均推定におけるサンプリング予算の最適配分
- 実験計画や個別化など,複数のグループの正確な推定が必要な分野で重要。
- 最適な配分には各群を均等にサンプリングする必要があり,既存手法では効率が悪い。
- 探索不要なアルゴリズムによる効率的な多群平均推定手法を開発し,その性能を保証する。
- 既存の結果を強化し,より鋭い保証を持つサブガウス分布のクラスを特定した。
- 探索不要な非適応型および適応型アルゴリズムを設計し,既存の結果よりもタイトな後悔限界を確立した。
- コンテキストバンディット設定にフレームワークを拡張し,側情報を用いて保証された性能を発揮するアルゴリズムを提案した。
共変量を用いた非負行列分解によるラベル行列の分類 [cs.LG, stat.ME]目的:分類のためのラベル行列
- データ解析において,高次元データの次元削減と解釈性の確保は重要な課題である。
- 既存の非負行列分解は教師なし学習であり,クラスラベルを直接活用できないという問題がある。
- ラベル行列を直接分解することで,共変量からラベルへの確率的なマッピングを確立し,分類精度を向上させる。
- 提案手法NMF-LABは,外部の分類器を必要とせず,直接クラスメンバーシップ確率を得る。
- 共変量(カーネル類似度を含む)をシームレスに統合し,未知のサンプルに対する予測を一般化可能とする。
- 多様なデータセットでの実験により,NMF-LABは高い予測精度,ノイズに対するロバスト性,スケーラビリティを示す。
RobotFleet:集中型マルチロボットタスクプランニングのためのオープンソースフレームワーク [cs.RO, cs.AI, cs.MA]目的:マルチロボットタスクプランニングとスケジューリングのフレームワーク
- 多様なロボット群の協調は,複雑なタスクを効率的に達成するために不可欠である。
- 異種ロボット群の連携には,計画,スケジューリング,実行の調整が課題となる。
- 大規模で拡張性のあるマルチロボットシステム構築の障壁を低減すること。
- 本フレームワークは,コンテナ化されたサービスとしてロボットをデプロイすることで,フリートのスケーリングと管理を容易にする。
- 共有された宣言的なワールドステートと双方向通信により,タスク実行と再計画を可能にする。
- LLMを活用することで,オープンワールドにおける推論を可能にし,自律性の各層をモジュール化している。
FLAMMABLE:多モデル連携と適応的バッチサイズを用いたマルチモデル連合学習フレームワーク [cs.DC, cs.LG]目的:マルチモデル連合学習におけるモデル精度と学習時間の最適化
- 連合学習はデータ分散環境下での機械学習を可能にする重要技術である。
- マルチモデル連合学習では,モデル間およびデータ間の異質性が課題となる。
- システム能力に応じたモデル選択とバッチサイズ調整による効率的な学習を実現する。
- FLAMMABLEは,既存手法と比較して,精度向上の時間(time-to-accuracy)を1.1~10.0倍に短縮した。
- 最終的なモデル精度も1.3~5.4%向上することを示した。
- 本研究で開発されたベンチマークプラットフォームは,今後のマルチモデル連合学習研究に貢献する。
CNN画像分類におけるバイアスの特定:画像スクランブルと変換の利用 [cs.CV, cs.AI]目的:CNN画像分類におけるバイアスの特定
- 画像認識技術は高度化の一途を辿り,様々な分野で活用が拡大している。
- CNNはデータ駆動型であるため,判断根拠が不明瞭で,バイアスに影響されやすい。
- 背景情報など,本来学習に不要な要素にCNNが依存していないかを検証する。
- 画像分割によるタイル化とランダムなシャッフルにより,データセットのバイアスを検出する手法を提案した。
- フーリエ変換,ウェーブレット変換,メディアンフィルター等の画像変換を適用し,背景ノイズを抽出する手法を開発した。
- 提案手法は,背景情報が利用できない状況下でも,コンテキスト情報と背景ノイズを区別し,バイアスの存在を検知できることを示した。
根拠付き言語モデルにおける選択的拒否の生成評価:RefusalBench [cs.CL, cs.CE, cs.CL, cs.AI, cs.LG]目的:根拠付き言語モデルにおける選択的拒否能力の評価
- RAGシステムにおける言語モデルの安全性確保は重要である。誤った情報源に基づく回答はリスクを伴うため。
- 既存の評価方法では,モデルがデータ特有のパターンを利用し,テスト事例を暗記してしまう問題がある。
- 言語モデルが誤った情報源に基づいて回答するのを防ぐための,動的な評価手法の確立を目指す。
- 大規模な実験により,最先端モデルでも,特に複数ドキュメントのタスクにおいて,拒否精度が低いことが明らかになった。
- 選択的拒否能力は,検出と分類という分離可能なスキルで構成され,モデルの規模や推論能力では改善されないことが判明した。
- 選択的拒否は学習可能なアライメントに依存する能力であり,改善の道筋が示唆された。
大規模言語モデルのための意味レベル知識編集フレームワークSTEAM [cs.CL, cs.CL, cs.AI]目的:大規模言語モデルにおける知識編集の改善
- 大規模言語モデルは膨大な知識を持つが,学習時の情報に固定されている。
- 既存の知識編集手法は,意味的な整合性を欠いている場合がある。
- 意味レベルでの知識の統合による,信頼性の高い知識編集を目指す。
- 提案手法STEAMは,更新された知識をモデルの知識構造に統合する。
- 意味的アンカーを用いて表現を整列させ,推論能力と整合性を向上させる。
- 実験結果から,潜在空間の整列が知識編集において重要であることが示された。
拡散モデルによるグラフ生成:推論時木探索ガイダンスによる制御可能性の向上 [cs.LG, cs.AI, cs.CE]目的:拡散モデルと木探索を活用した制御可能なグラフ生成手法
- グラフ学習は,Web規模システム,知識グラフ,創薬など広範な分野で基盤技術として重要である。
- 拡散モデルによるグラフ生成は制御が難しく,品質が不安定になりやすいという課題があった。
- 推論時の計算資源を有効活用し,より高精度で制御可能なグラフ生成を目指す。
- 本研究で提案するTreeDiffは,木探索と拡散モデルを組み合わせることで,生成されるグラフの制御性を向上させる。
- 分子生成ベンチマークにおいて,TreeDiffは最先端の性能を達成し,計算資源が増加するにつれて性能が向上する。
- TreeDiffは,効率的な潜在空間でのノイズ除去とグラフ空間での軽量な離散補正を組み合わせることで,スケーラビリティと構造的忠実性を両立している。
Mesh-Gait:2Dシルエットからの多Modal表現学習を通じた歩行者認識の統一的フレームワーク [cs.CV, cs.AI, cs.LG]目的:歩行者識別のための歩行パターン認識
- 歩行者認識は,生体認証技術として重要な役割を担う。個人の識別に応用可能。
- 視点変化,遮蔽,ノイズなどにより,従来の2D表現による認識精度が課題。
- 2Dシルエットから直接3D表現を再構成し,高精度かつ効率的な認識を実現。
- Mesh-Gaitは,2Dシルエットから3D表現を再構成することで,両Modalの利点を組み合わせる。
- 中間表現として3Dヒートマップを用いることで,計算効率と3D幾何学的情報の捕捉を両立。
- 実験結果から,Mesh-Gaitが最先端の認識精度を達成することが示された。
推論モデルにおけるトレース長は単純な不確実性シグナルである [cs.AI]目的:大規模推論モデルにおける信頼性評価指標の検討
- LLMの幻覚などの課題解決のため,不確実性評価は重要な研究テーマとなっている。
- 既存の信頼性評価指標は必ずしも十分ではなく,より簡便で効果的な指標が求められている。
- 推論トレース長が不確実性シグナルとして機能するか検証し,新たな評価指標を提案する。
- 推論トレース長は,他の信頼性評価指標と同等以上の性能を示すことが確認された。
- 推論後の学習がトレース長と精度の関係を変化させ,過剰な思考の影響を超えていることが示された。
- 高エントロピーなトークンが,トレース長が信頼性シグナルとして機能するメカニズムにおいて重要な役割を果たすことが明らかになった。
LONGQAEVAL:リソース制約下における長文臨床QAの信頼性評価の設計 [cs.CL, cs.AI]目的:長文臨床QAシステムの評価手法と推奨事項
- 医療現場でのAI活用が進む中で,臨床QAシステムの性能評価は不可欠である。
- 長文の回答を評価するには専門知識が必要であり,アノテーター間の意見の一致が難しい。
- 限られたリソースでも信頼性の高い評価を実現するための枠組みを提示すること。
- 回答全体の正誤に加え,文単位での評価を比較した結果,正誤評価には文単位評価が有効。
- 関連性評価には回答レベル評価が適しており,安全性評価は一貫性が低いことが判明。
- 回答全体のわずかな部分のみを評価しても,回答レベル評価と同程度の信頼性が得られる。