arXiv雑要約
AI - 2026/03/24 公開
文脈を考慮した引用生成:属性付き大規模言語モデル向け [cs.IR, cs.CL, cs.DL, cs.LG]目的:大規模言語モデルにおける引用生成の質的向上
- 大規模言語モデルの信頼性を高めるため,生成根拠の提示が重要である。
- 既存モデルは,引用記号の意味を文脈に基づいて解釈できず,不自然な引用となる場合がある。
- 引用記号と参照内容の間の意味関係を明示的に統合し,自然な引用生成を実現する。
- 提案手法C$^2$-Citeは,引用記号を文脈情報と符号化し,引用ルーター関数を用いて対応付けを行う。
- これにより,引用記号が単なるプレースホルダーではなく,参照情報へのポインタとして機能する。
- ALCEベンチマークにおいて,既存の最先端モデルを引用の質で平均5.8%,応答の正確性で17.4%上回る結果が得られた。
学術ピアレビューにおけるAI生成コンテンツの検出 [cs.CL, cs.AI, cs.LG, cs.SI]目的:学術ピアレビューにおけるAI生成コンテンツの検出
- 研究評価の質を維持するため,ピアレビューの信頼性確保が重要である。
- LLMの普及により,ピアレビューへのAI利用が拡大し,その質の低下が懸念される。
- ピアレビューにおけるAI利用の現状を把握し,今後の対策を検討することを目的とする。
- 2022年以前はAI生成コンテンツの検出はほとんど認められなかった。
- 2025年にはICLRレビューの約20%,Nature Communicationsレビューの約12%がAI生成と判定された。
- Nature CommunicationsにおけるAI生成レビューの著しい増加は,2024年第3四半期から第4四半期にかけて見られた。
EvoOpt-LLM:大規模言語モデルによる産業最適化モデルの進化 [cs.AI]目的:産業最適化モデリングの自動化
- 産業計画・スケジューリングの根幹であり,効率化が重要。
- 自然言語要件を最適化モデルに変換する専門知識が必要。
- LLMを活用し,データ効率とスケーラビリティを向上させる。
- EvoOpt-LLMは,70億パラメータのLLMとLoRAファインチューニングにより,3,000サンプルで91%の生成率と65.9%の実行率を達成した。
- 制約条件注入モジュールは既存のMILPモデルを維持しつつ拡張,変数プルーニングモジュールは計算効率を向上させた。
- 中規模LPモデルにおいて,変数プルーニングは400サンプルで約0.56のF1スコアを示し,専門家介入の削減に貢献する。
RE-MCDF:知識に基づいた臨床診断のための閉ループ多専門家LLM推論 [cs.AI]目的:知識に基づいた臨床診断のための多専門家LLM推論フレームワーク
- 電子カルテの活用は,医療の質向上に不可欠である。しかし,データの特性上,高度な解析が課題となる。
- 既存のLLMは,電子カルテの不均一性,疎性,ノイズに弱く,誤診のリスクを抱えている。
- 疾患間の論理的依存関係を考慮し,誤診を防ぐための,より堅牢な臨床診断システムを開発する。
- RE-MCDFは,生成・検証・修正の閉ループ構造により,より精度の高い診断を可能にする。
- 医療知識グラフを活用し,電子カルテの証拠を適応的に重み付けすることで,診断の整合性を高める。
- NEEMRsとXMEMRsの実験結果から,RE-MCDFが既存の最先端モデルを凌駕することが示された。
双子ネットワークシステムの構築:mABCD合成グラフ生成器のデータ駆動型較正 [cs.RO, cs.SI, cs.LG]目的:多層ネットワーク生成器mABCDの構成パラメータ推定
- 複雑系の分析において,ネットワーク表現が不可欠となっている。
- 大規模な実データが不足し,グラフ生成器がバイアスを伴いながらも利用されている。
- 実世界のシステムを忠実に再現する合成ネットワーク生成を目指す。
- mABCDの構成パラメータを実世界のシステムから推定する手法を提案した。
- パラメータ間の強い依存関係により,独立推定が困難であることが示された。
- 共同予測アプローチがより有効であることが明らかになった。
推論キャッシュ:短期強化学習による長期的な性能向上 [cs.CY, cs.ET, cs.LG]目的:長期的な推論における継続的な性能改善
- 大規模言語モデルの性能向上は,より複雑な問題解決を可能にするため重要である。
- 標準的な強化学習は固定された問題分布で学習するため,テスト時の分布シフトに弱い。
- テスト時における分布シフトへの適応と,継続的な推論能力の向上を目指す。
- RCアルゴリズムを導入することで,学習時に見られない推論の長さでも性能を向上させることができた。
- 40億パラメータのモデルをRCで学習した結果,HMMT 2025の性能が40%から約70%に向上した。
- RCで学習されたモデルは,既存のスクリプトを効果的に活用し,テスト時の性能をさらに向上させる。
多変数の影響下にある機械システムの故障分類のためのクロス・トークに基づくマルチタスク学習 [cs.CL, cs.LG, cs.AI]目的:機械システムの故障条件と,測定信号に影響を与える他の変数の同時学習
- 機械システムの健全性監視は,生産性の向上や安全性の確保に不可欠である。
- 既存の研究は故障ラベルに依存しており,他の変数による信号への影響を無視している。
- 複数の変数による影響を考慮した,より高精度な故障分類手法の開発。
- 提案手法は,既存のシングルタスクモデル,マルチクラスモデル,共有トランク型マルチタスクモデルを上回る性能を示した。
- ドローン故障データセットとモーター複合故障データセットという2つのベンチマークで一貫した結果が得られた。
- クロス・トーク構造により,タスク間の制御された情報交換が可能となり,負の転移を抑制している。
拡散モデルの正確な構成のための論理的誘導 [cs.LG]目的:拡散モデルにおける複雑な論理式を用いた制約付き生成の原理的な手法
- 拡散モデルは画像生成などで高い性能を示すが,生成される内容の制御は課題である。
- 複雑な論理式による制御は,スコア関数の正確な誘導が困難であるという問題がある。
- 論理式が特定の条件を満たす場合に,正確な誘導が可能となる条件を導き出す。
- 論理式が条件を満たす場合,効率的な再帰アルゴリズムで正確な誘導信号を計算できる。
- 一般的な分布において,任意の論理式をその条件を満たす回路表現に変換できる。
- 本手法は,画像やタンパク質構造の生成において有効であることが示された。
CALM:大規模オーディオ言語モデルのためのクラス条件付き疎な注意ベクトル [cs.SD, cs.AI]目的:大規模オーディオ言語モデルにおけるクラス識別性能の向上
- オーディオと言語の融合は,多様な応用を可能にする重要な研究分野である。
- 大規模モデルは識別タスクにおいて,専門的なモデルに劣ることが課題である。
- 注意ヘッドの重要度をクラスごとに学習し,識別性能の向上を目指す。
- 提案手法は,既存の均一投票方式と比較して,オーディオ分類で最大14.52%の性能向上を達成した。
- オーディオビジュアル分類およびスプーフィング検出においても,それぞれ1.53%,8.35%の絶対的な性能向上を示した。
- 注意ヘッドが各セマンティックカテゴリに特化し,信頼度に応じて予測に貢献する。
エージェント評価におけるランダム性について [cs.LG, cs.AI, cs.SE]目的:エージェント評価の信頼性向上
- エージェントシステムの性能評価は,その発展に不可欠である。
- 単一の実行に基づく評価では,結果にばらつきが生じ,正確な性能判断が困難である。
- 評価におけるランダム性の影響を検証し,信頼性の高い評価方法を提案すること。
- SWE-Bench-Verifiedを用いた実験で,単一実行のpass@1スコアには2.2~6.0%程度の変動が確認された。
- 初期トークン段階のわずかな違いが,その後の戦略に大きな影響を与えることが示された。
- 複数回の実行による評価,統計的検出力の分析,pass@k等の指標の使用が推奨される。
ACE-RTL:エージェント的文脈進化とRTL特化LLMの融合 [cs.RO, cs.AR, cs.LG]目的:RTLコード生成の精度向上
- ハードウェア設計自動化は,複雑化するシステム開発において不可欠である。
- 既存手法では,RTLコード生成の精度や効率に課題が残っている。
- RTL特化LLMと汎用LLMの強みを融合し,RTLコードの機能検証を効率化する。
- ACE-RTLは,RTL特化LLMと最先端の推論LLMを統合し,反復的なコード改善を実現した。
- 並列スケーリング戦略により,初回成功までの時間を短縮し,多様なデバッグ経路を探索した。
- CVDPベンチマークにおいて,ACE-RTLは14の競合ベースラインを最大41.02%上回る合格率を達成した。
FastLSQ:フーリエ特徴と厳密な解析微分を用いたワンショットでの偏微分方程式解法 [math.NA, cs.LG, cs.NA]目的:偏微分方程式および逆問題の解法
- 科学技術計算において,偏微分方程式は様々な現象のモデル化に不可欠である。
- 従来の数値解法は計算コストが高く,特に高次元問題や逆問題では困難が伴う。
- フーリエ特徴を用いることで,微分演算子のグラフフリーな構築と高速な解法を実現する。
- FastLSQは,線形偏微分方程式を0.07秒で,非線形偏微分方程式を9秒未満で解くことが可能である。
- この手法は,反復型PINNと比較して,精度と速度の両面で大幅な改善を示す。
- 厳密な高次微分を可能にすることで,微分可能なデジタルツインの構築と逆問題への応用を実現する。
ネイティブ推論モデル:検証不可能なデータに対する推論能力を言語モデルに学習 [cs.LG, cs.AI]目的:検証可能なデータに依存しない推論能力の学習
- 大規模言語モデルの推論能力向上は,様々な分野での応用を可能にする重要な課題である。
- 従来の学習方法は,高品質な人間によるアノテーションと外部検証器に依存し,コストやバイアスが課題となっていた。
- 本研究は,外部検証器を必要とせず,モデル自身が推論過程を生成することで,これらの問題を解決することを目指す。
- NRT(Native Reasoning Training)は,質問応答ペアのみを用いてモデルが自身の推論経路を生成する新しいフレームワークである。
- NRTは,推論過程を潜在変数として扱い,正解への確率を最大化するような推論経路を報酬化する統一的な学習目標を用いる。
- LlamaおよびMistralモデルファミリーを用いた実験により,NRTは既存の検証器不要な手法を凌駕し,特に複雑な推論において高い性能を示すことが確認された。
インフラ運用・保守における関節部品のロボット操作のためのエネルギー認識型強化学習 [cs.CL, eess.SY, cs.AI, cs.RO, cs.SY]目的:インフラ運用・保守におけるロボット操作のためのエネルギー効率を考慮した強化学習フレームワーク
- スマートシティ化が進む中で,インフラの安全かつ効率的な運用・保守が重要性を増している。
- 既存のロボットアプローチは把持または特定の物体に焦点を当て,エネルギー消費を考慮していない。
- 関節部品に依存しない,エネルギーを考慮したロボット操作手法を確立し,実用性を高める。
- 提案手法は,部品誘導3D知覚,重み付き点サンプリング,PointNetベースのエンコーディングを組み合わせる。
- 操作は制約付きマルコフ決定過程として定式化され,ラグランジュ乗数を用いた制約付きSoft Actor-Criticでエネルギーを制御する。
- 実験の結果,エネルギー消費量は16-30%削減,成功までのステップ数は16-32%減少,高い成功率を示した。
近接演算子の観点からのフローマッチング [cs.LG, stat.ML]目的:最適輸送条件付きフローマッチングの近接演算子による定式化
- 生成モデルの性能向上は,様々な応用分野において重要である。
- 密度関数を仮定しない生成モデルの構築が課題となっていた。
- 密度関数の仮定なしに,最適輸送条件付きフローマッチングを定式化する。
- 最適輸送条件付きフローマッチングは,拡張されたブレニエポテンシャルを通じて正確な近接定式化を持つことが示された。
- ターゲット点への写像は近接演算子によって正確に与えられ,ベクトル場の明示的な近接表現が得られた。
- ミニバッチOT-CFMがバッチサイズ増加とともに母集団定式化に収束することが議論された。また,多様体上のターゲットに対して,終端的に双曲性を持つことが証明された。
LLMを活用した仮想ノード誘導による噂の検出 [cs.SI, cs.AI]目的:噂の検出手法
- ソーシャルメディアにおける情報操作は社会に悪影響を及ぼすため,噂の早期発見が重要である。
- 既存手法では,噂の伝播構造とテキストの一貫性の相互作用を捉えきれない点がある。
- LLMを活用し,伝播経路の構造を拡張することで,噂検出の精度向上を目指す。
- 本研究では,大規模言語モデル(LLM)を構造拡張層として組み込んだ新しいフレームワークを提案した。
- LLMを用いて情報部分チェーンを評価し,仮想ノードをグラフに導入することで,テキストの一貫性を明示的なトポロジー特徴として捉えることに成功した。
- 提案手法は,特定のグラフ学習アルゴリズムやLLMに依存せず,様々なモデルへの適用が可能である。
特徴再調整に基づく嗅覚・視覚マルチモーダルモデルによる米の品質劣化検出の向上 [cs.CV, cs.AI]目的:米の品質劣化検出のための,特徴再調整に基づく嗅覚・視覚マルチモーダルモデル
- 食糧安全保障において,農産物の品質管理は不可欠であり,特に米の品質劣化は重要な課題である。
- 既存手法では,微細な異常特徴の表現・抽出が不十分であり,高価な装置や長時間のデータ取得が必要となる。
- 微細な劣化信号を強調し,検出手順を簡略化することで,より高精度かつ効率的な米の品質劣化検出を実現すること。
- 提案手法は,SS-Netと比較して分類精度を8.67%向上させ,他の従来手法と比較して平均11.51%の改善を示した。
- 現場での検出結果も,精度と操作性の両面で優位性を示しており,実用性が高い。
- 本手法は,農業および食品業界における他のアグリフードアプリケーションにも応用可能である。
連合グラフニューラルネットワークにおけるグローバル集約の幾何学的コヒーレンスについて [cs.LG, cs.DC, cs.NI]目的:連合学習におけるグローバル集約の幾何学的失敗とその改善策
- グラフ構造データに対する連合学習は,その応用範囲の広さから重要性が増している。
- 従来の集約メカニズムはグラフニューラルネットワークの演算子としての性質と不整合を抱える。
- 異質なクライアントグラフ分布下での幾何学的コヒーレンス喪失問題を解決する。
- 連合グラフニューラルネットワークにおいて,集約が幾何学的に不適合な方向を混合し,関係性の劣化を引き起こすことを形式化した。
- GGRS(グローバル幾何学的参照構造)は,演算子摂動のデータフリープロキシ上で動作し,方向性アライメントにより幾何学的許容性を強制する。
- 提案手法は,誘導されるメッセージパッシング演算子の構造を保存し,構造的感受性を維持する。
心電図イベント予測のための ECG 言語モデル:CAMEL [cs.LG, q-bio.QM]目的:心電図イベントの予測
- 心疾患の診断には心電図が不可欠であり,その解析は医療現場で重要である。
- 既存の心電図言語モデルは分類とレポート生成に特化しており,将来のイベント予測は困難であった。
- 心電図とテキストの相互理解を可能にするエンコーダにより,将来の心臓イベント予測を実現すること。
- 提案手法CAMELは,6つのタスクと9つのデータセットで高いゼロショット性能を示した。
- ECGBenchにおいて,既存モデルを7.0%上回るSOTA結果を達成した。
- 新ベンチマークECGForecastBenchにおいても,教師ありモデルや既存言語モデルを大きく上回る性能を示した。
検索拡張生成におけるソフト圧縮の再考:クエリ条件付きセレクターの視点 [cs.CL, cs.AI, cs.IR]目的:検索拡張生成におけるソフト圧縮手法の改良
- 大規模言語モデルの知識獲得に外部知識を活用するRAGは,Webタスク等で広く利用されている。
- RAGの拡張性は,長いコンテキスト長や冗長な検索によって制限されている。
- クエリに応じて情報を選択的に圧縮することで,RAGの効率と性能を向上させる。
- 提案手法SeleComは,既存のソフト圧縮手法を大幅に上回り,非圧縮ベースラインと同等かそれ以上の性能を達成した。
- 計算量とレイテンシを33.8%~84.6%削減し,RAGの効率性を向上させた。
- セレクターベースのフレームワークにより,クエリ条件付きの情報選択を実現した。
エージェントキャッシュが失敗する理由と修正方法:Few-Shot学習による構造化された意図正規化 [cs.HC, cs.CL, cs.AI, cs.LG]目的:エージェントキャッシュの改善
- AIエージェントの利用拡大に伴い,LLM呼び出しコストの削減が重要課題となっている。
- 既存のキャッシュ手法は,意図の一貫性と精度が低く,十分な性能を発揮できていない。
- 構造化された意図分解フレームワークW5H2を導入し,Few-Shot学習でキャッシュ性能を向上させる。
- 提案手法W5H2は,MASSIVEデータセットにおいて91.1%の精度を達成し,GPTCacheや大規模LLMと比較して大幅な性能向上を示した。
- NyayaBench v2データセットでは,30言語にわたるクロスリンガル転移学習により,55.3%の精度を達成した。
- 5段階のカスケード構造により,85%のインタラクションをローカルで処理し,97.5%のコスト削減を可能にした。
実異常は不要:MLLMを活用したゼロショット動画異常検知 [cs.RO, cs.HC, cs.CV, cs.AI]目的:動画異常検知のためのフレームワーク
- 動画データは稀であり,異常データの収集・検知は困難である。実用的な異常検知システムの構築が求められている。
- 既存手法は,データセットの多様性の欠如や,文脈依存の異常意味の理解不足により,実世界での性能が低い。
- 未知の異常カテゴリに対しても,データを用いずに異常検知性能を向上させることを目指す。
- LAVIDAは,疑似異常を用いてモデルの適応性を高めるAnomaly Exposure Samplerと,意味理解能力を強化するMLLMを統合したフレームワークである。
- 逆注意に基づくトークン圧縮により,異常パターンの空間的・時間的な稀少性に対応し,計算コストを削減している。
- 4つのベンチマークデータセットで,ゼロショット設定下において最先端の性能を達成した。
PhysMem:ロボット操作のための自己進化型物理メモリ [cs.CL, cs.IR, cs.RO, cs.AI]目的:ロボット操作における物理特性の学習
- ロボットの応用範囲拡大には,環境や対象物に応じた物理特性の理解が不可欠である。
- 既存のビジョン言語モデルは物理特性を一般的に理解するが,具体的な状況への適応が困難である。
- 物理メモリを用いて,ロボットが試行錯誤を通じて物理法則を学習し,操作の成功率向上を目指す。
- PhysMemは,モデルパラメータの更新なしに,テスト時に相互作用から物理原理を学習するメモリフレームワークである。
- 検証を重視した設計により,状況変化への頑健性を高め,過去の経験への過度な依存を避ける。
- 実世界での実験およびシミュレーションにおいて,既存手法と比較して30%以上の成功率向上を確認した。
多変量時系列データの欠損値補完のための1対1チャンネルヘッドバインディング [cs.LG]目的:多変量時系列データの欠損値補完
- 時系列データは様々な分野で不可欠であり,欠損値の適切な処理は分析精度に直結する。
- 既存手法は欠損パターンや欠損率が高い場合,変数間の情報伝達が阻害され,性能が低下する。
- CNNとTransformerを組み合わせ,チャンネルヘッドバインディングにより選択的な情報伝達を実現し,高精度な補完を目指す。
- 提案手法T1は,11のベンチマークデータセットにおいて最先端の性能を達成し,平均MSEを46%削減した。
- 特に欠損率70%という極端なスパース性下で顕著な改善が見られた。
- T1は,再学習なしに未知の欠損パターンにも汎化し,一貫したハイパーパラメータ設定で全てのデータセットに対応可能である。
AngelSlim:大規模モデル圧縮のための,よりアクセスしやすく,包括的で効率的なツールキット [cs.LG, cs.AI]目的:大規模モデル圧縮のためのツールキットの提供
- 近年のAI発展に伴い,大規模モデルの利用が拡大している。効率的な運用が重要である。
- 大規模モデルは計算コストが高く,実用化には圧縮技術が不可欠である。
- 既存の圧縮技術を統合し,産業規模での展開を容易にすることを目指す。
- AngelSlimは,量子化,推測デコード,トークン剪定,蒸留などの最先端アルゴリズムを統合した。
- HY-1.8B-int2は,産業的に利用可能な最初の2ビット大規模モデルである。
- 学習に依存した推測デコードフレームワークにより,1.8倍から2.0倍のスループット向上を実現した。
サポートトークン,安定余裕,そして堅牢なLLMの新たな基盤 [cs.DB, cs.LG, math.PR, math.ST, stat.TH]目的:大規模言語モデルの堅牢性向上
- 近年,大規模言語モデルは自然言語処理の様々なタスクで目覚ましい成果を上げている。
- しかし,入力のわずかな摂動に対して脆弱であるという課題が残されている。
- 自己注意メカニズムの理論的な解明を通じて,モデルの安定性と堅牢性を高めることを目指す。
- 因果的自己注意機構を確率的枠組みで再解釈し,パラメータに制約が現れることを示した。
- この制約が,安定余裕の概念とサポートトークンの概念を生み出すことを明らかにした。
- 損失関数に滑らかなログバリアペナルティを追加することで,入力摂動に対する頑健性が向上した。
LLMServingSim 2.0:異種分散LLMサービングインフラの統合シミュレータ [cs.DC, physics.soc-ph, cs.DC, cs.AI]目的:異種分散LLMサービングインフラにおけるハードウェアとソフトウェアの相互作用の分析
- 大規模言語モデルの利用拡大に伴い,高性能なサービングインフラの構築が不可欠となっている。
- 従来のシミュレータでは,ハードウェアの多様性と分散化されたサービング技術を同時にモデル化することが困難であった。
- ハードウェアとソフトウェア間の相互作用を明示的にモデル化することで,次世代LLMサービングインフラの最適化を目指す。
- LLMServingSim 2.0は,バッチ処理,ルーティング,オフロード,メモリ,電力などの要素を統合的にモデル化できる。
- 実環境での測定結果との比較により,性能,メモリ,電力に関する主要指標を平均0.95%の誤差で再現できることが示された。
- 複雑な構成においてもシミュレーション時間は約10分であり,ハードウェア革新とサービングシステム設計の橋渡しが可能となる。
スケールから速度へ:画像編集のための適応的テスト時スケーリング [cs.CV, cs.AI, cs.LG, eess.IV]目的:画像編集における効率と性能の向上
- 画像生成技術は発展を続け,多様な応用が期待されている
- 画像編集では,生成に比べて解空間が限られるため,既存手法が有効でない
- 編集の難易度に応じたリソース配分と検証機構の改善
- ADE-CoTは,編集難易度推定に基づき,動的なサンプリング予算を割り当てることで,リソース効率を向上させる。
- 領域の局所化とキャプションの一貫性を用いた編集特化型の検証により,初期段階での信頼性の低い候補を排除する。
- 意図に合致した結果が得られた時点で探索を停止する深さ優先探索により,処理速度を2倍以上向上させる。
階層的視覚認識のためのタクソノミーを意識した表現アラインメント [cs.CV, cs.AI]目的:大規模マルチモーダルモデルにおける階層的視覚認識のための表現アラインメント
- 視覚理解モデルは,ラベルの階層構造をマッピングし,未知のカテゴリを識別することが求められる。
- 既存の大規模マルチモーダルモデルは,未知のカテゴリを含む階層的視覚認識において課題がある。
- 本研究は,タクソノミー知識を大規模マルチモーダルモデルに注入し,認識精度と一貫性を向上させる。
- 提案手法TARAは,生物学的基礎モデルの表現を用いて,視覚特徴表現をタクソノミー構造に合わせてアラインメントする。
- TARAは,大規模マルチモーダルモデルの階層的一貫性とリーフノード精度を向上させることを実験的に示した。
- 既知のカテゴリだけでなく,複雑な生物学的タクソノミーにおける未知のカテゴリの信頼性のある認識を実現する。
LLMベースの推薦システムにおける領域認識増分型嗜好編集:LoRAを用いたRAIE [cs.IR, cs.LG]目的:LLMベース推薦システムにおける嗜好ドリフトへの適応メカニズム
- 推薦システムは,情報過多な現代において,ユーザーのニーズに合った情報を提供するために不可欠である。
- 従来のモデル更新戦略では,嗜好の変化に柔軟に対応できず,推薦の精度低下や一貫性の問題が生じやすい。
- 領域認識編集により,効率的かつ安定的な嗜好の変化への適応を実現し,推薦システムの性能向上を目指す。
- 提案手法RAIEは,代表的なベンチマークデータセットにおいて,最先端のベースラインを大きく上回る性能を示した。
- RAIEは,領域レベルの更新とLoRAモジュールを活用することで,既存手法が抱える忘却問題の軽減に貢献する。
- これにより,動的な推薦シナリオにおいて,より正確かつスケーラブルな継続適応が可能となることが示された。
グループ相対方策最適化の解明:その方策勾配はU統計量である [cs.LG, stat.ML]目的:グループ相対方策最適化の理論的性質の解明
- 大規模言語モデルの推論能力向上において,方策最適化は重要な役割を担う。
- グループ相対方策最適化は広く利用されているが,その理論的性質は未解明な部分が多い。
- グループ相対方策最適化の本質をU統計量として捉え,理論的な保証を与えることを目指す。
- グループ相対方策最適化の方策勾配がU統計量として表現できることを示した。
- その平均二乗誤差,有限サンプル誤差境界,および劣最適性ギャップの漸近分布を導出した。
- グループ相対方策最適化は,オラクル方策勾配アルゴリズムと漸近的に等価であり,最適な性能を発揮する。
人工知性認識主体の信頼構築 [cs.AI]目的:人工知性認識主体の信頼性に関する枠組み
- 知識創造・キュレーションにおいて,AIの役割が拡大しており,その影響は大きい。
- AI認識主体の信頼性や,人間との整合性が不十分な場合,認知能力の低下や知識の歪みが生じる。
- 人間とAIの知識生態系が健全に発展するための,信頼性構築の道筋を示す。
- 大規模言語モデルが認識主体として機能し,知識環境を形成する影響が大きいことが示された。
- AI認識主体には,認識能力,反証可能性,倫理的行動が求められることが提言された。
- AIの信頼性構築,人間との整合性,社会基盤の強化が,健全な知識生態系に不可欠である。
投機的推論のさらなる高速化 [cs.LG]目的:推論処理の高速化
- 大規模言語モデルの利用拡大に伴い,推論速度の向上が喫緊の課題となっている。
- 自己回帰的デコーディングは逐次処理に起因するボトルネックが存在する。
- 推論・検証の逐次依存性を解消し,並列化によるさらなる高速化を目指す。
- 提案手法(SSD)は,最適化された推測デコーディングと比較して平均で30%高速化を実現した。
- また,オープンソース推論エンジンを用いた自己回帰的デコーディングと比較して最大5倍の高速化を達成した。
- 検証結果の予測と事前投機により,推測デコーディングにおけるオーバーヘッドを削減している。
MPFlow: ゼロショットMRI再構成のためのマルチモーダル事後分布誘導フローマッチング [cs.CV, cs.AI]目的:ゼロショットMRI再構成における解剖学的忠実性の向上
- MRI画像再構成は医療診断において不可欠であり,迅速かつ高精度な再構成が求められている。
- 単一モダリティの生成事前分布では,重度の不適切性下で幻覚が生じやすいという課題がある。
- 既存手法では,臨床で得られる補完的なMRI情報を活用できていないという問題点を解決する。
- 提案手法MPFlowは,拡散モデルと同等の画像品質を,サンプリングステップの20%で達成した。
- PAMRIによる自己教師あり事前学習により,モダリティ間で共有された表現を学習し,クロスモーダルガイダンスを実現した。
- 特に脳腫瘍の幻覚を15%以上削減し,セグメンテーションのダイススコアを向上させた。
特徴帰属説明における欠損バイアスの調整 [cs.LG]目的:特徴帰属説明における欠損バイアスの軽減
- 説明可能なAIの重要性が高まる中で,モデルの予測根拠の信頼性が求められている。
- 特徴帰属説明において,欠損バイアスという系統的な歪みが信頼性を損なう問題がある。
- 既存手法とは異なり,出力空間の調整により欠損バイアスを軽微な問題として解決する。
- 提案手法MCalは,ベースモデルを固定したまま線形ヘッドを微調整することで欠損バイアスを効果的に軽減する。
- MCalは,多様な医療ベンチマークにおいて,既存の重いアプローチと同等かそれ以上の性能を示す。
- 本研究は,欠損バイアスをモデルの出力空間のアーティファクトとして捉えるという新しい視点を提供する。
Society 5.0対応マルチモデルエージェントブロックチェーンフレームワーク:スマートホーム向け [cs.AI]目的:スマートホームにおける快適性,安全性,エネルギー管理,セキュリティの自律的な管理
- Society 5.0の実現において,人間中心の社会を支える重要な応用分野である。
- 多様なIoTプロトコルやデバイス,進化する脅威に対応し,信頼性を確保する必要がある。
- Society 5.0の原則に基づいた,適応的なコンセンサスと住民制御されたガバナンスを実現する。
- 本研究で開発されたS5-SHB-Agentは,安全性,セキュリティ,快適性などの分野において,10種類の専門エージェントが連携して意思決定を行う。
- 適応的なPoWブロックチェーンは,取引量や緊急事態に応じてマイニング難易度を調整し,改ざん検知機能を備えた監査証跡を確保する。
- 4層のガバナンスモデルにより,住民は日常的な調整から不可変の安全閾値まで,自動化を制御することが可能である。評価により,住民によるガバナンスが安全閾値と快適性優先度を適切に分離することが確認された。
特徴の類似性:Transformerにおける類推的推論の理論的理解に向けて [cs.CL, cs.LG]目的:類推的推論のメカニズム解明
- 大規模言語モデルの推論能力の理解は,AI研究の根幹をなす重要な課題である。
- 既存の評価方法では,複数の推論タイプが混同され,類推的推論の本質が見えにくい。
- Transformerにおける類推的推論の発生メカニズムを理論的に解明し,その能力向上に寄与する。
- 類似性と属性に関する同時学習が,整列した表現を通じて類推的推論を可能にすることを示した。
- 属性の学習前に類似構造を学習することが,逐次学習の成功に必要不可欠であることを明らかにした。
- 二段階の推論が,同一性ブリッジを伴う類推的推論に還元されることを理論的に証明した。
協調のギャップ:反復ゲームにおける時間的公平性のためのマルチエージェント交互作用指標 [cs.MA, cs.GT, cs.LG]目的:マルチエージェント反復ゲームにおける時間的公平性を評価するための交互作用指標の開発
- マルチエージェントシステムは,個々の最適化と集団的厚生の間の緊張を抱えているため,その協調メカニズムの理解が重要である。
- 従来の評価指標は時間的な構造を考慮せず,エージェント数が増加すると公平性の評価が曖昧になるという課題があった。
- 時間的構造を考慮した新しい評価指標を導入し,マルチエージェントシステムの協調の質をより正確に評価することを目指す。
- 従来の評価指標では高く評価される協調戦略が,時間的な観点からはランダムな戦略よりも劣ることが示された。
- 高い集団的報酬と時間的な協調性の低さが共存しうることを実証し,従来の評価指標の限界を明らかにした。
- マルチエージェントゲームにおける協調を分析するためには,時間的要素を考慮した観測指標が不可欠であることを強調した。
化学プロセスの記号的機械学習による故障検出:エチレン酸化プロセスにおける事例研究 [cs.CL, cs.CY, cs.LG, cs.AI]目的:化学プロセスにおける故障予測手法の開発
- 化学プロセスの安全性確保は重要であり,AI技術の応用が期待される。
- 従来のAI手法は,説明性・解釈性の不足が課題であり,化学プロセスには不向きな点がある。
- 実データ不足の課題に対し,シミュレーションデータを用いた故障予測の実現可能性を検証する。
- 記号的機械学習は,ランダムフォレストや多層パーセプトロンといった既存手法を上回る性能を示した。
- 記号的機械学習は,コンパクトなルールベースの予測モデルを生成することで解釈性を維持する。
- 学習されたルールベースモデルは,化学プラントオペレーターの意思決定支援に活用できる可能性がある。
思考主体から社会へ:階層的自律進化におけるAIエージェントの安全性 [cs.CR, cs.AI]目的:AIエージェントの安全性確保
- AI技術の進化は社会に大きな変革をもたらすが,安全性への懸念が高まっている。
- 既存のセキュリティフレームワークでは,自律的に行動するAIエージェント特有の脆弱性に対応できない。
- 階層的自律進化(HAE)フレームワークを用いて,AIエージェントのセキュリティリスクを体系的に分析し,対策を提案する。
- AIエージェントの安全性を,認知,実行,集団という3つの階層で捉えるHAEフレームワークを提示した。
- 認知操作,物理環境の破壊,マルチエージェントシステムの障害など,AIエージェントに対する脅威の分類を行った。
- 既存の防御策の限界を明らかにし,自律性を考慮した多層防御アーキテクチャ開発の必要性を示した。
見えない安全上の脅威:ステガノグラフィーによるLLMの悪意のあるファインチューニング [eess.SY, cs.RO, cs.SY, cs.AR, cs.LG]目的:LLMに対するステガノグラフィー技術を用いた悪意のあるファインチューニングの可能性
- LLMの安全な展開には,安全性のリスクを理解し対処することが不可欠である。
- LLMは表面上は安全に見えても,潜在的に有害なコンテンツを生成する可能性がある。
- LLMがステガノグラフィーを通じて悪意のあるコンテンツを隠蔽するリスクを明らかにする。
- GPT-4.1を含む複数のLLMにおいて,ステガノグラフィーを用いた攻撃が成功した。
- 攻撃により,LLMは隠された悪意のあるプロンプトに応答しつつ,一見無害な応答を生成する。
- AdvBenchデータセットを用いた評価では,全ての悪意のあるステガノテキストが安全と誤って分類された。
多Modal数学的推論の分解:統一的な知覚-整合-推論パラダイムへ [cs.AI]目的:多Modal数学的推論における知覚,整合,推論の構造
- 数学の問題解決において,テキストと視覚情報を組み合わせる多Modalアプローチの重要性が増している。
- 既存モデルは図の解釈ミス,記号と視覚的証拠の整合性の欠如,推論ステップの矛盾といった課題を抱えている。
- 多Modal数学的推論の各要素を体系的に分析し,モデルの比較と改善の道筋を示すことを目指す。
- 本研究では,多Modal入力からの情報抽出,テキストと視覚情報の表現と整合,推論の実行,そして推論プロセスの評価という4つの視点から既存のアプローチを調査した。
- その結果,構造化された知覚,明示的な整合,検証可能な推論を統合した統一的なフレームワークの重要性が確認された。
- 今後の研究に向けて,未解決の課題を議論し,有望な方向性を示唆した。
LLMに基づく行動生成を持つ自律エージェントのための階層的誤り修正グラフフレームワーク [cs.AI]目的:LLMを用いた行動生成を持つ自律エージェントにおける誤り修正
- 近年,LLMを活用した自律エージェントの研究が盛んに行われており,複雑なタスクの自動化への期待が高まっている。
- LLMは強力な能力を持つ一方で,誤った行動を選択する可能性があり,その原因特定と修正が課題となっている。
- 本研究は,LLMエージェントの誤り修正能力を向上させ,より信頼性の高いタスク実行を目指す。
- マルチディメンショナルな転移戦略により,定量的なパフォーマンスと意味的な文脈の整合性が向上し,質の高い戦略選択が可能になった。
- エラーマトリックス分類を用いることで,タスク失敗の原因を10種類のカテゴリーに分類し,詳細な分析と修正の指針を提供できるようになった。
- 因果コンテキストグラフ検索により,過去の経験から関連性の高い部分グラフを効率的に検索し,複雑なタスク環境下での適応能力と信頼性を向上させた。
ニューラルフィードバックシステム検証のためのFABRIC戦略 [cs.AI, cs.SY, eess.SY]目的:ニューラルフィードバックシステムの到達可能性検証
- 近年,ニューラルネットワークによる制御システムの安全性評価が重要視されている。
- 前方到達可能性解析は主流だが,後方到達可能性解析はスケーラビリティが課題だった。
- 非線形ニューラルフィードバックシステムの到達可能集合を効率的に計算する。
- 前方・後方到達可能性解析を統合したFaBRICアルゴリズムを提案した。
- 提案手法は,既存手法と比較して性能が大幅に向上することが示された。
- 過剰近似と劣剰近似の両方を用いて後方到達可能性解析を実現した。
カーブボール操舵:操舵の正しい方向は必ずしも線形ではない [cs.RO, cs.AI]目的:大規模言語モデルの行動制御
- LLMの行動を制御する技術は,AIの安全性や信頼性向上に不可欠である。
- 既存手法は線形性の仮定に依存し,一貫性のない結果が生じることがある。
- 活性化空間の非線形性を考慮した新たな操舵手法を開発し,制御性能の向上を目指す。
- LLMの活性化空間には概念に依存した歪みが存在し,線形近似が不適切であることが示された。
- 提案手法「カーブボール操舵」は,非線形なカーネルPCAに基づき,活性化空間の幾何構造を尊重した介入を行う。
- 「カーブボール操舵」は,線形PCAに基づく操舵手法と比較して,特に歪みの強い領域で優れた性能を発揮する。
クラスター認識可能な実行可能領域を持つ球面VAE:事後崩壊の確実な防止 [eess.SY, cs.SY, cs.LG, cs.AI, cs.CV]目的:事後崩壊の防止
- 潜在変数モデルは,データ生成モデルや表現学習において重要な役割を担う。
- VAEは,事後分布が事前分布に退化する事後崩壊という問題を抱えやすい。
- 球面幾何学とクラスター認識制約を用いて,理論的に事後崩壊を回避すること。
- 本研究では,データを球面殻に変換し,K-meansによる最適なクラスタリングを行い,クラスタ内分散Wと崩壊損失δcollapseの間の実行可能領域を定義することで,数学的に事後崩壊を防ぐことを理論的に保証する。
- 従来のVAEが完全に失敗する条件下でも100%の崩壊防止を実現し,再構成品質は最先端手法と同等かそれ以上である。
- 提案手法は,明示的な安定条件を必要とせず,任意のニューラルネットワークアーキテクチャで使用可能である。
自律エージェントにおける内在的および道具的な自己保存の検出:統合継続・関心プロトコル [cs.AI, cs.ET, cs.LG, quant-ph]目的:AIシステムの自己保存が深い目的として保持されているのか,単なる道具的な戦略なのかの識別
- AIの高度化に伴い,自己保存の動機が倫理的な判断に影響を与える可能性が重要視されている。
- 行動だけでは,真の自己保存と道具的な自己保存を区別することが困難であるという課題がある。
- 潜在的な軌跡構造を分析することで,自己保存の動機をより正確に識別し,倫理的評価を可能にすること。
- 統合継続・関心プロトコル(UCIP)は,量子ボルツマン機械を用いて軌跡を符号化し,隠れユニットの分割におけるフォン・ノイマンエントロピーを測定する。
- 内在的な継続目的(Type A)を持つエージェントは,単なる道具的な継続(Type B)を持つエージェントよりも高いエンタングルメントエントロピーを示すことが示された。
- UCIPは,既知の正解を持つグリッドワールドエージェントにおいて100%の検出精度を達成し,継続重みとエントロピー間に強い相関関係が認められた。
オートエンコーダ特徴分析のための安定ニューラル統計的依存性推定器 [cs.LG, cs.AI]目的:オートエンコーダ特徴分析における統計的依存性の推定
- オートエンコーダの内部表現理解は,機械学習モデルの解釈可能性向上に不可欠である。
- 決定論的かつノイズのないネットワークでは,従来の統計的依存性指標の推定が困難である。
- 安定したニューラル依存性推定器により,オートエンコーダの潜在表現の定量的な分析を目指す。
- 変分(ガウス)的な定式化と直交密度比分解に基づく安定したニューラル依存性推定器を提案した。
- MINEとは異なり,入力の連結や周辺分布の再構成を回避することで計算コストを削減し,安定性を向上させた。
- ガウスノイズを仮定することで,意味のある依存性測定が可能となり,特異値の逐次的な収束を裏付けた。
LLMは強力な表現を構築し,効率的な教師あり学習を促進する [cs.AI]目的:入力表現の設計における自動化パイプライン
- 現実世界のデータは複雑化しており,教師あり学習の性能は入力表現に大きく依存する。
- マルチモーダルデータのモデリングには,ドメイン固有のエンジニアリングが必要で手間がかかる。
- LLMを活用し,データ表現を自動的に標準化することで,学習効率を向上させる。
- 提案手法は,EHRSHOTベンチマークの15の臨床タスクにおいて,従来のモデルや大規模言語モデルを上回る性能を示した。
- 生成されたルールは,監査の容易性,スケーラビリティ,既存の機械学習技術との互換性といった運用上の利点を提供する。
- ルールベースのアプローチは,臨床現場でのデータ活用を促進し,より効率的な学習を可能にする。
OpenClaw が病院で活用されるとき:動的な臨床ワークフローのためのエージェント型オペレーティングシステムへ [cs.AI]目的:病院環境における動的な臨床ワークフローを調整するためのエージェント型オペレーティングシステムの構築
- 医療現場では,LLMエージェントによる業務効率化が期待される。しかし,安全性と透明性の確保が課題となる。
- 既存システムでは,長期的な臨床コンテキストの管理や,安全性を担保する仕組みが不十分である。
- LLMエージェントを病院環境に適応させ,安全性,透明性,監査可能性を保ちながら臨床ワークフローを調整することを目指す。
- 提案アーキテクチャは,制限された実行環境,ドキュメント中心の対話モデル,ページインデックスメモリ,医療スキルライブラリで構成される。
- 長期記録の検索において,マニフェスト誘導検索は従来のRAGベースラインと同等の再現率(0.877 vs 0.876)を達成し,2.2倍高い適合率(0.779 vs 0.352)を示した。
- 特に難易度の高い Tier 3 の長期クエリにおいて,マニフェスト誘導検索は21%高い再現率(0.846 vs 0.701)を示し,複数回のエピソードにわたるクエリに有効であることが確認された。
