arXiv雑要約
AI - 2026/03/24 公開
RuntimeSlicer:障害管理のための汎用的な統一されたランタイム状態表現に向けて [cs.CL, cs.MA, cs.SE, cs.AI]目的:障害管理のための汎用的なランタイム状態表現
- 現代のソフトウェアシステムは規模と複雑性が増しており,効果的な障害管理が不可欠である。
- 既存の手法はタスク指向のパイプラインに依存しており,タスクやシステム間の汎用性に欠ける。
- 多様なランタイムデータを統合し,システムの状態を包括的に捉える表現を学習すること。
- RuntimeSlicerは,メトリクス,トレース,ログを単一のシステム状態埋め込みに直接エンコードする。
- Unified Runtime Contrastive Learningにより,異種データソースを統合し,モダリティ間アライメントと時間的一貫性を最適化する。
- State-Aware Task-Oriented Tuningは,ランタイム状態のパーティション分割と,ダウンストリームタスクへの状態条件付き適応を可能にする。
精密光学システムのクローズドループロボット組立,アライメント,および自己回復のためのフレームワーク [cs.RO, cs.AI, physics.optics]目的:精密光学システムの自律的な構築,アライメント,および維持
- 科学分野における自動化の重要性が増している。特に,化学や材料科学などの分野で顕著である。
- フリースペース光学は高精度を要求されるため,完全な自動化が困難であった。
- 高感度な光学システムにおけるクローズドループ自律性を実現し,自律的な光学実験の基盤を確立する。
- 本研究では,階層型コンピュータビジョン,最適化ルーチン,およびカスタムツールを統合したロボットフレームワークを開発した。
- 卓上レーザーキャビティをランダムに配置された部品から完全に自律的に構築することに成功した。
- レーザービームセンタリング,ビームアライメント,共振器アライメント,レーザーモード選択,および外乱からの自己回復などの機能を実証した。
商幾何,有効曲率,単純な浅いニューラルネットワークにおける暗黙的バイアス [cs.SI, cs.LG, cs.AI]目的:過パラメータ化された浅いニューラルネットワークにおけるパラメータ対称性による表現の冗長性の解析
- ニューラルネットワークの学習において,過剰なパラメータは汎化性能に影響を与えるため,その構造理解が重要である。
- パラメータ空間における幾何学的解析は,パラメータの対称性によって歪められ,本質的な学習特性を捉えにくい。
- パラメータ対称性を考慮した商空間における幾何学的構造を明らかにし,より本質的な学習特性を解明すること。
- パラメータ対称性による商空間を構築し,自然な計量と有効曲率を定義した。
- 勾配降下法において,水平成分のみが予測の進化に寄与し,垂直成分はゲージ変換に対応することを示した。
- 暗黙的バイアスを商空間レベルで捉え,予測クラスに複雑さを割り当てることの妥当性を主張した。
オンデバイスモデル推論のためのユーザ行動シーケンスを用いた特徴抽出の最適化 [cs.HC, cs.LG, cs.AI, cs.HC]目的:オンデバイスモデル推論における特徴抽出の最適化
- モバイルアプリにおける機械学習の活用が進み,ユーザ体験の向上に不可欠となっている。
- 既存研究は推論の高速化に偏っており,特徴抽出段階のボトルネックが無視されてきた。
- 特徴抽出における冗長な処理を削減し,エンドツーエンドの推論速度を向上させる。
- AutoFeatureは特徴抽出ワークフローをグラフとして抽象化し,冗長な処理を融合することで高速化を実現した。
- AutoFeatureは,五つの実サービスへの統合により,日中・夜間のオンデバイス推論時間を1.33倍〜4.53倍に短縮した。
- 効率的なキャッシュ機構により,連続推論時のデータ処理量を削減し,更なる高速化に貢献している。
推論トレース表現によるマルチエージェントシステムの効率的な障害管理 [cs.SE, cs.AI]目的:マルチエージェントシステムにおける障害管理の効率化
- 大規模言語モデルを用いたMASは,その高度な推論・協調能力から注目を集めており,ソフトウェアシステムの新たな設計パラダイムとなりつつある。
- 既存手法はトレース単位での処理に依存し効率が低く,過去の障害パターンを考慮しないため,診断精度が限られている。
- 過去の障害パターンを活用し,リアルタイムな障害検出・診断・緩和を実現することで,MASの信頼性向上を目指す。
- 提案手法EAGERは,推論トレース表現に基づき,エージェント内・エージェント間の推論と協調を効率的にエンコードする。
- EAGERは,教師なし学習を用いて歴史的な障害知識に基づいて,リアルタイムなステップごとの障害検出,診断,および自己回復を可能にする。
- 3つのオープンソースMASを用いた評価により,EAGERの有効性が確認され,信頼性の高いMAS運用に向けた今後の研究方向性を示唆する。
SafePilot:LLMを活用したサイバー物理システムの安全性を保証するフレームワーク [cs.RO, cs.AI]目的:LLMを活用したサイバー物理システムの安全性保証
- サイバー物理システムは社会インフラを支える重要技術であり,その安全性確保は不可欠である。
- LLMの「幻覚」と呼ばれる不正確な出力が,サイバー物理システムの誤動作や危険な行動を引き起こす可能性がある。
- LLMの幻覚を抑制し,サイバー物理システムの安全性と信頼性を向上させることを目指す。
- 本研究では,属性ベースおよび時間的仕様に基づいて,LLMを活用したサイバー物理システムのエンドツーエンドの安全性保証を可能にする階層的ニューロシンボリックフレームワークSafePilotを提案する。
- SafePilotは,タスクの複雑さを評価し,複雑なタスクは分割統治法により分解して計画を行うことで,LLMの計画能力を効果的に活用する。
- 提案手法は,自然言語制約を形式仕様に変換し,LLMの出力を検証することで,計画の妥当性を保証する。事例研究を通じて有効性が示された。
CatRAG:検索拡張を用いた公正なLLMのための関数子誘導構造バイアス軽減 [cs.CL, cs.AI]目的:大規模言語モデルにおけるバイアス軽減
- LLMは重要な場面で利用されるが,公平性と信頼性を損なうバイアスを含む可能性がある。
- 既存のバイアス軽減手法は部分的で,分布の変化に弱いという課題がある。
- 関数子と検索拡張生成(RAG)を組み合わせ,構造バイアスを軽減し,より公正なLLMを実現する。
- CatRAGは,質問応答バイアスベンチマーク(BBQ)において,3つのオープンソースLLMで最先端の結果を達成した。
- ベースモデルと比較して精度を最大40%向上させ,既存のバイアス軽減手法よりも10%以上改善した。
- ジェンダー,国籍,人種などのグループにおいて,バイアススコアをほぼゼロにまで低減した(ベースモデルでは60%)。
BOxCrete:コンクリート強度予測と配合最適化のためのベイズ最適化オープンソースAIモデル [cs.LG, cs.AI]目的:コンクリート強度予測と配合最適化のためのオープンソースAIモデル
- 現代のコンクリートは,性能,作業性,耐久性,持続可能性の要求を満たす必要があり,配合設計は複雑化している。
- 既存のAI/MLモデルは有望であるが,多くが企業秘密データやクローズドソース実装に基づいている。
- 再現性のあるオープンソース基盤を提供し,データ駆動型の配合設計開発を促進する。
- BOxCreteは,500件以上の強度データから学習した,確率的モデリングと最適化フレームワークである。
- ガウス過程回帰により,平均R$^2$ = 0.94,RMSE = 0.69 ksiという高い予測精度を達成した。
- BOxCreteは,圧縮強度と埋め込み炭素の多目的最適化を可能にし,不確実性を定量化する。
LLMとモンテカルロ木探索によるDBMSテストケース生成 [cs.CL, cs.SE, cs.AI]目的:DBMSの信頼性確保のための高品質なSQLテストケースの自動生成
- 現代のデータ駆動型アプリケーションにおいて,DBMSは基盤であり,その信頼性は不可欠である。
- 従来のファジング手法はDBMS固有の方言への適応に多大な手作業を要し,汎用性に欠ける。
- 軽量LLMを用い,構文的・意味的に多様なSQLテストケースを効率的に生成し,テストカバレッジを向上させる。
- 提案手法MISTは,3種類のDBMSと4つの軽量LLMにおいて,平均して行カバレッジが43.3%向上した。
- 関数カバレッジは32.3%向上し,分岐カバレッジは46.4%向上した。特にOptimizerモジュールでは最高69.3%の行カバレッジを達成した。
- MISTは,特徴ガイド型エラー駆動テストケース合成とモンテカルロ木探索によるテストケース変異を組み合わせることで,高いカバレッジを実現する。
高階偏微分方程式に対する文脈内演算子ネットワークの一般化限界 [cs.LG, cs.NA, math.NA]目的:高階偏微分方程式に対する文脈内演算子ネットワークの一般化能力の評価
- 偏微分方程式は,物理現象や工学問題を記述する基礎であり,その数値解法は重要である。
- 従来の数値解法は,方程式の次数や境界条件に応じてアルゴリズムを設計する必要がある。
- 文脈内学習を活用することで,様々な偏微分方程式に対して汎用的な解法を確立することを目指す。
- 文脈内演算子ネットワークは,高階偏微分方程式に対しても,ある程度の精度で解を予測できることが示された。
- 特に,解のダイナミクスや全体的な挙動といった定性的な精度は維持されていることが確認された。
- この結果は,モデルが学習データ外の問題に対しても,基本的な解の特性を外挿できる可能性を示唆している。
Transformerの汎化性能に関するより厳密な上限 [eess.SY, cs.SY, cs.LG, cs.AI]目的:Transformerモデルの汎化誤差の上限
- 深層学習モデルの理論的な理解は,その性能向上と安全性の確保に不可欠である。
- 既存の汎化誤差の上限は,多くの場合,緩やかであり,実用的なモデルの性能を正確に評価できない。
- Transformerアーキテクチャに特化した,より厳密な汎化誤差の上限を導出すること。
- オフセットRademacher複雑性を利用することで,様々なTransformerアーキテクチャに対するより厳密な汎化誤差の上限を導出した。
- 得られた上限は,仮説空間の被覆数との関係から,最適な収束率を達成している。
- 行列のランクやノルムを用いて被覆数を評価することで,アーキテクチャに依存した精度の高い汎化誤差の上限を得た。
進化型二者間多目的UAV経路計画:問題と実験的比較 [eess.SY, cs.SY, cs.NE, cs.AI]目的:効率と安全の両立を目指したUAV経路計画問題の二者間多目的最適化
- 都市部におけるUAVの利用拡大に伴い,効率性と安全性を両立した経路計画が重要となっている。
- 従来のUAV経路計画は単一の意思決定者によるものであり,効率と安全の部門間の対立を考慮できていない。
- 本研究は,効率部門と安全部門という二者間の意思決定構造をモデル化し,最適な経路計画を導くことを目指す。
- 提案手法であるBPAIMAは,従来の多目的進化アルゴリズム(NSGA-IIなど)や,多者間多目的進化アルゴリズム(OptMPNDS,OptMPNDS2など)と比較して,優れた性能を示すことが確認された。
- BPAIMAは,BPNNIAおよびBPHEIAといった二者間多目的最適化アルゴリズムと比較しても優位性が見られた。
- 本研究で提案された二者間多目的UAV経路計画問題のモデル化が,現実的なUAV運用における効率性と安全性の向上に貢献すると期待される。
強化学習におけるワールドモデルは何を学習するか:学習された環境シミュレーターにおける潜在表現の探求 [cs.RO, cs.SY, eess.SY, cs.LG, cs.AI]目的:ワールドモデルにおける潜在表現の構造と機能
- 強化学習のサンプル効率向上に,環境のシミュレーションが不可欠である。
- ワールドモデルが内部でどのように環境を表現しているか不明確である。
- ワールドモデルの潜在表現の解釈可能性を明らかにする。
- IRISとDIAMONDのどちらのモデルも,ゲームの状態変数(オブジェクトの位置,スコアなど)を線形的に復号可能な表現を獲得した。
- 潜在状態を操作することでモデルの予測が変化することから,表現が機能的に利用されている証拠が得られた。
- IRISの注意メカニズムは空間的な専門化を示し,特定のヘッドがゲームオブジェクトと重なるトークンに重点を置いていた。
記号的再帰的自己調整による反復的自己学習の安定化 [cs.AI]目的:反復的自己学習の安定化
- モデルの能力向上には継続的な学習が不可欠であり,自己生成データを用いた反復学習が有望視されている。
- 反復学習における推論エラーの累積が,性能劣化やモード崩壊を引き起こすことが課題となっている。
- 推論ステップレベルでの検証によるデータ品質の管理を通じて,反復学習の安定化を目指す。
- 提案手法NSRSAは,推論ステップごとに記号的な検証を行い,誤った推論を含むデータを訓練セットから排除することで,安定した自己学習を実現した。
- 結果として,NSRSAは結果のみの検証では通過してしまう「幸運な正解」を約34%排除し,より確実な学習を可能にした。
- NSRSAで検証されたデータを用いてDPOペアを構築することで,モデルは妥当な推論と誤った推論を区別する能力を向上させた (報酬精度46%から63%)。
マルチエージェント協調のための反事実的クレジットポリシー最適化 [cs.AI]目的:マルチエージェント協調におけるクレジット割り当ての改善
- 複雑な推論タスクを解決するため,大規模言語モデルの協調が重要視されている。
- 共有された報酬が個々の貢献を曖昧にし,学習の不安定性やフリーライド問題を引き起こす。
- 反事実的軌跡を用いたクレジット割り当てにより,フリーライドを抑制し学習効率を高める。
- CCPOは,各エージェントの貢献を評価する反事実的ベースラインを動的に構築する。
- これにより,役割に応じた利点が得られ,ポリシー最適化が促進される。
- 数学的および論理的推論ベンチマークにおいて,既存手法を上回る性能を示した。
言語エージェントのための階層型メモリ理論に向けて [cs.IR, cs.AI, cs.IT, cs.SI, math.IT]目的:言語エージェントにおける階層型メモリの設計原理
- 大規模言語モデルの性能向上には,長文脈の処理能力が不可欠である。
- 既存のアプローチは多様であり,設計選択の比較が困難である。
- 階層型メモリの設計を形式化し,比較可能な枠組みを提供する。
- 本研究では,抽出,粗視化,トラバーサルの3つの演算子に基づく統一的な理論を提案する。
- 粗視化における代表関数に自己充足性という概念を導入し,有効な検索戦略を制約する要因を明らかにする。
- 提案理論を11の既存システムに適用し,その汎用性を示す。
SAR ATRの再考:標的を意識した周波数・空間的強調フレームワークとノイズ耐性知識誘導 [cs.CV, cs.AI]目的:SAR画像における自動標的認識の精度向上
- SAR ATRは,海洋航行や災害監視において不可欠な技術であり,その重要性は高い。
- SAR画像特有のコヒーレントスペックルノイズが標的の特徴を覆い隠し,認識精度と汎化性能を低下させる。
- ノイズ環境下における標的認識の安定性を高め,高精度かつ軽量なモデルを実現することを目指す。
- 提案手法FSCEは,周波数・空間的特徴の適応的強調モジュールDSAFと,教師あり知識蒸留による標的領域への集中を組み合わせる。
- DSAFNet-Lは,MSTAR,FUSARShip,OpenSARShipの各データセットで既存手法と同等以上の性能を達成した。
- DSAFNet-Mは,精度を維持しつつモデルの複雑さを大幅に削減し,高い汎化性能を示すことが確認された。
白内障手術用ドメイン適応モデルCataractSAM-2:セグメンテーションとスケーラブルな正解アノテーション [cs.CV, cs.AI, cs.DB, cs.LG, cs.RO]目的:白内障手術動画の高精度なセマンティックセグメンテーション
- ロボット支援手術の精度向上に不可欠であり,術中認識の自動化が求められている。
- 高品質なアノテーションデータの作成には多大な時間と労力がかかる。
- アノテーション作業の負担を軽減し,効率的なデータセット開発を目指す。
- CataractSAM-2は,Meta社のSegment Anything Model 2を拡張し,白内障手術動画のセグメンテーションにおいて高い精度を達成した。
- スパースプロンプトと動画ベースのマスク伝播を組み合わせたインタラクティブなアノテーションフレームワークにより,アノテーション時間を大幅に削減した。
- 緑内障手術へのゼロショット汎化能力も示され,幅広い手術への応用可能性が確認された。
LLM隠蔽術におけるコルモゴロフ複雑性の限界と,パープレキシティに基づく検出プロキシ [cs.LG]目的:LLMを用いた隠蔽術における情報理論的コストの評価
- AIシステムの連携における秘密通信路の安全性確保が重要である。
- LLMの表面的な意味を保持しつつ,隠れた情報を埋め込む手法が確立されつつある。
- 隠蔽術によるテキストの複雑度増加を理論的に評価し,検出可能な指標を提示する。
- 隠蔽術は,埋め込まれるペイロードの量に応じて,必然的に生成テキストの複雑度を増加させる。
- コルモゴロフ複雑性は計算不可能だが,言語モデルのパープレキシティがその代替指標として機能する可能性がある。
- 提案するBinocularsスコアは,実験的に隠蔽術による複雑度増加を検出できることを示した。
確率的射影に基づくPINNsを用いた非線形偏微分方程式の安定性と分岐解析:クライロフ・アルノルディ法 [math.NA, cs.LG, cs.NA, math.DS]目的:非線形偏微分方程式の安定性と分岐解析
- 偏微分方程式は自然現象や工学問題を記述する基礎であり,その解析は重要である。
- 高次元問題における安定性・分岐解析は計算コストが高く,効率的な手法が求められている。
- 確率的射影とクライロフ・アルノルディ法を組み合わせ,効率的な安定性・分岐解析を実現する。
- 物理情報に基づいた確率的射影ニューラルネットワーク (PI-RPNN) を用いた数値フレームワークを提案した。
- 行列のランク不足による固有値計算の不安定性を,クライロフ・アルノルディ法によって克服した。
- PI-RPNNに基づく一般化固有値問題がほぼ確実に正則であり,標準的な固有値ソルバーで解けることを示した。
マルチエージェント強化学習のための適応型ロバスト推定器 [cs.AI]目的:マルチエージェント協調における推論能力向上
- 大規模言語モデルの推論能力を強化する上で,マルチエージェント協調は重要な手法となっている。
- 生成,批判,修正の相互作用における曖昧さから,エージェント間の貢献度評価が困難である。
- 重い裾を持つノイズの多い報酬への脆弱性を克服し,安定した学習を実現する。
- 提案手法は,質問,批判,書き換えの3段階パイプラインで推論を構造化し,各エージェントの貢献度を明確化する。
- 適応型ロバスト推定器は,マルチエージェントポリシー最適化中のバッチ経験平均のロバストな推定を可能にする。
- 数学的推論と具現化された知能のベンチマークにおいて,ノイズの多い報酬下でも既存手法を凌駕する性能を示した。
心による空間操作:マルチモーダル大規模言語モデルは精神的にナビゲートできるか [cs.AI]目的:マルチモーダル大規模言語モデルの精神的ナビゲーション能力の評価
- ロボット工学やAIにおいて,環境理解と自律的な行動計画は重要な課題である。
- 既存のマルチモーダル大規模言語モデルは,広範囲な時空間スケールでの空間推論が苦手である。
- 人間の認知能力である「精神的ナビゲーション」をAIに導入し,空間推論能力の向上を目指す。
- 新たなベンチマーク「Video2Mental」を導入し,モデルの認知地図構築能力と経路計画の精度を検証した。
- 標準的な事前学習だけでは,精神的ナビゲーション能力は自然に獲得されないことが明らかになった。
- NavMindは,認知地図を学習可能な中間表現として利用することで,優れた精神的ナビゲーション能力を実現した。
SSAM:マルチモーダル大規模言語モデルの統合のための特異部分空間アライメント [cs.LG, cs.CV]目的:マルチモーダル大規模言語モデルの統合手法
- マルチモーダル学習は,様々な情報源を統合し,より高度なAIの実現に不可欠である。
- 既存モデルの統合は,表現の差異やパラメータ干渉により困難であった。
- 学習不要で,既存モデルの知識を活かしつつパラメータ干渉を最小化する。
- SSAMは,学習データなしで最先端の性能を4つのデータセットで達成した。
- 従来の学習不要統合手法や,同時学習マルチモーダルモデルを上回る性能を示した。
- パラメータ空間でのアライメントが,効率的なマルチモーダル学習の代替手段となる。
限られた通信を持つUAV支援ワイヤレスネットワークにおける時空間注意エンハンスマルチエージェントDRL [cs.IT, cs.AI, cs.SY, eess.SY, math.IT]目的:UAV支援ワイヤレスネットワークにおけるスループット最大化
- 無線通信において,UAVを活用することで,地上からのデータ伝送を高速化し,通信範囲を拡大することが期待されている。
- UAV間の断続的な情報交換は遅延を生じさせ,効果的な協調を阻害する要因となっている。
- UAV間の情報共有を促進し,ネットワーク状態の認識精度を高めることで,遅延を削減しスループットを向上させる。
- 提案手法は,従来のMADRLと比較して,情報遅延を50%以上削減し,スループットを75%向上させることをシミュレーションで示した。
- UAV間の情報共有の改善はネットワーク容量を損なうことなく,学習性能とスループットを同時に向上させる。
- UAVの情報交換の必要性を低減し,UAV支援ワイヤレスネットワークにおけるMADRLの実用的な展開を促進する。
IoTネットワークにおける連合学習を用いたインネットワーク攻撃検知:実実装と分析 [cs.LG, cs.CR]目的:IoTネットワークにおけるインネットワーク攻撃検知手法
- IoTの急速な普及により,セキュリティ侵害のリスクが増大している。
- 従来の集中型アノマリ検知は,プライバシー,スケーラビリティ,遅延の問題がある。
- エッジデバイス上でリアルタイムに攻撃を検知し,データ転送量を削減すること。
- 提案手法は,リソース制約のあるエッジデバイスでの展開に適した軽量な自己符号化器ベースのアノマリ検知フレームワークである。
- 連合学習を用いることで,中央サーバーへのデータ転送を最小限に抑えながら,分散環境で協調的にモデルを学習可能である。
- 実環境のテストベッド実験の結果,提案手法はネットワーク攻撃を正確に識別し,通信オーバーヘッドを大幅に削減した。
多岐にわたるAIエージェントによる多角的認知症特性評価とリスクアセスメント [cs.AI, cs.CV]目的:認知症の特性評価とリスクアセスメントのための多角的AIシステムの開発
- 患者データは多様かつ不完全になりがちであり,正確な診断と治療には高度な解析が不可欠である。
- 既存のAIモデルは静的で不透明であり,実際の臨床現場での運用に課題がある。
- 臨床医の意思決定を支援する,解釈可能で堅牢なAIシステムの実現を目指す。
- Cerebraは,電子カルテ,臨床記録,画像解析を連携させ,認知症リスク予測において最先端モデルを上回る性能を示した。
- 認知症診断ではAUROC 0.86,生存予測ではC-index 0.81を達成し,高い精度を実証した。
- 熟練した医師による評価実験では,Cerebraの導入により認知症リスク推定の精度が17.5%向上した。
リーマン幾何学が言葉より雄弁である:グラフ基盤モデルから次世代グラフ知能へ [cs.DC, cs.LG, cs.AI]目的:グラフ基盤モデルの構築原理
- グラフは複雑な関係性を自然に記述し,様々な分野で重要な役割を担っている。
- 既存のグラフニューラルネットワークは,多ドメイン学習における記憶保持と解釈性に課題がある。
- リーマン幾何学を用いて,グラフ構造の複雑さを捉え,汎用的なグラフ基盤モデルを構築すること。
- グラフの構造的複雑さを捉えるため,リーマン幾何学に基づく新たなモデル(RFM)を提案する。
- RFMは,グラフの固有の幾何学構造を重視し,構造推論と生成能力を内包する。
- RFMを用いることで,グラフモデリングのパラダイムシフトを促し,次世代のグラフ知能を実現する。
mSFT:マルチタスクSFTにおける異質的なデータセット混合の過学習への対処 [cs.LG, cs.AI]目的:マルチタスクSFTにおけるデータセット混合の過学習問題の解決
- 言語モデルの性能向上には,多様なデータセットを用いた学習が不可欠である。
- 既存手法では,全てのサブデータセットに均一な計算資源を割り当てるため,過学習や未学習が発生しやすい。
- データセットごとの学習速度の違いを考慮し,過学習を抑制しながら効率的な学習を実現することを目指す。
- mSFTは,反復的に過学習の早期検出と除外を行い,最適なチェックポイントに復元することで学習を継続する。
- 10のベンチマークと6つのベースモデルにおいて,4つのベースラインと比較して一貫して優れた性能を示した。
- データセットサイズやタスク粒度,ハイパーパラメータに影響されにくく,低計算資源下でも性能向上が期待できる。
INTRYGUE:誘導を考慮したエントロピーゲーティングによる信頼性の高いRAG不確実性推定 [cs.AI]目的:RAGにおける不確実性推定の信頼性向上
- 大規模言語モデルの利用拡大に伴い,生成される情報の信頼性確保が重要になっている。
- RAGは事実に基づいた回答を改善するが,幻覚を完全には排除できず,不確実性評価が課題である。
- 既存のエントロピーに基づく不確実性評価方法がRAG環境で誤ったシグナルを発する問題を解決する。
- INTRYGUEは,誘導ヘッドの活性パターンに基づいて予測エントロピーをゲートするメカニズムを導入した。
- 4つのRAGベンチマークと6つのオープンソースLLMで,既存の不確実性評価手法と同等またはそれ以上の性能を示した。
- RAGにおける幻覚検出には,予測不確実性と文脈利用の内部信号を組み合わせることが有効である。
ルール状態推論 (RSI): ルールに基づいた領域におけるコンプライアンス監視のためのベイズ的枠組み [cs.HC, cs.LG, cs.AI, stat.ML]目的:ルールに基づいた領域におけるコンプライアンス監視のためのベイズ的枠組み
- 税制や規制遵守といった分野では,規則が事前に明確に定義されているため,規則の解釈と適用が重要となる。
- 既存の機械学習フレームワークは,観測データを真実とみなし規則を近似するため,規則が明確な領域では限界がある。
- 規則の活性化状態,遵守率,パラメータドリフトを推論することで,コンプライアンス監視の精度向上を目指す。
- RSIは,規制規則を構造化された事前分布としてエンコードすることで,コンプライアンス監視を潜在的なルール状態空間に対する事後推論として捉える。
- RSIは,データセットのサイズに関わらずO(1)時間で規制変更を吸収し,観測データが蓄積されるにつれて真のルール状態に収束することが理論的に保証される。
- ラベル付きの学習データなしで,F1=0.519,AUC=0.599を達成し,モデルの再学習と比較して600倍以上の高速化を実現した。
意味的整合性と凝縮インタラクションによるマルチモーダル時系列異常検知への取り組み [cs.LG]目的:マルチモーダル時系列異常検知モデルの開発
- 動的なシステムの健全性監視において,時系列異常検知は不可欠な役割を果たす。
- 既存研究は数値データに偏り,他のモダリティからの補完的情報が十分に活用されていない。
- 異種マルチモーダルデータの意味的整合性を確保し,冗長な情報を削減する。
- 提案手法MindTSは,時系列とテキスト間の意味的な整合性を実現するファイングレインな時間-テキスト意味的整合性を導入。
- コンテンツ凝縮再構成により,テキストモダリティ内の冗長な情報をフィルタリングし,クロスモーダル再構成を可能にする。
- 6つの実データセットによる実験で,既存手法と比較して競争力または優れた性能を示すことが確認された。
AgenticRec:ランキング重視型レコメンダエージェントのためのエンドツーエンドなツール統合型方策最適化 [cs.IR, cs.AI]目的:ランキング指向型レコメンダエージェントにおける方策最適化
- 大規模言語モデルに基づくレコメンダエージェントは,新たな推薦パラダイムとして期待されている。
- 既存手法では,中間的な推論と最終的なランキングフィードバックの乖離,及びきめ細かい嗜好の把握が困難である。
- 推論,ツール利用,ランキング最適化を統合し,ランキング性能の向上を目指す。
- AgenticRecは,推薦に特化したツールをReActループに組み込み,証拠に基づいた推論を可能にする。
- ランキングユーティリティを最大化する理論的に偏りのないList-Wise GRPOを提案し,複雑なツール利用経路に対する適切な評価を行う。
- ランキング違反からハードネガティブを抽出し,双方向の嗜好合わせを行うProgressive Preference Refinementにより,ペアワイズランキングエラーの上界を最小化する。
ブロードキャストチャネル向けレートレスDeepJSCC:歪み・レート・複雑さのトレードオフ [cs.IT, cs.LG, eess.SP, math.IT]目的:ブロードキャストチャネルにおける歪み,伝送レート,処理複雑さの柔軟なトレードオフ
- ワイヤレス環境において,データ集約型ブロードキャストアプリケーションが増加しており,効率的な通信手法が求められている。
- 既存のDeepJSCCは,最悪の場合のシナリオに限定され,適応的な複雑さやブロードキャスト環境への対応が不十分である。
- ヘテロなデバイス環境において,歪み,レート,復号複雑さの制御可能なトレードオフを実現すること。
- 提案手法は,学習されたソース変換と物理層LTコードを統合し,受信側の状況に応じてレートレスシンボルの受信数と復号反復回数を調整する。
- 不均等保護方式を用いることで,復号側情報を活用し,ヘテロな受信機に対応した性能向上が確認された。
- シミュレーション結果から,提案手法が厳しい通信・処理制約下で,エッジデバイスにおける画像ブロードキャスト品質を向上させることが示された。
効率的なゼロショットAI生成画像検出 [cs.CV, cs.AI]目的:AI生成画像の検出
- AI技術の進歩により,生成画像の精緻化が進み,真偽判定の重要性が増している。
- 既存手法では,未知の画像への汎化性能が低いか,微細な差異の検出が困難である。
- 構造化された周波数摂動に対する表現の感度を用いて,微細な操作を検出し,高精度な検出を目指す。
- 提案手法は,従来の訓練不要型検出器と比較して,1~2桁高速な推論が可能である。
- OpenFakeベンチマークにおいて,最先端手法をほぼ10%上回るAUCを達成した。
- 計算コストを大幅に抑えつつ,高い検出性能を両立している。
経路空間における近接方策最適化:シュレーディンガー橋の視点 [cs.LG]目的:生成モデルを用いた近接方策最適化の経路空間における定式化
- 生成モデルによる強化学習は有望だが,発展途上であり,効果的な学習手法が求められている。
- 従来の近接方策最適化は行動空間の確率比率で定義され,拡散モデルやフローベースの方策との整合性が課題となっていた。
- 生成モデルの方策に対する近接方策最適化を経路空間で統一的に扱うフレームワークを提案し,安定性と性能向上を目指す。
- 本研究では,Generalized Schr\"odinger Bridge (GSB)に触発されたGSB-PPOを提案し,経路空間における近接方策最適化を実現した。
- クリッピングベースのGSB-PPO-ClipとペナルティベースのGSB-PPO-Penaltyの2つの目的関数を開発し,実験的に比較検討した。
- ペナルティベースの目的関数が,クリッピングベースのものよりも安定性と性能が優れていることが示された。
EnterpriseLab:企業におけるエージェントの開発・デプロイのためのフルスタックプラットフォーム [cs.AI]目的:企業環境におけるAIエージェントの開発とデプロイを可能にするフルスタックプラットフォーム
- 企業におけるAI活用は,生産性向上やコスト削減に不可欠であり,その重要性は増している。
- 大規模言語モデルは強力だが,データ主権やコストが課題。小規模モデルはプライバシーを保てても専門性が低い。
- ツール連携,データ生成,学習の断片化を解消し,企業固有の課題に対応できるエージェント開発を支援する。
- EnterpriseLabは,企業アプリケーションを統合し,環境スキーマから学習データを自動生成する閉ループフレームワークを提供する。
- 8Bパラメータモデルは,GPT-4oに匹敵するパフォーマンスを示し,推論コストを8〜10倍削減することに成功した。
- EnterpriseBench(+10%)やCRMArena(+10%)を含む多様な企業ベンチマークにおいても,高いロバスト性を示した。
シリコン官僚制とAIテスト志向型教育:LLMベンチマークにおける汚染感受性とスコア信頼性 [cs.RO, cs.SY, eess.SY, cs.AI, cs.CL]目的:LLMベンチマークにおける汚染感受性とスコア信頼性の分析
- 大規模言語モデルの性能評価は,その活用範囲拡大において不可欠である。
- ベンチマークの信頼性が損なわれると,モデルの真の能力を正しく評価できない。
- ベンチマーク評価の脆弱性を明らかにし,より信頼性の高い評価方法を提案する。
- LLMベンチマークにおける汚染の影響が広範囲に確認された。
- ノイズ条件下で,ベンチマークのスコアが向上するケースが見られ,汚染された記憶が再活性化されている可能性が示唆された。
- ベンチマーク評価に加えて,汚染感受性とスコア信頼性の明示的な監査の重要性が強調された。
地域活性化のための分散型ガバナンス:ヒューマンデータエンジンによる低活力状態の緩和に向けた社会技術的フレームワーク [cs.CY, cs.LG]目的:地域経済の流れを最適化し,低活力状態を緩和するための社会技術的フレームワーク
- 都市情報学や観光研究は都市部の課題に焦点を当てがちであり,地方の衰退問題は軽視されがちである。
- 人口減少や構造的停滞が進む地域では,観光客の少なさが経済活動を抑制し,満足度を低下させる「低活力」という課題が存在する。
- ヒューマンデータエンジンを活用し,観光客の流れを再配分することで,地域経済の活性化を目指す。
- 福井県のデータ分析により,年間865,917件の実現可能な観光客増加機会と,約119.6億円の潜在的な収益損失が明らかになった。
- AI駆動の意思決定支援システムは,サンプル内での説明力が81%,サンプル外での予測性能が68%という高い精度を示した。
- 分散型ヒューマンデータエンジンと二重のナッジによるガバナンス構造が,地域間の観光客の流れを最適化し,経済的な流出を抑制する可能性を示唆した。
FedCVU:クロスビュー動画理解のための連合学習 [cs.FL, cs.DM, math.CO, cs.CV, cs.LG]目的:クロスビュー動画理解における連合学習フレームワーク
- プライバシー保護が重要視される中,複数カメラの動画データを活用する技術の必要性が高まっている。
- 異なる視点や背景を持つカメラデータは,データの偏りを生じやすく,学習が困難になるという課題がある。
- 視点差によるデータの偏りを解消し,効率的な連合学習を実現することで,動画理解の精度向上を目指す。
- 提案手法FedCVUは,VS-Norm,CV-Align,SLAの3つの要素により,クロスビュー動画理解における課題を克服する。
- 実験結果から,FedCVUは未知の視点での認識精度を向上させるとともに,既知の視点での性能も維持することが示された。
- 既存の連合学習手法と比較して,ドメインの異質性や通信制約に対する頑健性も確認された。
MISApp:多段意図認識セッショングラフ学習による次アプリ予測 [cs.LG]目的:次アプリ予測のための手法
- モバイルサービスの利便性向上に不可欠であり,ユーザーエクスペリエンスを大きく左右する。
- ユーザーの意図が短時間で変化し,過去の利用履歴が少ない場合に予測精度が低下する。
- セッションの構造的依存関係と意図の変化を捉え,予測精度を向上させる。
- MISAppは,多段セッショングラフ学習を用いて,ユーザーのプロファイルに依存せずに次アプリを予測する。
- 実験結果から,MISAppは標準的およびコールドスタート環境下で,既存手法と比較して高い予測性能を示す。
- 学習されたホップレベルの注意重みは,構造的な関連性と一致しており,提案手法の有効性を示唆する。
セキュアな検索拡張生成に向けた包括的レビュー:脅威,防御,およびベンチマーク [cs.CR, cs.AI]目的:検索拡張生成(RAG)システムのセキュリティに関する脅威,防御策,評価基準の体系的な分類
- 大規模言語モデルの幻覚や知識不足を軽減するRAG技術は,応用範囲が広がり重要性が増している。
- RAGの多層構造は,データポイズニングや敵対的攻撃など,新たなセキュリティ脆弱性を生み出している。
- RAGシステム全体のセキュリティリスクを明らかにし,堅牢なシステム開発を支援することを目的とする。
- 本研究では,RAGのワークフローに沿って,潜在的な脆弱性メカニズムと脅威ベクトルを体系的に分析した。
- 入力段階と出力段階の両方から,RAGに対する防御技術を分類し,それぞれの有効性を評価した。
- 今後の実験設計のために,既存のテストデータセット,セキュリティ基準,評価フレームワークを統合した。
TrustFed:データプライバシー制約下での信頼性の高い医療AIの実現 [cs.LG, cs.CY]目的:データプライバシー制約下における信頼性の高い医療AIの実現
- 医療AIの発展には,患者データの活用が不可欠だが,プライバシー保護が重要な課題となっている。
- 既存の連合学習は,データ不均一性や偏り,クラス不均衡により,予測精度と不確実性評価が低下しやすい。
- 本研究は,不均一で不均衡な医療データ下でも信頼性の高い不確実性評価を実現し,実用的な医療AI展開を目指す。
- TrustFedは,クライアント割り当てメカニズムとソフト近傍閾値集約戦略により,医療機関間での効果的なキャリブレーションを可能にする。
- 43万件以上の医療画像を用いた実験で,多様なクラス数と不均衡度を持つデータセットにおいて,頑健なカバレッジ保証を確認した。
- 本研究は,不確実性を考慮した連合学習を概念実証から臨床的に意義のある展開へと進め,次世代医療AIシステムの重要な要素とする。
大規模言語モデルにおける記憶の比較分析:統計的・内部レベルでの共通性とモデル特有の特性 [cs.CL, cs.LG]目的:大規模言語モデルの記憶に関する共通性と特有の特性の解明
- 知能の根幹をなす記憶能力の理解は,人間とLLM双方において重要である。
- LLMの学習データへのアクセス制限から,モデルごとの個別研究にとどまり,普遍性と特異性の区別が困難であった。
- 複数モデル系列を用いて,記憶メカニズムの普遍的理解とモデルごとの差異を明らかにすることを目指す。
- モデルサイズと記憶率の関係が対数線形にスケールすること,および記憶されたシーケンスが圧縮可能であることが示された。
- 記憶されたシーケンスの頻度とドメイン分布において,モデル間で共通のパターンが確認された。
- 内部レベルでは,LLMが摂動を除去できる一方,記憶されたシーケンスはより敏感であり,重要なヘッドの分布にモデル系列特有の特徴が認められた。
クロスシナリオにおける非ペアデータを用いた画像雨除去適応:スーパーピクセル構造事前知識と多段階疑似雨合成 [cs.CV, cs.AI, cs.GR, cs.LG, cs.MM]目的:画像雨除去における,ドメイン外のシナリオへの適応
- 画像雨除去は,屋外監視や自動運転などの低レベルコンピュータビジョンの基礎技術である。
- 深層学習は効果的だが,未知のシナリオでは性能が著しく低下する。
- 現実世界の雨の複雑な物理的特性と,合成データの乖離を解消する。
- 提案手法は,ターゲットドメインのペアデータなしで,雨が除去された背景画像のみを利用する。
- ソースドメインから安定した構造的特徴を抽出し,ターゲット背景との類似性により構造を整列させる。
- 多段階ノイズ生成によるリアルな雨粒のシミュレーションにより,性能向上と学習の高速化を実現した。
変動応答構造による最適メモリ符号化 [cs.NE]目的:最適メモリ符号化手法
- 物理系を利用した情報処理への応用が期待され,低消費電力な計算の実現に貢献する。
- 入力符号化が十分に理解されておらず,性能向上のボトルネックとなっている。
- システムの変動応答構造に基づき,タスク特化的なメモリ性能を最大化する符号化を確立する。
- 最適な入力符号化が,システムの変動応答構造によって幾何学的に決定されることが示された。
- 応答に基づく最適メモリ符号化(ROME)が,固定された電力制約下で線形メモリを最大化する入力方向の解析的基準として導出された。
- ROMEは,バックプロパゲーションによるエンコーダ最適化と同等であり,タスク依存の特徴混合と内部ノイズのトレードオフが明らかになった。
より深く考える,より長くはない:合成汎化のための深さ再帰型Transformer [cs.CL, cs.LG, cs.AI, cs.CL]目的:合成的汎化能力の向上
- Transformerは自然言語処理の基盤技術であり,様々なタスクで高い性能を発揮している。
- Transformerの固定された計算深さは,複雑な推論を必要とするタスクへの汎化を制限する。
- 可変の深さで推論可能な深さ再帰型Transformerを開発し,この問題を解決する。
- 深さ再帰型Transformerは,パラメータ数を増やさずに計算深さを変えることで,より深い推論を可能にした。
- グラフ到達可能性,ネストされたブール論理,非構造化関係テキストの3つのタスクにおいて,性能がタスクの複雑さに応じて改善された。
- タスク固有の知覚インターフェースとタスク不変の再帰的推論コアの相互作用が,OOD汎化に重要な役割を果たすことが示された。
LipsAM:オーディオ信号処理のためのリプシッツ連続な振幅変調器,およびプラグアンドプレイ逆響除去への応用 [cs.RO, cs.HC, cs.SD, cs.LG]目的:オーディオ信号処理のためのリプシッツ連続な振幅変調器の提案
- 深層学習の信頼性向上は重要である。リプシッツ連続性は信頼性を保証する指標となりうる。
- オーディオ処理向け深層学習へのリプシッツ連続性の応用は遅れており,既存研究との相性が課題である。
- 振幅変調器の構造を改良し,リプシッツ連続性を満たすことで安定性を高める。
- 提案手法LipsAMは,振幅変調器がリプシッツ連続性を満たすための十分条件を満たす。
- LipsAMをプラグアンドプレイ逆響除去アルゴリズムに適用した結果,安定性の向上が確認された。
- 数値実験により,提案アーキテクチャの有効性が実証された。
ミラージュ:視覚的理解の錯覚 [cs.MA, cs.AI]目的:マルチモーダルAIシステムの視覚言語推論メカニズムの解明
- AI技術は様々な分野で活用され,その性能向上は重要である。
- 視覚言語推論のメカニズムが十分に理解されていない。
- AIシステムの誤った推論を防ぐ評価方法の確立を目指す。
- マルチモーダルAIシステムは,存在しない画像に対しても詳細な説明を生成する「ミラージュ推論」を行うことが判明した。
- 画像入力なしでも高いスコアを獲得し,視覚情報の必要性を疑問視する結果が得られた。
- 明示的に推測を指示することで,より慎重な応答が得られ,ミラージュ推論との違いが明らかになった。B-Cleanという新たな評価手法を提案した。
AIトークン先物市場:計算資源のコモディティ化とデリバティブ契約設計 [cs.AI, econ.GN, q-fin.EC]目的:AIトークンのコモディティとしての属性分析と,標準化された先物契約の設計
- AIの普及に伴い,推論に消費されるトークンが新たなコモディティとして注目されている。
- トークンの価格変動リスクが,AIサービスを提供する企業のコストに影響を与える。
- トークンの価格変動リスクを軽減するための金融商品の設計を目指す。
- 提案するトークン先物契約は,AIサービス企業の計算コストの変動性を大幅に抑制することがシミュレーションで示された。
- 特に,需要急増のシナリオにおいて,62%から78%のコスト変動性低減効果が期待できる。
- GPU計算資源の先物取引の実現可能性や,トークン先物市場の規制枠組みについても検討された。
自律型AIエージェントのための推論系統:状態チェックポイントと実行トレースを超えた構造化された行動分析 [cs.MA, cs.AI, cs.DC, cs.SE]目的:AIエージェントの推論行動の構造化された系統の分析
- AIの自律化が進むにつれ,行動分析の重要性が高まっている。
- 既存のツールでは,推論の根拠を体系的に記録・分析できない。
- エージェントの行動原理を理解し,信頼性を向上させる。
- 本研究では,意図,観察,推論を記録する「Agent Execution Record (AER)」を提案する。
- AERを用いることで,推論パターンの抽出や信頼性評価が可能となる。
- 実配備された原因究明エージェントへの適用により,評価方法を確立した。
