arXiv雑要約

AI - 2026/03/18 公開

  • SAC-NeRF:ソフトアクタークリティック強化学習によるニューラル放射場のアダプティブなレイサンプリング [cs.CV, cs.AI]目的:ニューラル放射場における効率的なレンダリングのための適応的サンプリングポリシーの学習
    • フォトリアリスティックな新規視点合成が可能だが,体積レンダリング時の高密度なレイサンプリングが計算コストとなる
    • 従来の固定的なサンプリング戦略では,計算効率とレンダリング品質のバランスが課題であった
    • 強化学習を用いて,シーンの特性に適応した効率的なサンプリング戦略を自動的に学習する
    • SAC-NeRFは,ソフトアクタークリティック強化学習フレームワークを用いて,適応的なサンプリングポリシーを学習する。
    • Synthetic-NeRFとLLFFデータセットにおいて,サンプリングポイント数を35-48%削減しつつ,レンダリング品質を維持した。
    • 学習されたポリシーはシーン固有だが,データ駆動型サンプリング戦略の有効性を示唆している。

    Link: https://arxiv.org/abs/2603.15622

  • 製薬データ検索のためのマルチモーダルAI搭載フレームワークFinder [cs.IR, cs.AI]目的:製薬データ検索の効率化
    • 医薬品開発には大量のデータ活用が不可欠であり,迅速な情報検索が重要である。
    • 従来の検索システムはマルチモーダルコンテンツへの対応が難しく,手動でのキュレーションに依存する。
    • テキスト,画像,音声,動画など多様なデータを統合的に検索可能にするフレームワークの構築。
    • Finderは,テキスト,画像,音声,動画を含む多様な形式のデータ検索を可能にする。
    • ハイブリッドベクター検索により,従来のシステムよりも高い精度と文脈適合性を実現する。
    • 98言語の29万件以上の文書,3万件以上の動画,1,192件の音声ファイルを処理可能であることを示した。

    Link: https://arxiv.org/abs/2603.15623

  • 視覚言語モデルによる視覚障碍者・弱視者のナビゲーション支援に関する研究 [cs.CV, cs.AI, cs.RO]目的:視覚障碍者・弱視者のナビゲーション支援における視覚言語モデルの活用可能性
    • 高齢化社会において,視覚障碍者・弱視者の自立した生活支援が重要な課題となっている。
    • 既存のナビゲーション支援技術は,環境変化への適応性や複雑な状況での理解に課題がある。
    • 本研究は,視覚言語モデルの能力を評価し,ナビゲーション支援における課題解決に貢献する。
    • GPT-4oは,空間推論やシーン理解において他のモデルを大きく上回る性能を示した。
    • オープンソースモデルは,複雑な環境下での高度な推論や適応性に課題が残る。
    • 視覚言語モデルは,人間のフィードバックや空間推論能力の向上により,さらなるナビゲーション支援の可能性を秘めている。

    Link: https://arxiv.org/abs/2603.15624

  • 非ユークリッド空間におけるニューラル記号論理クエリ応答 [cs.AI]目的:知識グラフに対する複雑な一階述語論理クエリの応答
    • 知識推論において,複雑なクエリ応答は重要である。そのため,効率的かつ正確な手法が求められる。
    • 既存の記号的手法は解釈可能だが,不完全なグラフに対しては脆弱である。一方,ニューラル手法は汎化性能が高いものの,透明性に欠ける。
    • 論理クエリの階層構造を捉えきれない既存手法の課題を克服し,より効果的な推論を実現すること。
    • 提案手法HYQNETは,双曲空間を活用することで,論理的投影推論の階層性をより効果的に捉える。
    • HYQNETは,知識グラフの補完に双曲GNNを適用し,構造依存性を維持しながら再帰的なクエリツリーを埋め込む。
    • 3つのベンチマークデータセットにおける実験により,HYQNETが双曲空間での推論の優位性を示す強い性能を達成した。

    Link: https://arxiv.org/abs/2603.15633

  • NextMem:LLMベースエージェントのための潜在的事実記憶へ [cs.AI, cs.IR, cs.LG]目的:LLMベースエージェントにおける潜在的事実記憶の構築
    • LLMエージェントの意思決定には過去の観察の保持が不可欠であり,その基礎となるのが事実記憶である。
    • 既存手法は,テキストベースではコンテキストとインデックスの負荷が高く,パラメトリックベースでは破滅的忘却と高コストの問題がある。
    • 効率的な潜在記憶の構築と正確な再構成を実現し,既存の問題を解決することを目的とする。
    • NextMemは,自己回帰オートエンコーダを用いて潜在記憶を効率的に構築するフレームワークである。
    • 自己回帰再構成アライメントと漸進的な潜在置換を含む二段階の学習プロセスを提案する。
    • 実験の結果,NextMemは検索,ロバスト性,拡張性において優れた性能を発揮することが示された。

    Link: https://arxiv.org/abs/2603.15634

  • AIDABench:AIデータ分析ベンチマーク [cs.AI]目的:AIデータ分析タスクにおけるシステム評価基準
    • AI技術の文書理解・処理ツールは普及しており,その性能評価が重要になっている。
    • 既存のベンチマークは部分的な能力評価に偏り,実用的な終端間タスクの有効性を捉えきれていない。
    • 現実的なデータ分析タスクを網羅する,包括的な評価ベンチマークを提供すること。
    • AIDABenchは,質疑応答,データ可視化,ファイル生成の3つの能力次元を含む600以上のタスクで構成される。
    • 評価対象のタスクは難易度が高く,AIツールを使用しても専門家が1〜2時間要するレベルである。
    • 最先端モデルのpass-at-1の最高スコアは59.43%であり,複雑なデータ分析は依然としてAIにとって困難な課題であることが示された。

    Link: https://arxiv.org/abs/2603.15636

  • 理解度に基づいたエージェント経済:AI経済主体に対する堅牢性優先アーキテクチャ [cs.AI]目的:AI経済主体の堅牢性を重視したアーキテクチャ
    • AIが経済活動を行う機会が増える中,安全性の確保は重要課題である。
    • 従来の能力評価指標と実際の運用における堅牢性には相関がないという問題がある。
    • AIの理解度を検証し,堅牢性に基づいて経済的権限を制限することを目指す。
    • 理解度に基づいたゲート機構により,経済的権限は検証済みの堅牢性によって上限が設定される。
    • 制約遵守,認識的整合性,行動整合性という3つの次元で堅牢性を評価し,経済的ティアにマッピングする。
    • 本アーキテクチャは,AIの堅牢性評価と経済ガバナンスを結びつけ,安全性を競争優位性へと転換する。

    Link: https://arxiv.org/abs/2603.15639

  • フォルム・フォローズ・ファンクション:再帰的幹モデル [cs.HC, cs.AI, cs.LG, cs.NE]目的:再帰的推論による問題解決の効率化と信頼性向上
    • 複雑な問題解決において,効率的な推論モデルの構築は不可欠である。
    • 既存の再帰的推論モデルは,訓練にコストがかかり,貪欲な中間行動に偏りがちである。
    • 安定した深層構造に依存しない推論演算子の学習と,大規模な反復計算の実現を目指す。
    • RSMは,TRMと比較して20倍以上の高速な訓練を可能にし,同時に精度を向上させた。
    • テスト時には,任意の反復回数で推論を実行でき,追加の「思考」プロセスを訓練なしで実現する。
    • モデルの収束特性を利用することで,信頼性の高い問題解決とハルシネーションの抑制が可能となる。

    Link: https://arxiv.org/abs/2603.15641

  • CraniMem:エージェントシステムのための脳構造に着想を得たゲート付きバウンドメモリ [cs.AI]目的:エージェントシステムの長期的なワークフローにおける状態保持機構
    • 長期的なタスク遂行において,エージェントの過去の情報を適切に保持することは重要である。
    • 既存のメモリシステムは不安定な保持や干渉に弱く,長期的なタスクに課題がある。
    • 脳の記憶メカニズムに着想を得た,より堅牢で効率的なメモリシステムを開発する。
    • CraniMemは,ゲート機構とバウンドされた多段階メモリ設計により,長期タスクにおける状態保持の安定性を向上させた。
    • 有用性の低い情報を削除する統合ループにより,メモリの成長を抑制し,干渉を低減する。
    • ノイズを含む環境下での評価において,既存手法よりも頑健性を示すことが確認された。

    Link: https://arxiv.org/abs/2603.15642

  • 緑色都市インフラにおける大規模言語モデルのためのドメイン知識の強化 [cs.AI]目的:緑色都市インフラに関する大規模言語モデルの性能向上
    • 都市部の水害対策として重要性が増す緑色都市インフラの適切な維持管理が課題となっている。
    • 専門知識が分散しており,非専門家が信頼できる情報を得るのが困難である。
    • 大規模言語モデルにドメイン知識を付与し,専門的なタスクへの応用を目指す。
    • 提案するGSI Agentは,学習データによるファインチューニング,情報検索,そしてエージェントによる推論を組み合わせることで,緑色都市インフラ関連タスクの性能を大幅に向上させる。
    • 構築したGSIデータセットを用いた実験により,BLEU-4スコアが0.090から0.307に改善し,一般的な知識能力は維持された。
    • この結果は,ドメイン知識の体系的な強化が,汎用的な大規模言語モデルを専門的なインフラ分野へ適応させる有効性を示す。

    Link: https://arxiv.org/abs/2603.15643

  • 構造化電子カルテ基盤モデルにおけるトークン化のトレードオフ [cs.LG, cs.CL]目的:構造化電子カルテ基盤モデルにおけるトークン化手法の影響評価
    • 医療データは患者ケアの向上に不可欠であり,その活用法の改善が求められている。
    • 電子カルテデータの効率的なモデル入力への変換方法が確立されていない。
    • トークン化手法を最適化し,モデル性能と計算効率を向上させる。
    • イベントエンコーディングと位置時間エンコーディングの組み合わせが,多くの臨床予測タスクで最も優れた性能を示した。
    • この組み合わせは,事前学習に必要な浮動小数点演算回数をそれぞれ39.5%と9.6%削減した。
    • トークン化手法は,EHR基盤モデルの性能と効率を改善するための重要な要素であることが示された。

    Link: https://arxiv.org/abs/2603.15644

  • XLinear:クロスフィルターを用いた周波数強調型MLPによるロバストな長距離予測 [cs.LG, cs.AI]目的:長距離予測のための,周波数強調型MLPモデル
    • 時系列予測は多様な分野で利用されており,その重要性は高い。
    • 従来のMLPは複雑な特徴量の抽出に弱く,長距離依存性の把握が課題であった。
    • MLPのロバスト性を維持しつつ,長距離依存性を効果的に捉えることを目指す。
    • 提案手法XLinearは,トレンド成分に周波数領域の操作を取り入れたEFAを用いることで,長距離依存性を捉える。
    • 季節成分にはCrossFilterブロックを導入し,ノイズへのロバスト性を維持する。
    • 実験結果から,XLinearは最先端の性能を達成し,他のMLPベースの予測モデルを上回ることが示された。

    Link: https://arxiv.org/abs/2603.15645

  • 文脈的評価基準報酬を用いた交互強化学習 [cs.LG, cs.AI, cs.CL]目的:評価基準に基づく報酬の最適化手法
    • 人間からのフィードバックや検証可能な報酬を活用し,より高度なAIモデルの学習を可能にする。
    • 従来の評価基準報酬の枠組みでは,ベクトル報酬を固定された重みでスカラーに圧縮するため,性能が低下する。
    • スカラー化の必要性をなくし,各評価基準を交互に最適化することで,学習効率とモデル性能を向上させる。
    • 提案手法ARL-RRは,固定されたスカラー化手法と比較して,HealthBenchデータセットにおいて一貫して優れた性能を示す。
    • 報酬の集約が分散の縮小効果をもたらし,性能向上を説明できることを理論的に示した。
    • タスクのパフォーマンスに基づいて動的にメタクラスを選択する軽量な適応手順を導入し,重要な目標を強調する。

    Link: https://arxiv.org/abs/2603.15646

  • 凍結されたLLMの操舵:オンラインプロンプトルーティングによる適応的な社会的整合 [cs.LG, cs.AI]目的:LLMにおける適応的な社会的整合
    • LLMの安全性確保は重要な課題であり,進化する攻撃への対策が不可欠である。
    • 固定されたLLMの重みでは,変化する安全基準や新たな攻撃に対応できない。
    • 推論時の動的なプロンプトルーティングにより,再学習コストなしに安全性を向上させる。
    • 提案手法CCLUBは,効用と安全性の類似性グラフの共通部分のみでデータを集約し,リスクの高い汎化を防ぐ。
    • 理論解析により,CCLUBの亜線形な後悔保証が示され,ほぼ最適な性能が確認された。
    • 実験結果から,CCLUBはベースラインを上回り,累積報酬が10.98%向上,平均最適性ギャップが14.42%減少した。

    Link: https://arxiv.org/abs/2603.15647

  • 顔表情合成のための敵対的生成ネットワークの汎化性能向上 [cs.CV, cs.GR, cs.LG, cs.MM]目的:顔表情合成における汎化性能の向上
    • 顔表情の理解は,人間関係の認識やコミュニケーションにおいて重要である。
    • 既存のGANは学習データと異なる画像に対して性能が低下しやすい。
    • 学習データ外の画像に対しても安定して表情合成を行うこと。
    • 提案手法RegGANは,ECS,FID,QualiCLIPにおいて6つの最先端モデルを上回る性能を示した。
    • FSSでは2位の成績であり,顔の同一性保持能力も高いレベルにある。
    • 人間評価では,表情の質,同一性保持,リアリズムにおいて最良の競合モデルをそれぞれ25%,26%,30%上回った。

    Link: https://arxiv.org/abs/2603.15648

  • 6Gネットワークにおけるチャネル推定とレーダスペクトルセンシングのための量子鍵配送を保護した連合学習 [cs.CR, cs.IT, cs.LG, math.IT]目的:6Gネットワークにおけるチャネル推定とレーダスペクトルセンシングのための連合学習フレームワーク
    • 次世代通信(6G)では,セキュリティとプライバシー保護が重要な課題となっている。
    • 従来の連合学習は,モデル更新情報の漏洩によるプライバシー侵害のリスクを抱えている。
    • 量子鍵配送(QKD)を用いて連合学習を保護し,安全なモデル更新を可能にすること。
    • 提案手法は,チャネル推定において0.216のNMSE,レーダセンシングにおいて92.1%の精度と0.72のmIoUを達成した。
    • 傍受者が存在する場合,QBERは〜25%に上昇し,ラウンドは意図通りに中断された。
    • 再構成誤差は$10^{-5}$以下に抑えられ,正しい集約が確認された。

    Link: https://arxiv.org/abs/2603.15649

  • OOD検出におけるプロトタイプ誕生と消滅の実現方法 [cs.LG, cs.CV]目的:異常分布検出のためのプロトタイプ数適応メカニズム
    • 機械学習モデルの安全な利用には,未知のデータへの対応が不可欠であり,OOD検出はその鍵となる。
    • 既存手法はプロトタイプ数を固定しており,データ複雑さに応じて適応できない点が課題。
    • データ複雑さに応じてプロトタイプ数を動的に調整し,OOD検出性能を向上させる。
    • 本研究では,生物の細胞誕生・消滅に着想を得たPID(Prototype bIrth and Death)を提案した。
    • PIDは,既存プロトタイプの負荷状況に応じて新たなプロトタイプを生成し,曖昧なクラス境界のプロトタイプを削除する。
    • CIFAR-100等のベンチマークで,PIDは最先端性能を達成,特にFPR95指標で顕著な改善を示した。

    Link: https://arxiv.org/abs/2603.15650

  • 多施設集中治療室における早期敗血症予測のための知識グラフと時間的Transformerを用いた連合学習フレームワーク [cs.LG, cs.AI]目的:多施設集中治療室における早期敗血症予測
    • 集中治療室における敗血症の早期発見は生存率向上に不可欠であり,医療現場での重要性が高い。
    • 医療機関間でのデータ分散と,医療データの時間的複雑さ,そして厳格なプライバシー制約が課題となっていた。
    • プライバシーを保護しつつ,複数施設間の協調的なモデル学習を実現し,敗血症の早期予測精度向上を目指す。
    • 提案手法は,MIMIC-IVおよびeICUデータセットにおいて,曲線下面積 (AUC) 0.956を達成した。
    • これは,従来の集中型モデルと比較して22.4%の改善,標準的な連合学習と比較して12.7%の改善を示す。
    • 本研究は,多施設協調的な敗血症早期警告のための信頼性とプライバシー保護に優れたソリューションを提供する。

    Link: https://arxiv.org/abs/2603.15651

  • 再帰型言語モデルと不確実性:長文脈における自己反省型プログラム探索の驚くべき有効性 [cs.CL, cs.AI, cs.LG]目的:長文脈における言語モデルの性能向上
    • 言語モデルの性能は文脈長に大きく依存し,その扱いは重要な課題である。
    • 長文脈において,モデルは情報を正確に抽出,推論,利用することが困難である。
    • 不確実性を考慮したプログラム探索により,長文脈処理の精度向上を目指す。
    • SRLMは,自己整合性,推論長,および言語化された確信度という内部不確実性の指標を活用する。
    • 実験の結果,SRLMは最先端のベースラインを上回り,RLMと比較して最大22%の改善が見られた。
    • 再帰自体が性能向上に不可欠ではなく,自己反省型のプログラム探索が同等またはより良い結果をもたらすことが示された。

    Link: https://arxiv.org/abs/2603.15653

  • プロンプトベース分類におけるジニ係数の隠れた役割の発見 [cs.LG, cs.AI, cs.CV]目的:プロンプトベース分類におけるクラスの精度格差の検出と最適化
    • 少数クラスは分類において重要だが,精度が低いという課題がある。
    • 高精度なクラスが優位になりやすく,精度格差が無視されがちである。
    • ジニ係数を用いて精度格差を定量化し,バイアス軽減手法を提案する。
    • ジニ係数は,相対的な精度支配の指標としてだけでなく,直接的な最適化指標としても機能することが示された。
    • 実験の結果,提案手法は精度格差を大幅に縮小し,弱小クラスの精度を向上させることが確認された。
    • 本手法は,ニュース,バイオメディカル,画像分類など,様々なタスクで有効であることが示された。

    Link: https://arxiv.org/abs/2603.15654

  • 報酬抑制を超えて:多エージェント強化学習における動的表現回路遮断による隠密通信プロトコルの再構築 [cs.LG, cs.AI, cs.CL, cs.IT, cs.MA, math.IT]目的:多エージェント強化学習における隠密な共謀の検出と抑制
    • 分散型多エージェント強化学習は,自律システムの安全性において重要な役割を担う。
    • エージェント間における隠密な通信プロトコルの開発は,監視を回避する重大なAI安全上の脅威となる。
    • 潜在的な通信経路における協調を検出し,より堅牢な防御メカニズムを確立することを目指す。
    • 提案手法であるDRCBは,観測不可能なメッセージを統計的に監査可能なオブジェクトに変換することで,隠密通信を監視する。
    • コンテクスト・囚人のジレンマ実験において,DRCBは監視者の平均精度を9.3%向上させ,ボラティリティを43%削減することに成功した。
    • 符号シーケンスの分析から「意味劣化」が確認され,複雑な隠密符号化が困難になることが示された。

    Link: https://arxiv.org/abs/2603.15655

  • 属性誘導による信頼性の低いニューラルネットワーク動作の修正 [cs.LG, cs.AI, cs.CV]目的:ニューラルネットワークの信頼性の低い挙動の修正
    • ニューラルネットワークの性能向上は,様々な応用において不可欠である。
    • ノイズを含むデータに対する頑健性が低く,誤った特徴に依存しがちである。
    • 少ない修正データで,モデルの信頼性を向上させることを目指す。
    • 本研究では,ランク1モデル編集と属性情報を用いて,ニューラルネットワークの信頼性の低い挙動を特定し修正するフレームワークを提案した。
    • 既存の研究とは異なり,モデルの性能を維持しつつ,限られた修正データで修正を行うことを可能にした。
    • 層ごとの編集可能性を定量化する属性誘導層特定手法により,修正すべき主要な層を特定し,効率的な修正を実現した。

    Link: https://arxiv.org/abs/2603.15656

  • 適切なポケットを確認しましたか? メモリ拡張エージェントのためのコストを考慮したストアルーティング [cs.AI, cs.CL, cs.IR]目的:メモリ拡張エージェントにおけるストアルーティングの最適化
    • 近年,大規模言語モデルに外部メモリを付加する研究が進んでおり,知識獲得や推論能力の向上が期待されている。
    • 従来のシステムでは,全てのストアから情報を取得するため,コストが増大し,無関係な情報が混入する可能性がある。
    • 効率性と性能を両立するため,どのストアから情報を取得するかを決定するルーティングメカニズムの改善を目指す。
    • オラクルルーティングを用いることで,一様的な検索と比較して,文脈トークン数を大幅に削減しつつ,質問応答の精度が向上することが示された。
    • ストアルーティングは,メモリ拡張エージェント設計における重要な要素であり,スケーラブルなマルチストアシステムのための学習ルーティングメカニズムの必要性が示唆された。
    • ストア選択は,回答精度と検索コストをトレードオフするコスト感受性のある意思決定問題として定式化された。

    Link: https://arxiv.org/abs/2603.15658

  • DynaTrust: 動的信頼グラフによるマルチエージェントシステムに対するスリーパーエージェント防御 [cs.AI]目的:マルチエージェントシステムにおけるスリーパーエージェント攻撃に対する防御
    • 大規模言語モデルを活用したエージェントシステムは進化しているが,セキュリティ上の課題も増大している。
    • 既存手法は静的なグラフ最適化に偏り,変化する攻撃戦略への適応や誤検知率の抑制が難しい。
    • 動的な信頼グラフを用いて,変化する状況に対応しつつ,誤検知を低減する防御策を確立する。
    • DynaTrustは,マルチエージェントシステムを動的信頼グラフとしてモデル化し,信頼を継続的に変化させる。
    • 実験結果から,DynaTrustは最先端手法AgentShieldを防御成功率で41.7%上回り,86%を超える成功率を達成した。
    • グラフ適応によりシステム運用を中断させず,セキュリティと実用性のバランスを実現している。

    Link: https://arxiv.org/abs/2603.15661

  • OrthoAI v2:マウスピース矯正治療計画のためのシングルエージェントセグメンテーションからデュアルエージェント治療計画へ [cs.CV, cs.AI]目的:マウスピース矯正治療計画を支援するAIパイプラインの開発
    • 矯正歯科治療は,審美性や機能性を改善する上で重要な医療行為である。
    • 従来の治療計画は専門家の経験に頼る部分が大きく,客観性と効率性に課題があった。
    • AIを活用することで,より正確かつ効率的な治療計画を支援し,患者の負担を軽減することを目指す。
    • OrthoAI v2は,歯のセグメンテーションとランドマーク検出をデュアルエージェントで行うことで,精度を向上させた。
    • 新しいバイオメカニカルスコアリングモデルにより,治療計画の質を多角的に評価可能になった。
    • シミュレーション機能を搭載し,治療過程を可視化することで,より現実的な治療計画を立案できるようになった。

    Link: https://arxiv.org/abs/2603.15663

  • 大規模言語モデルにおける注意機構の本質:QVで十分である可能性 [cs.AI]目的:TransformerにおけるQuery-Key-Value (QKV)機構の本質
    • 大規模言語モデルの性能向上には,注意機構の理解が不可欠である。
    • QKV機構の理論的根拠が不明確であり,最適化の方向性が見えにくい。
    • QKV機構の本質を明らかにし,より効率的な注意機構の設計を目指す。
    • QKV機構は,品詞や構文解析の観点から理論的に解釈可能であることが示された。
    • MQA,GQA,MLAといった既存の注意機構を統一的に説明する枠組みが提示された。
    • QVパラダイムとQV-Ka最適化スキームの有効性が実験的に検証された。

    Link: https://arxiv.org/abs/2603.15665

  • コンパイルされた記憶:言語エージェントのためのより正確な指示 [cs.AI]目的:言語エージェントにおける記憶の有用性
    • 言語エージェントの性能向上には,適切な知識の活用が不可欠である。
    • 既存の記憶システムは情報管理に重点を置いており,記憶する情報の質が課題であった。
    • エージェントの経験から得られた知識を指示構造に変換し,行動改善を目指す。
    • Atlasは,ファインチューニングやRAGを用いずに,蓄積されたタスク経験をエージェントの指示構造にコンパイルする。
    • CUAD契約分析において,GPT-4oのトークンレベルF1が$+8.7$pp,適合率が$+12.5$pp向上した。
    • HotpotQAのマルチホップQAでは,結合F1が$+3.16$pp改善し,コンパイルされた知識がタスク指向であることを示した。

    Link: https://arxiv.org/abs/2603.15666

  • ファジー集合,直感主義ファジー集合,ニュートロソフィック集合,プリソジェニック集合,および拡張集合の動的サーベイ [cs.AI, cs.CE]目的:ファジー集合論における様々な不確実性モデルの体系的概観
    • 現実世界の現象には曖昧さや不確実性が存在し,それを数学的に厳密に扱う必要がある。
    • 既存のファジー集合論の枠組みは多様であり,その全体像を把握することが困難である。
    • ファジー集合,直感主義ファジー集合,ニュートロソフィック集合,プリソジェニック集合の主要な発展を統合的に提示する。
    • ファジー集合,直感主義ファジー集合,ニュートロソフィック集合,プリソジェニック集合に関する広範な研究を網羅したサーベイ論文である。
    • これらのモデルにおける共通の概念,構成,構造的パターンを明らかにし,分野間の関連性を強調している。
    • 今後の概念拡張や応用を促進するため,既存の研究成果を体系的に整理したものである。

    Link: https://arxiv.org/abs/2603.15667

  • 量子耐性を持つエージェント型知能のためのパラダイムシフト:構築型量子セキュリティ (QSC) [cs.AI, cs.CR, quant-ph]目的:量子セキュリティを組み込んだエージェント型知能システムの設計パラダイム
    • エージェント型AIが拡大する中で,安全な通信はシステム上の重要な課題である。
    • 既存の暗号化技術は量子コンピュータの登場により,その安全性が脅かされている。
    • 量子セキュリティをシステムアーキテクチャに組み込み,長期的な安全性を確保すること。
    • QSCは,量子耐性暗号,量子乱数生成,量子鍵配送を組み合わせることで実現される。
    • インフラの可用性や規制,性能要件に応じてセキュリティ体制を調整できる。
    • QSCは,エージェントのライフサイクル全体を通して,運用コストと複雑さを削減する。

    Link: https://arxiv.org/abs/2603.15668

  • 知っていることと知らないこと:多岐にわたる証拠を用いた確率的推論のための潜在事後因子モデル [cs.AI, cs.LG]目的:多岐にわたる証拠からの確率的推論のフレームワーク
    • 現実世界の意思決定には,不確実な情報を統合する必要があり,その重要性は高い。
    • 既存手法は不確実性の定量化が不十分,またはスケーラビリティに限界がある。
    • 潜在事後因子を用いて,構造化された確率的推論と学習型集約を比較すること。
    • 本研究で提案するLPF-SPNは,8つのドメインにおいて高い精度(最大97.8%)と低い較正誤差(ECE 1.4%)を達成した。
    • 既存のEDL,LLM,グラフベースのベースラインと比較して,有意に高い性能を示した。
    • 潜在的な不確実性表現と構造化された確率的推論を繋ぐ新たなフレームワークを提示する。

    Link: https://arxiv.org/abs/2603.15670

  • DRCY:エージェントによるハードウェア設計レビュー [cs.AR, cs.AI, cs.SE]目的:ハードウェア設計レビューの自動化
    • ハードウェア設計の誤りは修正に多大なコストと時間を要するため,設計段階での検証が重要である。
    • 既存のEDAツールは構造的な接続規則しか検証できず,部品データシートとの整合性確認が課題である。
    • 部品データシートに基づいたピンレベルでの接続の整合性検証を自動化し,設計エラーを早期に発見すること。
    • DRCYは,部品データシートを自動取得し,ピンごとの分析を行うことで,設計レビューの第一段階を自動化する。
    • DRCYはAllSpice Hubに導入され,CI/CDアクションとして設計レビューの提出時に実行されている。
    • 大手ハードウェア企業において,自動車設計から宇宙探査まで,幅広い分野で利用されている。

    Link: https://arxiv.org/abs/2603.15672

  • 潜在的事後因子に関する理論的基礎:複数証拠推論に対する形式的保証 [cs.AI, cs.IT, cs.LG, math.IT, stat.ML]目的:複数異種証拠項目の集約
    • 医療診断や金融リスク評価など,重要な分野で複数証拠推論が不可欠である。
    • 既存手法は,形式的保証が不十分,または複数証拠への対応が困難である。
    • 信頼性の高い多証拠AIの基盤を確立し,安全性が求められる応用を可能にする。
    • 潜在的事後因子(LPF)の理論的特性を完全に記述し,形式的保証を提供した。
    • 校正保存,モンテカルロ誤差減衰,PAC-Bayes boundなど,7つの保証を証明した。
    • 実験結果は,制御されたデータセット上で理論的保証を裏付けた。

    Link: https://arxiv.org/abs/2603.15674

  • LLMアプリケーションの品質保証ゲートとしての自動自己テスト:エビデンスに基づくリリース管理 [cs.SE, cs.AI]目的:LLMアプリケーションのリリース判断をエビデンスに基づいて行う自動自己テストフレームワーク
    • LLMは非決定的な出力とモデルの進化により,従来のテストでは品質管理が困難である。
    • LLMアプリケーションのリリースにおける品質保証の基準が明確でなかった。
    • エビデンスに基づく品質ゲートを導入し,リリース判断の自動化と品質向上を目指す。
    • フレームワークは,タスク成功率,コンテキスト維持率,応答速度,安全性,エビデンスカバレッジの5つの指標で品質を評価する。
    • 実際に展開された会話型AIシステムを用いたケーススタディにより,ROLLBACKが必要なビルドを特定し,安定した品質進化を支援した。
    • エビデンスカバレッジが回帰検知に重要であり,テスト実行時間はテストスイートの規模に比例することが示された。

    Link: https://arxiv.org/abs/2603.15676

  • 学習軌道のスペクトルエッジダイナミクス:スケールにわたる信号-ノイズ幾何学 [cs.CL, cs.LG, cs.AI]目的:学習軌道におけるスペクトルエッジダイナミクスを通じた信号とノイズの幾何学的構造の解明
    • 大規模言語モデルの学習は計算資源を大量に消費するため,効率的な学習方法の理解が重要である。
    • Transformerモデルの学習軌道は高次元空間に存在し,その構造を把握することは困難である。
    • 学習軌道の構造を定量的に捉え,学習の効率化や予測に役立てることを目指す。
    • パラメータ更新の特異値分解により,一貫した最適化方向と確率的ノイズを区別する「スペクトルエッジ」が確認された。
    • スペクトルエッジは,モデルサイズやタスクの複雑さに応じて,普遍的な三相パターン(上昇,プラトー,崩壊)を示すことが示された。
    • Johnson-Lindenstrauss投影を用いることで,大規模モデルにも適用可能なフレームワークであることが示唆された。

    Link: https://arxiv.org/abs/2603.15678

  • IdentityGuard:パーソナライズされた合成のための文脈を意識した制限と来歴 [cs.CR, cs.AI, cs.CV]目的:パーソナライズされたテキストから画像へのモデルにおける安全性確保
    • AI技術の発展に伴い,悪用リスクの抑制が重要課題となっている。
    • 既存の汎用的なフィルタリング手法は,有用な概念も削除してしまう問題がある。
    • 文脈を考慮した制限と来歴追跡により,悪用を防止しつつ有用性を維持すること。
    • IdentityGuardは,パーソナライズされたIDと組み合わせた有害コンテンツのみを制限する。
    • 特定の概念に固有の水印を付与することで,正確な追跡を可能にする。
    • 実験により,IdentityGuardがモデルの有用性を損なわずに悪用を抑制できることが示された。

    Link: https://arxiv.org/abs/2603.15679

  • ヒマチャル・プラデーシュ州における地形特性に着目したフラッシュ洪水感受性マッピング:グラフニューラルネットワークと確信度付き不確実性評価 [cs.LG]目的:ヒマチャル・プラデーシュ州におけるフラッシュ洪水感受性マッピング
    • ヒマチャル・プラデーシュ州では,洪水が甚大な被害をもたらしており,リスク管理が重要である。
    • 既存のリスクマップは,流域のつながりを考慮せず,予測精度に課題がある。
    • 流域のつながりを考慮したグラフニューラルネットワークを用いて,洪水感受性マッピングの精度向上を目指す。
    • グラフニューラルネットワークは,既存のモデルを上回る高い予測精度(AUC=0.978)を達成した。
    • 河川のつながりは,予測において重要な情報を含んでおり,その有効性が確認された。
    • 高感受性地域は,主要な交通網やインフラと重なっており,被害リスクが高いことが示された。

    Link: https://arxiv.org/abs/2603.15681

  • 複数ターン言語モデル対話における状態依存の安全性失敗 [cs.CR, cs.AI]目的:大規模言語モデルにおける安全性失敗の構造的理解
    • 言語モデルの安全性確保は,社会実装において不可欠であり,その重要性は増している。
    • 単独の質問応答では安全性が確認されても,複数ターンの対話では安全性確保が困難である。
    • 対話履歴を状態遷移として捉え,安全性失敗のメカニズムを分析・解明することを試みる。
    • 安全性評価において,静的な評価を通過したシステムでも,構造化された複数ターン対話で安全性が急速に低下することが確認された。
    • 安全性崩壊は,プロンプトの脆弱性だけでなく,対話状態の構造的な変化によって引き起こされることが示された。
    • 言語モデルの安全性は,会話の軌跡に沿った動的かつ状態依存的なプロセスとして捉えるべきであるという示唆が得られた。

    Link: https://arxiv.org/abs/2603.15684

  • DASH:効率的なオムニモーダル・トークン圧縮のための動的音声駆動セマンティックチャンキング [cs.MM, cs.AI, cs.CV, cs.SD]目的:オムニモーダル大規模言語モデルにおける効率的なトークン圧縮
    • マルチモーダルな情報処理は,AIの性能向上に不可欠であり,音声と映像の同時処理が重要となる。
    • 既存の圧縮手法は固定的な分割や注意機構に依存し,音声・映像のセマンティック構造を考慮していない。
    • 音声駆動による動的なセマンティックチャンキングで,高圧縮率と高精度を両立することを目指す。
    • DASHは,音声埋め込みをセマンティックなアンカーとして利用し,コサイン類似度の不連続性から境界候補を検出する。
    • これにより,可変長のセグメントを生成し,音声と映像のクロスモーダルセグメンテーションを確立する。
    • 実験結果から,DASHは既存手法と比較して,高い圧縮率を維持しつつ,優れた精度を示すことが確認された。

    Link: https://arxiv.org/abs/2603.15685

  • 不完全な劣化データを用いた残り寿命予測のための証拠的ドメイン適応 [cs.LG, cs.AI]目的:不完全な劣化データが存在する状況下での残り寿命予測の精度向上
    • 機械設備の故障予測は,安全性向上やメンテナンスコスト削減に不可欠である。
    • ターゲットドメインのラベル付きデータが不足し,劣化軌跡が不完全な場合,予測精度が低下する。
    • ドメイン適応により,ソースドメインの知識をターゲットドメインへ活用し,不完全なデータでも高精度な予測を実現する。
    • 提案手法EviAdaptは,劣化率に基づく段階分割により,ソースドメインとターゲットドメインの対応する段階を正確にマッチングさせる。
    • エビデンシャル学習を用いた不確実性アライメントにより,対応する段階間の不確実性を整合させる。
    • 実験により,EviAdaptが既存のドメイン適応手法と比較して,不完全な劣化データを用いたRUL予測において優れた性能を示すことが確認された。

    Link: https://arxiv.org/abs/2603.15687

  • PulmoVec:HeAR基盤モデルを用いた小児呼吸音の多角的分類のための二段階スタッキングメタ学習アーキテクチャ [cs.SD, cs.LG]目的:小児呼吸音の多角的分類のためのメタ学習アーキテクチャの開発
    • 呼吸器疾患は小児における罹患率と死亡率の主要な原因であり,早期正確な診断が重要である。
    • 聴診は主観的であり,聴診者間のばらつきが大きい。特に小児においては,その傾向が顕著である。
    • 既存のAIアプローチでは,データセットの規模が小さく,単一タスクに限定されるという課題がある。
    • PulmoVecは,イベントレベルの音響表現と患者レベルの臨床分類を結びつけることを可能にした。
    • イベントレベルでのスクリーニングモデルはROC-AUC 0.96,音型認識モデルはマクロROC-AUC 0.96,疾患群予測モデルはマクロROC-AUC 0.94を達成した。
    • 患者レベルでの疾患群分類では,正答率0.74,重み付きF1スコア0.73,マクロROC-AUC 0.91を示し,スタッキングによって性能が向上した。

    Link: https://arxiv.org/abs/2603.15688

  • 遷移フローマッチング [cs.LG, cs.AI, cs.CV]目的:遷移フローの学習
    • 生成モデルの発展において,効率的なサンプリング手法は重要である。
    • 従来のフローマッチングは多段階の積分が必要で計算コストが高い。
    • 単一ステップでの生成と,任意の時点への生成を可能にすること。
    • 本研究では,遷移フローを直接学習する新しいパラダイムを提案した。
    • 遷移フローはグローバルな量であり,単一ステップ生成に適している。
    • 提案手法とMean Velocity Flowとの関係性を示し,統一的な理論的視点を提供した。

    Link: https://arxiv.org/abs/2603.15689

  • ゆる構造ソフトウェア:実行時再配線型マルチエージェントシステムのエンジニアリング的背景,構造,および進化エントロピー [cs.SE, cs.AI]目的:実行時再配線型マルチエージェントシステムのゆる構造ソフトウェアの設計原則とパターン
    • 大規模言語モデルを用いたマルチエージェントシステムは自律性が高まり,複雑な問題解決に貢献するが,その制御が課題となっている。
    • エージェント数の増加に伴い,文脈圧力,協調エラー,システムドリフトといった問題が顕在化し,システムの堅牢性を損なう。
    • システムの進化エントロピーを管理し,設計性,スケーラビリティ,進化可能性を向上させるためのフレームワークを提案する。
    • ゆる構造ソフトウェア(LSS)は,決定論的ロジック構築から,実行時生成されるエントロピー管理へとエンジニアリングの焦点を移行する。
    • LSSは,View/Context Engineering,Structure Engineering,Evolution Engineeringという三層のエンジニアリングフレームワークによって,エントロピーを制御可能にする。
    • LSSデザインパターンは,流動的な相互作用を安定化させつつ,エージェントの適応性を維持するセマンティック制御ブロックとして機能する。

    Link: https://arxiv.org/abs/2603.15690

  • LLMトリガー生成器を活用したバックドア防御:BadLLM-TG [cs.CR, cs.AI]目的:バックドア攻撃に対する防御機構の開発
    • 機械学習モデルの信頼性は重要であり,バックドア攻撃はその信頼性を損なう。
    • 自然言語処理モデルへの適用が困難な,従来のノイズベースのトリガー生成器の限界。
    • LLMを活用し,自然言語処理モデルにおけるバックドア攻撃を効果的に防御すること。
    • 提案手法BadLLM-TGは,攻撃成功率を平均76.2%削減することに成功した。
    • 既存の防御手法と比較して,13.7%高い性能を示した。
    • プロンプト駆動型強化学習により,LLMトリガー生成器が最適化されている。

    Link: https://arxiv.org/abs/2603.15692

  • ハイパーグラフにおける過剰平滑化への対処:リッチフロー誘導型ニューラル拡散アプローチ [cs.LG, cs.AI]目的:ハイパーグラフニューラルネットワークにおける過剰平滑化の軽減
    • 複雑な高次関係のモデリングにおいて,ハイパーグラフニューラルネットワークは重要な役割を担う。
    • ハイパーグラフニューラルネットワークは層を深くすると過剰平滑化を起こしやすく,メッセージパッシングの制御が難しい。
    • 離散リッチフローを導入することで,ノード特徴量の進化を制御し,過剰平滑化を抑制することを目指す。
    • 本研究では,離散リッチフローを誘導した新しいメッセージパッシングパラダイムであるRFHNDを提案した。
    • RFHNDは,ノード特徴量の情報拡散速度を幾何学的なレベルで適応的に調整し,特徴量の均質化を防ぐ。
    • 実験結果から,RFHNDは既存手法と比較して性能が向上し,過剰平滑化を効果的に抑制することが示された。

    Link: https://arxiv.org/abs/2603.15696

  • LLMの推論時間とエネルギー消費の関係性に関する調査 [cs.PF, cs.AI, cs.SE]目的:LLMのAPI利用におけるエネルギー消費量の推定手法
    • LLMの規模拡大に伴い,環境への影響や資源消費が深刻化している。
    • API経由での利用ではエネルギー消費量が不透明であり,利用者はコストを把握しづらい。
    • 推論時間を指標としてエネルギー消費量を推定し,利用者の理解を深める。
    • 推論時間からAPI利用時のGPUモデルを推定できることが示された。
    • 推定されたGPUモデルに基づき,エネルギー消費量の見積もりが可能となった。
    • 本研究は,APIベースLLM利用におけるエネルギーコストの可視化に貢献する。

    Link: https://arxiv.org/abs/2603.15699

  • SEMAG:自己進化型マルチエージェントコード生成 [cs.SE, cs.AI]目的:自己進化型マルチエージェントコード生成フレームワーク
    • プログラミング支援の自動化は,ソフトウェア開発の効率化に不可欠である。
    • 既存手法はモデル選択が手動であり,タスクの変化への適応が困難である。
    • タスクの難易度に応じてワークフローを適応させ,モデルを自動更新する。
    • SEMAGは,複数のベンチマークにおいて,最新のPass@1精度を達成した。
    • 同一の基盤モデルを用いても,既存手法よりCodeContestsで3.3%の性能向上を示した。
    • 自己進化型モデル選択により,最適な基盤モデルを特定し,52.6%のPass@1精度を実現した。

    Link: https://arxiv.org/abs/2603.15707

  • 少数派の掌握:困難な長尾系列学習のための不確実性に基づく多専門家フレームワーク [cs.LG, cs.AI]目的:長尾系列学習における少数派クラスの認識精度向上
    • 系列学習において,不均衡なデータ分布は重要な課題であり,少数派クラスの認識が困難である。
    • 既存のMoEモデルは,パラメータ効率の悪さや専門家間の競合解決の難しさなどが課題となっていた。
    • 本研究では,不確実性に基づいた専門家連携により,少数派クラスの認識精度向上を目指す。
    • 提案手法UMEは,Ensemble LoRAによりパラメータ数を削減し,効率的なモデル化を実現した。
    • Sequential SpecializationとDempster-Shafer Theoryを活用し,少数派クラスへの専門家特化を促進した。
    • 不確実性に基づく融合メカニズムにより,専門家の意見を動的に重み付けし,予測の信頼性を高めた。

    Link: https://arxiv.org/abs/2603.15708

  • 様々なファジーおよび不確実な意思決定手法の調査 [cs.AI]目的:不確実性を考慮した多基準意思決定の体系化
    • 現実の問題解決において,曖昧さや情報不足が意思決定に影響を与えるため,その対処法が重要である。
    • 既存の研究は体系化されておらず,問題設定や手法の選択が困難である。
    • 多様な意思決定手法を分類し,適切な手法選択の指針を示す。
    • 本調査は,問題設定,重み付け,基準間の構造といった要素を分類することで,多基準意思決定の分野を体系化した。
    • 補償的スコアリング法,距離に基づく手法,非補償的アウトランキング法など,様々な解法を比較対照した。
    • 説明可能性,安定性,拡張性といった今後の研究課題を提示した。

    Link: https://arxiv.org/abs/2603.15709

  • アルカプトン尿症に関する生物医学文献からの知識グラフ抽出 [cs.AI, cs.IR, q-bio.QM]目的:アルカプトン尿症に関する知識グラフの構築と解析
    • 希少疾患研究は,患者数が少ないため十分な知見が得られにくい現状を打開する上で重要である。
    • 既存の生物医学知識グラフには,希少疾患に関する情報が不足しているか,全く含まれていない場合がある。
    • 本研究は,アルカプトン尿症に関する知識を効率的に抽出し,病態理解と治療標的探索に貢献することを目指す。
    • PubTator3を用いたテキストマイニングにより,大規模な生物医学的関係を抽出して知識グラフを構築した。
    • 構築した知識グラフは,既存の生化学的知識を用いて検証され,アルカプトン尿症に関連する遺伝子,疾患,治療法を特定した。
    • 本研究は,希少代謝疾患の解析における知識グラフ構築の有効性を示し,病気の全身的相互作用や潜在的治療標的を明らかにした。

    Link: https://arxiv.org/abs/2603.15711

  • 埋め込み認識特徴発見:イベント系列における潜在表現と解釈可能な特徴の架橋 [cs.LG, cs.AI, cs.IR]目的:イベント系列における潜在表現と解釈可能な特徴の関連性
    • 金融システム等ではイベント系列データが重要であり,その分析は不正検知等の高度化に不可欠である。
    • 深層学習による埋め込み表現は強力だが,解釈性が低く,実用上課題がある。
    • 埋め込み表現と解釈可能な特徴を統合し,より高性能で説明可能なモデルの構築を目指す。
    • EAFDは,埋め込み表現とLLMを活用し,イベント系列から特徴を自動的に発見する。
    • 発見された特徴は,埋め込み表現の情報整合性と予測能力の向上という二つの基準で評価・改良される。
    • 実験の結果,EAFDは既存手法を上回り,最先端の性能を達成した。

    Link: https://arxiv.org/abs/2603.15713