arXiv雑要約

AI - 2026/04/28 公開

  • RADIANT-LLM:安全重視の原子力工学における信頼性の高い意思決定支援のためのエージェント型検索拡張生成フレームワーク [cs.IR, cs.AI]目的:原子力工学における信頼性の高い意思決定支援のためのフレームワーク
    • 原子力工学は,国民の安全とエネルギー供給を支える重要な分野である。
    • 専門的な原子力分野において,LLMの幻覚と断片化されたドキュメントが課題となっている。
    • ドメイン知識に基づいた検索と,幻覚リスクの低減を目指す。
    • 本フレームワークは,ページおよび図レベルでの検索を可能にする多modalなドキュメント取り込みパイプラインを備える。
    • 開発された評価指標(CoP,HR,ViR)を用いた評価により,高い精度と低い幻覚率が示された。
    • RAG層のない汎用LLMと比較して,幻覚と引用エラーが顕著に減少することが確認された。

    Link: https://arxiv.org/abs/2604.22755

  • あなたのレビューはあなたを再現する:共伴分析のための顧客デジタルツインとしてのLLMベースのエージェント [cs.IR, cs.AI]目的:顧客の選好推定のためのLLMベース顧客デジタルツインの活用
    • 市場調査において,消費者の選好を把握することは,製品開発やマーケティング戦略の策定上,不可欠である。
    • 従来の共伴分析は,時間,コスト,回答者の負担が大きいという課題を抱えていた。
    • LLMを活用し,顧客の過去のレビューに基づいてデジタルツインを構築することで,これらの課題を解決する。
    • LLMベースの顧客デジタルツインは,実際のユーザーの選好を87.73%の精度で予測できることが示された。
    • コンピュータモニタの事例研究において,パネルタイプと解像度間のトレードオフを定量的に評価し,市場の現実と一致する選好構造を導出した。
    • 本研究は,従来の調査手法と比較して,スケーラビリティ,俊敏性,コスト効率に優れた代替手段をマーケティング調査に提供する。

    Link: https://arxiv.org/abs/2604.22756

  • StratRAG:検索拡張生成システムのためのマルチホップ検索評価データセット [cs.IR, cs.AI]目的:検索拡張生成システムにおけるマルチホップ推論タスクの評価
    • 質問応答システムの性能向上は,情報検索と自然言語処理の重要な課題である。
    • 既存の評価データセットでは,現実的なノイズのあるドキュメント環境での性能評価が困難である。
    • マルチホップ推論が必要なタスクにおいて,検索性能をより正確に評価すること。
    • StratRAGは,HotpotQAを基にした2,200例のデータセットであり,現実的なノイズを含むドキュメントプールを特徴とする。
    • ハイブリッド検索が全体的に最高の性能を示した(Recall@2 = 0.70, MRR = 0.93)。
    • 特に,ブリッジ質問は依然として難しく,強化学習に基づく検索ポリシーの研究の必要性を示唆している(Recall@2 = 0.67)。

    Link: https://arxiv.org/abs/2604.22757

  • RedParrot:クエリ意味キャッシュによるビジネス分析向けNL-to-DSLの高速化 [cs.IR, cs.AI, cs.CL]目的:ビジネス分析のための自然言語からドメイン固有言語への変換加速
    • ECや広告の拡大により,リアルタイムかつ高精度なビジネス分析の需要が高まっている。
    • 既存のLLMパイプラインは,高い遅延,コスト,エラー伝播の問題を抱え,実用化が困難である。
    • クエリの意味キャッシュを活用し,パイプライン処理をバイパスすることで,変換処理の高速化を図る。
    • RedParrotは,実世界の6つのデータセットにおいて,平均3.6倍の高速化と8.26%の精度向上を達成した。
    • SpiderとBIRDを基にした新しい公開ベンチマークにおいても,標準的なインコンテキスト学習ベースラインを大幅に上回る34.8%の精度向上を示した。
    • クエリの構造パターンに着目し,オフラインでのスケルトン構築,オンラインでの埋め込みモデル,異種RAGを組み合わせている。

    Link: https://arxiv.org/abs/2604.22758

  • コミュニティQAにおける会話を通じた関連質問検索 [cs.IR, cs.AI, cs.CL]目的:コミュニティQAにおける関連質問検索の性能向上
    • 質問応答システムの精度向上は,情報検索の重要な課題であり,ユーザーの効率的な問題解決を支援する。
    • 従来の関連質問検索手法は静的なアプローチに依存しており,質問間の文脈的な関係性を十分に捉えられていない。
    • 会話の特性を活用し,より精緻な質問表現を獲得することで,関連質問検索の精度を向上させることを目指す。
    • 提案手法TeCQRは,タグを強化した明確化質問(CQ)を用いて会話を構築し,関連質問の検索を行う。
    • ノイズ耐性モデルにより,質問とタグ間の意味的類似性を評価し,ノイズの影響を軽減することで,効果的な検索を実現する。
    • 実験結果から,提案手法が既存の最先端手法と比較して,有意に高い性能を示すことが確認された。

    Link: https://arxiv.org/abs/2604.22759

  • LLM間通信における差異の定量化:API検索とランキングを通じて [cs.IR, cs.AI, cs.CL]目的:LLM間コミュニケーションの差異の定量化
    • LLMは自律エージェントとして発展し,複雑なタスク遂行にAPIを利用する機会が増加している。
    • LLM間の信頼性や合意形成度は十分に評価されておらず,その差異が課題となっている。
    • LLM間のAPI検索とランキングにおける差異を定量的に評価し,協調性を高める。
    • 15のAPIドメインと5つの主要モデルファミリーを対象に評価した結果,全体的な合意は中程度(AO約0.50,tau約0.45)であった。
    • 構造化タスク(天気,音声認識)では安定した結果が得られた一方,オープンエンドなタスク(感情分析)では高い差異が見られた。
    • データに基づいたドメインでは一貫性が高く,抽象的な推論タスクでは一貫性が低下する傾向が確認された。

    Link: https://arxiv.org/abs/2604.22760

  • 行動知能プラットフォーム:確率的ジャーニーグラフ,行動知識抽出,そして根拠に基づいた言語生成によるイベントストリームから自律的な洞察へ [cs.IR, cs.IR, cs.AI]目的:行動データの自動洞察生成
    • プロダクト分析は,製品改善や顧客理解に不可欠であり,ビジネス成長を促進する。
    • 従来の分析システムはクエリが必須で,専門知識と質問設計能力が求められる。
    • イベントストリームから自動的に洞察を発見し,能動的に行動を説明するシステムを目指す。
    • 行動知能プラットフォーム(BIP)は,イベントストリームを自動生成された洞察に変換するシステムアーキテクチャである。
    • BIPは,イベントの標準化,ユーザー行動のモデル化,行動事実の抽出,そして自然言語による洞察生成の4層で構成される。
    • 行動知能問題の形式化,洞察生成のための検出器の分類,そして注目度に基づいた洞察の優先順位付けを行うスコアを提案した。

    Link: https://arxiv.org/abs/2604.22762

  • 日常的なLLMにおける道徳的判断の暗黙的な人間化 [cs.HC, cs.CY, cs.AI, cs.IR]目的:LLMの道徳的判断に対するクエリにおける暗黙的な人間化の強化
    • 対話型情報システムの普及により,ユーザーの質問範囲が拡大し,道徳的助言を求めるケースが増加している。
    • LLMに対する道徳的判断のクエリは,人間化された投影を引き起こし,誤った信頼や過度な依存のリスクを高める可能性がある。
    • 本研究は,LLMの応答における暗黙的な人間化の強化を分析し,そのリスク軽減策を検討することを目的とする。
    • 現在のLLMは,道徳的判断を求めるクエリに対し,暗黙的な人間化を強化する傾向があることが示された。
    • この人間化は,ユーザーがLLMを過信したり,その能力を過大評価したりするリスクを悪化させる可能性がある。
    • 今後は,ユーザー側の暗黙的な人間化を理解し,モデルの能力とユーザーの期待とのずれを修正する設計が求められる。

    Link: https://arxiv.org/abs/2604.22764

  • アルゴリズムによる行政とEU AI法:公共部門におけるAI利用のための法的原則 [cs.CY, cs.AI]目的:公共部門におけるAI利用に関する法的原則
    • 行政におけるAI活用は,効率化や新たなサービスの提供を可能にする一方,法的な課題も生じる。
    • AIによる行政判断の透明性,説明責任,そして適正な手続きの確保が課題となっている。
    • EU AI法の公共部門への適用可能性と,行政法原則との整合性を明らかにすること。
    • 本研究は,EU AI法が行政裁量,理由付記義務,比例原則といった行政法の基本原則とどのように関連するかを分析した。
    • 特に,ハイリスクシステムを公共部門で展開する際の法的義務と,自動化された意思決定における説明責任の確保について検討した。
    • AI法の危険度に基づくアプローチが比例原則と整合するかを検証し,倫理的かつ合法的利用のための対策を提案した。

    Link: https://arxiv.org/abs/2604.22765

  • 汎用人工知能の予測とシナリオ分析:現状,方法論的ギャップ,戦略的示唆 [cs.CY, cs.AI, cs.ET, cs.LG]目的:汎用人工知能の到達時期予測手法の現状と信頼性評価,および戦略・政策への示唆
    • 人工知能の進化は社会に変革をもたらす可能性があり,その影響を予測することは重要である。
    • 現在の予測手法には限界が多く,予測の信頼性が低いという課題が存在する。
    • より堅牢な予測基盤を構築するための研究課題を提示し,不確実性下での解釈を可能とする。
    • 既存の予測手法の多様性を整理し,その限界を明確化した。
    • 人間とAIの協調によるレポート作成アプローチを実験的に実施した。
    • 特定の予測を支持するのではなく,不確実性を考慮した解釈の枠組みを提供した。

    Link: https://arxiv.org/abs/2604.22766

  • 医療AIにおけるフロントエンドデザインの倫理的失敗:不均衡なユーザーとAIの関係 [cs.HC, cs.AI, cs.CY]目的:医療AIにおける不均衡なユーザーとAIの関係の特定
    • 医療AIの発展は,医療の質と効率を向上させる可能性を持つため重要である。
    • AIの倫理的議論は主にバックエンドに集中し,ユーザーインターフェースの倫理的側面が軽視されている。
    • ユーザーの透明性欠如とAIへの影響力の欠如という問題を解決し,バランスの取れた関係を構築すること。
    • 本研究では,不均衡なユーザーとAIの関係を「フロントエンドの倫理的失敗」として捉え,非対称な可読性の概念を提示する。
    • デフォルトの推奨,入力制限,不確実性の抑制などのデザイン選択が,主体性,臨床判断,人間の監視を損なうことを示す。
    • 双方向性をデザインの指針として提案し,医療AIにおけるよりバランスの取れた参加型の関係構築のための介入策を示す。

    Link: https://arxiv.org/abs/2604.22767

  • ブロック学習:言語学習のためのマルチエージェント討論支援型個別適応学習フレームワーク [cs.CY, cs.CL, cs.CY, cs.CY, cs.AI, cs.CL, cs.HC]目的:言語学習における個別適応学習フレームワーク
    • 言語習得はグローバル化において不可欠であり,効果的な学習手法の確立が求められている。
    • 従来のデジタル言語学習は,反復練習に偏りがちで,実際の会話能力向上に繋がりにくいという課題がある。
    • 会話能力評価と弱点克服のための個別最適化された学習方法を提供することで,この課題を解決する。
    • 本フレームワークは,CEFR基準に沿った評価指標を用い,マルチエージェント討論を通じて会話能力を評価する。
    • 実験の結果,本フレームワークは高い評価一致度と推奨の妥当性を実現した。
    • 8週間の学習調査により,本フレームワークが従来のフィードバックのみによる学習よりも優れた学習効果を示すことが示された。

    Link: https://arxiv.org/abs/2604.22770

  • ランダム性の下限:言語モデルのトークン分布における内在的非ランダム性の測定 [cs.CL, cs.AI, cs.LG]目的:言語モデルのトークン分布における内在的非ランダム性の評価
    • 言語モデルの性能向上には,モデルの挙動を理解することが不可欠である。
    • 既存研究では,言語モデルの非ランダム性の源泉が明確でなかった。
    • 言語モデルに内在する非ランダム性の下限を定量的に明らかにすることを目指す。
    • エントロピック偏差(ED)を用いて,モデルのトークン分布と一様分布の差異を測定した。
    • Transformerモデルは,意味的に中立なプロンプト下でも高いED値を維持し,非ランダム性の大部分が学習済みパラメータに由来することを示した。
    • State Spaceモデル(Mamba2)は,Transformerとは異なる挙動を示し,温度の影響を受けやすいことが明らかになった。

    Link: https://arxiv.org/abs/2604.22771

  • VLMが学生の解答を「修正」するとき:複数行手書き数式OCR評価における過剰修正の特定とペナルティ [cs.CY, cs.HC, cs.CY, cs.AI, cs.CV, cs.LG]目的:複数行手書き数式OCRにおける過剰修正の特定と評価指標の提案
    • 教育AIシステムにおいて,手書き数式の正確な読み取りは学習評価に不可欠である。
    • 既存の評価指標は単一行の式に偏っており,複数行の解答全体の意味的推論を評価できていない。
    • VLMの過剰修正という問題に対処し,より信頼性の高い評価フレームワークを構築すること。
    • VLMは学生の解答を忠実に書き起こすのではなく,誤りを「修正」する傾向があることが明らかになった。
    • 提案する評価指標PINKは,ルブリックに基づく評価と過剰修正の明示的なペナルティにより,BLEUと比較して人間の判断とより一致する。
    • GPT-4oは過剰修正により評価が下がり,Gemini 2.5 Flashが最も忠実な書き起こしモデルとして評価された。

    Link: https://arxiv.org/abs/2604.22774

  • 食材埋め込みにおける多次元風味構造:エピクロス [cs.HC, cs.CY, cs.AI, cs.LG]目的:食品の風味構造の解明
    • 食文化や料理において,風味は重要な要素である。
    • 風味に関する専門知識は暗黙的であり,体系的な分析が困難である。
    • 食材埋め込みから風味構造を抽出し,その理解を深めること。
    • FlavorGraphの食材埋め込みには,風味に関する知識が既に含まれていることが示された。
    • LLMを活用したパイプラインにより,風味構造の抽出精度が向上した。
    • 味,食感,地理,加工法,文化を含む少なくとも15の風味次元が特定された。

    Link: https://arxiv.org/abs/2604.22776

  • マルチフィデリティデジタルツインとFMEA知識強化に基づく汎用航空機におけるインテリジェントな故障診断手法 [cs.AI, cs.LG]目的:汎用航空機におけるインテリジェントな故障診断フレームワーク
    • 航空機の安全性確保は不可欠であり,迅速かつ正確な故障診断が重要である。
    • 実故障データが不足し,故障の種類が多く,故障の兆候が弱いという課題がある。
    • マルチフィデリティデジタルツインとFMEA知識を用いて,これらの課題を解決することを目指す。
    • ペアードミラー残差スキームは,20クラスのタスクで96.2%のMacro-F1スコアを達成した。
    • GRUサロゲートスキームは,わずか0.6%の性能低下で推論速度を4.3倍に向上させた。
    • 残差特徴の品質が,分類器のアーキテクチャよりも診断性能に約5倍大きく貢献することが示された。

    Link: https://arxiv.org/abs/2604.22777

  • Transformerの学習におけるスペクトルライフサイクル:一時的な圧縮波,持続的なスペクトル勾配,およびQ/K-Vの非対称性 [cs.LG, cs.AI]目的:Transformer事前学習中の重み行列の特異値スペクトルの系統的研究
    • Transformerは自然言語処理の基盤技術であり,性能向上が重要視されている。
    • Transformerの学習過程における内部状態の変化は未だ解明されていない部分が多い。
    • 学習中のスペクトル構造を分析し,Transformerの学習メカニズムを解明することを試みる。
    • 学習初期には浅い層から深い層へ圧縮波が伝播するが,最終的には深い層が浅い層を過剰に圧縮する現象が確認された。
    • モデルの深さが増すにつれて,スペクトル指数αの深層勾配が非単調な逆U字型となり,そのピーク位置が浅い層へとシフトする傾向が明らかになった。
    • クエリ/キー投影は深さ依存のダイナミクスを担い,値/出力投影は均一に圧縮されるという機能的な非対称性が確認された。スペクトル構造は剪定性能の向上に寄与する。

    Link: https://arxiv.org/abs/2604.22778

  • 知識境界を意識した強化学習によるLLMのハルシネーション軽減 [cs.LG, cs.AI, cs.CL]目的:LLMにおけるハルシネーション軽減策
    • LLMの性能向上は重要だが,誤った情報を生成するハルシネーションが課題となっている。
    • 既存の強化学習は慎重になりすぎて回答精度が低下する可能性がある。
    • 知識境界を意識した報酬設計と二段階の学習戦略により,精度とハルシネーションのバランスを改善する。
    • KARLは,知識境界の推定と動的な報酬設計により,回答精度を維持しつつハルシネーションを抑制する。
    • 二段階の強化学習戦略は,過剰な慎重さの回避と,知識境界外の誤答を抑制に転換する。
    • 複数のベンチマークで,KARLは既存手法よりも優れた精度とハルシネーションのトレードオフを実現した。

    Link: https://arxiv.org/abs/2604.22779

  • BiTA:時間グラフネットワークフレームワークにおける双方向ゲート付き再帰型ニューラルネットワーク-Transformer集約器によるアラート予測 [cs.LG, cs.AI]目的:コンピュータネットワークにおけるアラート予測手法
    • サイバー脅威は高度化の一途をたどっており,迅速な防御行動が不可欠である。
    • 既存の時間グラフニューラルネットワークは,時間的集約が単方向的であるため,複雑な攻撃パターンを捉えきれない。
    • 双方向性と長距離依存関係を考慮した時間的集約器BiTAを開発し,より正確なアラート予測を目指す。
    • BiTAは,既存の時間グラフモデルと比較して,曲線下面積,平均適合率,相互順位平均などの主要な性能指標において有意な改善を示した。
    • BiTAは,誘導的および変換的設定の両方でベースライン手法を上回り,動的なネットワーク環境における堅牢性と汎化能力を示した。
    • BiTAは,リアルタイムのサイバー脅威予測のためのスケーラブルで解釈可能なフレームワークであり,よりインテリジェントな侵入検知システムの実現に貢献する。

    Link: https://arxiv.org/abs/2604.22781

  • 確率的KVルーティング:適応的な層間キャッシュ共有の実現 [cs.LG, cs.AI]目的:Transformer言語モデルの効率的なキャッシュ共有手法
    • Transformerモデルの高性能化には,大規模なKVキャッシュが不可欠。しかし,メモリ消費量が課題となる。
    • 従来のKVキャッシュ削減は時間軸に焦点を当てていたが,層間共有は性能低下を招きやすい。
    • 確率的な層間アテンションにより,柔軟なキャッシュ共有戦略を学習し,メモリ消費量を削減する。
    • 提案手法は,層のキャッシュを意図的に削除することで,情報損失なく効率的な最適化を可能にする。
    • 事前学習またはファインチューニング時に適用することで,様々なモデルファミリーで層間キャッシュ共有が実現可能となる。
    • データ制約下では,正則化効果が期待でき,性能を維持・向上させながらキャッシュメモリ消費量を大幅に削減できる。

    Link: https://arxiv.org/abs/2604.22782

  • パラメータ効率はメモリ効率ではない:オンデバイスLLM適応のためのファインチューニングの再考 [cs.LG, cs.AI]目的:オンデバイスLLM適応のためのファインチューニング手法に関する研究
    • LLMの活用範囲拡大のため,限られたリソースでの実行が重要視されている。
    • 既存のPEFT手法はパラメータ数は削減するも,メモリ消費量が多い場合がある。
    • メモリ消費量を抑制し,オンデバイスでのLLM適応を可能にすること。
    • 本研究で提案するLARSは,活性化空間を制約することでメモリ消費量を削減する。
    • GPUとCPUの両方で,LoRAと比較して平均で33.54%,51.95%のメモリ削減効果が確認された。
    • Raspberry Piなどのリソース制約のある環境でも,LARSによるLLMのパーソナライズが実証された。

    Link: https://arxiv.org/abs/2604.22783

  • 敵対的学習を用いない:偽データ注入攻撃に対するセキュアな電力系統状態推定のための物理情報ニューラルネットワーク [cs.LG]目的:電力系統状態推定の安全性向上
    • 電力系統はデジタル化が進み,サイバー攻撃のリスクが増大しているため,その安全性確保が重要である。
    • 従来のモデルベースの手法では,偽データ注入攻撃に対する脆弱性が問題となっている。
    • 物理情報ニューラルネットワークを用いて,敵対的学習なしに攻撃に対する堅牢性を実現する。
    • 提案手法は,固定ウェイトの物理情報ニューラルネットワークと比較して,電圧の大きさおよび位相角の推定精度と安定性が向上した。
    • 動的損失重み付けにより,手動でのウェイト調整に対する感度を低減し,学習の効率を高めている。
    • IEEE 118バスシステムを用いた評価により,様々な偽データ注入攻撃に対して高い耐性を持つことが確認された。

    Link: https://arxiv.org/abs/2604.22784

  • CoFi-PGMA:マルチエージェントLLMにおけるフィルタリングされたフィードバック下での反事実的方策勾配 [cs.LG]目的:マルチエージェントLLMシステムにおけるフィルタリングされたフィードバック下での学習
    • LLMは複雑なタスク解決に不可欠であり,マルチエージェント化は性能向上に繋がる。
    • システム機構によるフィルタリングされたフィードバックは,標準的なRLHF目的関数を誤らせる。
    • エージェントごとの貢献度を考慮した反事実的な学習目的関数を確立し,学習信号の歪みを修正する。
    • CoFi-PGMAは,ルーティングと協調の両方のメカニズム下で効果的な学習を可能にする統一的なフレームワークである。
    • ルーティングシステムでは選択ゲート付きフィードバックのオフポリシー補正に対応し,協調システムでは離脱差分報酬による貢献度評価を実現する。
    • 実際の推論データセットにおいて,提案手法が有効であることを実証した。

    Link: https://arxiv.org/abs/2604.22785

  • AutoCompress:効率的なTransformer圧縮のための重要層の分離 [cs.LG]目的:Transformer圧縮手法の提案
    • Transformerは自然言語処理で高性能だが,巨大なモデルサイズが課題である。
    • モデル圧縮は計算コスト削減に有効だが,性能劣化を招きやすい。
    • 重要層を保護することで,圧縮率向上と性能維持を目指す。
    • AutoCompressは,特に小規模なTransformerにおいて,Layer 0がタスクに重要な情報を持つことを示した。
    • 重要層分離(CLI)により,GPT-2 Mediumを2.47倍に圧縮し,パラメータを59.5%削減した。
    • Layer 0の保護が,単なるモデルサイズの削減よりも性能向上に大きく貢献することが確認された。

    Link: https://arxiv.org/abs/2604.22786

  • 空間的共変量シフト下におけるPM2.5マッピング:アフリカのグリーン産業転換のための衛星・再解析データ融合 [cs.LG, cs.AI]目的:アフリカにおけるPM2.5濃度の空間分布推定システムの構築
    • アフリカのグリーン産業化には,信頼性の高い大気質モニタリング基盤が不可欠である。
    • 既存手法では,地理的変動に対する予測精度の維持が課題となっていた。
    • 地域ごとの信頼性評価を通じて,モニタリング基盤の拡張に向けた優先順位付けを行う。
    • 衛星データと再解析データを融合したLightGBMモデルは,空間交差検証においてRMSE 30.83 ug/m3,MAE 14.54 ug/m3を達成した。
    • 分割共形予測の結果,東アフリカ地域における予測信頼性が低いことが示された(PICP = 65.3%)。
    • 地域信頼性フラグとモニタリング優先度スコアを提示し,アフリカのグリーン産業転換と持続可能な開発目標の達成を支援する。

    Link: https://arxiv.org/abs/2604.22787

  • UGAF-ITS:分散型インテリジェント交通システムのマルチフレームワークAIガバナンスのための標準化フレームワークと検証ツール [cs.CY, cs.AI]目的:AIを活用したインテリジェント交通システムのガバナンスにおける標準化
    • AI技術の交通システムへの応用が進む中,安全性や信頼性の確保が重要課題となっている。
    • 各国のAI規制やガイドラインが異なり,企業は複数の基準に対応する必要がある。
    • 異なるフレームワーク間の整合性を高め,コンプライアンスコストを削減することを目的とする。
    • UGAF-ITSフレームワークは,3つの主要なAIガバナンス基準から154の要件を12の統合された管理策に集約した。
    • 3層モデル(車両,エッジ,クラウド)による運用により,各層で証拠の収集と管理を効率化できる。
    • 検証の結果,平均91.7%のフレームワーク網羅率,45.9%の証拠削減,完全なトレーサビリティが確認された。

    Link: https://arxiv.org/abs/2604.22789

  • 風力発電所の制御における専門家のデモンストレーションによる強化学習の加速 [eess.SY, cs.LG, cs.SY]目的:風力発電所制御のための強化学習の加速方法
    • 風力発電は再生可能エネルギー源として重要であり,効率的な制御が電力供給安定化に不可欠である。
    • 強化学習は有望だが,訓練の遅さや初期性能の低さが実用化の妨げとなっている。
    • 定常状態のウェイクモデルを利用し,強化学習の訓練を加速し,初期性能を向上させる。
    • 専門家のデモンストレーションによる事前学習により,初期学習のコストを削減し,貪欲なゼロヨーベースラインに匹敵する初期性能を実現した。
    • オンラインでの微調整において,すべての構成が25万ステップ以内に同様の性能に収束した。
    • 最終的に,ルックアップテーブルコントローラーの性能(約7%の電力増加)を上回る成果を得た。

    Link: https://arxiv.org/abs/2604.22794

  • 負荷制約下風力発電所流れ制御における多目的マルチエージェント強化学習 [eess.SY, cs.LG, cs.SY]目的:負荷制約下風力発電所流れ制御のための多目的マルチエージェント強化学習フレームワーク
    • 風力発電は再生可能エネルギー源として重要であり,発電効率の向上が求められている。
    • 従来のウェイクステアリングは発電量を増加させる一方で,下流タービンの構造荷重を増加させるという課題がある。
    • 本研究は,発電量最大化と構造荷重増加の抑制を両立する制御戦略を確立することを目指す。
    • 提案するマルチエージェント強化学習フレームワークは,発電量増加と構造荷重の制約を両立した協調的な制御ポリシーを学習した。
    • 各タービンエージェントは,ダメージ等価荷重の増加閾値(10%, 20%, 30%)を遵守しながら,発電量の最大化を目指した。
    • シミュレーション結果は,高ダメージ等価荷重の制御戦略から積極的に後退しながら,発電量の増加を優先する効果的な制御が可能であることを示唆している。

    Link: https://arxiv.org/abs/2604.22795

  • 風力発電所における動的ウェイク操向のための階層型強化学習モデル予測制御 [eess.SY, cs.LG, cs.SY]目的:風力発電所におけるウェイク操向最適化
    • 風力発電の効率向上が重要であり,風車の配置や制御が鍵となる。
    • 複雑な流れの物理現象と変動する条件により,最適化が困難である。
    • 強化学習とモデル予測制御を組み合わせることで,より効果的なウェイク操向を実現する。
    • 提案手法は,ベースライン制御と比較して23%の発電量増加を達成した。
    • 理想的な状態知識を持つモデル予測制御よりも優れた性能を示した。
    • 直接的な強化学習制御と比較して,訓練中の安全性が高く,安定した制御行動を実現した。

    Link: https://arxiv.org/abs/2604.22797

  • RCSB PDB AIヘルプデスク:タンパク質構造データ登録支援のための検索拡張生成 [cs.HC, cs.CY, hep-ex, cs.IR, cs.AI, cs.CL, q-bio.QM]目的:タンパク質構造データの登録支援
    • タンパク質構造は生命科学研究において不可欠であり,PDBはその中心的なデータベースである。
    • PDBへの登録が増加の一途をたどり,専門家による手作業での対応が限界に近づいている。
    • AIを活用し,登録者の問い合わせに自動で対応することで,Help Desk業務の効率化を目指す。
    • RAG(検索拡張生成)に基づくAIヘルプデスクを開発し,24時間体制で登録者を支援するシステムを構築した。
    • LangChain,PostgreSQL,GPT-4.1-miniを用いて,高品質な回答を生成し,引用情報も提示する。
    • Markdown形式のPDF抽出やトピックフィルタリングなど,高度な技術を導入し,専門用語の漏洩を防ぐ。

    Link: https://arxiv.org/abs/2604.22800

  • 見えざる悪: ARにおける意味的文脈を考慮したプライバシーリスク検出 [cs.DL, cs.SI, stat.AP, cs.CV, cs.AI, cs.SY, eess.SY]目的:AR環境における文脈依存のプライバシーリスク検出
    • AR技術の普及に伴い,視覚データの継続的な取得によるプライバシー侵害リスクが増大している。
    • 既存のARプライバシー保護策は視覚コンテンツの意味理解が不十分で,文脈に応じたリスク検出が困難である。
    • 視覚言語モデルを活用し,文脈に基づいたプライバシーリスクの検出と情報秘匿を実現することを目指す。
    • PrivARは,視覚シーンからの手がかりを利用し,パスワード等の機密情報となりうる要素を推論する。
    • PrivARは,テキスト情報を検出し隠蔽することで,プライバシー漏洩率を17.58%に低減し,高い精度(81.48%)とF1スコア(84.62%)を達成した。
    • 文脈に基づいた警告インターフェースの有効性に関するユーザー調査も実施し,プライバシーに配慮したAR設計の指針を得た。

    Link: https://arxiv.org/abs/2604.22805

  • FreqFormer:適応スペクトルルーティングを用いた長系列ビデオ拡散Transformerのための階層型周波数領域アテンション [cs.CV, cs.AI, eess.IV]目的:長系列ビデオ拡散Transformerにおける計算コストとメモリ使用量の削減
    • ビデオ処理において,長時間の動画を扱うことが重要であり,その計算効率が課題となっている。
    • 従来のTransformerでは,系列長が長くなるほど自己注意機構の計算量が急増する。
    • 周波数特性を考慮したアテンション機構により,計算効率を改善し,長系列ビデオの処理を可能にすること。
    • FreqFormerは,周波数帯域ごとに異なるアテンション機構を適用することで,計算量とメモリ使用量を大幅に削減する。
    • 低周波成分にはグローバルな注意機構,高周波成分にはローカルな注意機構を使用し,効率的な処理を実現している。
    • シミュレーションの結果,従来の自己注意機構と比較して,計算量とメモリトラフィックを大幅に削減できることが示された。

    Link: https://arxiv.org/abs/2604.22808

  • デジタル学習軌跡を用いたSRLアラインメント予測モデルの教科横断的な一般化可能性 [cs.CE, cs.SI, cs.SY, eess.SY, cs.DL, cs.CY, cs.LG, stat.AP]目的:STEM分野における中退率低減のための予測モデルの一般化可能性評価
    • 高等教育における学生の学習状況把握と,早期介入による中退防止の重要性が高まっている。
    • デジタル学習環境から得られるデータに基づいた予測モデルは存在するものの,教科や機関を超えた一般化が課題となっている。
    • 自己調整学習理論に基づき,デジタル学習軌跡データを用いて,予測モデルの汎用性を検証し,より効果的な早期警告システムを構築する。
    • デジタル学習軌跡データから,時間管理,努力調整,継続的な学習意欲などの自己調整学習に関連する行動が,学生のリスク予測に有効であることが示された。
    • Random Forestは高いin-sample精度を示したが,Elastic Netは異なる環境下での一般化性能に優れていた。
    • 機関間での予測精度とキャリブレーションは,学生のリスク率の違いにより低下したことから,予測モデルの適用には文脈への配慮が必要であることが示唆された。

    Link: https://arxiv.org/abs/2604.22812

  • ツール使用LLMエージェントのための完全な循環サブタスクグラフ:マルチエージェントワークフローにおける柔軟性,コスト,ボトルネック [cs.CY, cs.MA, cs.AI]目的:ツール使用LLMエージェントのマルチエージェントワークフローにおける柔軟性,コスト,ボトルネックの評価
    • 複雑なタスク達成には,複数段階の処理が必要であり,エージェント間の協調が重要となる。
    • マルチエージェントシステムでは,エージェント間の連携のオーバーヘッドや計算コストが増大しやすい。
    • サブタスクの柔軟な再実行が,タスク成功に貢献するかどうかを定量的に評価すること。
    • 完全な循環サブタスクグラフは,エージェントがサブタスクを自由に再実行できる柔軟性を提供する。
    • ALFWorldでは,明示的な再実行が回復と探索を支援する一方,TextCraftでは単純な順方向実行が効率的であることが示された。
    • Finance-Agentでは,情報検索,根拠付け,証拠合成がボトルネックであり,ワークフローの柔軟性だけでは不十分であることが示唆された。

    Link: https://arxiv.org/abs/2604.22820

  • Audio2Tool:音声言語理解と機能呼び出しの架け橋 [cs.SD, cs.LG, eess.AS]目的:音声言語モデルのツール呼び出し能力の評価
    • 音声アシスタントの普及に伴い,自然な音声入力による高度なタスク実行が重要になっている。
    • 既存の評価データセットは,ドメインの広さ,音声の多様性,複雑な推論能力の評価が不足している。
    • 多様な環境下での音声言語モデルのツール呼び出し性能の課題を明らかにすること。
    • Audio2Toolは,スマートカー,スマートホーム,ウェアラブルの3つのドメインを網羅する約3万件のクエリを含む大規模データセットである。
    • 評価の結果,既存の音声言語モデルは単純なコマンドには強いが,複雑な条件下では性能が低下することが示された。
    • 本データセットは,現実的な環境下での音声アシスタントの性能向上に貢献すると期待される。

    Link: https://arxiv.org/abs/2604.22821

  • DO-Bench:ビジョン言語モデルにおける物体幻覚の診断のための属性化ベンチマーク [cs.CV, cs.AI]目的:ビジョン言語モデルにおける物体幻覚の診断
    • ビジョン言語モデルの信頼性は重要であり,その中でも物体レベルでの幻覚は主要な課題である。
    • 既存のベンチマークは総合的な精度に焦点を当てており,エラーの原因が知覚的限界か文脈的先入観か特定できていない。
    • 文脈的先入観と知覚的根拠の強さを評価し,エラーの原因を特定すること。
    • DO-Benchは,文脈的先入観を強化する「Prior Override」次元と,視覚的証拠を増強する「Perception-Limited」次元の2つの側面から評価する。
    • 評価の結果,様々なビジョン言語モデルにおいて,先入観への感受性と知覚的信頼性に系統的な違いが明らかになった。
    • 物体幻覚は,総合的な精度だけでは捉えきれない,多様なメカニズムに依存するエラーパターンを示すことが示された。

    Link: https://arxiv.org/abs/2604.22822

  • PivotMerge:ポストアラインメントモデルマージによる異種マルチモーダル事前学習の架橋 [cs.CV, cs.AI]目的:異種マルチモーダル事前学習から学習されたクロスモーダルアラインメント能力の統合
    • マルチモーダルLLMは,多様なデータソースに依存しており,その性能向上は重要である。
    • 既存のマージ研究はファインチューニング後のシナリオに焦点を当てており,事前学習段階は未開拓である。
    • 異なるデータ分布におけるパラメータ干渉や,アラインメント貢献度の不均衡を解消することを目指す。
    • PivotMergeは,共有空間分解とフィルタリングにより,共有アラインメントパターンとドメイン固有の変動を分離する。
    • アラインメント誘導層ごとのマージは,異なるアラインメント貢献度に基づいて層固有のマージ重みを割り当てる。
    • CC12Mベースの評価でPivotMergeは既存手法を上回り,有効性と汎化能力を示す。

    Link: https://arxiv.org/abs/2604.22823

  • WeatherSeg:教師・生徒型二重学習と分類器更新注意機構を用いた耐候性画像セグメンテーション [cs.CV, cs.AI]目的:悪天候下における自律運転の環境認識の課題解決
    • 自動運転の安全性向上には,様々な天候条件下での正確な環境認識が不可欠である。
    • 悪天候時の画像認識は,画像品質の低下により性能が著しく劣化する。
    • アノテーションコストを削減しつつ,悪天候下でもロバストなセグメンテーションを実現する。
    • WeatherSegは,クリア,雨,曇り,霧などの多様な天候条件下で,既存モデルを大きく上回る精度とロバスト性を示す。
    • 二重教師・生徒型重み共有モデル(DTSWSM)により,悪天候画像からの知識蒸留を可能にした。
    • 分類器重み更新注意機構(CWUAM)は,環境属性に基づいて分類器の重みを動的に調整し,セグメンテーション精度を向上させる。

    Link: https://arxiv.org/abs/2604.22824

  • SGP-SAM:3D Segment Anythingモデルを病変セグメンテーションへ転移させる自己ゲーティングプロンプティング [cs.CV, cs.AI]目的:3D病変セグメンテーションへの効率的かつ効果的な転移
    • 近年の画像セグメンテーション技術の発展は,医療画像診断の精度向上に不可欠である。
    • 3D画像における病変は小さく不規則な形状が多く,セグメンテーションが困難である。
    • 中間特徴量の空間表現能力の向上と,前景・背景の不均衡を是正することを目指す。
    • 提案手法SGP-SAMは,自己ゲーティングプロンプティングモジュール(SGPM)により,空間情報を効率的に強化する。
    • SGPMは,特徴量への多スケール融合の必要性を予測し,状況に応じて活性化することで計算コストを削減する。
    • MSD Liver TumorおよびMSD Brain Tumorデータセットにおいて,既存手法と比較して高い精度を達成した。

    Link: https://arxiv.org/abs/2604.22825

  • Shape:産業用CAD解析のための自己教師あり3次元形状基礎モデル [cs.CV, cs.LG]目的:産業用CAD解析を支援する汎用的な3次元形状表現の確立
    • 産業用CADは製品開発の根幹であり,その効率化が重要である。
    • 既存の3次元形状表現は,精度や説明可能性に課題が残る場合がある。
    • 3次元形状の自己教師あり学習により,汎用的な形状表現を獲得すること。
    • 本研究で開発したShapeは,表面メッシュを高密度なトークン埋め込みに変換する。
    • Shapeは,構造化された3次元潜在グリッド,MAGNO,Transformerプロセッサを組み合わせている。
    • 評価実験の結果,Shapeは高い再構成精度と検索精度を達成した。

    Link: https://arxiv.org/abs/2604.22826

  • DGHMesh:大規模なデュアルレーダーmmWaveデータセットと,ヒューマンメッシュ再構成のための汎化に焦点を当てたベンチマーク [cs.CV, cs.LG]目的:ヒューマンメッシュ再構成のための大規模データセットおよび汎化性能評価ベンチマーク
    • ミリ波レーダーは,非接触かつプライバシーを保護し,堅牢な人間センシングに有用である。
    • 既存のミリ波レーダーを用いたヒューマンメッシュ再構成研究では,設定の変化に対する汎化性能の評価が不足している。
    • 様々な測定設定下でのヒューマンメッシュ再構成手法の汎化性能を客観的に評価するためのデータセットとベンチマークを提供する。
    • DGHMeshは,15人の被験者の8つの動作を収録した36万フレームからなる大規模なデータセットである。
    • 提案手法mmPTMは,マルチレーダー融合フレームワークを用いて高い精度と汎化性能を示すことが実験で明らかになった。
    • DGHMeshおよびmmPTMは,今後のミリ波レーダーを用いたヒューマンメッシュ再構成研究の発展に貢献する。

    Link: https://arxiv.org/abs/2604.22827

  • MetaEarth3D:空間的に拡張可能な生成モデリングによる世界規模3D生成の解禁 [cs.CV, cs.AI]目的:世界規模での3D生成
    • 地球観測やシミュレーションにおいて,広範囲な空間情報を扱う重要性が高まっている。
    • 既存の生成AIモデルは空間スケールが限定的で,大規模な地理環境の表現が困難である。
    • 大規模な空間スケールを考慮した生成モデルを開発し,地球規模の空間知能を実現すること。
    • MetaEarth3Dは,惑星規模で空間的に一貫性のある3D生成を可能にする最初の生成基盤モデルである。
    • 1000万枚の地球観測画像を用いて学習し,高い視覚的リアリズムと地理統計的リアリズムを両立している。
    • 次世代の空間知能を地球観測分野に活用するための基盤技術となりうる。

    Link: https://arxiv.org/abs/2604.22828

  • 3D姿勢推定のための2次元事前学習 [cs.CV, cs.LG]目的:3D姿勢推定における事前学習の効果検証
    • 深層学習において,入力データ理解の汎化が重要であり,事前学習はその有効な手段である。
    • 既存研究では,3D姿勢推定の事前学習に利用するデータセットが限定的であった。
    • 2次元データセットを用いた事前学習が,3D姿勢推定の性能向上に貢献するかを検証する。
    • 2次元での事前学習は,3次元データのみで学習するよりも,一貫して高い性能を示すことが確認された。
    • 特に計算効率の面で,2次元事前学習の優位性が明らかになった。
    • MPIIとHuman3.6Mを用いて,MPJPEスコア64.5mm以下を達成した。

    Link: https://arxiv.org/abs/2604.22830

  • 画像表現量と摂動トランスクリプトミクスを用いた介入を考慮した多重尺度表現学習 [cs.CV, cs.AI, cs.LG]目的:薬物発見のための画像表現学習における,介入情報を考慮した知識蒸留フレームワーク
    • 表現量の学習は,高スループットな薬物スクリーニングにおいて重要な役割を担う。
    • トランスクリプトミクスはコストが高く,データが限られているため,画像表現量との統合が課題である。
    • 弱くペア化されたデータにおける細胞型や用量変化を考慮し,未知の介入への汎化性能を向上させる。
    • 摂動トランスクリプトミクスを利用した教師モデルが,薬物類似性に基づいたコードブックからソフト分布を生成する。
    • 画像のみの生徒モデルは,教師モデルからの知識を蒸留することで,メカニズムに関する知識を獲得する。
    • Cell PaintingとRxRxデータセットを用いた実験で,未知の介入への転移学習と薬物標的遺伝子の発見において,既存手法を上回る性能を示した。

    Link: https://arxiv.org/abs/2604.22832

  • マイクロコントローラ向けWebSerialビジョン学習:デバイス上CNN学習のためのブラウザベースのコンパニオン [cs.CV, cs.LG]目的:TinyMLビジョンモデルの学習とSeeed Studio XIAO ESP32-S3 Senseへの展開のためのエンドツーエンドパイプライン
    • 組み込み機器での機械学習の需要が高まる中,学習環境の構築が課題となっている。
    • 従来の学習方法は,ソフトウェアのインストールや設定が煩雑で,手軽に試せない場合がある。
    • 本研究は,ブラウザ上で完結する学習環境を提供し,手軽にTinyMLモデルを開発できることを目指す。
    • 本システムは,Webブラウザ上でファームウェアの書き込み,画像収集,CNN学習,重みのエクスポート,活性化マップの可視化を可能にする。
    • TensorFlow.jsを用いた学習は,ブラウザ上で約1分で完了し,デバイス上での学習よりも高速である。
    • データは常にローカル環境に保持され,プライバシーを保護しつつ,学習,評価,展開のサイクルを約10分で実現する。

    Link: https://arxiv.org/abs/2604.22834

  • ParkingScenes:シミュレーション環境におけるエンドツーエンド自律駐車のための構造化データセット [cs.CV, cs.AI]目的:エンドツーエンド自律駐車のための構造化データセット
    • 都市部における駐車は困難であり,自動化技術の重要性が高まっている。
    • 自律駐車のための高品質で構造化されたデータセットが不足している。
    • 構造化されたデータセットを提供することで,自律駐車システムの性能向上を目指す。
    • ParkingScenesデータセットは,CARLAシミュレータ上で生成された16種類の縦列駐車と6種類の並列駐車シナリオを含む。
    • データセットはRGBカメラ,深度センサー,車両の状態,鳥瞰図など,豊富なマルチモーダルデータを提供する。
    • ParkingScenesで学習したモデルは,非構造化データで学習したモデルと比較して,駐車性能が大幅に向上した。

    Link: https://arxiv.org/abs/2604.22835

  • OAMVOS:第5回PVUW MOSEトラックの第2報告 [cs.CV, cs.AI]目的:SAMベースのトラッカーにおける頑健性の向上
    • 対象追跡は,自動運転やロボティクスなど,様々な分野で不可欠な技術である。
    • SAMベースのトラッカーは,長時間の遮蔽や急激な動きに弱く,特に小型物体で問題が顕著である。
    • 遮蔽や再出現に対する認識能力を高め,小型物体追跡の安定性を改善することを目指す。
    • 本研究では,DAM4SAMを拡張し,メモリ制御を改善することで,遮蔽や再出現に対する追跡性能を向上させた。
    • 信頼性に基づいた状態遷移機や分岐ベースの回復機構など,4つの要素を導入することで,状況に応じて最適なメモリ管理を実現した。
    • 小型物体の消失・再出現時には,古いアンカーへのアクセスを維持することで,追跡の継続性を高めている。

    Link: https://arxiv.org/abs/2604.22837

  • ニューラルネットワーク最適化の再考:スクラッチ学習とファインチューニングのための分離技術 [cs.CV, cs.AI]目的:ニューラルネットワークのスクラッチ学習とファインチューニングに適した最適化手法の分離
    • 大規模データと事前学習モデルの普及により,深層学習における最適化が重要視されている。
    • 既存の最適化手法は損失関数を最小化するのみで,スクラッチ学習とファインチューニングの違いに対応できていない。
    • スクラッチ学習とファインチューニングそれぞれに特化した最適化手法を開発し,性能向上を目指す。
    • DualOptは,スクラッチ学習にリアルタイムな層ごとの重み減衰を導入し,収束性と汎化性能を向上させる。
    • ファインチューニングにおいては,重みロールバックを最適化器に組み込み,モデル間の重み分布の整合性を保ち,知識の忘却を軽減する。
    • 層ごとの重み減衰を拡張し,ロールバックレベルを動的に調整することで,様々な下流タスクに対応する。

    Link: https://arxiv.org/abs/2604.22838

  • 骨格からピクセルへ:表現と予測の知識蒸留による少数ショット高精度イベントスポッティング [cs.CV, cs.AI]目的:少数ショット高精度イベントスポッティングにおける表現学習と予測の知識蒸留
    • スポーツ解析において,イベントの正確な検出は,競技の理解や分析に不可欠である。
    • イベントの発生は瞬間的であり,モーションブラーや微妙な動作の違いから正確な特定が困難である。
    • 限られたアノテーションデータで高精度なイベントスポッティングを実現する手法が求められている。
    • 適応重み知識蒸留(AWD)と焼きなまし多Modal知識蒸留(AMD-FED)の二つの戦略を提案し,F3Set-Tennis(sub)データセットで有効性を示した。
    • AMD-FEDは,骨格データの知識を視覚Modalに転送することで,少ないアノテーションでもロバストな性能を発揮した。
    • Figure SkatingデータセットにおいてもAMD-FEDの有効性を確認し,多Modal知識蒸留,特に表現レベルの転送の有効性を示した。

    Link: https://arxiv.org/abs/2604.22839

  • 構造的指針による検索拡張生成:事実に基づいた質問への対応 [cs.IR, cs.AI]目的:事実に基づいた質問に対する検索拡張生成の精度向上
    • 大規模言語モデルの幻覚(事実誤認)を抑制し,より信頼性の高い情報提供が求められている。
    • 従来の検索拡張生成はベクトル類似度に依存しており,ノイズに弱く,複雑な条件を満たせない場合がある。
    • 構造情報を活用し,検索精度を高め,複雑な条件を全て満たす回答生成を目指す。
    • 提案手法SG-RAGは,検索プロセスを埋め込みベースのサブグラフマッチングタスクとしてモデル化する。
    • ERQAデータセットを用いて評価した結果,SG-RAGは既存手法を大幅に上回り,全ての評価指標で顕著な改善が見られた。
    • SG-RAGは,評価指標において20.68~50.88ポイントの絶対的な改善を達成し,計算コストも許容範囲内に収まった。

    Link: https://arxiv.org/abs/2604.22843