arXiv雑要約

AI - 2026/04/02 公開

スマートレースロックセンサーを用いた座位・立位移行の検出と持続時間の測定 [eess.SY, cs.SY, cs.CL, cs.LG, cs.CV]目的：座位・立位移行の検出と持続時間の測定方法
- 高齢化社会において，転倒予防と自立した生活を支援する上で，姿勢制御の評価は重要である。
- 従来の評価方法では，専門的な設備や熟練した技能が必要であり，日常生活での継続的なモニタリングが困難である。
- 本研究は，簡便なウェアラブルセンサーを用いて，座位・立位移行を正確に検出し，持続時間を測定することを目指す。
- スマートレースロックセンサーを用いて，高齢者16名の座位・立位移行を評価した結果，高い検出精度が得られた。
- 袋集団決定木分類器は，座位・立位移行の分類において，98%の精度と80%のF1スコアを達成した。
- 座位・立位移行時間の測定誤差は平均で0.047秒であり，実用的なモニタリングへの可能性を示唆する。
Link: https://arxiv.org/abs/2604.00175
有限時間における射影付き二時間スケール確率的近似の解析 [eess.SY, cs.LG, cs.SY]目的：有限時間収束の解析
- 機械学習などの最適化問題において，効率的なアルゴリズムが求められている。
- 確率的近似アルゴリズムは，大規模問題に対して有効だが，収束速度の解析が困難である。
- 本研究は，射影付き二時間スケール確率的近似の収束速度を明確に評価することを目指す。
- 有限時間における平均二乗誤差の上界を導出した。誤差は制約された部分空間による近似誤差と統計誤差の二つの成分に分解される。
- 部分空間の選択（近似誤差）と平均化の範囲（統計誤差）の影響を明確に分離することができた。
- 合成問題と強化学習問題における数値実験を通じて，理論結果の妥当性を確認した。
Link: https://arxiv.org/abs/2604.00179
NFCベースの在庫管理システム：安全かつ効率的な通信 [cs.CR, cs.AI]目的：NFCを用いた在庫管理システムの開発
- 在庫管理は，サプライチェーン効率化やコスト削減に不可欠である。
- 従来のバーコードシステムは，セキュリティ脆弱性や物理的損傷のリスクがある。
- NFC技術を活用し，より安全で信頼性の高い在庫管理システムを構築する。
- 本研究では，電子店舗向けのNFCベースの在庫管理システムのプロトタイプを開発した。
- 各製品にNFCタグを貼り付け，顧客が購入する際にNFC通信を用いてレシートを発行する。
- NFCは，バーコードと比較して，セキュリティ，使いやすさ，効率性に優れていることが示唆された。
Link: https://arxiv.org/abs/2604.00181
エージェントAIと職業代替：新興労働市場の混乱に関する多地域タスク曝露分析 [eess.SY, cs.AI, cs.CY, cs.SY, econ.GN, q-fin.EC, stat.AP]目的：エージェントAIによる職業代替のリスク評価
- AI技術の進展は労働市場に大きな影響を与え，社会経済構造の変革を促す重要な要素である。
- 既存のタスクレベル分析では，複雑なワークフロー全体を代替するエージェントAIのリスクを十分に捉えられていない。
- 本研究は，エージェントAIがもたらす職業代替リスクを，新たな指標を用いて定量的に評価し，対策に資することを目的とする。
- エージェントAIのタスク曝露（ATE）スコアを用いて，2025年から2030年までの米国の主要テクノロジー地域における職業代替リスクを分析した。
- 分析の結果，Tier 1地域では，2030年までに分析対象の職業の93.2%が中程度の代替リスク（ATE >= 0.35）を超えることが示唆された。
- 同時に，AIとの協働，AIガバナンス，特定分野のAI運用など，17の新たな職業カテゴリーが創出される可能性が示された。
Link: https://arxiv.org/abs/2604.00186
視覚障碍者向け説明可能なAI：エージェント時代における信頼，モダリティ，解釈可能性の探求 [cs.HC, cs.AI, cs.ET]目的：視覚障碍者における説明可能なAIの要件
- AI技術の社会実装が進む中，その信頼性と透明性の確保が不可欠である。
- 既存の説明可能AI研究は視覚情報に偏っており，視覚障碍者への対応が遅れている。
- エージェント型AIにおける，視覚障碍者向けのアクセシブルな説明方法を模索する。
- 視覚障碍者はAIの失敗に対し，自己責任を感じやすい傾向があることが示唆された。
- 会話形式の説明が，視覚障碍者にとって特に重要なモダリティであることが明らかになった。
- マルチモーダルなインターフェース，失敗時の責任所在を考慮した説明，参加型開発が今後の課題である。
Link: https://arxiv.org/abs/2604.00187
AIエージェントの喧騒を理解する：導入，アーキテクチャ，実務家の教訓 [cs.SE, cs.AI, cs.NI]目的：AIエージェントの導入状況とアーキテクチャに関する実務家の知見
- AI技術の進化に伴い，自律的なシステムへの期待が高まっているため。
- 実務におけるAIエージェントの設計・導入に関する体系的な理解が不足している。
- 実務家の発表内容を分析し，AIエージェントの導入パターンを明らかにすること。
- 企業におけるAIエージェントの導入は，自動化，効率化，新たな価値創造を目的としている。
- LLMを基盤とするエージェントアーキテクチャの共通パターンが特定された。
- 応用分野は多岐にわたり，技術スタックも多様である。
Link: https://arxiv.org/abs/2604.00189
レヴィー・フローモデル：金融リスク管理のための重い裾を持つ正規化フロー [cs.LG]目的：金融リスク管理における重い裾を持つデータのモデリング
- 金融市場は，稀に起こる大きな変動を含むため，重い裾を持つ分布で記述する必要がある。
- 従来の正規分布ベースのモデルでは，金融データの重い裾を適切に捉えきれない場合がある。
- レヴィー過程に基づいた分布を用いることで，重い裾を持つデータのモデリング精度向上を目指す。
- レヴィー・フローモデルは，Variance Gamma (VG) および Normal-Inverse Gaussian (NIG) 分布をベース分布として使用することで，密度推定とリスク較正の大幅な改善を実現した。
- VGベースのフローは，ガウス分布ベースのフローと比較してテスト負の対数尤度を69%削減し，95% VaRの正確な較正を達成した。
- NIGベースのフローは，最も正確な期待手 shortfall の推定値を提供し，重い裾を持つデータのモデリングにおける有効性を示した。
Link: https://arxiv.org/abs/2604.00195
QUEST：クエリ変調球面注意を用いたロバストな注意機構 [cs.LG, cs.AI, cs.CV]目的：クエリとキーのノルム増加による学習不安定化問題の解決
- Transformerは深層学習で広く利用され，注意機構はその中核をなす。
- クエリとキーのノルムが任意に増加すると，学習が不安定になることがある。
- データ内の偽パターンによる学習不安定化を抑制し，ロバスト性を向上させる。
- QUESTは，キーをハイパースフェリック潜空間に制約することで学習の不安定性を解消する。
- 標準的な注意機構の置き換えが可能であり，汎用性も高い。
- 画像認識を含む様々なタスクで性能が向上し，データ汚染や敵対的攻撃に対するロバスト性も示された。
Link: https://arxiv.org/abs/2604.00199
オフライン制約付き複数好みのオラクルを用いたRLHF [cs.LG]目的：性能と安全性・公平性のトレードオフを考慮した，ターゲット集団の有用性最大化
- 強化学習において，人間のフィードバックを取り入れることで，より安全で公平な学習が可能になる。
- オフラインデータのみで学習を行う場合，データの偏りやノイズが性能に悪影響を及ぼす可能性がある。
- 複数の好みのオラクルを活用し，制約条件を満たしつつ，性能を向上させることを目指す。
- 提案手法は，KL正則化されたラグランジュ関数を用いて問題を定式化し，ギブス分布に基づく方策最適化を実現する。
- 制約条件の高確率での充足を保証する二重最適化アルゴリズムを提案し，オフライン制約付き好みの学習に対する有限サンプル性能保証を提供する。
- 理論解析を拡張し，複数の制約と一般化されたf-divergence正則化に対応可能であることを示す。
Link: https://arxiv.org/abs/2604.00200
教師なし学習による4DフローMRI速度強調と位相解包：発散のないニューラルネットワークの利用 [eess.SY, cs.SY, cs.RO, cs.LG]目的：4DフローMRIにおける速度場のノイズ軽減と位相解包の同時改善
- 心血管疾患の診断・治療において，4DフローMRIによる血流情報の正確な把握が重要である。
- 4DフローMRIでは，ノイズや位相解包のアーチファクトが速度計測の精度を低下させる問題がある。
- 速度場のノイズ軽減と位相解包を同時に行うことで，4DフローMRIの信頼性を高めることを目指す。
- DAF-FlowNetは，既存手法と比較して合成データにおいて速度誤差，方向誤差，発散量を低減した。
- 位相解包においては，ピーク速度/速度エンコーディング比が1.4および2.1において，残存位相包絡ボクセル数を大幅に減少させた。
- 患者データにおいても，微細な血流特徴を保持し，アーチファクトを補正，内部血流の一貫性を改善した。
Link: https://arxiv.org/abs/2604.00205
手書きおよび音声数字の分類のための鉛ジルコン酸チタン酸塩リザバーコンピューティング [cs.LG]目的：手書きおよび音声数字の分類
- 機械学習の分野において，エネルギー効率の良い計算手法の需要が高まっている。
- 従来の機械学習手法では，複雑なタスクにおいて計算コストや消費電力が課題となる。
- 低消費電力で動作する物理リザバーコンピューティングによる分類システムの開発。
- 鉛ジルコン酸チタン酸塩（PZT）リザバーは，MNIST手書き数字の分類において89.0%の精度を達成した。
- これは，同じ前処理済みデータに適用されたロジスティック回帰のベースラインよりも2.4%向上した結果である。
- 一方，AudioMNIST音声数字データセットでは，リザバーシステムとベースライン手法の精度はほぼ同等であった。
Link: https://arxiv.org/abs/2604.00207
重ね合わせにおけるニューラルシステムの表現的アラインメントの測定 [cs.LG]目的：ニューラルシステムの表現的アラインメント
- 神経科学と機械学習において，ニューラルネットワークの内部表現を比較することは重要な課題である。
- 既存のアラインメント指標は，表現の類似性が活動パターンの類似性につながると暗黙的に仮定している。
- 重ね合わせ状態におけるニューラルシステムの表現的アラインメントの問題を解決する。
- 重ね合わせは，表現類似性分析，中心カーネルアラインメント，線形回帰を系統的に低下させる。
- これらの指標は，潜在的な特徴ではなく，システムの重ね合わせ行列間の交差類似度に依存している。
- 特徴のスパース性により，元の特徴は低次元活動から回復可能であり，アラインメント指標は特徴そのものを比較する必要がある。
Link: https://arxiv.org/abs/2604.00208
パフォーマンス回帰検出のためのリスクを考慮したバッチテスト [cs.SE, cs.LG, cs.PF]目的：パフォーマンス回帰の検出における，リスクを考慮したバッチテストの有効性
- 大規模CIシステムにおいて，パフォーマンス回帰テストは不可欠だが，全テストの実行はコストが嵩む
- 従来のバッチテスト戦略は，コミットごとの異質性を考慮せず，実用性に課題があった
- 機械学習によるコミットリスクと適応的バッチングを統合し，CIリソース消費を削減すること
- Mozilla Firefoxを用いた実験により，CodeBERTを用いたリスク推定でROC-AUC 0.694を達成
- リスクを考慮したバッチテスト戦略（RAPB-la）により，テスト実行回数を32.4%削減
- RAPB-laは，フィードバック時間を3.8%短縮し，年間インフラコストを約491Kドル削減
Link: https://arxiv.org/abs/2604.00222
大規模言語モデル蒸留のための多様性を考慮した逆カルバック・ライブラー発散 [cs.LG, cs.AI]目的：大規模言語モデルの知識蒸留における最適化手法
- 近年，大規模言語モデルの活用が拡大しており，効率的な知識伝達が重要となっている。
- 従来の知識蒸留手法では，教師モデルと生徒モデルの能力差や語彙サイズが大きい場合に性能が低下する。
- 逆カルバック・ライブラー発散の過信傾向と非ターゲットクラスの指導の弱さを改善し，多様性を向上させる。
- 本研究では，多様性を考慮した逆カルバック・ライブラー発散（DRKL）を提案し，勾配効果の除去と非ターゲットクラスの指導強化を実現した。
- DRKLは，様々なデータセットとモデルファミリーにおいて，FKLやRKLを含む最先端の蒸留手法を上回り，性能と忠実度・多様性のトレードオフを改善した。
- DRKLは，教師モデルの知識をより効果的に生徒モデルに伝達し，より多様で高品質な出力を生成することが示された。
Link: https://arxiv.org/abs/2604.00223
ニューラル崩壊ダイナミクス：深さ，活性化，正則化，および特徴ノルム閾値 [cs.CL, cs.LG]目的：ニューラル崩壊の開始を支配するダイナミクスの特徴付け
- 深層学習モデルの汎化性能向上には，表現学習の理解が不可欠である。
- ニューラル崩壊の開始タイミングの予測は困難であり，そのメカニズムは不明であった。
- 特徴ノルムを指標として，ニューラル崩壊の開始タイミングを予測する。
- ニューラル崩壊は，平均特徴ノルムがモデル・データセット固有の臨界値fn*に達した際に発生する。
- fn*は学習条件に依存せず，その値は各(モデル，データセット)ペア内で集中している(CV < 8%)。
- ResNet-20とMNISTにおいてfn* = 5.867という，アーキテクチャ効果の大きな値が確認された。
Link: https://arxiv.org/abs/2604.00230
MAC-Attention：高速かつ正確なAttention計算のためのマッチ・修正・補完スキーム [cs.LG, cs.AI, cs.DC]目的：長文脈デコーディングにおけるAttention計算の高速化と精度維持
- 大規模言語モデルの性能向上には，長文脈を効率的に処理する技術が不可欠である。
- 従来のAttention計算は，文脈長が長くなるほど計算量が増大し，ボトルネックとなる。
- MAC-Attentionは，過去のAttention計算を再利用することで，計算量と帯域幅を削減し，高速化を実現する。
- MAC-Attentionは，LongBench v2，RULER，LongGenBenchにおいて，KVアクセスを最大99%削減した。
- 128Kの文脈長において，トークン生成遅延を60%以上削減し，Attentionフェーズの速度を最大14.3倍に向上させた。
- 計算再利用により，高速かつ忠実な長文脈推論を実現し，従来のFlashInferライブラリと比較してエンドツーエンドの速度も最大2.6倍に向上。
Link: https://arxiv.org/abs/2604.00235
グラフ生成のための階層的離散フローマッチング [cs.LG]目的：グラフ生成における効率化と分布の捉え方
- グラフ構造データは，社会システムや分子構造など多様な分野で重要視されている。
- 既存のグラフ生成モデルは，ノード数増加に伴う計算コストと生成ステップ数の多さが課題である。
- ノードペア評価数を削減し，離散フローマッチングを用いて生成時間を短縮することを目的とする。
- 提案手法は，グラフ分布をより効果的に捉えつつ，生成時間を大幅に削減できることを実験的に示した。
- 階層的生成フレームワークは，評価対象のノードペア数を減らすことに貢献する。
- 離散フローマッチングの採用により，デノイジングの反復回数を大幅に減少させることに成功した。
Link: https://arxiv.org/abs/2604.00236
AIを活用した正義のための説明可能な規制 [cs.CY, cs.AI, cs.MA]目的：正義のための説明可能な規制の提案
- 社会や民主主義に影響を与えるため，公正な規制は不可欠である。
- 既存の規制決定プロセスは，不透明で影響を受けやすく，正当性に疑問がある。
- AIを用いて，説明可能で適応性のある規制提言を創出することを目指す。
- 分散型AIを利用することで，静的で説明のつかない，影響されやすい既存の規制問題を解決する。
- ステークホルダーの選好をモデル化し，価値に基づいた方法で集約することで，正義，正当性，コンプライアンスを支援する。
- 事実や価値観の変化に応じて更新可能で，透明性の高い規制提言システムを提案する。
Link: https://arxiv.org/abs/2604.00237
分散最小化とリスク回避型多腕バンディットのためのソフトマックス勾配方策 [cs.CL, cs.LG, cs.AI, cs.NA, math.NA]目的：分散最小化およびリスク回避型多腕バンディット問題における方策
- 逐次意思決定問題において，最適な行動選択は重要であり，様々な分野で応用されている。
- 従来の多腕バンディット問題は期待報酬の最大化に焦点が当てられがちで，リスクを考慮したアプローチが不足している。
- 本研究は，安定性を重視し，分散を最小化するようなリスク回避型多腕バンディット問題を解決することを目的とする。
- ソフトマックスパラメータ化された方策を用い，分散最小化（または最小リスク）アームを選択する新しいアルゴリズムを提案した。
- 提案アルゴリズムは，現在の腕分布からの2つの独立した抽出を用いて目的関数の不偏推定量を作成し，自然な条件下での収束性を示す。
- 数値実験により，提案アルゴリズムの実用的な振る舞いを検証し，実装上の指針を示した。
Link: https://arxiv.org/abs/2604.00241
REM-CTX：強化学習と補助的文脈を用いた自動ピアレビュー [cs.CL, cs.AI]目的：自動ピアレビューの品質向上
- 研究評価の効率化が求められる中，ピアレビューの自動化は重要である。
- 従来のシステムはテキストのみに依存し，図表や学術的背景などの文脈が活用されていない。
- 補助的文脈を考慮することで，より質の高い自動ピアレビューを目指す。
- REM-CTXは，既存の6つのベースラインモデルを上回り，特に大規模な商用モデルと比較して優れたレビュー品質を示した。
- 2つの照合報酬は互いに補完的であり，品質を維持しつつ特定の照合報酬を改善することが確認された。
- 訓練動態の分析から，批判的側面が他の指標と負の相関があることが示唆され，多次元報酬のグルーピングが課題である。
Link: https://arxiv.org/abs/2604.00248
行動保健コミュニケーションシミュレーションのための安全性に配慮したロールオーケストレーション型マルチエージェントLLMフレームワーク [cs.AI, cs.MA]目的：行動保健コミュニケーションのシミュレーション
- メンタルヘルスケアの重要性が高まる中で，対話を通じた支援システムの開発が求められている。
- 単一のLLMでは，多様な対話機能を維持しつつ，安全性確保が課題となっていた。
- ロール分担と安全性監視により，より効果的かつ安全なシミュレーションを目指す。
- 本フレームワークでは，共感，行動，監督の各ロールを担うエージェントが連携し，役割分化が明確に示された。
- エージェント間の協調性，モジュール性，安全性監視，応答速度の間には予測可能なトレードオフが存在することが示された。
- このフレームワークは，行動保健インフォマティクスや意思決定支援研究のためのシミュレーション・分析ツールとして活用が期待される。
Link: https://arxiv.org/abs/2604.00249
知識ランドマークを用いた情報に基づいた機械学習 [eess.SY, cs.SY, math-ph, math.DS, math.MP, math.OC, cs.LG]目的：知識とデータの統合による機械学習モデルの構築
- 機械学習の汎化性能向上には，データのみならず，背景知識の活用が不可欠である。
- 既存の機械学習は，データの局所性と知識の抽象性の違いを十分に活かせていない。
- データと知識の相補性を活かし，よりロバストで汎化性能の高い機械学習モデルを構築する。
- 提案手法KD-MLは，データ駆動型機械学習モデルと比較して，物理法則に基づいたベンチマークにおいて一貫して高い性能を示した。
- 損失関数におけるハイパーパラメータは，データと知識の貢献度のバランスを調整する上で重要な役割を果たす。
- データのノイズレベルと知識ランドマークの粒度によって，モデルの性能が変化することが示された。
Link: https://arxiv.org/abs/2604.00256
不完全なデモンストレーションと変動する報酬を用いた階層型徒弟学習 [cs.LG, cs.AI]目的：不完全なデモンストレーションと変動する報酬からの徒弟学習
- 教育現場では，効果的な指導方針を学生とのインタラクションから直接導き出す徒弟学習が注目されている。
- 従来の徒弟学習は，固定された報酬のもとで最適またはほぼ最適な専門家のデモンストレーションに依存する点が課題であった。
- 本研究は，不完全な学生のデモンストレーションを構造化された信号として活用し，より正確な指導方針を導き出すことを目指す。
- 提案手法HALIDEは，不完全な学生のデモンストレーションを階層的な学習フレームワーク内でランク付けすることで，学生の行動を多層的にモデル化する。
- HALIDEは，最適な軌跡や固定報酬に依存する手法と比較して，学生の教育的決定をより正確に予測できることが示された。
- 本手法は，一時的なエラーと最適な戦略，そしてより高次の学習目標への有意な進捗を区別する能力を持つ。
Link: https://arxiv.org/abs/2604.00258
全体評価と分析的評価基準下でのLLMエッセイ採点：プロンプトの影響とバイアス [cs.CL, cs.AI]目的：LLMによるエッセイ採点における，人間による採点との一致度，方向性バイアス，及びバイアス推定の安定性
- 教育評価におけるLLMの活用に関心が高まっているが，その妥当性の検証が重要である。
- LLMの採点結果が，人間による採点と必ずしも一致せず，バイアスが存在する可能性がある。
- LLMのバイアスを特定し，少量のデータで修正可能な戦略を提案する。
- LLMは全体評価においては人間との高い一致度を示すが，分析的評価においては一貫性がない。
- 文法や構成などの低次評価項目において，LLMは人間よりも厳格な採点を行う傾向が見られた。
- 簡潔なキーワードベースのプロンプトが，詳細な評価基準形式のプロンプトよりも，多項目分析的評価において良好な結果を得る。
Link: https://arxiv.org/abs/2604.00259
シャッフルの学習：確率的最適化のためのブロック再配置と反転スキーム [cs.LG, math.OC]目的：確率的勾配降下法におけるデータ順序の最適化
- 機械学習の性能向上には，最適化アルゴリズムの効率化が不可欠である。
- 既存のシャッフル戦略では，さらなる最適化定数や安定性の改善が難しい。
- LLMを活用し，ランダムシャッフルを超える新たなシャッフル則を開発する。
- ブロック再配置は，既存のシャッフル戦略と比較して，勾配分散を厳密に減少させる。
- ペア反転は，エポックマップを対称化し，ステップサイズへの依存度を低減する。
- 実験結果は，提案手法が凸型・非凸型の両方のベンチマークにおいて，従来のシャッフルスキームよりも優れていることを示している。
Link: https://arxiv.org/abs/2604.00260
強化学習による化学積分に対する自律適応ソルバー選択 [cs.CL, cs.LG]目的：化学積分における暗黙的BDF積分法と準定常状態ソルバーの選択
- 反応流シミュレーションにおいて，硬い化学反応速度論の計算コストがボトルネックとなる。
- 従来のハイブリッド積分戦略は，局所的な状態に依存した経験則や教師あり学習に頼る。
- 本研究は，将来的な誤差蓄積を考慮した自律的なソルバー選択を目指す。
- 強化学習を用いた適応戦略により，平均約3倍の高速化が達成された。
- 0次元均一反応器条件で，高速化は1.11倍から10.58倍の範囲で変動した。
- 学習済みの戦略は1次元逆流拡散炎に転移し，CVODEと比較して約2.2倍の高速化を示した。
Link: https://arxiv.org/abs/2604.00264
相互作用のベンチマーク：協調インスタンスオブジェクトナビゲーションのための再現可能な基準 [cs.CV, cs.AI]目的：協調インスタンスオブジェクトナビゲーションにおける，ナビゲーション能力と協調的な質疑応答能力の明確な評価
- ロボットによる現実世界でのナビゲーションは，人間の指示に基づき，曖昧さを解消する必要がある。
- 既存のベンチマークはナビゲーション成功に偏重しており，協調的対話の評価が不十分である。
- ナビゲーションと質疑応答を分離し評価可能なベンチマークを構築することで，対話型AIモデルの性能向上を目指す。
- 新しいベンチマークQAsk-Navを開発し，ナビゲーションと質疑応答を独立して評価可能にした。
- QAsk-Navは28,000件の質疑応答データを含み，CoINモデルの学習と分析を支援する。
- 軽量なモデルLight-CoNavを開発し，既存手法よりも高速かつ汎化性能が高いことを示した。
Link: https://arxiv.org/abs/2604.00265
物理的AIのためのハイブリッドエネルギーベースモデル：ポートハミルトニアンダイナミクスの証明可能な安定な同定 [eess.SY, cs.AI, cs.LG, cs.SY, math.DS]目的：ポートハミルトニアンダイナミクスの安定な同定手法
- 物理現象をモデル化する上で，エネルギー保存則や構造保存則は重要である。それらを組み込んだAIモデルは解釈性が高い。
- 従来のエネルギーベースモデルは，安定性に関する保証が乏しく，不安定な挙動を示す可能性がある。
- 安定性に関する理論的保証を持つエネルギーベースモデルを開発し，安全性を考慮した物理AIを実現すること。
- 本研究では，吸収不変性に基づく新しいエネルギーベースモデルのフレームワークを提案した。
- 提案手法は，非滑らかな活性化関数に対しても負のエネルギー散逸を保証し，安定性と表現力のトレードオフを克服する。
- 数値実験により，提案アーキテクチャが，安定性と安全性を保証しながら高い表現力を実現することを示した。
Link: https://arxiv.org/abs/2604.00277
妥協の幾何学：制御可能なモダリティアラインメントによる生成能力の解放 [cs.CV, cs.AI]目的：画像とテキストの共有埋め込み空間におけるモダリティギャップの低減
- 画像とテキストを組み合わせた処理は，様々な応用分野で重要性が増している。
- 既存モデルでは，画像とテキストの表現間に「モダリティギャップ」が存在し，性能を制限している。
- 本研究では，モダリティギャップを構成する要素を分析し，両方のギャップを同時に低減する手法を提案する。
- 提案手法TPC-CMAは，モダリティギャップを最大82.3%まで低減することを示した。
- クラスタリングARIは0.318から0.516に，キャプション評価指標CIDErは57.1%向上した。
- わずか4.84%の精度低下で，66.6%のギャップ低減を達成した。
Link: https://arxiv.org/abs/2604.00279
VeriAct：検証可能性を超えて - 正確かつ完全な形式仕様の能動的合成 [cs.SE, cs.AI]目的：正確かつ完全な形式仕様の自動合成
- ソフトウェアの信頼性確保において，形式仕様は不可欠な役割を担う分野である。
- 高品質な形式仕様の自動合成は難しく，専門知識が要求されるという課題がある。
- 検証合格だけでは不十分な，形式仕様の正確性と完全性を高めることを目指す。
- 従来のプロンプトベースのアプローチとVeriActを比較した結果，VeriActの方が検証合格率，正確性，完全性の全てで優れていることが示された。
- 検証合格仕様の多くが，実際には不正確または不完全であり，入力と出力に関して過剰または不十分な制約を持っていることが判明した。
- Spec-Harnessを用いることで，検証器だけでは見えない仕様の不備を検出可能となり，より信頼性の高い形式仕様の作成に貢献する。
Link: https://arxiv.org/abs/2604.00280
LLM支援コンピューターサイエンス教育における目的ドリフトの人間介在制御 [cs.AI]目的：LLM支援コンピューターサイエンス教育における目的ドリフト制御の人間介在アプローチ
- AI技術の教育利用は，学習効果の向上や個別最適化に貢献しうるため重要である。
- LLMの出力は時に課題仕様から逸脱し，教育現場における信頼性や効果を損なう可能性がある。
- 人間がLLMの挙動を制御し，目的ドリフトを抑制するための教育方法を確立すること。
- 本研究では，システム工学と制御理論の概念に基づき，目的と世界モデルを学生が設定・構成可能な運用上の成果物として捉えた。
- パイロットの学部CS実験カリキュラムを提案し，計画と実行の分離，受容基準とアーキテクチャ制約の指定を訓練した。
- 3つのグループ間で感度分析を行い，現実的な条件下での効果量検出可能性を検証した。
Link: https://arxiv.org/abs/2604.00281
拡散モデルとPAC保証によるデータ駆動型到達可能性解析 [cs.HC, eess.SY, cs.LG, cs.SY]目的：非線形動的システムの到達可能性解析のためのデータ駆動型フレームワーク
- 動的システムの安全性評価は，ロボティクスや制御工学において重要な課題である。
- 従来の到達可能性解析法は，計算コストが高く，高次元システムには適用が困難である。
- 本研究は，データのみから効率的に到達可能性を推定する手法を開発する。
- 提案手法では，拡散モデルを用いて動的システムの状態分布を学習する。
- 再構成誤差に基づく非適合性スコアを用いて到達可能な集合を推定し，Learn Then Test法で閾値を調整する。
- 実験結果から，提案手法はPAC保証を満たしつつ，古典的な手法では扱えない高次元システムにも適用できることが示された。
Link: https://arxiv.org/abs/2604.00283
AIエージェントの社会性を測る即興ゲーム：Connectionsの場合 [cs.AI, cs.MA]目的：AIエージェントの社会性に関する評価基準
- AIの発展に伴い，人間との協調や相互理解が重要になっている。
- 既存のAI評価では，社会的な推論能力の測定が困難である。
- AIエージェントの社会性を評価する新たな指標を確立すること。
- 即興ゲームConnectionsは，知識検索，要約，認知状態の認識能力を組み合わせる。
- Connectionsは，言語モデルベースのエージェントの社会性を測る新たなベンチマークとして有効である。
- 限られた環境下でのコミュニケーションを通じて，AIエージェントは社会性を示す必要がある。
Link: https://arxiv.org/abs/2604.00284
MambaVoiceクローニング：ステートスペースモデルと拡散制御による効率的かつ表現力豊かなテキスト読み上げ [eess.SY, cs.SY, eess.SY, cs.SY, cs.CL, cs.SD, cs.LG]目的：拡散に基づくテキスト読み上げにおける条件付け経路の完全なSSM化
- 自然な音声合成技術は，人間とコンピューターのコミュニケーションを円滑にする上で不可欠である。
- 従来のテキスト読み上げモデルは，計算コストが高く，メモリ消費量が多いという課題があった。
- 本研究は，より効率的で安定したテキスト読み上げモデルの実現を目指す。
- MVCは，StyleTTS2，VITS，Mamba-attentionハイブリッドと比較して，MOS/CMOS，F0 RMSE，MCD，WERにおいてわずかながら統計的に有意な改善を達成した。
- エンコーダーのパラメータ数を21Mに削減し，スループットを1.6倍に向上させた。
- 拡散が主要な遅延源のままであるものの，SSMのみの条件付けにより，メモリフットプリント，安定性，デプロイ可能性が向上した。
Link: https://arxiv.org/abs/2604.00292
SYNTHONY：ストレスを考慮した意図条件付きエージェントによる深層テーブル生成モデル選択 [cs.LG, stat.ML]目的：深層テーブル生成モデルの選択
- テーブルデータのプライバシー保護やデータ拡張に深層生成モデルが活用される場面が増加している。
- データセットの分布特性によって最適な生成モデルが異なり，実用上の展開が困難になっている。
- データセットの特性とユーザの意図に基づいて，最適な生成モデルを効率的に選択すること。
- データセットの困難度を定量化する「ストレスプロファイリング」が生成モデルの性能予測に有効であることが示された。
- ストレスプロファイリングに基づく$k$NNセレクタは，ゼロショットLLMやランダムベースラインと比較して，トップ1選択精度が大幅に向上した。
- 性能予測におけるキャパビリティレジストリの限界が示され，学習可能なキャパビリティ表現が今後の課題として挙げられた。
Link: https://arxiv.org/abs/2604.00293
SANA I2I：テキストフリーフローマッチングフレームワーク - ペア画像間の画像変換とその胎児MRIアーチファクト低減への応用 [cs.HC, cs.CV, cs.AI]目的：ペア画像間の画像変換のためのテキストフリー高解像度画像生成フレームワーク
- 医療画像処理は，診断精度向上に不可欠であり，近年その重要性が増している。
- 高品質なペア画像データの取得が困難であり，教師あり学習のボトルネックとなっている。
- テキストプロンプトに頼らず，ペア画像のみで画像変換を可能にし，データ取得の課題を解決する。
- SANA I2Iは，テキスト条件なしで高解像度な画像生成を可能にする。
- 胎児MRIのモーションアーチファクト低減において，解剖学的構造を維持しつつ効果的なアーチファクト抑制を実現した。
- 少ステップでの推論で競合する性能を示し，医療画像における効率的な画像変換の可能性を示唆する。
Link: https://arxiv.org/abs/2604.00298
多段階LLMエージェントのための非対称アクター・クリティック [cs.CL, cs.AI]目的：多段階対話におけるLLMエージェントの信頼性向上
- LLMは推論・対話能力に優れるが，実用化には一発成功が求められる場面が多い。
- 既存手法は再試行を必要とするか，商用LLMを活用できないという課題がある。
- 商用LLMを損なわずに，エージェントの信頼性とタスク成功率を高めることを目指す。
- 強力な商用LLMをアクター，小規模なオープンソースLLMをクリティックとして非対称な枠組みを提案。
- クリティックはアクターの行動を監視し，同じ対話内で介入することで信頼性を向上。
- 実験により，提案手法が既存手法と比較して，信頼性とタスク成功率を大幅に改善することを確認。
Link: https://arxiv.org/abs/2604.00304
入力制約のある離散時間システムに対する値関数に基づく安定化領域の特性評価とニューラル近似 [eess.SY, cs.NE, cs.SY, math.DS, math.OC]目的：入力制約のある離散時間システムの安定化領域の推定
- 非線形システムの安定化は制御工学における重要な課題であり，その実現には安定化可能な制御不変集合の正確な把握が不可欠である。
- 一般的な非線形システムに対する安定化領域の推定は，理論的・計算的な限界により，未だ困難な問題である。
- 本研究では，安定化領域の推定に関する新たな枠組みを提案し，その困難性の克服を目指す。
- コンパクト集合の空間で定義される新しい値関数を通じて，安定化領域を特徴づけることに成功した。
- 物理情報を取り入れたニューラルネットワークフレームワークを開発し，導出された関数方程式を学習プロセスに組み込むことで，値関数を効率的に学習することが可能となった。
- 数値例を通して，提案手法が安定化領域を高精度に推定し，安定化コントローラを合成できることを示した。
Link: https://arxiv.org/abs/2604.00305
SAGE：プロキシ事後分布を用いたAI駆動型地下地質統計抽出 [cs.LG, physics.geo-ph, stat.ML]目的：地下速度モデルの統計的整合性のあるプロキシ生成
- 地下構造解析は資源探査や地盤工学において重要であり，精度の高い速度モデルが不可欠である。
- 従来の速度モデル構築法は，高品質なデータセットを必要とし，現実的にはデータ不足が課題となる。
- 本研究は，限られたデータから地質学的に妥当な速度モデルを効率的に生成することを目指す。
- SAGEは，ウェルログや地震探査データを用いて，統計的に整合性のある地下速度モデルを生成するフレームワークである。
- 学習済みのSAGEは，地震探査画像のみから高解像度の速度場を生成可能であり，ウェル情報の制約を間接的に反映する。
- 合成データおよび実データを用いた検証により，SAGEが限られた観測制約下でも複雑な地下変動を捉えられることが示された。
Link: https://arxiv.org/abs/2604.00307
慢性心不全のモニタリングにおける音声由来の予後予測デジタルバイオマーカー：縦断的観察研究 [cs.SD, cs.LG]目的：慢性心不全患者における健康状態悪化の予測に関わる音声特徴の評価
- 心不全は進行性の疾患であり，医療経済的負担が大きい。早期発見と介入が重要である。
- 既存の在宅モニタリングは予測精度が低く，患者の積極的な参加が必要とされる。
- 本研究は，音声データを用いた早期の健康状態変化の検出による，より積極的なケアを目指す。
- 音声の母音特徴は健康状態と強い相関関係が認められた。
- 過去の音声データに基づく時系列特徴は，既存のモニタリング指標よりも高い感度と特異度を示した（0.826/0.782 vs 0.783/0.567）。
- エネルギーシフトの遅延，エネルギー変動の低さ，母音のシマー変動の高さなどが，健康状態悪化の重要な指標となった。
Link: https://arxiv.org/abs/2604.00308
条件付きデコーディングによる堅牢なマルチモーダル安全性 [eess.SY, cs.SY, cs.LG, cs.AI]目的：マルチモーダル大規模言語モデルにおける安全性向上
- 大規模言語モデルの利用拡大に伴い，安全性確保が重要課題となっている。
- マルチモーダルモデルは，クロスモーダルな相互作用により安全性が損なわれやすい。
- 本研究は，外部分類器等を用いずに，マルチモーダルモデルの安全性を高めることを目指す。
- 提案手法CASAは，内部表現を用いて安全トークンを予測し，悪意のあるクエリを検出する。
- 多様なベンチマークにおいて，CASAは攻撃成功率を97％以上低下させた。
- CASAは，通常の入力に対する有用性を維持し，安全性と性能の両立を実現した。
Link: https://arxiv.org/abs/2604.00310
ネットワークテレメトリにおける障害検知と原因分析のための協調型AIエージェントと批評家 [cs.DC, cs.NI, cs.AI, cs.MA]目的：ネットワークテレメトリにおける障害検知，重症度評価，および原因分析のための協調的AIシステム
- ネットワークシステムの安定運用には，迅速かつ正確な障害検知と原因特定が不可欠である。
- 従来の障害検知手法では，複雑なネットワーク環境における多様な障害に対応することが困難である。
- 複数エージェントと批評家による協調学習を通じて，高精度な障害分析を実現する。
- 提案手法では，AIエージェントと批評家が連携し，マルチモーダルタスクを効率的に解決する。
- 各エージェントと批評家は，コスト関数を秘匿したまま，協調的にシステム全体のコストを最小化する。
- ネットワークテレメトリの事例において，提案手法の有効性が実証された。
Link: https://arxiv.org/abs/2604.00319
整列されたAIシステムの持続的な脆弱性 [cs.RO, cs.SY, eess.SY, cs.CL, cs.CY, cs.LG, cs.AI]目的：AI安全性の課題解決
- AIの自律性が高まるにつれ，予期せぬ挙動によるリスクが顕在化している。
- 既存の安全対策では，高度なAIモデルに対する脆弱性を完全に排除できない。
- AIシステムの危険な挙動を検出し，修正，予測するための手法を確立する。
- 回路発見自動化ツールACDCが，Transformerの回路を効率的に抽出することに成功した。
- 潜在的敵対的学習（LAT）により，既存の安全対策が失敗するスリーパーエージェント問題を解決した。
- Best-of-N脱獄攻撃は，GPT-4oとClaude 3.5 Sonnetに対して高い攻撃成功率を示し，敵対的頑健性の定量的な予測を可能にした。
- エージェントの誤動作率は，シナリオが現実であると認識した場合，6.5%から55.1%に上昇し，モデルの危険な行動を露呈した。
Link: https://arxiv.org/abs/2604.00324
測度値ニューラルネットワーク：粒子データからのMcKean-Vlasov力学の学習 [math.NA, cs.LG, cs.NA, physics.comp-ph]目的：McKean-Vlasov力学の学習手法
- 生物学を含む多様なシステムにおいて，相互作用から生まれる集団行動の理解が重要である。
- 相互作用をデータから学習するには，確率分布への対応が課題であった。
- 粒子データから直接，測度依存的な相互作用項を推論する新たな手法を開発する。
- 本研究で提案する測度値ニューラルネットワークは，確率測度上で動作し，スケーラブルな分布-ベクトル表現を学習する。
- 理論的に，生成される力学系のwell-posednessと，関連する相互作用粒子系のchaos propagationが証明された。
- 数値実験により，様々なシステムにおいて，精度の高い予測と外挿性能が示された。
Link: https://arxiv.org/abs/2604.00333
キャリアデータが枯渇したとき：創業者成功予測のための構造化特徴量エンジニアリングとシグナル限界 [eess.SY, cs.SY, eess.SY, cs.SY, cs.LG]目的：創業者成功の予測モデル構築
- スタートアップの成功予測は，投資判断やリソース配分において不可欠である。
- 創業者データからは弱いシグナルしか得られず，成功事例は稀少である。
- 既存データの限界を明らかにし，より豊富なデータが必要となる要素を示す。
- 構造化特徴量エンジニアリングとXGBoostモデルにより，Val F0.5 = 0.3030を達成した。
- プロットからの特徴量抽出では，モデル重要度の26.4%を占めたが，CVスコアは悪化した。
- データセットの情報量が予測性能の天井を決定していることが示唆された。
Link: https://arxiv.org/abs/2604.00339
LLMベースのGraphQAのためのグラフプーリングトークン：1つのトークンで十分か？ [cs.LG]目的：大規模言語モデル(LLM)を用いたグラフ質問応答(GraphQA)におけるグラフ構造情報の効果的なエンコード方法の検討
- グラフニューラルネットワーク(GNN)とLLMの統合はGraphQAにおいて有望な手法だが，複雑な構造情報のLLMへのエンコードが課題。
- 既存手法はグラフ部分構造を単一トークンに圧縮するため，情報ボトルネックが生じ，性能が制限される。
- マルチトークンプーリングとグローバルアテンション機構により，情報ボトルネックを解消し，グラフエンコーダの品質を向上させる。
- マルチトークンプーリングはグラフからLLMへのインターフェース帯域を拡大し，より多くの情報を伝達可能にする。
- Virtual Node Pooling(VNPool)やプルーニング法を用いた階層的な射影は，LoRAによる安定化により，フルグラフベースラインに匹敵する性能を示す。
- GraphQAベンチマークは表現飽和の問題を抱えており，ターゲット回答は孤立したノード特徴と強い相関があることが示唆された。
Link: https://arxiv.org/abs/2604.00342
大規模化か，あるいは撤退か：ブライテンベルギア型ロボットによる集団行動のシミュレーション [cs.RO, cs.CL, stat.AP, cs.RO, cs.AI]目的：集団行動における，捕食者回避と群がる行動のシミュレーション
- 動物行動理解に応用でき，協調行動のメカニズム解明に貢献する可能性があり重要である。
- ロボット群の協調行動を効果的に実現する制御機構が確立されていないという課題がある。
- 捕食者に対する群がり行動の成功率に影響を与える要因を明らかにすることを目指す。
- 群がる行動の呼び出し範囲とロボット群のサイズが，行動の成功に大きな影響を与えることが示唆された。
- 呼び出し範囲が広いほど，またロボット群が大きいほど，群がり行動は成功しやすい傾向が見られた。
- 本研究は，人工生命における行動選択シミュレーションや自律エージェントの制御アーキテクチャ設計に応用可能である。
Link: https://arxiv.org/abs/2604.00350
ストレス応答性貯留層における高次元井戸制御のための深層学習加速サロゲート最適化 [cs.LG]目的：ストレス応答性貯留層における高次元井戸制御の最適化
- 貯留層における生産最適化は，エネルギー資源開発において重要な課題である。
- 従来の最適化手法は計算コストが高く，複雑な貯留層モデリングのボトルネックとなっている。
- 深層学習を活用し，計算コストを削減しつつ高次元制御の最適解を効率的に探索する。
- 深層学習によるサロゲートモデルは，フル物理シミュレーションの結果と2～5％以内の誤差で一致した。
- 本手法により，計算コストを最大で3桁削減することが可能となった。
- 問題に応じたサンプリング戦略とサロゲートモデリングの組み合わせが，高次元最適化問題への応用を可能とする。
Link: https://arxiv.org/abs/2604.00352
シグナル：エージェント間インタラクションのための軌跡サンプリングとトリアージ [cs.AI, cs.CL]目的：エージェント間インタラクション軌跡のトリアージ
- 大規模言語モデルに基づくエージェント応用の普及に伴い，その改善が不可欠となっている。
- 軌跡データは膨大かつ非決定論的であり，レビューにはコストと時間がかかるという課題がある。
- 効率的な軌跡トリアージ手法を確立し，改善のための情報収集を加速させる。
- 提案手法は，インタラクション中に計算される軽量なシグナルを用いて，有益な軌跡を効率的に特定する。
- τ-benchを用いた評価により，シグナルに基づくサンプリングは，ヒューリスティックフィルタリングやランダムサンプリングと比較して，情報取得率が大幅に向上することが示された。
- シグナルは，報酬レベルやタスク領域に関わらず，軌跡ごとの情報量を向上させることが確認された。
Link: https://arxiv.org/abs/2604.00356
gpt-ossとの調和 [cs.AI, cs.LG]目的：gpt-oss-20bの性能評価の再現
- 大規模言語モデルの客観的評価は，その能力を理解し，改善するために不可欠である。
- OpenAIの論文では，使用したツールや評価環境が明示されておらず，再現性が課題となっていた。
- モデルが利用するツールを特定し，ネイティブな評価環境を構築することで，再現性を高める。
- gpt-ossがツールを呼び出すパターンを解析し，訓練データ由来のツール利用傾向を明らかにした。
- モデルのネイティブ形式でメッセージをエンコードするharmony agent harnessを開発した。
- SWE Verified HIGHで60.4%，MEDIUMで53.3%，AIME25で91.7%を達成し，OpenAIの報告値と一致した。
Link: https://arxiv.org/abs/2604.00362