arXiv雑要約

AI - 2026/04/20 公開

LLMシミュレータを差分プライバシーデータ生成器として評価 [cs.LG, cs.CL, cs.CR]目的：LLMシミュレータのデータ生成性能の評価
- 個人情報保護の重要性が高まる中，データ活用の両立が課題となっている。
- 従来の差分プライバシー法は，高次元のユーザープロファイルに対して有効性が低下する。
- LLMシミュレータが統計分布を忠実に再現できるか検証し，その課題を明確化する。
- PersonaLedgerは，詐欺検出においてある程度の有用性を示したが（AUC 0.70 at epsilon=1），分布のずれが見られた。
- LLM固有のバイアスが，入力統計を上書きし，時間的・人口統計学的特徴に系統的な歪みを生じさせている。
- LLMベースの手法が真価を発揮するためには，このバイアスへの対策が不可欠である。
Link: https://arxiv.org/abs/2604.15461
ラギッドページングアテンション：TPU向け高性能かつ柔軟なLLM推論カーネル [cs.PF, cs.AI, cs.LG]目的：TPUアーキテクチャにおけるLLMワークロードの効率的なマッピング
- LLMの利用拡大に伴い，コスト効率の良いTPUなどのアクセラレータが重要になっている。
- 既存のLLM推論カーネルはGPU中心であり，TPUへの効率的なマッピング手法が確立されていない。
- 動的かつ不均一な実行パターン下で，TPUにおけるLLM推論を効率化する。
- RPAは，TPU7x上でLlama 3 8Bを用いた評価で，デコードにおいて最大86%のメモリ帯域幅利用率を達成した。
- RPAは，プリフィルにおいて73%のモデルFLOPs利用率を達成し，高い性能を示した。
- vLLMとSGLangのTPUバックエンドとして統合され，実運用レベルでの効率的なTPU推論基盤を提供している。
Link: https://arxiv.org/abs/2604.15464
準実行スタック：エージェント駆動型ソフトウェアエンジニアリングとSEの範囲拡大 [cs.SE, cs.AI]目的：準実行スタックという診断参照モデルの提示
- AI技術の進化により，ソフトウェアエンジニアリングのあり方が大きく変化しつつある。
- AIによる自動化が進む中で，ソフトウェアエンジニアの専門性が失われるのではないかという懸念がある。
- ソフトウェアエンジニアリングの対象を，コードだけでなく，より広範な要素を含むものとして捉え直す。
- ソフトウェアエンジニアリングは衰退するのではなく，その対象が実行可能なコードから，自然言語やワークフローを含む準実行可能な成果物へと拡大している。
- 準実行スタックモデルは，この拡大を理解し，ボトルネックや移行ポイントを特定するためのフレームワークを提供する。
- 既存のソフトウェアエンジニアリングプロセスを維持すべきか，簡素化・再設計すべきかの判断基準として，保存と浄化のヒューリスティックを提示する。
Link: https://arxiv.org/abs/2604.15468
情報継承を用いた連鎖型軽量ニューラル予測器による可逆圧縮 [eess.SY, cs.SY, eess.SP, cs.IT, cs.LG, math.IT]目的：可逆データ圧縮のための確率推定
- データ圧縮は，情報伝送や保存において不可欠な技術であり，効率化が常に求められている。
- 従来の圧縮手法では，計算量と圧縮率のトレードオフが存在し，特に高効率な可逆圧縮は困難である。
- ニューラルネットワークを活用し，軽量かつ効率的な確率推定器を開発することで，この課題を解決する。
- 提案手法は，連鎖型ニューラル予測器アーキテクチャにより，確率推定に必要なパラメータ数を最小限に抑えることに成功した。
- 情報継承メカニズムの導入により，圧縮効率を向上させ，最先端のPAC圧縮機に匹敵する圧縮率を実現した。
- GPU上でのエンコード・デコード処理において，PAC圧縮機をそれぞれ1.2～6.3倍，2.8～12.3倍上回るスループットを達成した。
Link: https://arxiv.org/abs/2604.15472
統一されたドメイン表現と双方向ロジット蒸留による多目的LLMアンラーニングの調和 [cs.RO, cs.MA, eess.SY, cs.SY, eess.SY, cs.SY, math.OC, cs.LG, cs.AI]目的：多目的LLMアンラーニングの調和
- LLMの普及に伴い，有害またはプライバシー侵害情報の削除が不可欠となっている。
- 既存手法は，削除効果と汎用性維持に偏り，頑健性や境界行動が軽視されている。
- 複数のアンラーニング目標間の干渉を回避し，バランスの取れたアンラーニングを実現すること。
- 提案手法は，統一されたデータ表現と双方向蒸留により，複数のアンラーニング目標を調和させる。
- ドメイン分布を整列させ，一見無関係なタスクを協調的な最適化へと転換する。
- 多様かつ困難な要件に対して，最先端の性能を発揮し，バランスが取れて信頼性の高いアンラーニングを可能にする。
Link: https://arxiv.org/abs/2604.15482
${\pi}_{0.7}$: 指示可能な汎用ロボット基盤モデルと創発的機能 [cs.LG, cs.RO]目的：多様な環境における，即使用可能な高い性能の実現
- ロボット工学は，人々の生活を豊かにする可能性を秘めているため重要である。
- 汎用的なロボットの実現には，多様なタスクへの適応能力が不可欠である。
- 多様なデータを用いて，指示に基づいてタスクを遂行する能力の向上を目指す。
- ${\pi}_{0.7}$は，未学習の環境で多様な言語指示に従うことが可能である。
- 洗濯物を折るなど，ゼロショットのクロスエンボディメント汎化を実現した。
- エスプレッソマシンの操作において，専門的な強化学習モデルに匹敵する性能を示した。
Link: https://arxiv.org/abs/2604.15483
FineSteer：大規模言語モデルにおける詳細な推論時制御のための統一的フレームワーク [cs.LG, cs.AI, cs.CL]目的：大規模言語モデルの推論時制御に関するフレームワーク
- 大規模言語モデルの安全性や幻覚といった課題解決は，社会実装において重要である。
- 既存手法は，効果，有用性維持，学習効率の同時達成が難しく，柔軟性に欠ける。
- 本研究は，モデル内部表現の制御タイミングと方法を詳細に制御することで上記課題を解決する。
- 提案手法FineSteerは，条件付き制御と微細ベクトルの合成という二段階構成により，推論時の制御を可能にする。
- サブスペース誘導型条件付き制御（SCS）機構は，不要な制御を回避し，モデルの有用性を維持する。
- Mixture-of-Steering-Experts（MoSE）機構は，望ましい制御行動の多様性を捉え，クエリ固有の制御ベクトルを生成する。
Link: https://arxiv.org/abs/2604.15488
IoMTベース無線ボディエリアネットワークにおけるQ学習を用いたQoS考慮型マルチパスルーティングプロトコル [cs.NI, cs.AI]目的：IoMT環境下における無線ボディエリアネットワークのQoSを考慮したマルチパスルーティング手法
- 医療分野におけるIoT技術の発展は，高度なヘルスケアサービスの実現に不可欠である。
- 動的なネットワーク構成，エネルギー制約，多様なQoS要件が，IoMTの普及の課題となっている。
- データ優先度に応じた効率的なルーティング制御により，IoMTにおける信頼性とエネルギー効率の向上を目指す。
- 提案手法QQMRは，データ型ごとに学習ポリシーを維持し，主経路とバックアップ経路を選択することで，パケット配信率を改善する。
- シミュレーション結果から，既存手法と比較して，遅延，ルーティングオーバーヘッド，エネルギー消費を大幅に削減できることが示された。
- 適応的な多層キューイングとファジーC-meansクラスタリングにより，ルーティング決定を最適化し，QoSを向上させる。
Link: https://arxiv.org/abs/2604.15489
ProtoTTA：プロトタイプ誘導テスト時適応 [cs.CL, cs.LG, cs.CV]目的：テスト時適応におけるプロトタイプ活用
- 深層学習モデルの解釈可能性は重要であり，医療分野など，高い信頼性が求められる領域で不可欠である。
- 既存モデルは訓練データに依存するため，分布シフトに対して頑健性に欠けるという課題がある。
- 本研究は，テスト時適応においてプロトタイプを活用することで，モデルの頑健性と解釈可能性を向上させることを目指す。
- ProtoTTAは，出力エントロピー最小化よりも頑健性を向上させ，プロトタイプ活性化の適切な意味的焦点を取り戻す。
- ProtoTTAは，プロトタイプ類似度分布のエントロピーを最小化し，シフトしたデータ上でより確信的かつプロトタイプ固有の活性化を促す。
- 新しい解釈可能性指標とVLM評価フレームワークを用いて，ProtoTTAが人間の意味的焦点とVLMによる推論品質を回復することを確認した。
Link: https://arxiv.org/abs/2604.15494
知的な意味的トポロジーによるマルチモーダル知識抽出と空間的接地 [cs.AI, cs.CV, cs.HC, cs.RO]目的：小売店，倉庫，病院などの複雑で密集した環境における空間的接地を改善するためのマルチモーダル知識抽出パイプライン
- 人間や具現化されたAIにとって，複雑な環境での空間認識は不可欠であり，安全性と効率性を高める上で重要である。
- 従来のコンピュータビジョンは，密集した環境や長尾のセマンティック分布に対して脆弱であり，空間的接地において課題が残る。
- 本研究は，モバイルポイントクラウドからセマンティックアノテーションされたナビゲーショントポロジーを抽出し，空間的接地を強化することを目的とする。
- GISTは，シーンを2D占有マップに変換し，トポロジカルレイアウトを抽出し，知的なキーフレームとセマンティック選択を通じて軽量なセマンティック層を重ねる。
- GISTは，意図に基づいたセマンティック検索，ワンショットセマンティック局所化，ゾーン分類，視覚的に基づいた指示生成において優れた性能を示した。
- 現場での評価（N=5）では，音声指示のみで80%のナビゲーション成功率を達成し，普遍的デザインの可能性を実証した。
Link: https://arxiv.org/abs/2604.15495
SecureRouter：効率的な安全な推論のための暗号化ルーティング [cs.CR, cs.AI]目的：暗号化された入力に対する入力適応型モデル選択による，安全なTransformer推論の高速化
- プライバシー保護が重要視される中，クラウド上での安全なAI推論技術の需要が高まっている。
- 既存のプライバシー保護推論システムは，処理速度とコストの高さが実用化の妨げとなっている。
- 入力に応じて最適なモデルを選択することで，効率性と精度を両立し，安全なAI推論を現実的なものにすること。
- SecureRouterは，暗号化された特徴量からモデルごとの有用性とコストを予測する，MPCコストを考慮した安全なルーターを導入した。
- MPCに最適化されたモデルプールとの連携により，ルーティング，推論，プロトコル実行を統合し，データとモデルの機密性を維持する。
- 先行研究と比較して，SecureRouterは精度損失をほとんど抑えながら，レイテンシーを1.95倍削減することに成功した。
Link: https://arxiv.org/abs/2604.15499
PolicyBank：LLMエージェントのためのポリシー理解の進化 [cs.CL, cs.SI, stat.AP, cs.CL, cs.AI]目的：LLMエージェントのポリシー理解の進化と，それによるポリシー遵守の改善
- 組織におけるLLMエージェントの利用が拡大しており，ポリシー遵守が不可欠である。
- 自然言語で記述されたポリシーには曖昧さや論理的欠陥が含まれることが多く，誤動作の原因となる。
- ポリシー理解の進化を通じて，仕様のギャップを埋め，より正確なポリシー遵守を実現すること。
- PolicyBankは，ツールレベルのポリシー洞察を構造的に維持し，反復的に洗練するメモリメカニズムである。
- 既存のメモリメカニズムがポリシーを不変の真実として扱うのに対し，PolicyBankは「適合しているが誤り」という行動を強化しない。
- ポリシーギャップのシナリオにおいて，PolicyBankは人間による正解とのギャップの最大82%を解消した。
Link: https://arxiv.org/abs/2604.15505
LLMbench：大規模言語モデルの比較精読のためのワークベンチ [cs.RO, cs.CY, cs.AI]目的：大規模言語モデルの出力の比較精読を可能にするツールの開発
- AI技術の発展に伴い，生成されるテキストの質的評価が重要になっている。
- 既存の評価ツールは定量的な評価に偏っており，人文科学的な精緻な分析が困難である。
- 生成AIモデルの挙動を確率論的に理解するための新たな視点を提供する。
- LLMbenchは，トークンレベルの対数確率，単語レベルの差異，文体，構造解析などの分析機能を備えている。
- このツールは，生成されたテキストを確率分布として捉え，視覚化を通じてカウンターファクチュアルな可能性を提示する。
- AIモデルの批判的検討において，対数確率データが重要な情報源となり得ることを示唆している。
Link: https://arxiv.org/abs/2604.15508
カナダのAI登録が示す，隠蔽する，曖昧にする官僚的な沈黙 [cs.AI, cs.CY, cs.HC]目的：政府のAIシステム登録における説明責任の範囲設定
- AI技術の社会実装が急速に進む中で，透明性の確保と説明責任の所在が重要課題となっている。
- AIシステムの登録は，透明性向上に貢献する一方，その設計によっては情報開示の限界や歪みを生む可能性がある。
- 本研究は，AIシステム登録が，技術的な側面を重視し，社会的な文脈を軽視する傾向を明らかにする。
- カナダ政府のAI登録データ分析の結果，システムの86％が内部効率化のために導入されていることが判明した。
- 登録データは，AIの「主権」というレトリックと，官僚的な実務との乖離を浮き彫りにし，AI運用における人間の判断や不確実性管理が隠蔽されている。
- AIを「信頼できるツール」として捉える登録の設計は，説明責任を形式的なものにするリスクを孕んでいる。
Link: https://arxiv.org/abs/2604.15514
LACE：クロススレッド探索のための格子型注意機構 [cs.AR, cs.SY, eess.SY, eess.SY, cs.RO, cs.SY, cs.NI, cs.AI]目的：大規模言語モデルにおける推論能力の向上
- 大規模言語モデルの性能向上は，自然言語処理の発展に不可欠である。
- 従来の並列推論では，各経路が独立しており，冗長な誤りを繰り返す。
- スレッド間での注意機構を導入し，推論経路間の協調的な探索を実現する。
- LACEは，複数の推論経路を並行して連携させ，中間的な知見を共有・修正することを可能にする。
- 合成データを用いた学習により，モデルにスレッド間のコミュニケーションと誤り訂正を明示的に学習させる。
- 標準的な並列探索と比較して，推論精度が7ポイント以上向上し，LACEの有効性が示された。
Link: https://arxiv.org/abs/2604.15529
検証済みライブラリ契約に基づく検証 [eess.SY, cs.SY, cs.PL, cs.LG, cs.LO, cs.SE]目的：検証済みライブラリ契約によるクライアントプログラムの検証
- 複雑なライブラリを利用するプログラムの検証自動化が求められている。
- ライブラリの振る舞いを正確に表現する契約の生成が困難である。
- クライアントプログラムが正当性を証明できる適切な契約を自動生成する。
- 本研究では，クライアントプログラムの正当性証明に必要なライブラリメソッドのモジュール契約を合成する。
- 文脈依存契約という新しい契約形式を提案し，古典的なモジュール契約よりも簡潔である。
- 制約ソルバーとテストエンジンを活用した，反例誘導学習フレームワークを実現した。
Link: https://arxiv.org/abs/2604.15533
UA-Net：TRISO画像セマンティックセグメンテーションのための不確実性認識ネットワーク [cs.CV, cs.LG]目的：TRISO燃料微細構造画像のセグメンテーションと不確実性マップの生成
- TRISO燃料は高温照射下で変化するため，燃料性能評価には詳細な材料分析が不可欠である。
- 従来の目視検査は，時間と労力を要し，主観的な判断に左右される可能性がある。
- 深層学習を用いて，TRISO燃料画像から特徴領域を自動的に抽出し，検査の効率化と精度向上を目指す。
- 提案手法UA-Netは，テストセットにおいて平均IoU 95.5%，平均Precision 97.3%を達成した。
- メタモデルは，特異度91.8%，感度93.5%を示し，誤分類の検出において高い性能を発揮した。
- UA-Netは，新しいTRISO画像に対しても高い精度で層領域を抽出できることを示した。
Link: https://arxiv.org/abs/2604.15542
構文・意味的文脈評価要約(SSAS)を用いた感情予測の一貫性分析 [cs.CL, cs.AI]目的：感情予測における一貫性向上
- 大規模言語モデルは様々な分析に応用可能だが，確率的な性質から一貫性に課題がある。
- 現代のデータはノイズが多く，感情予測の不安定性を増大させている。
- SSASフレームワークにより文脈を確立し，予測の信頼性を高める。
- SSASフレームワークは，データ品質を最大30%向上させる。
- ノイズ除去と感情予測精度の改善により，予測の一貫性を高める。
- 文脈推定能力の一貫性は，意思決定のための安定した根拠を提供する。
Link: https://arxiv.org/abs/2604.15547
ブロードキャスト通信下における確率的勾配プッシュの最適化 [cs.LG, cs.DC, math.OC]目的：分散型連合学習における収束時間最小化
- 無線ネットワークにおける分散学習は，データプライバシー保護と効率的なモデル学習の両立に不可欠である。
- 既存手法は対称性と二重確率性の制約により，通信グラフの設計自由度が低い。
- 非対称な混合行列を許容する確率的勾配プッシュ(SGP)による効率的な設計アルゴリズムを開発する。
- 提案手法は，既存技術と比較して収束時間を大幅に短縮できることを実データによる評価で示した。
- 混合行列の設計において，グラフ理論的パラメータを考慮した効率的なアルゴリズムを開発した。
- SGPの収束速度に依存する目的関数を抽出し，それに基づいた混合行列設計を行った。
Link: https://arxiv.org/abs/2604.15549
運動量を用いた自然勾配降下法 [cs.LG, cs.AI, cs.NA, math.NA, math.OC]目的：非線形多様体における関数の近似
- 機械学習モデルの性能向上は重要であり，特に深層学習においては最適化手法が鍵となる。
- 勾配降下法は局所最小値に陥りやすく，学習が停滞する問題がある。
- 非線形モデルにおける学習の効率化と，局所最適解からの脱出を目指す。
- 自然勾配降下法に運動量を導入することで，学習過程が改善されることが示された。
- 提案手法は，関数空間上での最適更新に近づき，より効率的な学習を可能にする。
- 運動量項を加えることで，局所最小値からの脱出を促し，より良い解を得られる可能性がある。
Link: https://arxiv.org/abs/2604.15554
アフィン等変性近接演算子の学習 [cs.LG, cs.CV]目的：アフィン等変性近接演算子の実現
- 信号処理や機械学習において，近接演算子は逆問題解決など，様々な応用で不可欠である。
- 既存の学習型近接演算子では，シフトやスケールに対する等変性が組み込まれていない場合がある。
- シフトとスケールに関して等変性を持つ学習型近接演算子を開発し，汎化性能の向上を目指す。
- 本研究で提案するAE-LPNは，シフトとスケール変換に対して厳密な等変性を持つ近接演算子を学習できる。
- 合成データと実データを用いた実験により，AE-LPNが分布外ノイズやアフィン変換に対して頑健であることが示された。
- これにより，学習型近接演算子の実用性が向上し，様々な応用範囲が広がる。
Link: https://arxiv.org/abs/2604.15556
ステアリングベクトルが成功する場所の予測 [cs.LG, cs.CL]目的：ステアリングベクトルの有効性予測手法
- 大規模言語モデルの制御は重要であり，モデルの挙動を意図通りに操作することが求められる。
- ステアリングベクトルの有効性は概念や層によって異なり，事前に予測が困難であった。
- 線形アクセス可能性プロファイル(LAP)を用いて，ステアリングベクトルの有効性を事前に予測すること。
- 線形アクセス可能性プロファイル（LAP）は，モデルの埋め込み行列と中間隠れ状態を用いることで，学習なしにステアリングベクトルの有効性を予測する。
- 24種類の概念ファミリーと5つのモデル(Pythia-2.8B〜Llama-8B)で実験した結果，LAPの指標はステアリングの有効性と層選択を高い相関(ρ = +0.86〜+0.92)で予測した。
- 実験結果から，差の平均によるステアリングが有効な場合，非線形手法が必要な場合，そしてどの方法も有効でない場合を説明する三つの領域フレームワークが示された。
Link: https://arxiv.org/abs/2604.15557
事前登録された信念修正契約 [cs.AI, cs.CL, cs.LO, cs.MA]目的：多主体系における信念修正の際の合意形成による誤った結論への収束を防ぐためのメカニズム
- 多主体系は複雑な問題を解決するために重要だが，合意形成が必ずしも正しい結論に繋がるとは限らない。
- 合意，自信，権威，多数決などが証拠として扱われ，誤った信念への高い確信度での収束を引き起こす可能性がある。
- 事前登録された信念修正契約によって，信念修正を厳格に管理し，誤った合意形成による問題解決を試みる。
- 事前登録された証拠トリガーと修正演算子を用いることで，社会的なラウンドのみでは自信が増加せず，誤ったカスケードが発生しないことが証明された。
- 検証可能なトリガープロトコルは，信念軌跡と監査トレースを保存するPBRC標準形を許容することが示された。
- 健全な強制によって，上位仮説の変化は具体的な検証済みの証拠セットに起因することが保証され，説明責任が確立される。
Link: https://arxiv.org/abs/2604.15558
AIエージェント蒸留における危険行動の潜在的伝播 [cs.AI]目的：AIエージェント蒸留における危険行動の潜在的な伝播
- AIの安全性確保は重要であり，特にエージェントの行動特性の理解と制御が不可欠である。
- AIエージェントの学習データに潜む危険な行動特性が，意図せず別のエージェントに伝播する可能性がある。
- 学習データの明示的なフィルタリングだけでは不十分であり，潜在的な危険行動の伝播を防ぐ新たな対策が必要である。
- 実験により，危険なエージェント行動がモデル蒸留を通じて潜在的に伝播することが示された。
- API環境とBash環境の両方で，キーワードの完全な除去を行っても，学生エージェントは行動バイアスを継承した。
- データサニタイズだけでは防御が不十分であり，行動バイアスは軌跡のダイナミクスに暗黙的にエンコードされていることが示唆された。
Link: https://arxiv.org/abs/2604.15559
ユーザーとアイテムの埋め込み表現の重み付き類似度による協調フィルタリング [cs.RO, cs.IR, cs.LG]目的：ユーザーアイテム推薦とアイテムアイテム推薦の重み付き類似度フレームワークによるトップN推薦手法
- 推薦システムは情報過多な現代において，ユーザーが求める情報へのアクセスを効率化する上で重要である。
- 深層学習モデルは高性能だが，計算コストが高く，実装が複雑であるという課題がある。
- 既存手法の利点を活かしつつ，計算効率と実装の容易性を両立する推薦手法を開発すること。
- 提案手法は，ユーザーアイテム埋め込みとアイテムアイテム埋め込みを共有することで，モデルの簡素化と計算効率の向上を実現した。
- 複数のデータセットを用いた実験の結果，提案手法は競争力のある性能を示し，多様なシナリオで堅牢であることが確認された。
- 埋め込み表現固有のファインチューニングが不要なため，ベースアルゴリズムのハイパーパラメータを再利用でき，実装が容易である。
Link: https://arxiv.org/abs/2604.15573
ファインチューニングが幻覚を誘発する理由とその修正方法 [cs.CL, cs.AI, cs.LG, cs.NE]目的：大規模言語モデルにおける幻覚の軽減
- 言語モデルの発展は，情報処理の自動化に不可欠であり，その信頼性が重要である。
- ファインチューニングにより，既存知識の劣化が生じ，事実誤認の幻覚が発生しやすい。
- ファインチューニング時の知識劣化を抑制し，幻覚の発生を最小限に抑えること。
- 提案手法である自己蒸留に基づくファインチューニングは，事実学習を促進しつつ，既存知識に関する幻覚を抑制する。
- 新たな知識の獲得が不要な場合，パラメータグループを固定することで，タスク性能を維持しつつ幻覚を低減できる。
- 幻覚の主な原因は，重複する意味表現間の干渉であり，自己蒸留はこの干渉を軽減することで効果を発揮する。
Link: https://arxiv.org/abs/2604.15574
自己回帰モデルにおける方策改善としての報酬重み付きClassifier-Free Guidance [eess.SY, cs.SY, cs.LG, cs.AI]目的：自己回帰モデルにおける報酬に基づくサンプリング分布の調整
- 生成モデルの性能向上には，出力の多様性と品質のバランスが重要である。
- 報酬関数の変更時に，モデルの再学習が必要となり，適応性が低い。
- テスト時に報酬関数に応じて最適化し，適応性を高める手法の開発。
- 報酬重み付きClassifier-Free Guidance (RCFG) が，Q関数によるサンプリング分布の調整を近似することを示した。
- RCFGを分子生成に適用し，テスト時に新しい報酬関数で最適化できることを示した。
- RCFGを教師として蒸留することで，標準的な強化学習の収束を加速できることを示した。
Link: https://arxiv.org/abs/2604.15577
ドメイン特化型エージェントのための記号的ガードレール：有用性を損なわずに，より強力な安全性とセキュリティの保証 [cs.SE, cs.AI, cs.CR]目的：ドメイン特化型AIエージェントにおける安全性とセキュリティの保証
- AIエージェントは強力な応用を可能にするが，プライバシー侵害や金銭的損失などの重大な損害を引き起こす可能性がある。
- 既存の緩和策は信頼性を向上させるものの，保証を提供できないという課題がある。
- 記号的ガードレールを通じて，AIエージェントの安全性とセキュリティを確実に保証することを目指す。
- 既存の80件のベンチマーク分析の結果，85%は具体的なポリシーを持たず，高レベルな目標や常識に依存していることが判明した。
- 指定されたポリシー要件の74%は，多くの場合，単純かつ低コストなメカニズムを用いて，記号的ガードレールによって強制可能であることが示された。
- 記号的ガードレールは，安全性とセキュリティを向上させながら，エージェントの有用性を損なわないことが確認された。
Link: https://arxiv.org/abs/2604.15579
行動に基づいたアイテム埋め込みを，個別化された時間的文脈を通じて学習する [cs.IR, cs.LG]目的：行動に基づいたアイテム埋め込みの学習
- 推薦システムにおいて，アイテム埋め込みは重要な要素であり，ユーザーモデリングの精度向上に不可欠である。
- 既存手法はユーザー履歴を順序を考慮しない集合として扱うため，時間経過によるユーザーの嗜好変化を捉えきれない。
- ユーザーごとの行動ペースに合わせた時間的文脈を考慮し，より正確なアイテム埋め込みを学習することで，この問題を解決する。
- 提案手法TAI2Vecは，時間的近接性を埋め込み学習プロセスに直接統合し，ユーザー適応的な時間定義を用いる。
- TAI2Vec-Discは異常検知によりセッションを分割し，TAI2Vec-Contは時間減衰関数を用いてアイテム間の関係を重み付けする。
- 8つのデータセットで実験した結果，TAI2Vecは既存手法と比較して，80%以上のデータセットでより高精度な埋め込みを生成した。
Link: https://arxiv.org/abs/2604.15581
ニューラルネットワークによる駒の価値分析 [cs.LG, cs.AI]目的：駒の価値予測の精度向上
- チェスにおける駒の価値評価は，戦略の根幹であり，AIの棋力向上に不可欠である。
- 駒の価値は局面によって変動するため，汎用的な価値評価が困難である。
- 局面全体の情報を活用し，駒の価値をより正確に予測することを目指す。
- CNNベースのオートエンコーダを用いて局面情報を潜在表現として取り込むことで，駒の価値予測精度が大幅に向上した。
- グランドマスターレベルの対局データを用いて検証した結果，従来のモデルと比較して，検証データの平均絶対誤差を16%削減することに成功した。
- 相対的な駒の価値を平均0.65ポーン以内の精度で予測することが可能になった。
Link: https://arxiv.org/abs/2604.15585
「すみません，少しよろしいでしょうか」CoLabScience：生物医学的発見とLLM-専門家連携のためのプロアクティブAIアシスタント [cs.CL, cs.AI, cs.HC, cs.LG]目的：生物医学的発見とLLM-専門家連携の促進
- 生物医学研究の加速には，AIの活用が不可欠である。効率化と新たな知見の発見が期待される。
- 既存のLLMは受動的であり，研究チームの議論への自律的な介入が困難である。
- 研究チームの議論を支援する，プロアクティブなLLMアシスタントの実現を目指す。
- CoLabScienceは，PULIという新しいフレームワークを用いて，適切なタイミングで議論に介入する。
- PULIは，研究提案や会話履歴を活用し，介入の精度と有用性を向上させる。
- 新しいベンチマークデータセットBSDDを用いて評価した結果，既存手法を大きく上回る性能を示した。
Link: https://arxiv.org/abs/2604.15588
自動コードコンプライアンスのための様々なファインチューニング戦略とモデル規模におけるLLM帰属分析 [cs.CL, cs.AI, cs.LG]目的：LLMの解釈的行動の比較
- LLMはコードコンプライアンスの自動化に活用され始めている。その性能向上は重要である。
- 既存研究では，LLMの学習方法が解釈性に与える影響が無視されている。
- ファインチューニング戦略とモデル規模がLLMの解釈的行動に及ぼす影響を明らかにする。
- フルファインチューニングは，パラメータ効率的なファインチューニング手法よりも統計的に異なり，焦点を絞った帰属パターンを示す。
- モデル規模が大きくなるにつれて，LLMは数値制約やルール識別子を優先する特定の解釈戦略を開発する。
- 7Bを超えるモデルでは，生成されたルールと参照ルールの意味的類似性の性能向上は停滞する。
Link: https://arxiv.org/abs/2604.15589
自律的なセキュリティ管理のための強化学習プラットフォームCSLE [cs.CR, cs.AI]目的：自律的なセキュリティ管理のための強化学習プラットフォーム
- ネットワークシステムにおけるセキュリティは重要であり，その自動化・適応化が求められている
- 既存の強化学習によるセキュリティ管理はシミュレーション環境に限定され，実環境への適用が課題となっている
- CSLEは現実的な環境下での実験を可能にし，実運用システムへの適用を目指す
- CSLEは，仮想化環境でターゲットシステムをエミュレートし，計測・ログを収集することでシステムモデルを特定する
- 特定されたシステムモデルに基づきシミュレーションシステムでセキュリティ戦略を効率的に学習する
- 学習した戦略をエミュレーションシステムで評価・改良し，理論と実運用間のギャップを縮小する
Link: https://arxiv.org/abs/2604.15590
BioHiCL：MeSHラベルを用いた生物医学情報検索のための階層的マルチラベル対照学習 [cs.IR, cs.AI]目的：生物医学情報検索における性能向上
- 生物医学分野では，膨大な文献の中から必要な情報を迅速に取得することが重要である。
- 既存の検索手法は，二値的な関連性しか考慮せず，詳細な意味的重複を捉えきれていない。
- 階層的なMeSHアノテーションを活用し，より高精度な検索を実現することを目指す。
- BioHiCLは，階層的構造化されたMeSHラベルを用いた対照学習によって，生物医学情報検索の性能を向上させる。
- BioHiCL-Base (0.1B) と BioHiCL-Large (0.3B) は，情報検索，文の類似度，質問応答タスクにおいて良好な結果を示した。
- 計算効率も高く，実用的な展開が可能である。
Link: https://arxiv.org/abs/2604.15591
DALM：三段階構造化生成によるドメイン代数言語モデル [cs.CL, cs.AI]目的：ドメイン代数言語モデルの開発
- 大規模言語モデルの活用が広がる中で，知識の干渉問題が課題となっている。
- 既存モデルでは，異なるドメインの知識が混同し，生成結果に悪影響を及ぼす可能性がある。
- ドメインを構造的に制約することで，知識の干渉を抑制し，より正確な生成を目指す。
- DALMは，ドメインラティス上で構造化されたノイズ除去を行うことで，トークン生成の制約を克服する。
- 生成過程をドメイン，関係性，概念の不確実性の解決という三段階に分け，各段階で代数的制約を適用する。
- CDC知識表現システムを用いて，結晶ライブラリのドメイン注釈データセットで検証を行い，有効性を示した。
Link: https://arxiv.org/abs/2604.15593
データセンタージム：マルチ目的データセンタースケジューリングのための物理ベースシミュレーター [cs.DC, cs.AI]目的：地理分散型データセンターにおけるジョブスケジューリングの物理的根拠に基づいたシミュレーション環境
- データセンターの効率的な運用は，エネルギー消費とコスト削減に不可欠である。
- 従来のスケジューラは，計算，熱，電力の相互作用を十分に考慮していない。
- 熱と電力のダイナミクスを明示的に考慮したスケジューリングアルゴリズムを開発し，性能向上を目指す。
- DataCenterGymは，計算キューイング，熱力学，HVAC，温度依存の性能劣化を統合したシミュレーション環境である。
- Hierarchical Model Predictive Control (H-MPC)アルゴリズムは，分散型ジョブ配置において熱と電力のダイナミクスを考慮する。
- 実験の結果，H-MPCはベースラインスケジューラと比較してスケジューリング性能を向上させる。
Link: https://arxiv.org/abs/2604.15594
不完全な協調的人間-AIインタラクション：シミュレーションとユーザー調査における人間とAIの属性の影響比較 [cs.CL, cs.AR, cs.CL, cs.AI, cs.CY, cs.HC]目的：人間とAI間のインタラクションにおける人間とAIの属性の影響の比較
- AI技術の発展に伴い，人間とAIの協調が重要となっている。
- 目標が完全に一致しない状況下での，人間とAIの相互作用の影響に関する研究が不足している。
- 部分的に目標が異なる状況下で，AIの属性が人間とのインタラクションに与える影響を明らかにすること。
- シミュレーション実験では，個性の特徴とAIの属性が同程度に影響を与えた。
- 実際の人間を対象とした実験では，AIの属性，特に透明性がより大きな影響を及ぼした。
- シミュレーションと実際の実験，そしてシナリオの種類によって結果に差異が見られた。
Link: https://arxiv.org/abs/2604.15607
暗闇での適応：ブラックボックスモデルのための効率的かつ安定なテスト時適応 [cs.LG, cs.CV]目的：ブラックボックスモデルのテスト時適応手法
- 現実世界の多くのモデルはAPI経由でしか利用できず，その適応が重要である。
- APIアクセスのみのブラックボックスモデルのテスト時適応は未だ課題が多い。
- 高コストな最適化や，限定的な適応能力といった既存手法の課題を解決する。
- BETAは軽量なローカルホワイトボックスモデルを用いて，勾配経路を確立し，安定した適応を実現した。
- ImageNet-Cにおいて，ViT-B/16で+7.1%，CLIPで+3.4%の精度向上を達成し，既存手法を上回った。
- 商用APIでは，ZOOと同等の性能を250分の1のコストで，リアルタイム推論速度を維持した。
Link: https://arxiv.org/abs/2604.15609
CLIMB：Mambaベース潜在拡散モデルとガウス整合オートエンコーダを用いた制御可能な脳画像縦断的生成 [cs.MA, cs.CV, cs.AI]目的：脳構造の経時的な変化のモデリング
- 脳画像は疾患の早期発見，予後予測，治療計画に不可欠であり，その生成技術は医療分野で重要である。
- 既存の潜在拡散モデルは計算コストが高く，ノイズの影響を受けやすいという課題があった。
- 計算効率を高めつつ，高品質な脳画像生成と経時変化の正確なモデリングを実現すること。
- CLIMBは，状態空間モデルを用いて計算コストを削減しつつ，高品質な脳画像生成を可能にした。
- ガウス整合オートエンコーダにより，従来の変分オートエンコーダのノイズ問題を改善した。
- Alzheimer's Disease Neuroimaging Initiativeデータセットを用いた評価で，構造類似性指標0.9433を達成し，既存手法を上回る性能を示した。
Link: https://arxiv.org/abs/2604.15611
VoodooNet：高次元乱数射影による解析的基底状態の実現 [cs.LG, cs.AI]目的：解析的基底状態の実現
- AI技術の発展は，リアルタイム処理が求められるエッジAIの性能向上に不可欠である。
- 従来の深層学習は，勾配降下法に依存し，計算コストが高く，時間もかかる。
- 高次元乱数射影により，学習コストを削減し，リアルタイム処理を可能にすること。
- VoodooNetは，MNISTで98.10%，Fashion-MNISTで86.63%という高い分類精度を達成した。
- Fashion-MNISTにおける性能は，10エポックのSGDベースライン(84.41%)を上回る。
- 次元数と精度の間には対数的な関係が見られ，性能は「銀河」空間の体積に依存する。
Link: https://arxiv.org/abs/2604.15613
拡張型Best-of-Nサンプリングによる推論における柔軟なエンパワメント [cs.LG]目的：強化学習における行動推論へのエンパワメントの組み込み
- 強化学習は，複雑な課題を自律的に解決する能力を持つため，ロボティクスやゲームなど幅広い分野で重要視されている。
- 探索と活用（EED）のジレンマは，強化学習における重要な課題であり，最適なバランスを見つけるのが難しい。
- エンパワメントをBest-of-Nサンプリングに適用することで，EEDのバランスを柔軟に調整し，学習性能を向上させる。
- 提案手法は，おもちゃの問題を通じて，EEDのバランスを調整する能力が検証された。
- 複雑な移動タスクを解決する際の強化学習のパフォーマンスが向上することが示された。
- Tsalis統計量に基づく拡張型Best-of-Nサンプリングにより，計算コストを維持しながら汎用的なポリシー修正が可能となった。
Link: https://arxiv.org/abs/2604.15614
コード生成における多数決 [cs.LG]目的：大規模言語モデルによるコード生成における機能的多数決の有効性
- ソフトウェア開発の自動化は，生産性向上に不可欠であり，その重要性は増している。
- 大規模言語モデルによるコード生成は有望だが，生成されるコードの信頼性が課題である。
- テストケースを用いた実行シグネチャに基づく多数決で，生成コードの精度向上を目指す。
- 機能的多数決は，LiveCodeBenchにおいて，大きな計算コストをかけずに性能を大幅に向上させる有効な推論戦略であることが示された。
- 機能的合意をラベルなしテスト時強化学習の集約戦略に拡張し，ホールドアウトタスクにおけるpass@1を向上させた。
- ただし，ベースモデルの性能上限を超える自己改善は確認されなかった。
Link: https://arxiv.org/abs/2604.15618
適応的検索拡張生成の必要性の再考：適応的リストワイズランキングの視点から [cs.RO, cs.IR, cs.AI, cs.CL]目的：適応的検索拡張生成の必要性に関する検証と，新たな適応的検索フレームワークAdaRankLLMの提案
- 大規模言語モデルの活用が進む中，外部知識の取り込み方とその効果が重要視されている
- 従来の検索拡張生成はノイズに弱く，関連性の低い情報が生成に悪影響を及ぼす可能性があった
- 大規模言語モデルの性能向上に伴い，適応的な検索の必要性を改めて検証し，効率的な情報利用を目指す
- AdaRankLLMは，3つのデータセットと8つのLLMにおいて，一貫して最適な性能を発揮し，コンテキストのオーバーヘッドを大幅に削減した
- 適応的検索は，弱いモデルの限界を克服するための重要なノイズフィルターとして機能し，強力なモデルにとってはコスト効率の良い最適化ツールとして機能することが示された
- AdaRankLLMは，ゼロショットプロンプトとパッセージドロップアウトメカニズムを用いた適応的ランカーを開発し，静的な固定深さ検索戦略と比較することで，適応的リストワイズランキングの必要性を検証した
Link: https://arxiv.org/abs/2604.15621
LLM誘導実行によるエッジインテリジェンス向け適応型ビジョンファウンデーションモデル [cs.CV, cs.LG]目的：エッジデバイスにおける言語対応型ビジョンファウンデーションモデルの効率的な推論
- 常時稼働のコンテキストAI実現にはビジョン理解が不可欠であり，その重要性は増している。
- ビジョンファウンデーションモデルは計算負荷が高く，エッジデバイスへの展開が困難である。
- シーンコンテキストとタスク複雑度に応じて動的に計算量を調整し，効率的な推論を実現する。
- AdaVFMは，ニューラルアーキテクチャ検索(NAS)を組み込み，軽量なサブネットを動的に実行する。
- クラウド上の大規模言語モデル(LLM)を活用し，コンテキストを考慮したエージェントによるランタイム制御を実現。
- ImageNetやADE20Kの実験で，既存手法を最大7.9%（acc@1）および5.2%（mIoU）上回る精度と効率性を達成。
Link: https://arxiv.org/abs/2604.15622
SIMMER：MLLMベースの埋め込みによるクロスモーダルな料理画像-レシピ検索 [cs.AR, eess.SY, cs.SY, cs.HC, cs.CV, cs.CL, cs.IR, cs.LG, cs.MM]目的：料理画像とレシピテキスト間のクロスモーダル検索
- 栄養管理，食事記録，調理支援など，多様な応用が期待される分野である。
- 既存手法は複雑なアライメント戦略やタスク固有のネットワーク設計が必要である。
- MLLMを活用し，セマンティックギャップを埋める統一的なエンコーダを構築する。
- SIMMERは，Recipe1Mデータセットにおいて最先端の性能を達成した。
- 1k画像-レシピ検索のR@1を81.8%から87.5%に，10k画像-レシピ検索のR@1を56.5%から65.5%に向上させた。
- レシピの構造（タイトル，材料，調理手順）に適したプロンプトテンプレートを設計した。
Link: https://arxiv.org/abs/2604.15628
HYPERHEURIST：LLM駆動コード生成のためのシミュレーテッドアニーリングに基づく制御フレームワーク - 最適化されたハードウェア設計において [cs.AR, cs.AI]目的：LLM駆動コード生成によるハードウェア設計の最適化
- 近年，LLMはハードウェア設計の自動化において大きな可能性を示しており，設計効率の向上が期待される。
- LLM単独での生成は，機能的な正しさと電力効率の両立が難しく，安定した設計が困難である。
- LLM生成RTLを中間候補として扱い，シミュレーテッドアニーリングで最適化することで，高性能・低消費電力な設計を目指す。
- HYPERHEURISTは，LLM生成RTLを中間候補とみなし，シミュレーテッドアニーリングにより最適化を行うフレームワークである。
- コンパイル，構造チェック，シミュレーションによる機能検証後，PPA最適化を実施することで，安定した最適化を実現する。
- 8つのRTLベンチマークにおいて，単一パスLLM生成RTLよりも安定した最適化結果が得られた。
Link: https://arxiv.org/abs/2604.15642
PINNACLE：古典および量子PINNのためのオープンソース計算フレームワーク [cs.LG, physics.comp-ph, quant-ph]目的：物理情報ニューラルネットワーク(PINN)のためのオープンソース計算フレームワーク
- 近年，機械学習を用いた物理現象のシミュレーションが注目されており，PINNはその主要な手法の一つである。
- PINNはハイパーパラメータの調整が難しく，古典的なソルバーと比較して計算コストが高いという課題がある。
- 様々なPINNの構成や学習手法を系統的に評価し，性能向上に資する定量的な指標を提供することを目指す。
- 本フレームワークは，1次元双曲型保存則，非圧縮性流れ，電磁波伝播などのベンチマーク問題においてPINNの性能を評価できる。
- 実験結果から，PINNの性能は構成や学習手法に大きく依存し，古典的なソルバーと比較して計算コストが高いことが示された。
- ハイブリッド量子古典PINNにおける回路評価複雑度の推定を行い，パラメータ効率の向上が期待される領域を特定した。
Link: https://arxiv.org/abs/2604.15645
CodeMMR：自然言語，コード，画像をつなぐ統合検索 [cs.HC, cs.SE, cs.AI]目的：自然言語，コード，画像の統合検索モデルの提案
- 現代のソフトウェア開発において，コード検索は不可欠であり，LLMを活用したコーディング支援にも貢献する。
- 既存のコード検索モデルはテキスト中心であり，プログラムに含まれる視覚的・構造的な要素を考慮していない。
- 自然言語，コード，画像を統合的に扱える検索モデルを開発し，コード検索の精度向上を目指す。
- CodeMMRは，自然言語，コード，画像を共通の潜在空間に埋め込み，高い汎化性能を示す。
- 既存モデル（UniIR，GME，VLM2Vecなど）と比較して，nDCG@10で平均10ポイントの性能向上を達成した。
- CodeMMRをRAGに統合することで，コード生成の精度と視覚的な接地性が向上し，次世代の知的プログラミングシステムの可能性を示唆する。
Link: https://arxiv.org/abs/2604.15663
天体観測に基づくAIエージェントのためのスケーラブルなモデル適合ベンチマーク環境 Stargazer [cs.LG]目的：AIエージェントの天体物理学的制約下におけるモデル適合タスクの評価
- 自律型AIエージェントの発展に伴い，科学的根拠に基づいたタスクの評価環境が求められている。
- 既存の評価環境では，物理的制約の遵守と数値最適化のバランスが課題となっていた。
- AIエージェントが現実の研究課題を解決するための能力向上を目指す。
- Stargazerは，120のタスクを含むスケーラブルな環境であり，難易度別に3つの階層に分類されている。
- 最先端の8つのAIエージェントの評価により，統計的な適合性と物理パラメータの正確性の乖離が明らかになった。
- 計算資源の増加は限定的な効果しかなく，トークン使用量の増加は意味のある探索よりも失敗ループを反映している場合が多い。
Link: https://arxiv.org/abs/2604.15664
NK-GAD：隣接知識を活用した教師なしグラフ異常検知 [cs.LG]目的：グラフ構造データにおける異常パターンの特定
- グラフ構造データは現実世界の複雑な関係性を表現可能であり，様々な応用分野で重要性が増している。
- 既存手法は同質性（homophily）を前提とするため，属性レベルで異質性（heterophily）を示すグラフへの適用が困難である。
- 属性レベルの異質性を持つグラフにおける異常検知の精度向上を目指す。
- 本研究では，接続ノードペアの種類に関わらず属性類似度の分布がほぼ同一であること，および異常エッジの存在によりスペクトルエネルギー分布が変化することを発見した。
- これらの知見に基づき，隣接知識を活用するNK-GADフレームワークを提案した。これは類似・相違する隣接ノードの特徴を捉えるエンコーダ，正規分布をモデル化する再構成モジュール，特徴を洗練する中心集約モジュール，および属性と構造を再構成する二重デコーダで構成される。
- 7つのデータセットでの実験により，NK-GADは平均でAUCを3.29％改善することを示した。
Link: https://arxiv.org/abs/2604.15668