arXiv雑要約

AI - 2026/05/04 公開

LLM指向型情報検索：ノイズ除去優先のアプローチ [cs.IR, cs.AI, cs.CL]目的：LLMによる情報検索におけるノイズ除去の重要性
- 情報検索は人間だけでなくLLMも利用するようになり，その性能はLLMの活用に大きく依存する。
- LLMは注意資源に制限があり，ノイズに弱いため，誤った情報が幻覚や推論エラーの原因となる。
- 情報アクセスパイプライン全体のボトルネックとなっているノイズ除去の問題解決を目指す。
- LLM時代の情報検索における課題を「アクセス不可」「発見困難」「不整合」「検証不能」の4段階で捉えた。
- インデックス作成，検索，コンテキスト設計，検証，エージェントワークフローを含むノイズ最適化手法の分類を提示した。
- 継続学習アシスタント，コーディングエージェント，深層研究など，検索に依存する分野における情報ノイズ除去の研究事例を紹介した。
Link: https://arxiv.org/abs/2605.00505
ユニークなマルチタスクPAMPAデータセットにおけるQSPR手法の比較研究 [cs.CL, cs.LG]目的：多機能PAMPAデータセットに対するQSPR手法の有効性評価
- 医薬品開発において，細胞膜透過性は重要な薬物動態パラメータである。
- 既存のPAMPAデータセットは，単一の膜タイプに限定される場合が多い。
- 複数の膜タイプを同時にモデル化する包括的な研究が必要とされている。
- 専門家が設計した物理化学的特性記述子が，限られたサンプルサイズの透過性研究に適していることが示された。
- 深層学習ベースの表現よりも，物理化学的記述子の方が良好な予測性能を示すことが明らかになった。
- 複数の臓器特異的PAMPA膜を同時にモデル化する包括的な研究は，新規な膜特異的透過性プロファイルに関する知見を提供する。
Link: https://arxiv.org/abs/2605.00508
スケールを考慮した敵対的分析：多スケール複雑系における生成AIの診断 [cs.CE, cs.LG, cs.CV, physics.comp-ph]目的：生成AIが多スケール複雑系の支配的物理法則を内部化しているかどうかの検証
- 複雑系は自然界に広く存在し，その理解は科学技術の発展に不可欠である。
- 既存の機械学習モデルは統計的相関を学習するだけであり，物理法則の理解が不十分である。
- スケールを考慮した診断により，生成AIの脆弱性を評価し，物理法則を尊重するモデル開発を促す。
- 従来のXAI手法は物理的に不適切な摂動を引き起こし，モデルの評価を歪める。
- 提案手法であるCDDは，物理制約に基づいたデータ生成とモデル評価を可能にする。
- 生成モデルは物理的摂動に対して構造の固定化と非線形不安定性を示し，連続的なPDEのような応答を示さない。
Link: https://arxiv.org/abs/2605.00510
ControBench: ソーシャルネットワークにおける論争的言説分析のためのインタラクションを考慮したベンチマーク [cs.CL, cs.LG]目的：ソーシャルネットワーク上のイデオロギー対立における議論の理解
- 政治的二極化，誤情報，コンテンツモデレーションの研究において重要である。
- 既存のデータセットは，テキストのみに着目，構造と意味のバランスが悪い，ユーザーのイデオロギーが不明確である。
- 異質なソーシャルインタラクショングラフと豊富なテキスト意味を組み合わせたベンチマークを提供し，議論構造を分析する。
- ControBenchは，Redditの3つの話題（トランプ，中絶，宗教）の7,370人のユーザー，1,783の投稿，26,525のインタラクションを含む。
- グラフ構造は，ユーザーと投稿のノードを意味的に強化されたエッジで接続し，議論の文脈を維持している。
- 調整された同質性は低く，実際の議論構造を反映しており，様々なモデルの性能評価に適している。
Link: https://arxiv.org/abs/2605.00513
専門家の空間ネットワーク：アーキテクチャと専門家配置 [cs.DC, cs.AI, cs.NI]目的：衛星ネットワークにおける大規模言語モデルの効率的な分散配置
- 宇宙空間でのデータセンターは，持続可能なエネルギー源を利用し，計算資源を提供する可能性を秘めている。
- 衛星の限られた計算能力と通信能力が，大規模言語モデルの分散配置における課題となっている。
- モデルのアーキテクチャとネットワークトポロジーを考慮し，低遅延なトークン生成を実現する配置戦略を提案する。
- 提案手法Space-XNetは，衛星コンステレーションをリング状に分割し，各サブネットにMoEレイヤーを配置する。
- レイヤー内における専門家配置は，活性化確率の異なる専門家を，低遅延なルーティングパス上の衛星にマッピングする最適化問題として定式化された。
- シミュレーションの結果，Space-XNetは従来の配置戦略と比較して，少なくとも3倍の遅延削減を達成した。
Link: https://arxiv.org/abs/2605.00515
シリコンの対決：消費者向けLLM推論における性能，効率，エコシステム障壁 [cs.PF, cs.AI, cs.AR]目的：消費者向けLLM推論におけるNvidiaとApple Siliconエコシステムの性能と効率の比較分析
- 大規模言語モデル(LLM)の利用拡大に伴い，消費者向けハードウェアでの効率的な推論が重要課題となっている。
- GPUのVRAM容量の制約や，量子化による精度低下，PCIeボトルネックなどが推論性能を阻害している。
- 本研究は，異なるアーキテクチャの利点を明らかにし，消費者向けLLM推論の最適なハードウェア構成を提示する。
- Nvidia Blackwellアーキテクチャでは，NVFP4量子化によりスループットが向上するが，起動遅延とのトレードオフが存在する。
- AppleのUMAアーキテクチャは，VRAMの制約を回避し，80Bパラメータモデルにおいて線形的なスケーリングを可能にする。
- AppleのSoC設計は，Nvidiaと比較して最大23倍のエネルギー効率を実現し，持続可能性に貢献する。
Link: https://arxiv.org/abs/2605.00519
SAGA：GPUクラスタにおけるAIエージェント推論のためのワークフローアトミックなスケジューリング [cs.DC, cs.AI, cs.LG, cs.OS]目的：AIエージェントのGPUクラスタにおける推論効率の向上
- AIエージェントの複雑なタスク処理において，GPUリソースの効率的な利用が重要である。
- 既存のGPUスケジューラは個々の推論を独立して扱うため，中間状態の再利用が失われ，遅延が増大する。
- ワークフロー全体をスケジューリング単位として扱うことで，中間状態の再利用を促進し，遅延を削減することを目指す。
- SAGAは，エージェント実行グラフを用いてKVキャッシュの再利用を予測し，オフライン最適ポリシーに近づく。
- SWE-benchやWebArenaにおいて，SAGAはvLLM v0.15.1と比較してタスク完了時間を1.64倍短縮し，GPUメモリ利用率を1.22倍向上させた。
- SAGAは，スループットがわずかに低下するものの，レイテンシに敏感な対話型AI環境において優れた性能を発揮する。
Link: https://arxiv.org/abs/2605.00528
クロスドキュメント検索拡張生成のための階層的抽象ツリー [cs.LG, cs.AI, cs.IR]目的：クロスドキュメント質問応答における知識獲得の効率化
- 大規模言語モデルの性能向上には，外部知識の活用が不可欠である。
- 既存のツリー型RAGは，複数ドキュメント間の関係性を捉えきれていない。
- データの分布に適応し，詳細な情報を保持するツリー構造の構築を目指す。
- 提案手法Ψ-RAGは，反復的な「マージと崩壊」プロセスを通じて，データ分布に適応する階層的抽象ツリーを構築する。
- この手法は，再構成されたクエリとエージェント駆動のハイブリッド検索器を用いて，知識ベースと効果的に相互作用する。
- クロスドキュメント多段QAベンチマークにおいて，既存手法を大幅に上回るF1スコアを達成した。
Link: https://arxiv.org/abs/2605.00529
Tempus: Versal AI Edge向け時間的スケーラビリティを持つリソース不変GEMMストリーミングフレームワーク [cs.DC, cs.AR, cs.LG, cs.PF, cs.RO]目的：Versal AI Edge SoCにおけるリソース不変な時間的GEMMフレームワークの開発
- 大規模言語モデルの性能向上には計算規模の拡大が不可欠である。
- エッジデバイスでは計算資源，メモリ，電力に制約がある。
- リソース制約下で効率的なGEMM推論を実現する。
- Tempusは，16個のAIE-MLコアの固定計算ブロックを用い，反復グラフ実行とデータタイリングによりスケーラビリティを実現した。
- GEMMワークロードにおいて，10.677Wの電力消費で607 GOPSを達成した。
- Tempusは，最先端の空間的SOTA（ARIES）と比較して211.2倍高いPlatform-Aware Utility（PAU）を示し，リソース効率の高さを示した。
Link: https://arxiv.org/abs/2605.00536
血管画像の3Dにおける学習されたボクセルごとの方向ベクトルからの血管グラフ再構築：Vesselpose [cs.CV, cs.LG]目的：3D血管画像からの血管グラフ再構築
- 医学画像処理において，血管のセグメンテーションと追跡は重要な役割を担う。
- 既存手法は，血管ネットワークの完全かつ正確な再構築には課題が残る。
- より正確な血管グラフを抽出し，複雑な血管構造のモデリングを可能にすること。
- 提案手法は，3つのベンチマークデータセットで最先端の性能を達成した。
- 特に，ラット心臓血管のマイクロCTスキャンといった困難な3D画像への適用が示された。
- グラフの誤った分割や融合を定量化する新たな指標が提案された。
Link: https://arxiv.org/abs/2605.00538
連続性を超えて：単一細胞スナップショットからの離散分岐ダイナミクスのシミュレーションフリー再構成 [cs.CL, cs.DC, cs.LG, cs.AI, math-ph, math.MP, q-bio.GN, q-bio.QM]目的：単一細胞スナップショットからの離散分岐ダイナミクス再構成
- 細胞の挙動理解には，細胞分裂やアポトーシスといった動的な変化の追跡が不可欠である。
- 既存手法は連続的な質量流体として扱うため，個々の細胞レベルでの出生・死亡イベントを捉えきれない。
- 単一細胞レベルでの離散的な出生・死亡ダイナミクスを捉え，系統分岐と運命決定を理解することを目指す。
- 提案手法USBは，シミュレーションなしで確率的・不均衡な影響を統合し，単一細胞分解能での出生・死亡ダイナミクスをモデル化する。
- 理論的に，USBはBranching Schr\"odinger Bridge (BSB)問題への解法を提供し，個々の細胞のブラウン運動と離散的な出生・死亡ジャンプを厳密に解釈する。
- 実験的に，USBは既存手法と同等以上の軌道再構成性能を示し，単一細胞レベルでの現実的な出生・死亡ダイナミクスのシミュレーションを可能にする。
Link: https://arxiv.org/abs/2605.00545
A11y-Compressor：視覚的コンテキスト再構築と冗長性削減によるGUIエージェント観測効率の向上フレームワーク [cs.CL, cs.AI]目的：GUIエージェントの観測表現効率の向上
- GUIとのインタラクションにおいて，エージェントの信頼性向上には，効果的な観測表現が不可欠である。
- アクセシビリティツリーは冗長性が高く，要素間の空間関係などの構造情報に乏しいという課題がある。
- アクセシビリティツリーをコンパクトかつ構造化された表現に変換し，観測効率を改善することを目指す。
- A11y-Compressorは，アクセシビリティツリーを変換するフレームワークであり，Compressed-a11yとして実装された。
- Compressed-a11yは，モダリティ検出，冗長性削減，意味構造化のパイプラインを用いることで，入力トークン数を22%に削減した。
- OSWorldベンチマークにおいて，タスク成功率を平均5.1%向上させるという結果が得られた。
Link: https://arxiv.org/abs/2605.00551
Stable-GFlowNet：対照的な軌道バランスによる多様かつ堅牢なLLM Red-Teamingへ [cs.LG]目的：大規模言語モデルの脆弱性評価
- LLMの安全性確保は重要であり，脆弱性評価はその不可欠なプロセスである。
- 効果的かつ多様な攻撃手法の発見が課題だが，両立は難しい。
- GFNの訓練の不安定性を解消し，より安定した脆弱性評価を実現する。
- 提案手法S-GFNは，GFNにおけるパーティション関数Zの推定を排除し，訓練の不安定性を軽減する。
- ペアワイズ比較とロバストなマスキング手法により，ノイズの多い報酬への対策を行う。
- 多様な設定において，S-GFNが優れた攻撃性能と多様性を示すことが確認された。
Link: https://arxiv.org/abs/2605.00553
部分自動運転における意味のある人間による制御の評価：行動と知覚の関連性 [cs.AR, cs.HC, cs.AI, cs.CY, cs.RO]目的：部分自動運転システムとのインタラクションにおけるドライバーの有意義な人間による制御（MHC）の経験
- 自動運転技術の進展は，交通安全の向上や移動の効率化に貢献するが，ドライバーの責任範囲が曖昧になっている。
- 部分自動運転において，ドライバーの積極的な制御が低下し，緊急時の介入に必要な注意や主観的制御感が損なわれている。
- ドライバーの意図と自動運転システムの意図のずれを解消し，安全で信頼性の高い運転体験を提供すること。
- 自動運転車がドライバーを理解しているという知覚と，ステアリングトルクの衝突の間には有意な負の相関が認められた。
- 反応時間と十分な制御感の知覚の間には，意外な正の相関が明らかになった。
- ドライバーの意図と自動運転の意図の不一致，安全性への懸念，ドライバーの操作への抵抗が，有意義な人間による制御の低下に寄与することが示唆された。
Link: https://arxiv.org/abs/2605.00556
構造が解放をもたらす：制約のある意味形成がいかに斬新な研究成果を生み出すか [cs.CL, cs.AI]目的：科学研究におけるアイデア創出の構造化
- 科学的発見はアイデア創出の過程であり，研究の核心をなす。
- 既存のアプローチでは，この重要なアイデア創出段階が軽視されがちである。
- LLMを用いた研究ワークフローを強化し，計画が科学的発見に与える影響を解明する。
- 意味形成に基づいたフレームワークSCISENSEを構築し，アイデア創出を8つの認知段階の構造化されたシーケンスとして捉えた。
- Targetモードで訓練されたモデルは，Inferモードのモデルより軌跡の質が2.0％向上し，より斬新で多様な出力を生み出すことが示された。
- Target軌跡に基づいて条件付けられたコーディングエージェントは，Infer軌跡のものよりも実行可能性と品質の高い研究成果を生成した。
Link: https://arxiv.org/abs/2605.00557
電気容量制車両経路問題に対する二層遅受容ヒルクライミングのインスタンス対応パラメータ設定 [cs.NI, cs.AI, math.OC]目的：電気容量制車両経路問題に対する二層遅受容ヒルクライミングのインスタンス対応パラメータ設定手法
- 組合せ最適化問題において，アルゴリズム性能はパラメータ設定に大きく左右される。
- 単一の最適化されたパラメータ設定は，インスタンスの多様性を活かせない場合がある。
- インスタンスの特徴からパラメータを予測し，未知のインスタンスへの適応を目指す。
- 提案手法は，IEEE WCCI 2020ベンチマーク問題で，既存手法と比較して平均0.28%の目的関数値の削減を達成した。
- これは，数百万ドル規模の輸送運用において，有意なコスト削減に繋がる可能性がある。
- オフラインチューニングと回帰モデルにより，インスタンス固有のパラメータラベルを取得し，パラメータ予測を可能にした。
Link: https://arxiv.org/abs/2605.00572
AIの過大宣伝が期待性能を膨張させるが，インタラクションの結果には影響しない：フィッツの法則を用いたAIプラセボ研究 [cs.HC, cs.AI]目的：AIの過大宣伝によるユーザーの期待形成と，実際のインタラクション結果との乖離
- AI技術の進展に伴い，ユーザーインターフェースへのAI導入が活発化している。
- AI能力を誇張した「AIウォッシング」により，ユーザーの誤った期待が生まれている。
- AIウォッシングがユーザーの期待に与える影響と，実際のパフォーマンスへの影響を検証する。
- 参加者は，プラセボ条件下で有意にパフォーマンス向上を期待したが，客観的・主観的評価には差が見られなかった。
- AIウォッシングはユーザーの期待を増大させるものの，実際のインタラクション結果は変化させないことが示された。
- AI製品の主張に対する説明責任の必要性を強調し，フィッツの法則をAIラベル付き入力デバイスの監査手法として確立する。
Link: https://arxiv.org/abs/2605.00582
視覚モダリティを通じたビジョン・言語モデルの脱獄 [cs.CV, cs.AI, cs.LG]目的：ビジョン・言語モデルの安全性に関する脆弱性の検証
- 近年，画像とテキストを扱うビジョン・言語モデルが発展しているが，安全性確保が課題となっている。
- 既存研究ではテキストによる攻撃が中心であり，視覚モダリティに着目した安全性評価は十分ではない。
- 視覚情報を悪用した攻撃手法を開発し，モデルの安全性に対する脆弱性を明らかにする。
- 視覚的な記号や画像置換，文脈変換，類推問題などを利用した攻撃により，安全性対策を回避できることを示した。
- テキストベースの安全性訓練だけでは，視覚的に伝達される悪意のある意図に対処できないという，モダリティ間のずれを指摘した。
- 安全性向上のためには，視覚モダリティを重要な攻撃対象として捉え，安全対策を講じる必要があることを強調した。
Link: https://arxiv.org/abs/2605.00583
特徴量間の制約下における分類器の公平性 [cs.LG, cs.AI]目的：特徴量間の制約を考慮した分類器の公平性の評価と改善
- 機械学習において，公平性は重要な倫理的課題であり，社会的な影響が大きい。
- 特徴量間に制約が存在する場合，公平性の評価が困難になるという問題がある。
- 制約を考慮した公平な説明の定義に基づき，分類器の公平性を評価・改善する。
- 決定の公平性を，保護された特徴を含まない説明によって判断する新たな定義を提案した。
- 制約を無視すると，保護された特徴と保護されていない特徴間に制約がない場合でも，公平性が大きく変化することが示された。
- 分類器の公平性の異なる定義間の関係を明らかにし，公平性テストの計算複雑性を分析した。
Link: https://arxiv.org/abs/2605.00592
深層学習における可能性的予測不確実性 [cs.IR, cs.LG, cs.AI, cs.CV]目的：深層学習モデルの予測不確実性の信頼性向上
- 深層学習は様々な応用で成果を上げているが，未知の入力に対する過信を抑制する必要がある。
- 既存の不確実性モデリング手法は，計算コストまたは理論的根拠の点で課題を抱えている。
- 可能性理論に基づき，計算効率と理論的厳密性を両立した不確実性モデリング手法を提案する。
- 提案手法DAPPrは，ディリクレ分布を用いた可能性的事後予測により，効率的な不確実性推定を実現する。
- DAPPrは，最先端のevidential deep learning手法と同等またはそれ以上の性能を複数のベンチマークで示した。
- DAPPrは，理論的な導出と計算効率の両方を維持しており，実用的な不確実性モデリングを提供する。
Link: https://arxiv.org/abs/2605.00600
アフィニティだけでは不十分：Mixture-of-Expertsにおける自由エネルギー原理の回復 [cs.LG, cs.NE]目的：Mixture-of-Expertsにおけるドメイン遷移時のルーティング性能向上
- 大規模言語モデルにおいて，モデルの効率化と性能向上が重要課題となっている。
- Mixture-of-Expertsモデルは，疎なルーティング機構により効率化を図るが，ドメイン遷移時に性能が低下する。
- 自由エネルギー原理とスパイクニューラルネットワークのダイナミクスを応用し，ドメイン遷移時のルーティング精度を向上させる。
- 提案手法では，3つのゲート修正（temporal memory, precision-weighted gating, anticipatory routing）を導入し，ドメイン遷移時の正解専門家への割り当て確率を大幅に向上させた。
- 特に，temporal memoryとanticipatory routingの組み合わせは，単独での効果を上回る相乗効果を示し，oracleとの差を大幅に縮小した。
- 文字レベルの言語モデル実験では，提案手法であるbeta-routingが，従来のMoEモデルと比較して，transition-step BPCを大幅に低減することを示した。
Link: https://arxiv.org/abs/2605.00604
統合前に分離：SFTとRLVRタスクベクトルのテスト時合成 [cs.CL, eess.AS, cs.LG]目的：SFTとRLVRの能力をテスト時に合成する手法
- 大規模言語モデルの性能向上には，知識の幅広さと推論深さの向上が不可欠である。
- SFTとRLVRを組み合わせる場合，破局的忘却や勾配の競合といった問題が発生しやすい。
- SFTとRLVRを直接統合するのではなく，テスト時に合成することで上記の問題を回避する。
- 提案手法DoTSは，SFTとRLVRのチェックポイントを独立して学習し，推論時にタスクベクトル演算によって能力を合成する。
- DoTSは，選択的なスパース化とノルム保存スケーリングによって干渉を低減し，ベイズ最適化を用いて最適な組み合わせ係数を見つける。
- 実験結果から，DoTSは既存の学習ベースの統合手法と同等またはそれ以上の性能を発揮し，計算コストはわずか約3%である。
Link: https://arxiv.org/abs/2605.00610
BlenderRAG：検索拡張コード合成による高精度3Dオブジェクト生成 [cs.CL, cs.IR, cs.CV, cs.AI, cs.GR, cs.HC, cs.LG]目的：3Dオブジェクトの生成
- 3Dコンテンツ制作の自動化が求められており，効率的な生成手法の開発が重要である。
- 既存の言語モデルでは，文法エラーや形状の不整合が頻発し，実用的な生成が困難である。
- 検索拡張によるコード生成を通じて，高品質な3Dオブジェクトを生成する手法を確立すること。
- 本研究では，50種類のオブジェクトカテゴリに関する専門家検証済みデータセットを活用し，BlenderRAGを提案した。
- BlenderRAGは，4つの最先端LLMにおいて，コンパイル成功率を40.8%から70.0%に，セマンティック正規化アライメントを0.41から0.77に向上させた。
- ファインチューニングや専用ハードウェアを必要とせず，容易に導入可能なシステムを実現した。
Link: https://arxiv.org/abs/2605.00632
次元削減のためのクラス角歪み指数 [cs.LG]目的：次元削減におけるクラスター構造の忠実度評価
- 可視化において，データの全体構造と局所構造の保持は重要である。適切な次元削減手法選択に不可欠。
- t-SNEやUMAPなど，既存手法ではクラスター配置が恣意的，または誤解を招く可能性がある。
- クラスター間の角度関係を用いて，次元削減後のクラスター構造の歪みを定量的に評価する。
- 提案手法CADIは，既存のクラスター品質指標が失敗するケースでも解釈可能な結果を提供する。
- CADIは角度計算に基づき微分可能であり，次元削減手法の最適化に利用できる。
- CADIに基づく次元削減手法の有効性が，実データおよび合成データで示された。
Link: https://arxiv.org/abs/2605.00637
オフライン確率的多腕バンディットからのアンラーニング [cs.LG, cs.DS]目的：オフライン確率的多腕バンディットにおけるデータ削除とプライバシー保護
- 機械学習の普及に伴い，プライバシー保護の重要性が高まっている。
- データ削除要求への対応が困難であり，モデルの再学習が必要となる場合が多い。
- データ再学習を回避しつつ，プライバシーを保護するアンラーニング手法の開発。
- 本研究では，オフライン確率的多腕バンディット問題に対するアンラーニング手法を提案。
- ガウスメカニズムとロールバックを基盤とし，データ環境とプライバシー制約に応じて切り替える適応的アルゴリズムを設計。
- 提案手法の有効性とトレードオフを理論的保証と実験により検証。
Link: https://arxiv.org/abs/2605.00638
機械学習間原子ポテンシャルの信頼性判断のタイミング [cs.LG, physics.chem-ph]目的：機械学習間原子ポテンシャルの信頼性評価
- 物質科学において，原子レベルでのシミュレーションは重要な役割を果たす。
- 既存の不確実性評価手法は計算コストが高く，精度の高い信頼性指標が得られない場合がある。
- バックボーン埋め込み表現を用いた識別分類器により，効率的かつ正確な信頼性評価を実現する。
- 本研究で開発したPROBEは，予測誤差を正確に追跡する信頼性確率を提供する。
- PROBEは，アンサンブル不一致よりも優れた二値信頼性シグナルを示し，バックボーン表現の表現力が高まるほど性能が向上する。
- マルチヘッド自己注意機構を用いることで，追加の計算コストなしに原子の重要度マップが得られる。
Link: https://arxiv.org/abs/2605.00640
確率的ストレス最適化によるグラフ描画と次元削減の架け橋 [cs.LG]目的：抽象的で非線形な構造の可視化
- 高次元データの理解や分析において，情報の視覚化は重要な役割を果たす。
- 従来の次元削減手法は計算コストが高く，大規模データへの適用が困難な場合がある。
- グラフ描画で有効な確率的最適化手法を次元削減に応用し，効率的な可視化を目指す。
- 提案手法は，既存のSMACOFアルゴリズムと比較して，大幅に高速な収束性を示す。
- 標準的な高次元ベンチマークデータセットにおいて，同等または低いストレス値を達成した。
- scikit-learnとの互換性を有し，容易に利用可能である。
Link: https://arxiv.org/abs/2605.00641
自分自身からクリック場所を学習：GUIグラウンディングのためのオンポリシー自己蒸留 [cs.AI, cs.CV]目的：GUIグラウンディングにおける自己蒸留フレームワーク
- GUIグラウンディングは，GUI自律エージェントの核となる能力であり，自然言語指示と視覚座標を対応付ける。
- 従来の強化学習法は，多数のロールアウトを必要とし，困難なサンプルに対して疎な報酬しか得られないという課題がある。
- 本研究は，単一のロールアウトで高密度なトークンレベルの教師信号を提供するオンポリシー自己蒸留のGUIグラウンディングへの適用を目指す。
- 提案手法GUI-SDは，ターゲットバウンディングボックスとガウスソフトマスクを用いた視覚的に豊かな特権コンテキストを構築することで，正確な座標を漏洩することなく有益なガイダンスを提供する。
- エントロピー誘導蒸留により，桁の重要度と教師の確信度に基づいてトークンに重みを付け，最適化を最も影響力のある信頼できる位置に集中させる。
- 6つのGUIグラウンディングベンチマークで，GUI-SDはGRPOベースの手法や単純なOPSDよりも精度と学習効率の両方で一貫して優れた性能を示した。
Link: https://arxiv.org/abs/2605.00642
MCMC修正による多変量変分オートエンコーダを用いた多変量エネルギーベースモデルの学習 [cs.LG, cs.AI]目的：多変量エネルギーベースモデル，共有潜在生成器，および結合推論モデルの学習
- 多変量データにおける複雑な依存関係の把握にEBMは有効であり，様々な応用が期待される。
- 既存手法では，EBMの学習においてMCMCサンプリングが不安定になり，モード間の関係性を捉えきれない問題がある。
- データ空間と潜在空間の両方でMCMC修正を組み込むことで，EBMの学習を効果的に改善することを目指す。
- 提案手法は，生成器と推論モデルを互いに補完し合い，効果的なEBMサンプリングと学習を可能にする。
- 生成器はEBMサンプリングのための強固な初期状態を提供する一方で，推論モデルは生成器の事後サンプリングのための情報に基づいた潜在初期化を提供する。
- 多変量合成品質とコヒーレンスにおいて，様々なベースラインと比較して優れた性能が確認された。
Link: https://arxiv.org/abs/2605.00644
予測から実践へ：タスクを意識した血糖予測評価フレームワーク [cs.LG]目的：血糖予測におけるタスク適合性評価フレームワーク
- 臨床現場での意思決定支援において，時系列予測の重要性が高まっている。
- 標準的な集約指標では，モデルの実際の有用性が隠れてしまう場合がある。
- 高リスク領域における危険な失敗を回避し，タスクへの適合性を評価する。
- 早期警告においては，イベントレベルのリコールと患者1日あたりの誤警報回数を評価することで，実運用上の負担を反映した評価が可能となった。
- 全体的に高いリコールを示すモデルでも，インスリン効果が高いpost-bolus期において警告の誤りが多いことが示された。
- 介入実験により，予測モデルがインスリン計画変更に対するグルコース応答を正確に予測できないことが明らかになった。
Link: https://arxiv.org/abs/2605.00645
PEACE：小児・成人心電図のクロスモーダル強化アライメントによる堅牢な小児診断 [cs.IR, cs.LG]目的：小児・成人心電図のアライメントによる小児診断の精度向上
- 小児の心電図診断は，成人データで学習したモデルの性能が低く，診断が難しい
- 小児のラベル付きデータが不足しており，学習が困難である
- 成人データを利用し，小児データ不足を補い，診断精度を向上させる
- PEACEは，臨床的意味分解，特徴抽出，カリキュラムゲート最適化を組み合わせることで，成人心電図表現と小児診断ターゲットをアライメントする。
- ZZU-pECGデータセットにおいて，ゼロショット，50ショット，フルファインチューニング設定でそれぞれ59.39%，79.03%，90.89%のAUCを達成した。
- また，PTB-XLラベル空間では96.65%のAUCに達し，臨床的意味での補助的な学習が有効であることが示された。
Link: https://arxiv.org/abs/2605.00647
予算制約としてのリーマン多様体 [cs.LG]目的：総予算制約下でのK個の選択肢をN個のグループに割り当てること
- 機械学習における重要な問題であり，モデルの効率化や性能向上に不可欠である。
- 組み合わせ最適化の困難さから，真の目的関数を直接最適化することが難しい。
- 予算制約下での真の目的関数を効率的に最適化する手法を開発すること。
- ソフトマックス緩和を用いることで，予算制約はlogit空間における滑らかなリーマン多様体として表現できる。
- 提案手法RCOは，リーマン多様体の構造を利用して，正確な予算制約下での最適化を可能にする。
- 実験結果から，RCOは既存手法と比較して，より高い精度と計算効率を示すことが示された。
Link: https://arxiv.org/abs/2605.00649
AdaMeZO：LLMファインチューニングのためのAdam様式ゼロ次最適化手法（モーメントの維持なし） [cs.LG, cs.AI]目的：LLMのファインチューニングにおけるGPUメモリ消費量削減
- LLMは多様なタスクに利用可能だが，計算資源の制約が存在する。
- 従来のバックプロパゲーション法はGPUメモリを大量に消費する。
- メモリ効率を保ちつつ，MeZOの収束速度を改善すること。
- AdaMeZOは，MeZOと比較して同等または優れた性能を示す。
- AdaMeZOは，MeZOよりも最大70%少ないフォワードパスで学習可能である。
- AdaMeZOは，多様な損失地形に適応する能力が確認された。
Link: https://arxiv.org/abs/2605.00650
マルコフリスク尺度と多パターンリスク近似を用いた強化学習 [cs.LG, cs.AI, math.OC, stat.ML]目的：リスク回避型有限ホライズンマルコフ決定問題における強化学習手法
- 強化学習は，不確実な環境下での意思決定問題を解決するための重要な手法である。
- リスクを考慮した強化学習は，現実世界の多くの問題に対応するため不可欠である。
- マルコフリスク尺度と多パターン近似により，効率的なリスク回避型強化学習を実現する。
- ミニバッチ尺度と多パターンリスク回避問題を定義し，特徴量に基づくQ学習に適用した。
- 提案手法は，$\mathcal{O}\big(H^2 N^H \sqrt{ K}\big)$ の高確率後悔限界を持つことを示した。
- 評価ステップを効率化する経済的なQ学習手法も提案し，その有効性を検証した。
Link: https://arxiv.org/abs/2605.00654
スパイク系列機械とTransformer [cs.NE, cs.LG]目的：系列学習における共通機能の形式化
- 系列データ処理はAIの基盤であり，多様な応用分野で重要性が増している。
- Transformer等の既存モデルは複雑であり，その動作原理の理解が困難である。
- スパイクニューラルネットワークとTransformerの共通基盤を明らかにすること。
- スパイク系列機械とTransformerは，符号化，文脈維持，関連検索，記憶，復号の5つの機能操作を独立に実現している。
- 位相-潜時等価性により，正弦波位相とスパイクタイミングが線形関係にあることが示された。
- 位置エンコーディングにおける周波数圧縮は収束せず，ランクベースの埋め込みがより良い性能を示した。
Link: https://arxiv.org/abs/2605.00662
初期ノイズ最適化による構造化3D潜在空間の補完 [cs.CV, cs.AI]目的：構造化3D潜在拡散モデルにおける初期ノイズの最適化
- 3Dコンテンツ生成の重要性が高まる中で，高品質な3Dデータ編集技術が求められている。
- 既存の3D潜在拡散モデルでは，初期ノイズが構造に与える影響が大きく，安定性が課題となっていた。
- 初期ノイズを最適化することで，3Dデータの補完における一貫性とプロンプトへの適合性を向上させる。
- 本研究では，初期ノイズ最適化戦略を提案し，構造化3D潜在拡散モデルにおける3D補完の品質を大幅に改善した。
- 提案手法は，既存の学習不要な補完手法と比較して，文脈の一貫性とプロンプトへの整合性が向上することを示した。
- 初期ノイズ制御は，従来のサンプリング軌道操作とは異なる，3D補完のための独立した制御次元として確立された。
Link: https://arxiv.org/abs/2605.00664
強化学習における状態ごとの安全性確保のための拡張ラグランジュ乗数ネットワーク [cs.LG, cs.AI]目的：強化学習における状態ごとの安全性制約下での学習安定化
- 実世界での強化学習応用に際し，安全性は重要な課題であるため，安全性を考慮した学習手法が求められている。
- 状態ごとの安全性制約をラグランジュ法で扱う場合，状態ごとに乗数を必要とし，その近似にネットワークを用いるが，学習が不安定になりやすい。
- 拡張ラグランジュ乗数ネットワーク(ALaM)により，状態ごとの乗数の学習を安定化させ，安全な強化学習を実現することを目指す。
- 拡張ラグランジュ法に二次ペナルティ項を加えることで，乗数の遅延更新を補い，局所的な凸性を確保し，ポリシーの振動を抑制した。
- 乗数ネットワークを二重ターゲットへの教師あり回帰で学習させることで，学習を安定化させ，収束を促進した。
- SAC-ALaMアルゴリズムは，最先端の安全な強化学習手法と比較して，安全性，報酬，学習ダイナミクスの安定性において優れた性能を示した。
Link: https://arxiv.org/abs/2605.00667
難読化された自然数ゲームによるLLM証明システムの建築的推論能力の評価 [cs.DB, cs.LG]目的：LLM証明システムの建築的推論能力
- 形式数学の自動化は，数学研究の加速や新たな発見に繋がる可能性を秘めている。
- LLMの形式数学における成功が，真の論理的推論によるものか，事前学習データとのパターンマッチングによるものか不明である。
- 既知の数学領域外における局所的な公理と定義のみを用いた形式的証明の合成能力を評価する。
- 難読化により推論時間が長くなるという普遍的な傾向が確認された。
- 汎用モデルは性能が低下する一方，推論に特化したモデルは精度を維持した。
- これらの結果は，数学的推論能力を定量的に評価するための指標を提供する。
Link: https://arxiv.org/abs/2605.00677
分散型ブラックボックスコンセンサス最適化における行動と協調の学習 [eess.SY, cs.SY, cs.MA, cs.NE]目的：分散型ブラックボックスコンセンサス最適化のための行動と協調の学習
- マルチエージェントシステムにおいて，分散的な最適化は重要であり，効率的な協調が不可欠である。
- 従来の最適化手法は固定的な協調パターンに依存し，異質な非凸環境下での適応性に課題があった。
- 本研究は，最適化の軌跡から行動と協調パターンを学習することで，自己設計型マルチエージェントシステムを実現する。
- 提案手法LACMASは，標準的なベンチマークおよび実世界のタスクにおいて，解の質，収束効率，通信効率を向上させた。
- 大規模言語モデルを活用し，エージェントの行動と協調パターンに対して，高レベルなガイダンスを提供することで，性能向上を実現した。
- 段階的な認知スケジューリング戦略により，リソースを考慮しながら適応的な行動を活性化し，効率的な最適化を可能にした。
Link: https://arxiv.org/abs/2605.00691
緑内障進行軌道の層別化のための深層カーネル学習 [cs.LG]目的：緑内障患者の進行軌道の層別化
- 慢性疾患の管理において，患者リスクの層別化は臨床上重要な課題である。
- 電子カルテのデータは不規則であり，患者の状態を正確に把握することが難しい。
- 患者の進行リスクを早期に特定し，適切な介入を可能にすること。
- 本研究では，深層カーネル学習を用いて，緑内障患者を3つの明確なサブグループに分類することに成功した。
- モデルは，現在の重症度と進行を分離して学習し，視力低下が緩やかでも進行リスクの高いグループを特定した。
- この結果は，臨床的判断を支援し，高リスク患者への介入を改善する可能性を示す。
Link: https://arxiv.org/abs/2605.00708
グラフ表現学習のためのエイトチソン埋め込み [cs.LG, cs.SI]目的：グラフ構造と学習された特徴の関係性の洞察
- グラフ機械学習は，リンク予測やノード分類などのタスクに不可欠であり，表現学習がその中核を担う。
- 既存のグラフ埋め込みは解釈が難しく，学習された特徴とグラフ構造の関係性が不明瞭であるという課題がある。
- 潜在的な典型因子に基づいたノードの混合表現を捉え，解釈可能なグラフ埋め込みを構築することを試みる。
- エイトチソン幾何学に基づいた新しいグラフ埋め込みフレームワークを提案し，ノードをシンプレックス値の構成として表現した。
- 等距的対数比（ILR）座標を用いることで，ユークリッド空間での制約のない最適化を可能にしつつ，エイトチソン距離を保持した。
- ノード分類およびリンク予測において，既存手法と同等の性能を達成し，構築的に解釈可能性を提供した。
Link: https://arxiv.org/abs/2605.00716
生成的なインパルス応答の拡張による話者距離推定の改善に向けて [cs.SD, cs.AI, eess.AS, eess.SP]目的：話者距離推定モデルの性能向上
- 音響環境の理解と，それに基づく距離推定は，コミュニケーションシステムの質向上に不可欠である。
- 話者距離推定において，十分なデータ量の確保が課題であり，特に多様な音響条件でのデータが不足している。
- 本研究は，データ拡張によって話者距離推定の精度向上を目指す。
- 生成されたインパルス応答の品質をフィルタリングすることで，課題データとの整合性を確保した。
- GWA rooms において，平均絶対誤差（MAE）を1.66mから0.6mに，Treble rooms においては2.18mから0.69mへと大幅に削減した。
- 特に中距離から長距離における推定精度が向上しており，データ拡張の効果が示された。
Link: https://arxiv.org/abs/2605.00721
組合せ複体におけるワイスファイラー・レーマンテスト：トポロジカルニューラルネットワークの汎化表現力 [cs.LG]目的：組合せ複体におけるワイスファイラー・レーマンテストの理論的基礎
- グラフや超グラフなど，多様な構造を扱うトポロジカルデータ解析の重要性が増している。
- 既存のトポロジカルニューラルネットワークは理論的基盤が分断され，統一的な深層学習フレームワークがない。
- 組合せ複体を用いたワイスファイラー・レーマンテストを構築し，トポロジカル深層学習の表現力を高める。
- 組合せ複体ワイスファイラー・レーマンテスト（CCWL）を定義し，トポロジカルメッセージパッシングを形式化した。
- CCWLの表現力は，4種類の隣接関係のうち，上下近傍を用いることで十分に達成されることを証明した。
- 組合せ複体同型ネットワーク（CCIN）を提案し，合成データおよび実データで性能を評価し，優位性を示した。
Link: https://arxiv.org/abs/2605.00725
デカップルド関係アラインメントによる異種グラフ基盤モデルの強化 [eess.SY, cs.SY, cs.CE, physics.comp-ph, physics.med-ph, q-bio.QM, cs.SI, cs.AI]目的：異種グラフにおける関係アラインメント手法
- グラフ基盤モデルは均一グラフで成功を収めているが，実世界は異種グラフが主流である。
- 従来のグローバル特徴アラインメントはタイプ特有のセマンティクスを歪め，構造を破壊する。
- 関係構造と特徴セマンティクスを分離し，より効果的なアラインメントを実現すること。
- 提案手法DRSAは，関係駆動型アラインメントフレームワークとして，既存のGFMに組み込める。
- DRSAは，低ランクの関係部分空間内でクロスタイプ間の相互作用を調整する二重関係部分空間投影機構を導入する。
- 様々なベンチマークデータセットで，DRSAがドメイン間およびFew-shot知識転移能力を大幅に向上させることが示された。
Link: https://arxiv.org/abs/2605.00731
EASE：絡み合いを考慮したアンカー閉鎖による連合マルチモーダルアンラーニング [cs.NI, cs.AI, cs.LG, cs.MM]目的：連合マルチモーダルアンラーニングの実現
- プライバシー保護が重要となる連合学習において，マルチモーダルな知識の活用が求められている。
- 連合学習におけるマルチモーダルモデルは，忘却された知識が両モダリティやクライアント勾配空間に絡み合いやすく，アンラーニングを困難にしている。
- 本研究は，絡み合いを解消し，効率的な忘却を実現することで，連合マルチモーダルアンラーニングの性能向上を目指す。
- 本研究で提案するEASEは，3つの残差アンカーチャネルを閉鎖するエンタングルメントアウェアなサブスペース除去フレームワークである。
- 複数のデータセットとアンラーニングシナリオにおいて，既存手法を上回る性能が確認された。
- Flickr30Kデータセットにおける実験では，リトレーニング参照に匹敵するR@1精度を達成した。
Link: https://arxiv.org/abs/2605.00733
LLMツール呼び出しの評価と最適化フレームワーク：呼ぶべきか否か [eess.SY, cs.SY, cs.DB, cs.AI]目的：LLMツール呼び出しの評価と最適化
- LLMの能力拡張に不可欠であり，外部ツールとの連携が重要視されている。
- ツール呼び出しが必ずしも有益ではなく，冗長または有害な場合が存在する。
- LLMのツール呼び出し判断の質を向上させ，タスク性能を改善すること。
- モデルが認識するツール呼び出しの必要性と有用性は，実際の必要性や有用性と乖離していることが判明した。
- モデルの隠れ状態に基づく必要性と有用性の軽量な推定器を開発した。
- これらの推定器を利用した制御器は，自己認識型設定よりも優れたタスク性能を示した。
Link: https://arxiv.org/abs/2605.00737
入院後の予期せぬ再入院予測のための時間的データ要件 [cs.LG]目的：予期せぬ再入院予測の精度向上に最適な過去データの時間範囲
- 電子カルテの普及により，医療データの活用が重要視されている。
- 予測モデル構築において，最適な過去データ期間の決定が課題である。
- 再入院予測モデルの時間範囲最適化のための指針を確立すること。
- 非構造化データ（臨床記録）では，術前3～6ヶ月間のデータが最も予測性能が高かった。
- 構造化データでは，時間範囲を長くするほど性能が向上したが，12ヶ月で頭打ちとなった。
- データの種類によって最適な時間範囲が異なり，より多くのデータが必ずしも良い予測結果に繋がるとは限らない。
Link: https://arxiv.org/abs/2605.00738
エージェントAIオーケストレーションはベイジアン整合性を持つべき [cs.AI, cs.LG, stat.ML]目的：エージェントAIシステムのベイジアン整合性
- AIエージェントの応用範囲拡大に伴い，不確実性下での意思決定の重要性が増している。
- 既存のAIシステムは，不確実性に対応するための明確な枠組みを欠いている。
- エージェントAIオーケストレーション層におけるベイジアン原則の適用可能性を検証する。
- 本研究は，AIエージェントのオーケストレーション層において，ベイジアン原則が有効であることを主張する。
- ベイジアン決定理論を用いることで，AIシステムはタスクに関連する潜在的な量を追跡し，信念を更新し，行動を選択できる。
- 実用的な特性と設計パターンを示し，校正された信念と有用性を考慮したポリシーがAIオーケストレーションを改善することを示す。
Link: https://arxiv.org/abs/2605.00742
NonZero：マルチエージェントモンテカルロ木探索における相互作用誘導型探索 [cs.LG]目的：マルチエージェントモンテカルロ木探索における効率的な探索手法
- 協調型マルチエージェント環境は複雑であり，AIの応用範囲が広いため，効率的な探索が重要である。
- 従来のモンテカルロ木探索は，共同行動空間が指数関数的に増加するため，探索が困難である。
- 相互作用スコアを用いた低次元表現による探索で，効率性と性能の向上を目指す。
- NonZeroは，相互作用を考慮した探索により，探索空間を削減し，計算コストを低減する。
- MatGame，SMAC，SMACv2といった実験環境で，既存の手法と比較してサンプル効率と最終的な性能が向上した。
- 提案手法は，近似的なグラフ局所最適解に到達するための亜線形な局所後悔保証を持つ。
Link: https://arxiv.org/abs/2605.00751
Themis：柔軟な多基準評価のための多言語コード報酬モデルの学習 [cs.SE, cs.LG]目的：多言語，多基準コード報酬モデルの学習と評価
- 言語モデルの性能向上には，報酬モデルによる方策調整が不可欠であり，その重要性は増している。
- 既存のコード生成における報酬モデルは，実行可能性のフィードバックに偏っており，多角的な評価が困難である。
- 機能的正確性だけでなく，多様な基準に基づいたコードの評価を実現する報酬モデルを開発すること。
- Themis-CodeRewardBenchというコード報酬モデル評価のためのベンチマークを新たに構築した。
- 大規模なコード選好データセットThemis-CodePreferenceを構築し，それを用いてThemis-RMという多言語コード報酬モデル群を学習した。
- 実験の結果，モデルの規模拡大や多様な選好を用いた学習により，性能が向上することを示した。
Link: https://arxiv.org/abs/2605.00754