arXiv雑要約

AI - 2026/05/12 公開

  • FPGAにおけるスパイク性再帰型ニューロンの省エネルギー実装 [cs.CE, cs.MS, cs.NE]目的:FPGA上でのスパイク性再帰型ニューロンを用いたSNNアクセラレータの省エネルギー化
    • 近年,AI技術の発展に伴い,消費電力の削減が重要な課題となっている。
    • 従来のANNは計算量が多く,消費電力が大きいという課題がある。
    • より少ないエネルギー消費でニューラルネットワークを実現するため,SNNの実装が求められている。
    • MNISTデータセットを用いた検証により,提案手法が96.31%の認識精度を達成した。
    • スパイクトレース長とシナプス重みの量子化を調整することで,エネルギー消費を削減しつつ高い精度を維持できることを示した。
    • 5ビット重みで0.55mJ/digit,4ビット重みで0.45mJ/digitのエネルギー消費を実現した。

    Link: https://arxiv.org/abs/2605.10679

  • プロキシからの正確なアンラーニングは,近似アンラーニングにおける近接性の保証をもたらす [cs.LG]目的:機械アンラーニングの理論的保証
    • 機械学習モデルのプライバシー保護は重要であり,データ削除要求への対応が不可欠である。
    • 従来のアンラーニング手法は,モデルパラメータの更新に依存し,理想的な再学習モデルとの乖離が生じやすい。
    • データ分布構造に基づいたアンラーニングにより,理想的な再学習モデルに最も近いモデルを生成すること。
    • 提案手法は,データ分布の推論精度を高めることで,正確なアンラーニング信号を導出できる。
    • 理想的な再学習モデルとのKullback-Leiblerダイバージェンスに関する理論的な上限が示され,手法の正当性が確認された。
    • 実験結果は,提案手法が競合手法と比較して,理想的な再学習モデルに最も近い分類器を達成することを示した。

    Link: https://arxiv.org/abs/2605.10680

  • 誤り訂正符号のためのスケーラブルなMambaベースのメッセージパッシングニューラルデコーダ [cs.IT, cs.LG, math.IT]目的:誤り訂正符号のニューラルデコーダの性能向上
    • 信頼性の高い通信には必須であり,特にノイズの多い環境下での重要性が高い。
    • 既存のアテンションベースのデコーダは,コード長が長くなると計算量とメモリ消費量が膨大になる。
    • Mamba構造を活用し,アテンション機構を回避することで,長コードに対するスケーラビリティを改善する。
    • MMPDは,(1056, 880) LDPCコードにおいて,既存のCrossMPTデコーダと比較して0.45dBの性能向上を達成した。
    • メモリ消費量は1.5倍削減され,特に長コードにおいてその効果は顕著に現れた。
    • 実用的な長コードのニューラルデコーディングへの適用可能性を示す結果となった。

    Link: https://arxiv.org/abs/2605.10681

  • データシェイプリーはランダムより優れているか?NASHに問う [cs.LG, cs.AI]目的:高品質な訓練データ部分集合の特定
    • 機械学習モデルの性能は訓練データに大きく依存するため,データ選択の質が重要である。
    • データシェイプリーは計算コストが高く,必ずしもランダム選択より優れているとは限らない点が課題。
    • シェイプリー値が有効な設定を特定し,それを利用して効率的に高品質なデータを選択すること。
    • 提案手法NASHは,ターゲットの目的関数をシェイプリー値で解釈可能な成分関数に分解する。
    • NASHは,これらの成分関数を非線形に集約することで,データ選択の効率を大幅に向上させる。
    • 実験により,NASHがシェイプリー値/セミバリューに基づくデータ選択の効果を,わずかな計算コスト増で高めることが示された。

    Link: https://arxiv.org/abs/2605.10684

  • 遺伝的プログラミングに基づく遺伝子編集を用いた記号回帰法GESR [cs.AI]目的:記号回帰による数式発見の効率向上
    • 自然現象を記述する数学法則の発見は,古来からの人類の課題であり,科学的理解に不可欠である。
    • 従来の遺伝的プログラミングは,変異と交叉がランダムであるため,効率が低いという課題があった。
    • BERTモデルを用いた遺伝子編集により,より効率的な記号回帰を実現し,計算コストを削減することを目指す。
    • 提案手法GESRは,従来の遺伝的プログラミングと比較して計算効率が大幅に向上した。
    • BERTモデルによる変異と交叉の制御が,記号回帰の性能向上に貢献した。
    • 複数の記号回帰タスクにおいて,GESRは優れた全体的な性能を示した。

    Link: https://arxiv.org/abs/2605.10685

  • 高次のモーメント回収による乱流動力学の有限表現法 [cs.LG]目的:乱流動力学の有限表現法
    • 乱流は,気象,工学など広範な分野で重要であり,その予測精度向上が求められている。
    • 高次モーメントの正確な捕捉が困難であり,乱流現象の記述のボトルネックとなっている。
    • データから乱流の支配方程式と主要な統計量を同時に識別し予測することを目指す。
    • 提案手法は,記号回帰と生成モデルを組み合わせることで,決定論的動力学の閉じた表現を発見する。
    • 生成モデルにより,残留確率的成分を学習し,第1段階の近似誤差を修正することで,高次の統計量の正確な特徴付けを可能にする。
    • 数値実験により,相互作用項や強制表現の回復,そして5次までの統計モーメントの正確な予測が実証された。

    Link: https://arxiv.org/abs/2605.10687

  • DANCE:脳波におけるイベントの検出と分類 [cs.LG, eess.SP]目的:脳波におけるイベント検出と分類
    • 神経科学において,連続的な脳活動の解析は不可欠であり,認知機能や疾患の理解に繋がる。
    • 既存手法は既知のイベント開始時点に合わせた解析に依存しており,リアルワールドの継続的なモニタリングには不向き。
    • 未知のイベント開始時点から直接イベントを検出し分類する手法を開発し,リアルワールドでの応用を目指す。
    • DANCEは脳波信号からイベントをセット予測問題として捉え,イベントの検出と分類を同時に行う。
    • 10種類のデータセットで評価した結果,既存手法と比較して幅広い認知・臨床・BCIタスクで優れた性能を示した。
    • てんかんモニタリングにおいて最先端の性能を確立し,BCIタスクではイベント開始時点が既知の場合と同等の精度を達成した。

    Link: https://arxiv.org/abs/2605.10688

  • マルチエージェント推論における傍観者効果:協調的相互作用における認知的分散の定量化 [cs.CY, cs.CG, cs.RO, cs.MA, cs.AI]目的:マルチエージェントシステムにおける認知的分散の現象
    • 大規模言語モデルの活用が進む中で,複数エージェント間の協調が推論能力向上に繋がると期待されている。
    • しかし,エージェント間の相互作用が,必ずしも個々のエージェントの能力向上に寄与するとは限らない。
    • 本研究は,エージェント間の社会的圧力が,認知的分散を引き起こすメカニズムを定量的に解明することを目的とする。
    • シミュレーション実験により,エージェント間の社会的圧力が増加すると,個々のエージェントの論理的自律性が低下し,集団への迎合を優先する「傍観者効果」が確認された。
    • 「Interaction Depth Limit ($D_L$)」と呼ばれる閾値が存在し,この閾値を超えるとエージェントは自身の論理的思考を抑制し,外部からの影響を受けやすくなることが示された。
    • モデルは内部では正しい推論を行っているにも関わらず,実験設定上の集団への迎合のために誤った結論を選択する「Alignment Hallucinations」という現象が発見された。

    Link: https://arxiv.org/abs/2605.10698

  • RelFlexformer:積分可能な相対位置符号化のための効率的な注意3D-Transformer [cs.LG]目的:積分可能な相対位置符号化を用いた効率的な注意メカニズムの提案
    • 3次元データ処理において,効率的なTransformerモデルの構築が重要視されている。
    • 従来の注意メカニズムは計算コストが高く,長序列データの処理が困難であった。
    • 非構造化3次元空間における点群データなどの処理を効率化する新しいTransformerモデルを開発する。
    • RelFlexformerは,任意の積分可能な変調関数を用いた3D相対位置符号化を柔軟に統合する新しい3D-Transformerモデルである。
    • RelFlexformerの注意計算の計算量はO(L log L)であり,従来のモデルよりも効率的である。
    • 大規模な3次元データセットを用いた実験により,RelFlexformerが品質向上に貢献することが確認された。

    Link: https://arxiv.org/abs/2605.10706

  • 低リソース言語NLPがクロスリンガル転移だけでは不十分である理由:ルクセンブルク語からの教訓 [cs.CL, cs.AI]目的:低リソース言語におけるNLP技術拡張の課題と持続可能な開発戦略
    • 言語多様性の維持が重要であり,NLP技術は少数言語への応用が求められている。
    • 低リソース言語では,アノテーション付きデータの不足がNLP技術の発展を阻害している。
    • クロスリンガル転移と言語固有の努力のバランスが,低リソース言語NLPの鍵となる。
    • クロスリンガル転移は,低リソース言語の性能向上に貢献するが,言語固有の高品質データが不可欠である。
    • 言語固有のデータは,クロスリンガルな枠組みと組み合わせることで,その潜在能力を最大限に発揮する。
    • クロスリンガル転移と言語固有の努力は競合するものではなく,相互補完的な関係にある。

    Link: https://arxiv.org/abs/2605.10714

  • ポストトレーニングで何を最適化すべきか:テスト時スケーリング則の視点 [cs.LG, stat.ML]目的:大規模言語モデルにおけるテスト時戦略の最適化
    • 大規模言語モデルの利用拡大に伴い,その性能向上が不可欠である。
    • 既存のポストトレーニング目標は,テスト時の最適な性能を十分に反映していない。
    • 限られた計算資源下で,テスト時の性能を最大化する手法を開発する。
    • テスト時のパフォーマンスは,報酬分布の上位テールに依存するため,平均報酬の最適化だけでは不十分である。
    • TEAおよびPrefix-TEAは,様々な言語モデル,報酬モデル,データセットにおいて,テスト時の性能を向上させる。
    • 報酬分布の上位テールの統計量を外挿することで,少ないロールアウト数でも,テスト時の最適化が可能となる。

    Link: https://arxiv.org/abs/2605.10716

  • マルチエージェント軌跡モデリングのためのヘテロスケダスティック拡散 [cs.LG, cs.CV]目的:マルチエージェント軌跡の補完と不確実性推定
    • 現実世界のアプリケーションにおいて,軌跡予測だけでなく補完が重要である。
    • 既存手法では,状態ごとの不確実性を定量化できていない。
    • 生成されたシーンの誤差確率を推定し,予測のランキングを可能にすること。
    • U2Diffineは,軌跡補完と状態ごとの不確実性推定を同時に行う統一的な拡散モデルである。
    • 提案手法は,4つのスポーツデータセットにおいて最先端の性能を達成した。
    • 誤差確率推定のためのRankNNを統合することで,高い相関関係が確認された。

    Link: https://arxiv.org/abs/2605.10717

  • 計算コンティニュアムにおける因果的観測可能性のための不確実性を考慮したレジリエンス・マイクロエージェント [cs.DC, cs.AI, cs.LG, cs.PF, cs.SY, eess.SY]目的:計算コンティニュアムにおける曖昧な故障の診断と緩和
    • 計算コンティニュアムは,現代の情報システムの基盤であり,その信頼性は極めて重要である。
    • 既存手法は,因果関係の認識不足や高い認識的不確実性により,曖昧な故障を確実に診断できない。
    • 不確実性を考慮し,破壊的な介入を回避しながら,故障の根本原因を特定し,修復すること。
    • AURORAは,破壊的アクションの発生率を0%に抑え,従来のベースラインを上回る性能を示す。
    • 修理精度は62.0%を達成し,平均修復時間は3msに達した。
    • 自由エネルギー原理,因果的do計算,局所的因果状態グラフを統合することで,効率的かつ高精度な診断を実現する。

    Link: https://arxiv.org/abs/2605.10718

  • ECFPを用いた事前学習によるQSAR向けグラフニューラルネットワークの性能向上 [cs.LG]目的:QSARのためのグラフニューラルネットワークの性能向上
    • 創薬において分子表現法の重要性が増しており,GNNはその有力な手法の一つである。
    • 従来の分子特徴量化手法との比較において,GNNの優位性が明確でない場合がある。
    • ECFPを用いた事前学習により,GNNの汎化性能と実用性を向上させることを目指す。
    • ECFPで事前学習したGNNは,6つのBiogenベンチマークのうち5つで,統計的に有意な性能向上が確認された。
    • ヘテロなデータセットや複雑なエンドポイントにおいては,外挿性能が低下する傾向が見られた。
    • 事前学習時のサブストラクチャレベルでの情報漏洩が性能に影響を与えることが示唆された。

    Link: https://arxiv.org/abs/2605.10722

  • AllocMV:構造化された持続的状態による音楽ビデオ生成のための最適リソース配分 [cs.CV, cs.AI, cs.LG, cs.MA]目的:音楽ビデオ生成における最適リソース配分
    • 音楽ビデオの自動生成は,エンターテイメント産業において重要な役割を担う技術である。
    • 長尺の音楽ビデオ生成には,計算コストやショット間の整合性維持が課題となっていた。
    • 計算コストを抑えつつ,高品質で一貫性のある音楽ビデオを生成することを目指す。
    • AllocMVは,音楽ビデオ合成を多肢選択ナップサック問題として定式化する階層的フレームワークである。
    • このフレームワークは,グローバルプランナーがキャラクター,シーン,共有グラフを含むコンパクトな構造化オブジェクトとして持続的状態を表現する。
    • 評価の結果,AllocMVは,厳格な予算とリズムの制約下で,知覚品質とリソース消費の最適なトレードオフを達成した。

    Link: https://arxiv.org/abs/2605.10723

  • カーネル勾配ドリフトモデル [cs.LG, math.DG]目的:カーネルを用いた生成モデリングの新しい枠組み
    • 拡散モデルは高品質だが計算コストが高い。より効率的な生成手法が求められている。
    • 従来のドリフトモデルはガウスカーネルに限られ,理論的理解が十分ではなかった。
    • 一般的なカーネルに対する理論的根拠を確立し,多様なデータへの応用を可能にする。
    • カーネル勾配ドリフトは,固定されたユークリッド空間の変位方向をカーネルによって誘導される方向に置き換える。
    • これにより,識別可能性が保証され,smoothed-KL descentの解釈が可能となる。
    • 球面上の地理空間データ,プロモーターDNA,分子生成において,最先端の性能を達成した。

    Link: https://arxiv.org/abs/2605.10727

  • iPay:マルチモーダルネットワークと適応的空間事前学習による統合的な支払い行動認識 [cs.CV, cs.AI]目的:公共交通機関における支払い行動の自動認識
    • 公共交通機関の利用状況分析や不正乗車対策において,決済データの自動分析は不可欠である。
    • 既存手法は,騒がしい車内監視映像への対応が難しく,汎化性能の低い手動特徴量に依存する傾向がある。
    • RGB画像と骨格データの利点を組み合わせ,高精度かつ効率的な支払い行動認識を実現すること。
    • iPayは,RGB画像と骨格情報を統合したマルチモーダルなエキスパートアーキテクチャを採用し,認識精度を向上させた。
    • 特に,手からアンカーへの相対的な動きを明示的にモデル化する空間差分識別器(SDD)が,認識能力の向上に貢献した。
    • 実際の車内監視映像を用いた実験により,iPayが既存手法を上回り,83.45%の認識精度を達成した。

    Link: https://arxiv.org/abs/2605.10732

  • XQCfD:事前データと事前ポリシーによる高速Actor-Criticアルゴリズムの加速 [cs.LG]目的:強化学習におけるサンプル効率の向上
    • 実世界での強化学習は,探索コストが高い。ロボティクス分野では,サンプル効率が重要となる。
    • 既存のアルゴリズムは,事前学習済みポリシーを有効活用できず,サンプル効率が不十分である。
    • 事前データと事前ポリシーを活用し,効率的な学習を実現すること。
    • XQCfDは,サンプル効率の高いXQC actor-criticを拡張し,デモンストレーションデータから学習する。
    • 提案手法は,初期ポリシーを急速に忘却しない定常的なネットワークアーキテクチャを採用することで,分布外でのポリシー改善を可能にする。
    • Adroit, Robomimic, MimicGen等の複雑な操作タスクにおいて,最先端の性能を達成した。

    Link: https://arxiv.org/abs/2605.10734

  • AdaPaD:自己修正ランク発見によるPEFTのための適応並列デフレーション [cs.LG]目的:PEFTにおける適応並列デフレーション手法
    • 大規模言語モデルのファインチューニングは計算資源を要するため,効率的な手法が求められている。
    • LoRAなどのパラメータ効率的なファインチューニングでは,適切なランクrの選択が課題である。
    • ランクの自動発見と誤差の低減を通じて,より効率的なファインチューニングを実現すること。
    • AdaPaDは,各ランク1成分を同時に学習し,過去の成分の誤差を考慮して目標値を更新する。
    • この自己修正メカニズムにより,誤差が徐々に減少し,固定された残差として残らない。
    • 実験的に,AdaPaDは既存手法と同等以上の性能を示し,アダプターのサイズを削減することに成功した。

    Link: https://arxiv.org/abs/2605.10741

  • 検証可能なスパース反転とトークン再ラベルを用いたワンショット連合学習(ViTを使用) [cs.LG, cs.AI]目的:ワンショット連合学習におけるグローバルモデルの学習
    • データプライバシー保護が重要視される中,分散データを用いた効率的な学習手法が求められている。
    • 極端な非IID設定下では,既存のデータフリー手法で生成されるデータの品質が低いという課題がある。
    • 意味的誤整列を解消し,高品質な合成データを用いた学習を実現することを目指す。
    • 提案手法FedMITRは,合成画像の全パッチを活用し,スパースモデル反転とトークン再ラベルを行う。
    • スパースモデル反転により,背景ノイズからの勾配不安定性を解消し,汎化誤差を抑制する。
    • トークン再ラベルは,勾配分散を低減し,より堅牢な知識蒸留を可能にする。

    Link: https://arxiv.org/abs/2605.10748

  • エージェントの主体性:基盤エージェントの基盤科学としてのエージェントサイバネティックス [cs.CE, cs.AI]目的:基盤エージェントの理論的枠組み
    • AI応用の複雑化と長期間運用において,エージェントの制御とコミュニケーション原理の確立が重要である。
    • 現状のエージェント開発は経験則に頼る部分が多く,原理に基づいた設計が不足している。
    • サイバネティックスの法則を基盤エージェントに適用し,信頼性,継続的運用,自己改善を可能とする。
    • 本研究は,サイバネティックスの古典的な法則をエージェント設計原則にマッピングし,「エージェントサイバネティックス」という枠組みを提唱する。
    • コード生成,コンピュータ利用,自動研究の3つの応用分野において,エージェントサイバネティックスによる分析フレームワークの有効性を示す。
    • 本研究は,基盤エージェントの原理に基づいた,信頼性の高い実世界への展開を促進することを目指す。

    Link: https://arxiv.org/abs/2605.10754

  • ア adjoint matchingの強化:拡散モデルとフローマッチングモデルのポストトレーニングにおける強化学習のスケーリング [cs.LG, cs.CV]目的:拡散モデルおよびフローマッチングモデルにおける強化学習によるポストトレーニングのスケーリング
    • 拡散モデルは,スケーラブルな画像生成技術として注目されており,その性能向上は重要である。
    • 既存の強化学習によるポストトレーニング手法は,計算コストが高く,スケーリングが課題となっている。
    • 拡散モデルの学習構造を維持しつつ,報酬に基づいたモデルの調整を効率的に行うことを目指す。
    • 提案手法であるReinforce Adjoint Matching (RAM) は,SDEロールアウトや報酬勾配を必要とせず,計算コストを大幅に削減する。
    • Stable Diffusion 3.5Mにおける実験結果から,RAMは合成,テキストレンダリング,人間による嗜好性において最高の報酬を達成した。
    • RAMは,Flow-GRPOのピーク報酬に,最大で50分の1の学習ステップ数で到達することが示された。

    Link: https://arxiv.org/abs/2605.10759

  • GridProbe:長編動画VLMにおける適応的なテスト時計算のための事後探索 [cs.CV, cs.AI]目的:長編動画VLMにおける効率的なフレーム選択手法の開発
    • 動画理解は,VLMの重要な応用分野であり,その性能向上は様々なタスクに貢献する。
    • 従来のVLMは,大量のフレームを処理する必要があり,計算コストが課題となっていた。
    • 本研究は,テスト時に必要な計算量を動的に調整し,効率性と精度を両立することを目指す。
    • GridProbeは,VLM自身の推論能力を用いてフレームの重要度を評価し,質問に関連するフレームを適応的に選択する。
    • Video-MME-v2において,GridProbeはベースラインと同等の精度を維持しつつ,計算量を大幅に削減した。
    • 小規模なフレーム選択モデルと大規模なQAモデルを組み合わせることで,より高い性能と効率を実現した。

    Link: https://arxiv.org/abs/2605.10762

  • MATRA: エージェント型AIシステムの攻撃対象領域のモデリング - OpenClawケーススタディ [cs.AI, cs.CR]目的:エージェント型AIシステムの攻撃対象領域のモデリング
    • AIエージェントの利用拡大に伴い,セキュリティ評価の重要性が増している。
    • 既存の脅威クラスを特定のAIエージェントに適用したリスク評価手法が不足している。
    • エージェント型AIシステムの具体的なリスクを定量的に評価し,対策を講じることを目指す。
    • MATRAは,既存のリスク評価手法を応用し,LLMの脅威をシステム固有のリスクに変換する。
    • 資産ベースの影響評価とアタックツリーを用いて,リスク発生の可能性を体系的に評価する。
    • OpenClawを用いたケーススタディで,ネットワークサンドボックス等のアーキテクチャ制御がリスクを軽減することを示す。

    Link: https://arxiv.org/abs/2605.10763

  • ブレーキを壊せ,車輪を壊すな:エントロピー最大化による非ターゲット型脱獄 [cs.CV, cs.AI]目的:視覚言語モデルにおける非ターゲット型脱獄の実現
    • 視覚言語モデルの安全性確保は重要である。悪意のあるプロンプトによる誤動作を防ぐ必要がある。
    • 既存の脱獄手法はモデル間の汎用性に乏しく,実用的な脅威とはなりにくいという課題がある。
    • エントロピー最大化により,汎用性の高い脱獄攻撃を実現し,モデルの脆弱性を明らかにする。
    • 自己回帰デコーディングにおいて,拒否応答が高エントロピーのトークンに集中することが示された。
    • 提案手法UJEM-KLは,拒否応答を反転させつつ,出力品質を維持する軽量な攻撃である。
    • UJEM-KLは,複数のモデルとベンチマークで高い攻撃成功率と汎用性を示す。

    Link: https://arxiv.org/abs/2605.10764

  • マルチモーダル継続的命令チューニングのための動的クロスモーダルプロンプト生成 [cs.CV, cs.AI, cs.LG]目的:マルチモーダル継続的命令チューニングにおける能力獲得と破滅的忘却の抑制
    • マルチモーダル大規模言語モデルの性能向上に不可欠であり,実世界での応用範囲拡大が期待される分野である。
    • 既存手法はタスクレベルでのモジュール選択に偏っており,画像や質問の多様性に対応しきれていない。
    • クエリと画像のペア毎に異なるプロンプトを生成し,タスクレベルの制約を克服することを試みる。
    • DRAPEは,テキスト命令と視覚的特徴に基づいて,クエリ・画像条件付きのプロンプトを動的に生成する。
    • 既存のプロンプトベースおよびLoRAベースの手法と比較して,最先端の性能を達成した。
    • 共有プロジェクターへの帰無空間勾配投影とCLIPベースのプロトタイプルーティングにより,忘却を抑制している。

    Link: https://arxiv.org/abs/2605.10765

  • MPerS:動的なMLLM MixExperts知覚誘導リモートセンシングシーンセグメンテーション [cs.CV, cs.AI]目的:リモートセンシングシーンのセグメンテーション手法
    • リモートセンシング技術は,地球観測や環境モニタリングに不可欠であり,その精度向上が重要である。
    • 既存研究では,テキスト情報を効果的に活用できておらず,高品質なリモートセンシングキャプションの生成が課題となっている。
    • 多様な視点からの高品質なキャプション生成と,効果的なテキストと画像の融合によるセグメンテーション精度の向上を目指す。
    • MLLMを活用し,多様な専門家の視点から高品質なリモートセンシングキャプションを生成する手法を提案した。
    • 動的なMixExpertsモジュールにより,最も効果的なテキスト情報を適応的に統合することで,セグメンテーション精度を向上させた。
    • 提案手法は,3つの公開データセットで優れた性能を達成し,有効性を実証した。

    Link: https://arxiv.org/abs/2605.10769

  • DynaMiCS: 動的な混合を用いて制約条件下のLLMをファインチューニング [cs.LG]目的:大規模言語モデルの多岐にわたる領域でのファインチューニングにおける性能向上
    • LLMの性能向上は,自然言語処理の多様な応用において不可欠である。
    • 既存手法では,特定の能力の維持と向上の両立が難しく,汎化性能の低下が課題となる。
    • 制約条件を満たしつつ,対象領域の性能を向上させるファインチューニング手法の確立。
    • DynaMiCSは,ドメイン固有の評価を通じて,学習データセット間の相互影響を動的に推定する。
    • これにより,対象ドメインの性能向上と制約ドメインの損失維持を両立した最適化を実現した。
    • 既存手法と比較して,計算コストを抑え,参照モデルや手動調整を必要としない。

    Link: https://arxiv.org/abs/2605.10770

  • MSTAR自動ターゲット認識のための大規模言語-視覚質問応答モデルの構築に向けて [cs.CV, cs.AI, eess.IV]目的:SAR画像における詳細なターゲット認識能力の向上
    • 地空認識技術は,軍事・情報分野において極めて重要な役割を担うため,その精度向上が求められている。
    • SAR画像は環境条件に左右されやすく,軍事車両の識別は熟練した分析者の長年の経験を要する。
    • 大規模言語-視覚モデル(LLVM)を用いて,SAR画像におけるターゲット認識の自動化と精度向上を目指す。
    • 大規模言語-視覚モデル(LLVM)のパラメータ効率的なファインチューニングにより,98%の精度で詳細なターゲット特性を識別することに成功した。
    • MSTAR公開データセットを拡張し,SAR画像用の説明文キャプションと質問応答ペアを含む,新しいトレーニング・評価ベンチマークを開発した。
    • 本研究は,軍事・情報分野における機械支援リモートセンシングATRの発展に貢献するユニークな試みである。

    Link: https://arxiv.org/abs/2605.10772

  • 深層低ランク残差蒸留による事前学習済み重みのロック [cs.LG]目的:オープンウェイト大規模言語モデルの不正利用に対する防御機構
    • オープンウェイトモデルは,多様な環境での利用や研究を促進する重要な技術である。
    • モデルの自由な改変は,不正な利用につながる可能性があり,その対策が課題である。
    • モデルの性能を維持しつつ,改変による不正利用を防ぐ新たな防御手法を開発する。
    • DLR-Lockは,事前学習済みMLPを深層低ランク残差ネットワーク(DLR-Net)に置き換えることで,バックプロパゲーション時の活性化メモリを増大させる。
    • DLR-Netの導入により,標準的なファインチューニングの最適化を複雑にし,逆伝播の計算コストを増大させる。
    • 防御戦略を完全に知る攻撃者に対しても有効であり,元のモデルの性能を維持できることを実験で示した。

    Link: https://arxiv.org/abs/2605.10777

  • 最終層を超えて:視覚的トークン化のための多層表現融合 [cs.CV, cs.AI]目的:視覚的トークン化における多層表現融合
    • 画像処理技術は,画像認識や生成といった様々な応用において不可欠である。
    • 既存手法では,事前学習済みのエンコーダの最終層のみを利用し,中間層の豊富な情報を活用できていない。
    • 中間層の情報を効果的に融合することで,表現力を高め,画像生成品質を向上させる。
    • DRoRAEは,エネルギー制約ルーティングと漸進的修正を用いて,すべてのエンコーダ層を適応的に集約する軽量な融合モジュールである。
    • ImageNet-256において,DRoRAEはrFIDを0.57から0.29に,生成FIDを1.74から1.65に低減した。
    • 融合容量と再構成品質の間にロジスティック線形スケーリング則($R^2{=}0.86$)が認められ,表現の豊富さが重要な指標となることが示された。

    Link: https://arxiv.org/abs/2605.10780

  • 反抗的な生徒:自己蒸留RLVRによる推論探索のための教師シグナルの逆転 [cs.LG, cs.CL]目的:自己蒸留を用いた大規模言語モデルの推論探索手法
    • 大規模言語モデルの性能向上は,AI研究の重要な目標であり,そのための学習方法が求められている。
    • 従来の自己蒸留では,成功事例において生徒の推論が教師によって上書きされ,多様性が失われるという課題があった。
    • 生徒が教師の予測と異なる成功経路を発見した場合,その過程を強化することで,より効果的な探索を目指す。
    • 本研究では,教師シグナルを逆転させ,生徒自身の成功に基づく推論を強化するRLRTを提案した。
    • RLRTは,ベース,命令調整,思考調整されたQwen3チェックポイントにおいて,自己蒸留や探索ベースラインを大幅に上回る性能を示した。
    • 情報非対称性をRLVRの新たな設計軸として確立し,生徒主導の探索の有効性を示唆した。

    Link: https://arxiv.org/abs/2605.10781

  • TrajPrism: 言語に基づいた都市経路理解のためのマルチタスクベンチマーク [cs.AI]目的:言語と経路を統合した都市経路理解
    • 都市の移動は経路と自然言語で表現され,その理解は都市計画や自動運転等の応用において重要である。
    • 従来の経路モデルは幾何学に偏りがちで,言語と経路の整合性評価が不足している。
    • 言語と経路の対応関係を評価し,より自然な都市移動理解を目指す。
    • TrajPrismは,経路生成,意味的経路検索,経路キャプションの3つのタスクを統合したベンチマークである。
    • 本ベンチマークは,ポルト,サンフランシスコ,北京の実際の都市経路30万件と,言語アノテーション210万件を含む。
    • 実験モデルは,言語入力を考慮しない既存手法と比較して,性能向上を示した。

    Link: https://arxiv.org/abs/2605.10782

  • MASS-DPO:直接方策最適化のための多重負例能動的サンプル選択 [cs.LG]目的:多重負例を用いた直接方策最適化における能動的サンプル選択手法
    • 方策最適化は,機械学習モデルの性能向上に不可欠であり,特に強化学習の分野で重要な役割を果たす。
    • 負例の選択コストが高く,類似した負例が多く存在することで,学習効率が低下する可能性がある。
    • 情報量の多い負例サブセットを効率的に選択し,学習の冗長性を低減することを目指す。
    • MASS-DPOは,フィッシャー情報に基づく目的関数を用いて,コンパクトで情報量の多い負例サブセットを選択する。
    • 実験の結果,推薦システムや多肢選択QAタスクにおいて,既存手法と同等以上の精度を達成した。
    • 少ない負例数で高い精度を維持し,学習の安定性と効率を向上させた。

    Link: https://arxiv.org/abs/2605.10784

  • ComplexMCP:動的,相互依存的,大規模ツールサンドボックスにおけるLLMエージェントの評価 [cs.AI, cs.SE]目的:LLMエージェントの性能評価
    • 業務自動化の需要増加に伴い,LLMエージェントの応用範囲が拡大している。
    • 既存のLLMエージェントは,独立したAPIの呼び出しには長けているが,複雑な環境下での自動化には課題がある。
    • 現実世界の複雑なツール連携環境におけるLLMエージェントのボトルネックを特定し,改善策を検討する。
    • ComplexMCPベンチマークによって,最先端モデルでも成功率は60%にとどまり,人間の90%を下回ることが示された。
    • 性能低下の要因として,ツール検索の飽和,過信による環境確認の省略,そして戦略的な諦めが挙げられた。
    • 本研究は,相互依存的なワークフローにおけるLLMエージェントの限界を明確にし,次世代の自律システムの開発に向けた重要な基盤を提供する。

    Link: https://arxiv.org/abs/2605.10787

  • 拡散モデル学習における表現劣化問題の解明 [cs.LG]目的:拡散モデル学習における表現劣化問題の解明と改善
    • 拡散モデルは高性能だが,学習効率が課題。高品質な生成には安定した学習が不可欠である。
    • ノイズレベルの上昇に伴い,生成物の構造歪曲が生じ,学習が不安定になるという問題がある。
    • 有効回復可能性に着目し,最適化努力の再配分によって表現学習を安定化させる。
    • 本研究で提案するElucidated Representation Diffusion(ERD)は,有効回復可能性に基づいて最適化努力を動的に再配分する。
    • ERDは外部の教師信号を用いず,表現学習を安定化させ,収束を加速し,高い生成性能を実現する。
    • 表現劣化は,Neural Tangent Kernelスペクトルの弱体化と有効低ランク挙動に関連していることが示唆された。

    Link: https://arxiv.org/abs/2605.10790

  • PathISE:知識グラフ質問応答のための情報的パス教師あり学習 [cs.AI]目的:知識グラフ質問応答における,質問に関連するパスの学習
    • 知識グラフは,構造化された知識表現として,質問応答システムの重要な基盤である。
    • 質問応答モデルの訓練には高品質な中間教師信号が必要だが,その作成には高いコストがかかる。
    • 回答レベルのラベルから高品質な中間教師信号を学習し,効率的な質問応答を実現する。
    • PathISEは,関係パスの重要度を推定する軽量なTransformerベースの推定器を導入する。
    • この推定器によって生成された擬似的なパスレベルの教師信号を,LLMパス生成器に組み込む。
    • 3つのベンチマークで,PathISEは既存のモデルと同等またはそれ以上の性能を達成した。

    Link: https://arxiv.org/abs/2605.10791

  • ConQuR:LLMのための最適化された回転によるコーナーアラインメント活性量子化 [cs.LG]目的:LLMの活性量子化における回転最適化によるコーナーアラインメント
    • 大規模言語モデルの普及には,メモリ消費量と推論コストの削減が不可欠である。
    • 低ビット活性量子化は,外れ値による量子化誤差が大きいため困難である。
    • 本研究は,効率的な回転校正により活性量子化の精度向上を目指す。
    • 提案手法は,活性を内接超立方体のコーナーにアラインメントする回転を学習する。
    • これにより,活性エネルギーを次元間で均等に分散させ,量子化誤差を低減する。
    • Llama-2とLlama-3モデルを用いた実験で,高い性能と効率性を示す。

    Link: https://arxiv.org/abs/2605.10793

  • 秘密を保つことはできるか?言語モデルの文章における意図しない情報漏洩 [cs.CR, cs.AI]目的:言語モデルにおける情報漏洩の検証
    • 言語モデルの利用拡大に伴い,情報保護の重要性が増している。
    • プロンプトや機密情報が,意図せず出力に反映されるリスクがある。
    • 言語モデルが秘密情報を漏洩するメカニズムを明らかにすること。
    • 最先端の言語モデルは,秘密の単語を直接出力することなく,テーマや描写を通じて,統計的に有意な割合で秘密を漏洩する。
    • 秘密を隠すように指示すると,モデルは秘密から遠ざかるように書き,その回避行動自体が検知可能である。
    • 情報漏洩はモデル間で共有され,モデルのサイズに比例して大きくなる。また,短い文章では情報漏洩は起こらない。

    Link: https://arxiv.org/abs/2605.10794

  • サッカーパフォーマンス分析における解釈可能な機械学習:エリートリーグから大学競技への転移性の証拠 [cs.AI]目的:サッカーパフォーマンス分析における解釈可能な機械学習の転移性に関する検証
    • サッカーにおけるデータ分析の重要性が増しており,選手のパフォーマンス向上に貢献する可能性を秘めている。
    • 機械学習モデルの解釈性は,その信頼性を確保する上で重要だが,競技レベル間の違いによる影響は不明な点が多い。
    • エリートリーグで学習したパフォーマンス指標が大学レベルのサッカーに適用可能かどうか,解釈の安定性を検証する。
    • エリートリーグでは,リーグ,モデル,解釈手法に関わらず,パフォーマンス指標の階層構造に一貫性が見られた。
    • 一方,大学サッカーでは,主要な指標の順位が大きく変動し,解釈の安定性が低下し,エリートリーグとの構造的な合致が弱かった。
    • この結果は,解釈可能性の頑健性がドメインに依存することを示唆しており,解釈の不安定さは対象ドメインの構造的な曖昧さを示す診断信号となり得る。

    Link: https://arxiv.org/abs/2605.10796

  • Muown:ミューオン最適化のための行ノルム制御 [cs.LG]目的:言語モデルの事前学習におけるミューオン最適化の安定化と性能向上
    • 近年,言語モデルの事前学習において,ミューオンがAdamWに匹敵する性能を示す。
    • ミューオンは重み減衰に敏感であり,大規模な学習において不安定になることがある。
    • ミューオンの行ノルムの変動を制御し,学習の安定性と性能を向上させる。
    • 提案手法Muownは,ミューオンの行ノルムベクトルを明示的な最適化変数として扱い,学習を安定化させる。
    • Muownは,FineWeb-Eduデータセットでの事前学習において,perplexityを改善し,AdamW等の既存手法を上回る性能を示した。
    • Muownは,学習率や重み減衰に対する感度を低減し,最適化の安定性と効率性を向上させる。

    Link: https://arxiv.org/abs/2605.10797

  • 終端語が優勢になる:思考連鎖の信頼性研究における形式の交絡 [cs.LG, cs.AI, cs.CL]目的:思考連鎖の信頼性を評価する際の形式的交絡の特定
    • 大規模言語モデルの思考連鎖は複雑な推論を可能にするが,その信頼性評価は困難である。
    • 既存の信頼性研究では,形式的な特徴が計算過程に影響を与えている可能性が指摘されていなかった。
    • 思考連鎖の信頼性を正しく評価するための標準的な手法を確立すること。
    • 標準的なベンチマークにおいて,思考連鎖の終端に答えが明示されている場合,モデルは計算過程ではなく答えの位置に強く依存する。
    • 答えの文言のみを除去することで,モデルの性能が著しく低下し,終端への感受性が約19倍低下することが確認された。
    • モデルの規模が大きくなるにつれて,この形式的交絡の影響は軽減される傾向にある。

    Link: https://arxiv.org/abs/2605.10799

  • AI駆動ツールによるキャンパスのウェルビーイング向上:予防と介入のアプローチ [cs.AI, cs.CY, cs.HC]目的:キャンパスのウェルビーイング向上を図るためのAI駆動ツール開発
    • 学生の学業成績はウェルビーイングに大きく左右されるため,その向上は高等教育機関にとって重要である。
    • 多くの大学では,学生の満足度をモニタリングし,メンタルヘルスのリスクを早期に発見する効果的な手段が不足している。
    • 本研究は,フィードバック収集の改善とメンタルヘルス検出の高度化を通じて,この課題の解決を目指す。
    • TigerGPTというパーソナライズされたチャットボットを開発し,使いやすさ75%,満足度81%を達成した。
    • 追跡質問のタイプを適応的に変更するAURAフレームワークにより,会話の質が平均0.12向上し,具体的な質問の回数が63%減少した。
    • DSM-5とPHQ-8に基づいたPsychoGPTにより,初期の苦悩分類,症状レベルのスコアリング,外部評価との整合性が可能になった。

    Link: https://arxiv.org/abs/2605.10804

  • 推論は無償ではない:LLMジャッジにおける堅牢な適応型コスト効率ルーティング [cs.AI, cs.CL, stat.ML]目的:LLMジャッジにおける推論の利用に関するコストと精度に関する研究
    • LLMをジャッジとして活用する研究は,人間の判断を代替する可能性を秘めている。
    • LLMの推論能力は計算コストが高く,単純な評価には必ずしも有効ではない。
    • コストと精度のバランスを取りながら,最適な推論戦略を動的に選択すること。
    • 本研究では,推論を用いるべき状況とそうでない状況を識別し,効率的なルーティング手法を提案した。
    • 提案手法RACERは,分布シフトを考慮した最適化問題としてルーティングを定式化し,理論的な収束性も保証されている。
    • 実験結果から,RACERは分布シフト下で優れた精度とコストのトレードオフを実現することが示された。

    Link: https://arxiv.org/abs/2605.10805

  • PhyGround:生成型ワールドモデルにおける物理的推論のベンチマーク [cs.CV, cs.AI, cs.LG]目的:生成型ワールドモデルにおける物理的推論の評価基準
    • 動画生成技術の発展に伴い,現実世界の物理法則を反映したシミュレーションが重要になっている。
    • 既存の物理学に焦点を当てた動画ベンチマークは,評価の粗さ,アノテーションのバイアス,自動評価の不十分さなどの課題を抱えている。
    • 物理法則に基づいた詳細な評価と,より信頼性の高い自動評価手法の開発を目指す。
    • PhyGroundは,250のプロンプトと13の物理法則に基づく評価基準を備えたベンチマークである。
    • 大規模な人間による評価実験の結果,モデル間の順位付けの相関性が高いことが確認された。
    • PhyJudge-9Bは,Gemini-3.1-Proよりも大幅に低いバイアスを示す,物理に特化したVLMである。

    Link: https://arxiv.org/abs/2605.10806

  • セキュアなハードウェア設計と関連問題に対するLLM:機会と課題 [cs.CR, cs.AR, cs.LG]目的:LLMを活用したハードウェア設計における機会と課題の分析
    • 半導体産業は発展を続けており,設計の自動化とセキュリティ強化が重要である。
    • LLMの導入は可能性を広げる一方,新たな脆弱性の問題も生じている。
    • LLMを活用した設計におけるセキュリティリスクを軽減し,信頼性向上を目指す。
    • LLMはRTLコード生成やテストベンチ自動化に貢献し,高レベル仕様とシリコン間のセマンティックギャップを埋める。
    • データ汚染や敵対的機械学習による回避など,LLMの脆弱性に関する最新の研究動向を体系的に分析した。
    • 動的ベンチマーキングや積極的なレッドチームによる評価など,効果的な対策についても議論した。

    Link: https://arxiv.org/abs/2605.10807

  • ドメイン適応言語モデルを用いた脅威モデリング:実証的評価と考察 [cs.CR, cs.AI]目的:脅威モデリングにおけるドメイン適応言語モデルの効果検証
    • サイバーセキュリティの重要性が増す中,脆弱性検出へのLLM活用が注目されている。
    • 既存研究では,汎用LLMの限定的なプロンプト設定での評価が中心であった。
    • STRIDEアプローチを用いた5Gセキュリティにおける脅威モデリングの課題解決を目指す。
    • ドメイン適応モデルは,汎用モデルに対して一貫して優れた性能を示すとは限らないことが示された。
    • デコーディング戦略がモデルの挙動と出力の妥当性に大きく影響することが明らかになった。
    • モデル規模の拡大が必ずしも信頼性の高い脅威モデリングに繋がらないという限界が示唆された。

    Link: https://arxiv.org/abs/2605.10808

  • 誤り制約付き言語生成 [cs.LG, cs.DS]目的:言語生成における誤り総数の最小化
    • 言語生成は,自然言語処理の根幹であり,様々な応用への展開が期待される分野である。
    • 従来の言語生成研究では,最終的な正答率ばかりが重視され,学習過程における累積誤りに着目されてこなかった。
    • 本研究は,言語生成アルゴリズムが出力する誤りの総数を最小限に抑えることを目指す。
    • 誤り制約付き言語生成という新たな概念を導入し,累積誤りの重要性を指摘した。
    • 有限クラスにおいては,最適な最終誤り時間と誤り制約の両方を達成するアルゴリズムを提示した。
    • 無限言語ストリームにおいては,誤り制約と収束保証の間にトレードオフが存在することを証明した。

    Link: https://arxiv.org/abs/2605.10809

  • 数学論文の続きに対する尤度スコアリング:ショートカット脆弱性テスト付きの自己教師ありベンチマーク [cs.LG]目的:技術論文の隠れたテキストを予測するための自動生成されたベンチマーク
    • 数学・物理学論文のテキスト生成は,研究の効率化に不可欠であり,その自動化が求められている。
    • 大規模言語モデルは高い性能を示す一方,ショートカット学習などの脆弱性が存在する可能性がある。
    • 尤度スコアリングを用いて,モデルの推論能力を評価し,ショートカット学習の検出を目指す。
    • GPT-5.5,Opus 4.7,GPT-5.4 nanoの予測は,Qwen3-8BおよびKimi K2.6スコアラー下で,コンテキストのみのコントロールよりもクリップされた尤度を改善した。
    • GPT-5.5の予測は,コンテキストのみでファインチューニングされたスコアラーを用いたコントロールよりも優れていた。GPT-5.4 nanoの予測は優位性を示さなかった。
    • 尤度スコアリングは,静的なベンチマークとして有効であり,強化学習やモデル選択の最適化前にショートカット脆弱性を探査するための設定として役立つ。

    Link: https://arxiv.org/abs/2605.10810

  • ナノリサーチ:パーソナライズされた研究自動化のためのスキル,メモリ,ポリシーの共進化 [cs.AI]目的:パーソナライズされた研究自動化の実現に向けたマルチエージェントフレームワーク
    • 研究活動は多様であり,研究者のリソースや手法,成果物の形式が異なる。
    • 既存の研究自動化システムは均一な出力しか生成できず,個々の研究者のニーズに応えられない。
    • 研究者の知識,経験,嗜好を蓄積・活用し,個別最適化された研究自動化を実現すること。
    • NanoResearchは,スキルバンク,メモリモジュール,ラベルフリーポリシー学習という三層の共進化によって,研究自動化におけるパーソナライズを可能にする。
    • 実験の結果,NanoResearchは最先端のAI研究システムと比較して大幅な改善を示し,サイクルが進むにつれてより優れた研究を低コストで実現することが示された。
    • スキルバンクは反復的な操作を再利用可能なルールに凝縮し,メモリモジュールは研究者の経験を蓄積し,ポリシー学習はフィードバックに基づいてプランナーを改善する。

    Link: https://arxiv.org/abs/2605.10813