arXiv雑要約

AI - 2026/03/12 公開

  • UAV交通シーン理解:クロススペクトル誘導アプローチと統一されたベンチマーク [cs.CV, cs.AI]目的:UAVによる交通シーンの理解
    • 交通システムの高度化において,広範囲な監視と柔軟な展開が可能なUAVの活用が不可欠である。
    • 既存手法は,光学画像への過度な依存により,夜間や霧などの悪条件下で性能が著しく低下する問題がある。
    • 複雑な交通行動の評価に必要なドメイン固有の知識を組み込み,悪条件下でもロバストな理解を目指す。
    • 提案手法CTCNetは,クロススペクトル情報を活用し,外部の交通規制知識を埋め込むことで,複雑な交通行動の理解と違反の識別を可能にする。
    • 新たに構築されたTraffic-VQAベンチマークは,光学画像と熱画像を組み合わせた大規模なデータセットであり,UAV交通シーン理解の研究を促進する。
    • 実験結果から,CTCNetが最先端手法と比較して,認知および知覚の両面で顕著な性能向上を示すことが明らかになった。

    Link: https://arxiv.org/abs/2603.10722

  • 人間による推論に着想を得た堅牢な音声ディープフェイク検出への道 [cs.SD, cs.AI]目的:音声ディープフェイク検出の堅牢性向上
    • 音声技術の発展に伴い,悪意による音声偽造が深刻化しており,個人情報への不正アクセス等のリスクがある。
    • 既存のディープフェイク検出手法は,未知の音声ドメインや生成モデルに対する汎化性能が低いという課題がある。
    • 人間らしい推論に基づいた,説明可能なディープフェイク検出手法を開発し,その有効性を検証する。
    • 提案手法HIR-SDDは,大規模音声言語モデルと人間による注釈データを用いた思考連鎖推論を組み合わせることで,高い検出性能を実現した。
    • HIR-SDDは,予測結果に対する妥当な根拠を提供し,人間が理解しやすい形で判断の理由を説明できる。
    • 実験評価により,提案手法が新たな音声ドメインや生成モデルに対しても有効であることが示された。

    Link: https://arxiv.org/abs/2603.10725

  • CacheSolidarity:マルチテナントLLMサービングシステムにおけるプレフィックスキャッシュサイドチャネルの防止 [cs.CR, cs.DC, cs.LG]目的:マルチテナントLLMサービングシステムにおけるプレフィックスキャッシュサイドチャネルに対するセキュリティ確保
    • LLMの効率的な推論は重要であり,キャッシュ技術はその性能を大きく左右する。
    • 自動プレフィックスキャッシュは高速化に貢献する一方,タイミングサイドチャネルを引き起こす可能性がある。
    • キャッシュ共有を維持しつつ,サイドチャネル攻撃から情報を保護することを目的とする。
    • CacheSolidarityは,キャッシュ再利用を監視し,疑わしい共有を特定し,必要な場合にのみプレフィックスを隔離する。
    • 既存の防御策と比較して,最大70%高いキャッシュ再利用率と30%低い推論レイテンシを実現する。
    • LLMサービングにおけるセキュリティとパフォーマンスの両立が可能であることを示す軽量設計である。

    Link: https://arxiv.org/abs/2603.10726

  • 精度を超えて:畳み込みニューラルネットワークにおける信頼性と不確実性推定 [cs.LG, stat.ML]目的:畳み込みニューラルネットワークの信頼性および不確実性推定手法の比較と評価
    • 深層学習は多様な分野で活用されているが,その信頼性評価は重要である。
    • 深層学習モデルは予測精度は高いものの,過信傾向があり,信頼性が低い場合がある。
    • モデルの不確実性を適切に推定し,より信頼性の高い深層学習システムを構築すること。
    • H-CNN VGG16は予測精度が高いが,過信傾向が強いことが示された。
    • GoogLeNetはより適切な不確実性推定結果を示し,校正性能が高いことが確認された。
    • Conformal Predictionは統計的に保証された予測集合を提供し,高い意思決定の場面での実用性を示した。

    Link: https://arxiv.org/abs/2603.10731

  • 機械学習ワークフローの文法 [cs.LG]目的:機械学習ワークフローにおけるデータリークの防止
    • 機械学習の信頼性は科学的発見や意思決定に不可欠であり,その精度は極めて重要である。
    • データリークは機械学習モデルの性能を過大評価し,現実世界での汎化性能を損なう深刻な問題である。
    • 本研究は,データリークを構造的に防止するための文法を提案し,その有効性を検証することを目指す。
    • 提案された文法は,教師あり学習ライフサイクルを7つの基本要素に分解し,型付き有向非巡回グラフ(DAG)で接続することで,データリークを抑制する。
    • 特に,評価・検証境界を設ける「assess制約」は,テストセットの過剰な評価を防止し,性能の過大評価を防ぐ。
    • 実験結果から,選択リークは性能を0.93,記憶リークは0.53-1.11の標準偏差で過大評価することが示された。

    Link: https://arxiv.org/abs/2603.10742

  • CUPID:単一モデルによるアレオリックおよびエピステミック不確実性の同時推定のためのプラグインフレームワーク [cs.LG, cs.AI]目的:深層学習における不確実性の推定手法
    • 医療診断や自律的な意思決定など,ハイステークスな分野では,正確な不確実性推定が不可欠である。
    • 既存の手法は,単一の不確実性タイプしか扱えないか,ベースモデルの修正・再学習が必要で,実用化が困難である。
    • ベースモデルの変更や再学習なしに,アレオリックおよびエピステミック不確実性を同時に推定する手法を提案する。
    • CUPIDは,事前学習済みのネットワークの任意の層に柔軟に挿入可能である。
    • アレオリック不確実性は学習されたベイズ識別写像によってモデル化され,エピステミック不確実性は構造化された摂動に対するモデルの内部応答を分析することで捉えられる。
    • 分類,回帰,分布外検出を含む様々なタスクで競争力のある性能を示し,不確実性の起源に関する層ごとの洞察を提供する。

    Link: https://arxiv.org/abs/2603.10745

  • 深層ランダム分散関数計算(DeepRDFC):ニューラル分散チャネルシミュレーション [cs.IT, cs.AI, cs.LG, math.IT]目的:分散関数計算における性能向上
    • 分散処理と機械学習の応用範囲拡大に不可欠であり,効率的な計算手法が求められている。
    • 共通のランダム性が限られる場合や,厳密な関数計算保証が必要な場面で課題が生じる。
    • ランダム分散関数計算(RDFC)の性能向上と,その利用促進を目指している。
    • オートエンコーダ(AE)を用いて確率分布の総変動距離を最小化し,高精度な分散チャネルシミュレーションを実現した。
    • 提案手法は,データ圧縮手法と比較して,通信負荷の軽減に貢献する。
    • 本研究は,深層学習に基づくRDFC手法の確立に貢献し,限られたランダム性下での利用を促進する。

    Link: https://arxiv.org/abs/2603.10750

  • ニューラルネットワークモデルにおける知的財産のコピー保護のためのPUFベースのアプローチ [cs.CR, cs.LG]目的:ニューラルネットワークモデルにおける知的財産のコピー保護
    • 企業における知的財産は価値が高く,その保護は不可欠である。特に,機械学習モデルに埋め込まれた知的財産は保護が重要となる。
    • 複製されたハードウェアへのソフトウェアやモデルの不正コピーが容易に行われる可能性がある。ハードウェアとソフトウェアの紐付けが不十分である。
    • ハードウェア固有の特性を利用し,ニューラルネットワークモデルの重みをハードウェアに紐付け,不正なコピーを困難にすることを目指す。
    • 提案手法により,複製されたハードウェア上ではニューラルネットワークモデルの精度が低下することが確認された。
    • 物理的に複製不可能な関数(PUF)を活用することで,モデルの重みをハードウェアに強く紐付けることが可能となった。
    • 本研究は,ニューラルネットワークモデルに組み込まれた知的財産の保護に貢献すると考えられる。

    Link: https://arxiv.org/abs/2603.10753

  • 勾配の符号の優先順位付け:ワイヤレス連合学習のための重要度を考慮したフレームワーク [cs.LG, cs.IT, eess.SP, math.IT]目的:ワイヤレス連合学習における勾配情報の重要度に応じた資源配分による性能向上
    • エッジデバイスにおけるAIモデルの共同学習を可能にし,ユビキタスな知能化アプリケーションを支える重要な技術である。
    • 無線リソースの制約により通信が不安定になりやすく,ワイヤレス連合学習の課題となっている。
    • 勾配の符号を優先的に伝送することで,限られた無線資源下での学習性能を向上させる。
    • 提案手法SP-FLは,符号の伝送を優先し,残りの勾配の大きさの回復が困難な場合でも再利用を可能にする。
    • パケットレベルとデバイスレベルにおける重要度の差を考慮した階層的な資源配分問題を定式化し,帯域幅と電力の最適化を行う。
    • シミュレーション結果から,リソース制約下において,既存手法と比較してCIFAR-10データセット上で最大9.96%高いテスト精度を示すことが確認された。

    Link: https://arxiv.org/abs/2603.10763

  • 極端事象の予測のための力学情報に基づく深層学習 [cs.LG, math.DS, nlin.CD]目的:高次元カオス力学系における極端事象の予測
    • 複雑な現象を予測することは,防災やリスク管理において不可欠である。
    • 極端事象は稀であり,発生メカニズムの解明が困難である。
    • 限られた観測データから,極端事象の兆候を捉え,予測精度向上を目指す。
    • 本研究では,事象発生前の過渡的な不安定性を捉えることで,極端事象の予測を可能にする。
    • 最適時間依存モードを用いた低次元空間での不安定性増大評価により,計算コストを削減している。
    • Kolmogorov流れの実験結果から,メカニズムを明示的に組み込むことで予測可能な期間が大幅に延長されることが示された。

    Link: https://arxiv.org/abs/2603.10777

  • カテゴリカルVQAのためのショートカット:スーパーニューロンの活用 [cs.CV, cs.AI, cs.LG]目的:視覚的根拠のある多様なタスクにおける精度の高い分類器
    • 画像と言語を理解するVLMsは,様々な応用において重要な役割を担っている。
    • VLMsの性能向上には,教師ありファインチューニング等が必要であり,計算コストが高い。
    • 計算コストを抑えつつVLMsの性能を向上させるための新たな手法を提案する。
    • VLMsの活性化値を直接プローブすることで,精度の高い分類器を構築できることを示した。
    • 特に,初期層の活性化値(スーパーニューロン)を利用することで,高速化と性能向上が同時に実現された。
    • 最速で5.10倍の速度向上を達成し,分類性能もロバストに改善された。

    Link: https://arxiv.org/abs/2603.10781

  • コンテキストクラスタリングと誤り訂正によるAI強化セルラー空間トラフィック需要予測(5G/6G計画向け) [cs.LG, cs.AI, cs.SY, eess.SY]目的:セルラー空間トラフィック需要の正確な予測
    • 5G/6G計画において,セルラーネットワークの容量計画や高密度化に不可欠な要素である。
    • 単純な学習/テスト分割では空間自己相関により近隣への漏洩が生じ,予測精度が過大評価されやすい。
    • 空間的汎化性能を向上させ,信頼性の高い帯域幅プロビジョニングを実現すること。
    • 提案手法は,コンテキストを考慮した二段階分割戦略と残差空間誤り訂正により,漏洩を抑制し空間的汎化性能を改善する。
    • カナダの主要都市5箇所での実験結果は,場所のみによるクラスタリングと比較して,一貫して平均絶対誤差(MAE)を低減することを示している。
    • より信頼性の高い帯域幅プロビジョニングや,証拠に基づいたスペクトル計画・共有評価を支援する。

    Link: https://arxiv.org/abs/2603.10800

  • インテリジェントなスペクトル管理に向けて:グラフニューラルネットワークを用いたスペクトル需要推定 [cs.NI, cs.AI, cs.LG, cs.SY, eess.SY]目的:スペクトル需要の推定
    • 無線通信の需要増加に伴い,限られたスペクトル資源の効率的な利用が重要となっている。
    • 既存のスペクトル管理手法では,スペクトル需要の変動を正確に捉えることが困難である。
    • 本研究は,スペクトル需要の空間的な変動を詳細に推定する手法を開発し,効率的なスペクトル共有・割当を支援する。
    • 本研究で開発したHR-GATは,カナダの5都市におけるスペクトル需要推定において,既存手法と比較して平均RMSEを約21%削減した。
    • HR-GATは,空間的な自己相関を低減し,汎化性能を向上させることに成功した。
    • 推定されたスペクトル需要マップは規制当局が利用可能であり,無線ネットワークにおけるスペクトル共有・割当を支援する。

    Link: https://arxiv.org/abs/2603.10802

  • 育成優先エージェント開発:対話型知識結晶化によるドメイン専門家AIエージェントの構築 [cs.AI, cs.HC, cs.SE]目的:ドメイン専門家AIエージェント構築のための新たなパラダイム
    • LLMベースのエージェント開発が活発化しており,その性能向上の鍵はドメイン知識の有効な組み込みにある。
    • 従来のコード優先型やプロンプト優先型では,知識が固定化され,専門家の持つ暗黙知や継続的な進化に対応できない。
    • 対話を通じて知識を徐々に結晶化させることで,専門知識の獲得と進化を可能にする。
    • 本研究では,エージェントを最小限の構成で初期化し,ドメイン専門家との対話を通じ段階的に成長させる「育成優先開発」を提案する。
    • 「知識結晶化サイクル」を導入し,対話中に得られた断片的な知識を構造化された再利用可能な資産に定期的に変換する。
    • 金融調査エージェントの事例を通じて,本パラダイムの有効性,限界,そして人間とエージェントの共同進化への影響を議論する。

    Link: https://arxiv.org/abs/2603.10808

  • 拡散誘導潜在空間最適化によるタンパク質反事実 [cs.DB, cs.LG, cs.AI]目的:タンパク質の望ましい特性への予測を反転させる最小限の,生物学的に妥当な配列編集
    • 深層学習はタンパク質特性を高精度に予測するが,改良変異体設計の指針は乏しい。
    • モデルが不安定性を指摘した場合,機能維持下での安定化変異を特定する方法がない。
    • モデルの解釈と仮説に基づいたタンパク質設計を可能にするツールの開発。
    • MCCOPは,既存の離散および連続ベースラインよりも,まばらで妥当性の高い反事実を生成する。
    • 同定された変異は,発色団パッキングや疎水性コアの強化など,既知のバイオフィジカルメカニズムと一致する。
    • MCCOPは,モデル解釈と仮説駆動型タンパク質設計の両方に対するツールとして確立された。

    Link: https://arxiv.org/abs/2603.10811

  • 経路予測における敵対的攻撃に対する防御機構としてのランダム化スムージングの評価 [cs.LG]目的:経路予測モデルの敵対的攻撃に対する頑健性の向上
    • 自動運転の安全性と効率性は,正確かつ堅牢な経路予測に依存している。
    • 最先端の予測モデルでも,わずかな摂動を加えた敵対的攻撃に脆弱であることが示されている。
    • 敵対的攻撃に対する効果的な防御策を,ランダム化スムージングを用いて確立すること。
    • ランダム化スムージングは,複数の経路予測モデルにおいて,非敵対的な設定での精度を損なうことなく,頑健性を一貫して向上させることが示された。
    • この手法は,他のドメインで成功したアプローチに基づき,経路予測における敵対的攻撃を緩和するための,シンプルかつ計算コストの低い技術である。
    • 異なるランダム化スムージング戦略をテストした実験により,その有効性が検証された。

    Link: https://arxiv.org/abs/2603.10821

  • 音声認識LLMによる話者検証:評価と拡張 [cs.SD, cs.AI]目的:音声認識LLMにおける話者識別能力の評価と向上
    • 音声技術は,セキュリティやユーザ認証において重要な役割を担う。
    • 既存の音声認識LLMは,言語内容に偏っており,話者識別に十分な能力がない。
    • 話者識別能力を向上させることで,より安全で便利な音声インターフェースを実現する。
    • 提案手法により,API利用モデルおよびオープンウェイトモデルにおいて,話者検証スコアを継続的に算出可能となった。
    • 最新の音声認識LLMのベンチマークにより,話者識別性能が低いことが示された (VoxCeleb1で20%以上のEER)。
    • TinyLLaMA-1.1BにECAPA-TDNNの埋め込みを統合したECAPA-LLMは,VoxCeleb1-Eで1.03%のEERを達成し,専用話者検証システムに匹敵する性能を示した。

    Link: https://arxiv.org/abs/2603.10827

  • BALD-SAM:不一致に基づく能動プロンプティングによるインタラクティブセグメンテーション [cs.CV, cs.AI]目的:インタラクティブセグメンテーションにおける能動プロンプティング手法
    • 画像セグメンテーションは,医療画像解析や自動運転など,幅広い分野で不可欠な技術である。
    • 従来の手法では,アノテーターが視覚的にマスク品質を評価し,プロンプトを配置する必要があり,効率が低い。
    • モデル由来の基準を用いて,情報量の多い領域を効率的にプロンプトとして選択することを目指す。
    • BALD-SAMは,ベイズ的不一致に基づく能動学習を空間プロンプト選択に適用することで,高い性能を実現した。
    • 16のデータセットにおいて,14のベンチマークで1位または2位の成績を収め,汎用性の高さを示した。
    • 特に,薄いオブジェクトや複雑な構造を持つオブジェクトのセグメンテーションにおいて,人間のプロンプトやオラクルプロンプトを上回る結果が得られた。

    Link: https://arxiv.org/abs/2603.10828

  • 手がかりの競合に関する信頼性とそれ以降 [cs.CV, cs.AI]目的:ニューラルネットワークにおける視覚的な手がかりへの依存性の理解
    • ニューラルネットワークの意思決定プロセスを人間が理解可能な形で解明する上で重要である
    • 既存の評価手法では,手がかりのバイアスが不安定で曖昧になりやすい
    • 信頼性の高い,解釈可能な形状・質感バイアスの診断を可能にする
    • 新しいデータセットと評価フレームワーク「REFINED-BIAS」を導入した
    • 形状と質感の明確な定義に基づき,バランスの取れた手がかり対を構築する
    • モデル間のより公平な比較と,バイアスのより正確な診断を可能にする

    Link: https://arxiv.org/abs/2603.10834

  • コールドスタートのドラフティングと継続的洗練:NPUカーネル合成への価値駆動型メモリアプローチ [cs.CL, cs.LG, cs.AI, cs.CL]目的:データ不足なプログラミングドメインにおけるカーネル合成の自動化
    • データが限られる新興のドメイン固有アーキテクチャでは,大規模言語モデルの活用が困難である。
    • NPUプログラミングのようなデータ不足環境では,既存モデルの性能が大幅に低下する。
    • 価値駆動型メモリ機構により,データ不足環境でのカーネル合成性能を向上させる。
    • EvoKernelは,初期ドラフティングから継続的な洗練まで,カーネル合成ライフサイクルを自動化する自己進化型エージェントフレームワークである。
    • EvoKernelは,NPUカーネルベンチマークを用いて,最先端モデルの正答率を11.0%から83.0%に向上させた。
    • 反復的な洗練により,初期ドラフトと比較してメディアンで3.60倍の高速化を達成した。

    Link: https://arxiv.org/abs/2603.10846

  • ブドウ園におけるロボット局所化のための意味的ランドマークパーティクルフィルタ [cs.RO, cs.AI]目的:ブドウ園におけるロボット局所化の精度向上
    • 農業分野におけるロボット活用は労働力不足の解消に不可欠であり,正確な位置推定が自動運転の鍵となる。
    • ブドウ園のような整列した作物の列は,LiDARや画像を用いたSLAMで誤った場所への収束を引き起こしやすい。
    • 意味的情報を活用し,作物の列の識別を改善することで,ロバストな局所化を実現する。
    • 提案手法は,従来の幾何学的な手法やGNSSのみによる手法と比較して,局所化精度を大幅に向上させた。
    • 絶対位置誤差は,2つの移動方向でそれぞれ22%と65%減少した。
    • 列の認識精度が向上し,横方向の誤差も減少することで,反復的な屋外農業環境におけるロバストな局所化が可能となった。

    Link: https://arxiv.org/abs/2603.10847

  • V₀.₅:スパースRLロールアウトのための汎用価値モデルを事前分布として [cs.LG, cs.AI, cs.CL]目的:スパースRLにおける頑健なアドバンテージベースラインの構築
    • 強化学習において,報酬の検証可能性が重要視されており,効率的な学習には適切なベースラインが必要である。
    • 従来のベースライン推定は,分散が高く,サンプル効率が低いという課題があった。
    • 価値モデルの事前分布とロールアウトの経験的平均を融合し,分散とバイアスのバランスを取ることで,安定した学習を実現する。
    • 提案手法V₀.₅は,既存手法GRPOやDAPOと比較して,収束速度が速く,性能が向上した。
    • V₀.₅は,価値モデルの信頼性をリアルタイムで統計的に検定し,ロールアウト予算を動的に配分する。
    • 数学的推論ベンチマーク6つで評価した結果,V₀.₅は10%以上の性能向上を達成した。

    Link: https://arxiv.org/abs/2603.10848

  • 6ABOS:EnMAPハイパースペクトルミッションのための6Sに基づくオープンソース大気補正フレームワーク [cs.LG]目的:EnMAPハイパースペクトル画像の自動大気補正
    • 光学的に複雑な環境モニタリングにおいて,地表面反射率の正確な取得は重要である。
    • 水域における水面からの反射や大気散乱の影響で,地表面反射率の取得が困難である。
    • EnMAPデータを用いた水域研究のための,透明性,再現性,拡張性の高いツールを提供する。
    • 6ABOSは,6Sモデルを活用し,レイリー散乱,エアロゾル,ガス吸収を考慮した物理的根拠に基づいた反転スキームを実装する。
    • Google Earth Engine(GEE)APIと連携し,EnMAPメタデータの自動解析と大気パラメータの動的取得を可能にする。
    • 地中海の異なる栄養状態の水域で検証を行い,現地測定値とEnMAP由来の水面反射率のスペクトル類似性が高いことが示された。

    Link: https://arxiv.org/abs/2603.10856

  • GRACE:グリッド,ロードマップ,連続環境のための統一された2Dマルチロボットパスプランニングシミュレータとベンチマーク [cs.RO, cs.AI, cs.MA]目的:マルチエージェントパスファンディングとマルチロボットモーションプランニングの進展
    • ロボットの自律性と協調作業を実現する上で,効率的な経路計画は不可欠である。
    • 既存のツールは,スケーラビリティと再現性の点で課題を抱えており,比較が困難である。
    • 異なる表現形式での比較を可能にし,実用的な応用への移行を促進すること。
    • GRACEは,グリッド,ロードマップ,連続環境といった複数の抽象レベルで,同じタスクを再現性のある演算子と共通の評価プロトコルを通じてインスタンス化する統一されたシミュレータである。
    • 公開されたマップと代表的なプランナーを用いた実験により,共有されたインスタンスセット上で妥当な比較が可能となった。
    • 表現の忠実度と計算速度のトレードオフが定量化され,より高忠実度のMRMPは速度が遅く,グリッド/ロードマッププランナーはスケーラビリティが高いことが示された。

    Link: https://arxiv.org/abs/2603.10858

  • SNPgen:表現型を監督した遺伝子型表現と潜在拡散による合成データ生成 [cs.LG, q-bio.GN]目的:表現型を監督した合成遺伝子型データの生成
    • ゲノム解析は疾患リスク評価に重要だが,個人データへのアクセス制限が存在する。
    • 既存の合成データ生成法は,表現型との整合性が低く,実用的な精度を欠いている。
    • 表現型を考慮した高品質な合成遺伝子型データ生成によるプライバシー保護と実用性の両立。
    • SNPgenは,GWASに基づく変異選択と潜在拡散モデルを組み合わせることで,高精度な合成データを生成する。
    • 合成データを用いた予測性能は,実データと同等レベルであり,PRS解析においても良好な結果が得られた。
    • プライバシー分析では,個人識別リスクが低く,データ構造の維持と高い対立遺伝子頻度相関が確認された。

    Link: https://arxiv.org/abs/2603.10873

  • 極大規模マルチラベルテキスト分類ライブラリデータセット:デジタルライブラリにおける実践的なAI活用を真剣に考えた場合 [cs.CL, cs.AI, cs.DL, cs.IR]目的:カタログレコードと統合権威ファイル(GND)のアノテーションを含む大規模な二言語(英語/ドイツ語)コーパス
    • 情報発見において主題索引は重要だが,大規模かつ多言語対応での維持は困難である。
    • 既存の分類システムでは,テキストと権威ある用語との正確なマッピングが課題となっている。
    • 権威に基づいたAI共同作業者によるカタログ作業の効率化と精度向上を目指す。
    • 本研究で提供するリソースは,オントロジーを意識したマルチラベル分類と再現性のある評価を可能にする。
    • 3つのシステムに対する統計的プロファイルと質的なエラー分析を実施し,性能を評価した。
    • 精度だけでなく有用性と透明性を評価し,権威に根ざしたAI共同作業者の開発を促進する。

    Link: https://arxiv.org/abs/2603.10876

  • LAtte:交差被験者脳波分類のための双曲ローレンツ注意機構 [cs.CL, cs.RO, eess.SY, cs.SY, cs.LG]目的:交差被験者脳波分類におけるロバストかつ汎化性能の向上
    • 脳波分類は,医療診断からブレイン・コンピュータ・インターフェースまで幅広い応用分野で重要である。
    • 脳波はノイズが多く,被験者間での変動が大きいため,正確な分類が難しいという課題がある。
    • 本研究は,被験者間の共有モデル学習を通して,脳波分類のロバスト性と汎化性能を高めることを目指す。
    • 提案手法LAtteは,ローレンツ注意機構とInceptionTimeエンコーダを統合し,脳波分類の性能を向上させる。
    • 事前学習により被験者間の共通基盤信号を学習し,ローレンツ低ランクアダプタを用いて被験者固有の埋め込み表現を獲得する。
    • 3つの脳波データセットで評価した結果,既存の最先端手法と比較して著しい性能向上を達成した。

    Link: https://arxiv.org/abs/2603.10881

  • 合成調節要素の設計のための連続拡散トランスフォーマー [cs.LG, cs.AI, q-bio.GN]目的:合成調節DNA配列の生成
    • 遺伝子発現調節機構の理解は,生物学研究および創薬において重要である。
    • 既存手法では,十分な多様性と信頼性を兼ね備えた配列設計が困難である。
    • 拡散トランスフォーマーを用いて,高精度かつ多様な調節配列を効率的に設計すること。
    • 拡散トランスフォーマーは,従来のU-Netモデルと同等の性能を,より少ない計算量で達成した。
    • CNNエンコーダーが性能向上に不可欠であり,学習データの記憶効果を低減することを示した。
    • DDPOファインチューニングにより,予測される調節活性が大幅に向上し,真の調節シグナルが反映されていることが確認された。

    Link: https://arxiv.org/abs/2603.10885

  • 大規模推論モデルのアクティブRLファインチューニングのためのダイナミクス予測サンプリング [cs.LG, cs.AI]目的:大規模推論モデルの推論能力向上を目指したRLファインチューニングにおける効率的なデータ選択
    • 近年,大規模言語モデルの推論能力向上にRLファインチューニングが不可欠な手法となっている。
    • 従来のオンラインプロンプト選択法は計算コストが高く,ファインチューニングのメリットを相殺する可能性がある。
    • 本研究では,高コストなロールアウトを削減し,効率的なデータ選択を実現する手法を提案する。
    • 提案手法であるDPSは,プロンプトの学習ダイナミクスを事前に予測することで,情報量の多いプロンプトを効率的に選択する。
    • 実験の結果,DPSは冗長なロールアウトを大幅に削減し,学習プロセスを高速化することが示された。
    • 数学,計画,視覚幾何学などの様々な推論タスクにおいて,優れた推論性能を達成した。

    Link: https://arxiv.org/abs/2603.10887

  • 処方検証における安全性とトレーサビリティのためのハイブリッド知識基盤フレームワーク [cs.RO, cs.SY, eess.SY, cs.AI, cs.IR]目的:処方検証の安全性とトレーサビリティ向上
    • 服薬ミスは患者の安全を脅かす重大な問題であり,薬剤師による検証は最後の防衛線である。
    • 大規模言語モデルは事実の信頼性やトレーサビリティに課題があり,複雑な推論に弱い。
    • 信頼性と根拠に基づいた処方監査システムを構築し,薬剤師の負担を軽減する。
    • 提案システムPharmGraph-Auditorは,信頼性の高いハイブリッド製薬知識ベース(HPKB)を構築し,処方監査の安全性を高める。
    • HPKBは,関係性とグラフ構造を統合し,厳密なマッピング層を介して推論を行う。
    • 実験結果は,知識抽出能力の高さと,より安全で迅速な処方検証の可能性を示唆している。

    Link: https://arxiv.org/abs/2603.10891

  • 強化学習におけるエルゴード性 [cs.LG]目的:強化学習における報酬過程のエルゴード性に関する考察
    • 強化学習は,自律的な意思決定を行うエージェントの学習に不可欠である。
    • 報酬過程がエルゴードでない場合,期待値はエージェントの実際のパフォーマンスを反映しない。
    • エルゴードでない報酬過程下での,個々の軌跡の長期的なパフォーマンスを最適化する手法を検討する。
    • 報酬過程のエルゴード性は,マルコフ連鎖のエルゴード性との関連性を示す。
    • エルゴードでない報酬過程が強化学習エージェントに与える影響を,具体例を用いて説明する。
    • 既存の解決策が,エルゴードでない報酬動態下で個々の軌跡のパフォーマンスを向上させることを示す。

    Link: https://arxiv.org/abs/2603.10895

  • LookaheadKV:未来を垣間見ることで高速かつ正確なKVキャッシュ退去を実現する手法 [cs.NI, cs.LG, cs.AI]目的:大規模言語モデルにおけるKVキャッシュ退去の効率化
    • Transformerモデルの性能維持にはKVキャッシュが不可欠だが,長文処理においてメモリ消費量が課題となる。
    • 既存手法では,重要度の低いKVを退去させるものの,未来の応答予測のコストが高い。
    • 未来予測のコストを削減しつつ,KVキャッシュ退去の精度を向上させる。
    • LookaheadKVは,明示的な未来応答生成を行わず,パラメータ効率の良いモジュールで重要度を予測する。
    • 既存の低コストな手法と比較して精度が高く,より高コストな近似手法よりも優れている。
    • 長文理解ベンチマークにおいて,競合手法を凌駕し,初回トークンまでの時間を最大14.5倍短縮する。

    Link: https://arxiv.org/abs/2603.10899

  • ファインチューニングが失敗し,汎化するのはいつか:LLMベースTTSにおけるデータ多様性と混合学習の役割 [cs.DC, cs.SD, cs.AI, cs.ET]目的:LLMベースTTSにおけるファインチューニングの効果検証
    • 近年,LLMをTTSの基盤として活用する研究が進んでおり,高品質な音声合成が期待されている。
    • 凍結されたLLMでは,話者固有の音響特性や知覚特性のモデル化が不十分であるという課題がある。
    • データ多様性を考慮したLoRAファインチューニングによる話者適応の改善を目指す。
    • LoRAファインチューニングは,非ファインチューニングのベースモデルQwen-0.5Bよりも,音声品質の3つの側面(知覚品質,話者忠実度,信号レベル品質)で一貫して良好な結果を示した。
    • 特に,音響的な多様性が豊富な学習データを持つ話者において,DNS-MOSスコアが最大0.42ポイント向上し,知覚品質が大幅に改善された。
    • LoRAは,話者ID表現を効果的に適応させつつ,言語モデリングを劣化させることなく,音声類似度を向上させることが示された。

    Link: https://arxiv.org/abs/2603.10904

  • 機械学習と組み合わせ型融合分析によるNCAAトーナメント予測 [eess.SY, cs.SY, cs.CL, cs.CL, cs.LG]目的:NCAAトーナメント予測の精度向上
    • スポーツ予測は,データ分析の重要な応用分野であり,関心が高まっている。
    • 既存のランキングシステムだけでは,予測精度に限界がある。
    • 複数のランキングシステムを効果的に融合し,予測精度を向上させる。
    • 本研究では,新しい手法である組み合わせ型融合分析(CFA)を導入した。
    • CFAを用いたチームランキングにより,74.60%の予測精度を達成した。
    • これは,既存の主要な10のランキングシステムよりも高い精度である。

    Link: https://arxiv.org/abs/2603.10916

  • ECoLAD:自動車時系列異常検知のための展開指向型評価 [cs.LG]目的:自動車時系列データの異常検知における展開可能性評価
    • 自動車の安全性向上には,リアルタイムな異常検知が不可欠である。
    • 従来の評価では,実際の車載環境での制約が考慮されていない。
    • 車載環境におけるCPU制約下での性能評価手法を確立する。
    • ECoLADは,CPUスレッド数制限や計算量削減ルールを適用することで,展開環境を模倣した評価を実現する。
    • 自動車の実際のテレメトリデータにおいて,軽量な古典的手法は高い検出性能を維持する。
    • 一方,一部の深層学習手法は,精度を失う前に展開可能性を失うことが示された。

    Link: https://arxiv.org/abs/2603.10926

  • 歴史的合意:ガウス混合モデル事前分布の反復選択による事後崩壊の防止 [cs.CE, cond-mat.mtrl-sci, physics.app-ph, cs.LG, cs.AI, cs.CV]目的:変分オートエンコーダにおける事後崩壊の防止
    • 潜在変数がデータの特徴を捉えきれない場合,生成モデルの性能が低下する。
    • 変分オートエンコーダでは,事後分布が事前分布に退化する「事後崩壊」が頻発する。
    • 複数のクラスタリング制約を満たすモデルを訓練し,パラメータ空間の安定化を図る。
    • 提案手法「歴史的合意訓練」は,ガウス混合モデル事前分布の反復選択により,事後崩壊を根本的に排除する。
    • この手法は,デコーダの分散や正則化強度に関わらず,非崩壊な表現学習を可能にする。
    • 明示的な安定条件を必要とせず,任意のニューラルネットワークアーキテクチャで利用可能である。

    Link: https://arxiv.org/abs/2603.10935

  • カーネル密度推定器を用いた表形式合成データにおけるメンバーシップ開示リスクの定量化 [cs.LG, stat.AP]目的:表形式合成データにおけるメンバーシップ開示リスクの定量化
    • プライバシー保護の重要性が高まる中,合成データは現実のデータ共有の代替手段として注目されている。
    • 合成データにもメンバーシップ推論攻撃(MIA)のリスクが存在し,十分なプライバシー保証が困難である。
    • カーネル密度推定器(KDE)を用いて,合成データのメンバーシップ開示リスクを定量的に評価する手法を提案する。
    • 提案手法は,合成データと訓練レコード間の最近傍距離の分布をモデル化し,メンバーシップの確率的推論を可能にする。
    • 「真の分布攻撃」とより現実的な「現実的な攻撃」の2つの攻撃モデルを提案し,実データと合成データを用いて評価した結果,既存手法よりも高いF1スコアとリスク特性化を実現した。
    • 本手法は,合成データのリリース前に,データ管理者による事後的なリスク評価を可能にする実用的なフレームワークを提供する。

    Link: https://arxiv.org/abs/2603.10937

  • 期待を超える安全なRLHF:普遍的なスペクトルリスク制御のための確率的優越性 [cs.LG, cs.AI]目的:人間のフィードバックによる安全な強化学習におけるリスク制御手法
    • 強化学習は様々な分野で活用が期待されるが,安全性確保が不可欠である。
    • 従来の期待コスト制約は,コスト分布の不確実性を捉えきれず,極端な事象への対応が課題であった。
    • 確率的優越性を用いて,分布全体を比較し,テールリスクを直接制御することを目指す。
    • 提案手法RADは,期待コスト制約を確率的優越性制約に置き換えることで,安全性と有用性を両立する。
    • 量子重み付き確率的優越性制約は,広範なスペクトルリスク尺度を普遍的に制御することが示された。
    • 実験結果から,RADはベースラインよりも無害性を向上させ,分布外評価においても堅牢性を示すことが確認された。

    Link: https://arxiv.org/abs/2603.10938

  • アノテーションはいつ信頼すべきか:質量スペクトルからの分子構造検索における選択的予測 [cs.LG, stat.ML]目的:質量スペクトルからの分子構造検索における信頼性の高い予測選択
    • 質量分析は,化学,生物学,医学など広範な分野で重要な役割を担う分析手法である。
    • 既存の分子構造同定手法は依然として高い誤り率を示すため,信頼性の評価が課題となっている。
    • 予測の不確実性が高い場合に予測を控えることで,誤ったアノテーションのリスクを低減することを目指す。
    • 不確実性の定量化戦略として,フィンガープリントレベルと検索レベルの二段階で評価を行った。
    • 第一階の信頼度指標や検索レベルの偶然的確実性は,リスクとカバレッジのトレードオフにおいて良好な結果を示した。
    • 分布フリーなリスク制御により,許容可能な誤り率を設定し,その制約を満たすアノテーションのサブセットを得ることが可能である。

    Link: https://arxiv.org/abs/2603.10950

  • テスト時スケーリング下における推論LLMのランキング [cs.LG, math.ST, stat.TH]目的:テスト時スケーリング下での推論LLMのランキング方法
    • 大規模言語モデルの推論能力評価は重要であり,より信頼性の高いランキング手法が求められている。
    • テスト時スケーリング下でのモデルランキングは未だ十分に研究が進んでいない。
    • 統計的なランキング手法を用いて,テスト時スケーリング下での信頼性の高いモデルランキングを実現すること。
    • 提案手法Scorioは,ペア比較モデル,項目応答理論,投票ルールなど,様々な統計的ランキング手法を実装している。
    • Scorioを用いたランキングは,ベイジアンゴールドスタンダードとの相関が非常に高く,多くの手法で同じ順位付けを再現した。
    • 貪欲デコーディングを事前情報として用いることで,単一試行時のばらつきを低減できるが,サンプリング方法の違いによるバイアスが生じる可能性がある。

    Link: https://arxiv.org/abs/2603.10960

  • ウェアラブルIMU信号に対する生物学的インスパイア型自己教師あり学習 [cs.LG]目的:手首装着型IMU信号からロバストな人間活動表現の学習
    • ウェアラブルセンサの普及により大規模な健康モニタリングが可能となった。
    • ラベル付きデータの不足が,ロバストな活動表現の学習を阻害している。
    • 人間の運動の生物学的構造に基づいた学習により,HARの性能向上を目指す。
    • 提案手法は,運動の基本単位であるサブムーブメントに着目したトークン化戦略を用いる。
    • トークン化により,Transformerエンコーダによる運動セグメントの時系列依存性のモデリングが可能となった。
    • NHANESコーパスを用いた事前学習の結果,既存のSSLベースラインを上回り,データ効率も向上した。

    Link: https://arxiv.org/abs/2603.10961

  • Pointy - 点群基礎モデルのための軽量Transformer [cs.CV, cs.LG]目的:点群データの基礎モデル構築のための軽量Transformerアーキテクチャ
    • 点群データ処理は,自動運転やロボティクスなど幅広い分野で重要性が増している。
    • 既存の基礎モデルは,大規模なデータセットとクロスモーダルな教師信号に依存している。
    • 本研究は,より小規模なデータセットでも高性能な点群基礎モデルを構築することを目指す。
    • わずか3万9千個の点群データのみで学習した本モデルは,20万個以上の学習サンプルで学習した大規模な基礎モデルを上回る性能を示した。
    • 100万個以上の点群,画像,テキストサンプルで学習した最先端モデルに匹敵する結果が得られ,学習設定とアーキテクチャの重要性が示された。
    • 実験フレームワークを統一することで,アーキテクチャの選択が結果に与える影響を明確にし,シンプルなバックボーンでも競争力のある結果が得られることを示した。

    Link: https://arxiv.org/abs/2603.10963

  • TOSSS:大規模言語モデルのためのCVEベースのソフトウェアセキュリティベンチマーク [cs.LG, cs.CL, cs.CR, cs.SE]目的:大規模言語モデルの,安全なコードと脆弱なコードの選択能力の測定
    • LLMは様々な分野で活用され,ソフトウェア開発を支援するツールとして重要性が増している。
    • LLMを開発ワークフローに組み込むことで,新たな脆弱性が生じる可能性があり,セキュリティが懸念される。
    • 既存のベンチマークの限界を克服し,CVEデータベースに基づいた,より包括的なセキュリティ評価を行う。
    • TOSSSは,LLMに安全なコードと脆弱なコードの選択を促し,その性能を0から1のセキュリティスコアで評価する。
    • C/C++およびJavaコードにおいて14のLLMを評価した結果,スコアは0.48から0.89の範囲であった。
    • TOSSSは,LLMプロバイダが公開するベンチマークスコアにセキュリティの観点を加えるための補完的な指標となりうる。

    Link: https://arxiv.org/abs/2603.10969

  • 汎用的な器用な操作のための接触範囲誘導探索 [cs.ET, cs.AR, cs.DC, cs.SY, eess.SY, cs.RO, cs.AI]目的:汎用的な器用な操作における探索手法の開発
    • ロボットによる複雑な作業自動化に不可欠であり,人間の多様な手の動きを再現する必要がある。
    • 報酬関数の設計が困難で,タスクごとに手作業での調整が必要となることが多い。
    • 多様な接触パターンを効率的に学習し,報酬設計の負担を軽減することを目指す。
    • 接触範囲誘導探索(CCGE)は,物体表面と手のキーポイントの交差を接触状態として表現する。
    • CCGEは,ハッシュコードで得られた物体状態に基づいて接触頻度をカウントし,探索を促進する報酬を生成する。
    • 実験の結果,CCGEは既存の手法と比較して学習効率と成功率を大幅に向上させ,実世界への転移も良好であった。

    Link: https://arxiv.org/abs/2603.10971

  • FRIEND: B5GネットワークにおけるマルチRIS構成と傍受者インテリジェント検出の同時最適化のための連合学習 [cs.ET, cs.CY, cs.LG]目的:RIS強化されたセルフリーmmWaveネットワークにおける悪意のあるユーザー検出
    • B5Gネットワークでは,セルフリーアーキテクチャとRISがIIoT通信の信頼性,容量,スケーラビリティ,セキュリティ向上に不可欠である。
    • 従来のセキュリティメカニズムは,スケーラビリティや遅延の制約から,複雑な分散環境における傍受対策が困難である。
    • 連合学習を用いて,プライバシーを保護しながら,次世代IIoT向けに物理層の傍受検出を可能にすることを目指す。
    • 連合学習とマルチRIS協調の統合により,従来の非RIS方式と比較して,約30%の秘匿率向上を達成した。
    • エッジデバイスがローカルで観測されたCSIを用いてDCNNを共同学習することで,データ交換の必要性をなくし,プライバシーを保護する。
    • モデルに早期終了メカニズムを組み込むことで,計算複雑さの要件も満たしている。

    Link: https://arxiv.org/abs/2603.10977

  • GroundCount:物体検出による視覚言語モデルのグラウンディングと,数え間違いの軽減 [cs.CV, cs.AI]目的:視覚言語モデルにおける数え間違いの軽減
    • 視覚言語モデルは画像とテキストを理解する重要な技術であり,様々な応用が期待されている。
    • 既存の視覚言語モデルは,数え間違いという課題を抱えており,精度が低い。
    • 物体検出モデルの空間情報を活用し,視覚言語モデルの数え間違いを軽減することを目指す。
    • GroundCountは,物体検出モデルからの明示的な空間的グラウンディングを視覚言語モデルに追加することで,数え間違いを軽減する。
    • Ovis2.5-2Bモデルにおいて,最高81.3%の数え精度を達成し,6.6ppの改善が見られた。推論時間も22%短縮された。
    • 位置エンコーディングが重要な要素であり,モデルの性能に応じて効果が異なること,信頼度スコアはノイズとなる場合があることが示された。

    Link: https://arxiv.org/abs/2603.10978

  • LEO 6G非地球ネットワークにおける連合学習駆動型ビーム管理 [cs.RO, cs.RO, cs.DB, cs.LG, physics.space-ph]目的:LEO衛星コンステレーションにおける連合学習によるビーム選択
    • 将来の6Gにおいて,非地球ネットワークは重要な通信手段となることが期待されている。
    • LEO衛星ネットワークでは,伝搬状況が動的に変化するため,効率的なビーム管理が課題である。
    • 本研究は,動的な伝搬状況下で効率的なビーム管理を実現するための手法を提案する。
    • グラフニューラルネットワーク(GNN)は,多層パーセプトロン(MLP)と比較して,ビーム予測の精度と安定性が向上した。
    • 特に仰角が低い場合において,GNNの優位性が顕著に示された。
    • これにより,将来の非地球ネットワークにおける軽量かつインテリジェントなビーム管理が可能となる。

    Link: https://arxiv.org/abs/2603.10983

  • MLPの離散的な魅力:Transformerフィードフォワード層における連続信号の二値ルーティング [cs.HC, cs.LG]目的:Transformer言語モデルにおけるMLP層の信号ルーティングのメカニズム解明
    • Transformerは自然言語処理の基盤であり,その性能向上は重要な課題である。
    • Transformerの内部動作は複雑で,MLP層の役割は十分に理解されていない。
    • 本研究は,MLP層における信号処理を二値ルーティングの視点から捉え,その機能を明らかにすることを目指す。
    • MLP層が連続信号を二値ルーティングしていることが示された。ニューロンの活性化が二値化され,非線形処理の必要性を判断している。
    • GPT-2 Smallにおいて,特定のニューロンがコンセンサスアーキテクチャを形成し,例外処理を行うことが確認された。層が進むにつれてコンセンサス構造が発達する。
    • MLP層の除去実験から,コンセンサスが確立されている層ではperplexityへの影響が小さいことが確認された。これは,ルーティングが機能している証拠となる。

    Link: https://arxiv.org/abs/2603.10985

  • 力学系における不確実性評価のためのMCMC情報ニューラルエミュレータ [cs.LG]目的:力学系の不確実性評価手法
    • 物理モデルの代替手段として重要であり,計算コスト削減に貢献する。
    • モデルパラメータの事前分布が不明確な場合,効率的な不確実性評価が困難。
    • MCMCを用いてパラメータ分布を入力とし,計算時間短縮と高精度化を目指す。
    • ニューラルネットワークを物理モデルの代替とし,MCMCによってパラメータ分布を組み込むことで,不確実性評価を効率化。
    • 提案手法は,予測のための分位点エミュレータと,ODEモデルパラメータに対応する軌道パスを推定する自己符号化器ベースのODEネットワークエミュレータで有効性が示された。
    • 性能低下を分布の不一致から定量的に予測できる数学的解析も提示。

    Link: https://arxiv.org/abs/2603.10987

  • ソフトウェア工学における革新の触媒としての人工知能 [cs.SE, cs.AI]目的:ソフトウェア工学における人工知能の革新促進効果
    • 現代のソフトウェア開発は複雑化の一途を辿り,迅速な対応が不可欠である。
    • アジャイル開発は普及しているが,要件変更への対応と品質維持が課題である。
    • 本研究は,AIによるアジャイル開発の最適化と新たな能力の創出を目指す。
    • AI(特に機械学習と自然言語処理)の統合は,要件管理からコード生成,テストに至るまでの反復作業の自動化を促進する。
    • AIは,既存のアジャイルプラクティスを最適化するだけでなく,将来のソフトウェア開発において品質,速度,革新を維持するために不可欠な新たな能力をもたらす。
    • 調査の結果,ソフトウェアエンジニアリングの専門家は,AI駆動型ツールに対する認識,導入,影響について肯定的な評価を示している。

    Link: https://arxiv.org/abs/2603.10994