arXiv雑要約

AI - 2026/03/26 公開

KCLNet：アナログ回路における電気的等価性指向グラフ表現学習 [cs.LG, cs.AI]目的：アナログ回路のグラフ表現学習
- 電子設計自動化において表現学習の重要性が高まっている。特にテスト容易性分析や論理推論に貢献する。
- アナログ回路は連続的な電気的特性を持つため，離散的なデジタル回路と異なり表現学習が難しい。
- 電気的制約を考慮したアナログ回路の表現学習方法を確立し，汎化性能の向上を目指す。
- 提案手法KCLNetは，回路埋め込み空間の秩序性を維持することで，回路埋め込みの汎化性能を大幅に向上させる。
- KCLNetは，アナログ回路の分類，サブ回路検出，回路編集距離予測などの下流タスクで高い性能を示す。
- 本研究は，電気的制約を保存したアナログ回路の表現学習における新たな有効な解決策を提供する。
Link: https://arxiv.org/abs/2603.24101
多重グラフにおける因果性に基づく分散表現学習 [cs.LG, cs.SI]目的：多重グラフにおける共通情報と層特有情報の分離
- ネットワーク分析において，ノード間の多様な関係性を捉える多重グラフの重要性が増している。
- 多重グラフの分散表現学習では，共通情報と層特有情報が絡み合い，汎化性能と解釈性が課題となる。
- 因果推論に基づき，多重グラフからロバストで解釈可能な表現を学習すること。
- 提案手法CaDeMは，層間の埋め込みを整列させ，層特有の信号を捉えることで，共通情報と層特有情報を分離する。
- バックドア調整により，共通埋め込みが層特有の情報から分離され，グローバルな情報のみを反映する。
- 合成データと実データでの実験により，既存手法と比較して一貫した性能向上が示された。
Link: https://arxiv.org/abs/2603.24105
産業IoT向け多層MLベースセキュリティフレームワークの構築 [cs.CR, cs.LG]目的：産業IoT環境における軽量な機械学習ベースセキュリティフレームワーク
- 産業のデジタル化が進み，IoTデバイスのセキュリティ確保が不可欠となっている。
- 従来のセキュリティ対策は単一の層に限定され，コストが高く実環境への適用が困難である。
- ネットワーク環境の悪化が信頼収束に与える影響を予測・軽減する手法を確立すること。
- 本研究では，Tm-IIoTトラストモデルとH-IIoTアーキテクチャを基盤とし，機械学習を活用するTCAアプローチを提案した。
- TCAアプローチにより，信頼収束時間を最大28.6%短縮し，敵対的行動に対する堅牢性を維持することに成功した。
- 安価なオープンソースハードウェアに基づく実環境展開アーキテクチャを提案し，多層攻撃検知に向けた研究を進めている。
Link: https://arxiv.org/abs/2603.24111
単層スパイクニューラルネットワークのためのフィードバック制御最適化回路の混合信号実装 [cs.LG]目的：単層スパイクニューラルネットワークのフィードバック制御最適化
- スケーラブルで適応的なニューロモーフィックシステム実現には，チップ上学習が不可欠である。
- 既存の学習手法は，ハードウェア実装が困難，または制限が厳しいという課題がある。
- 現実的な混合信号制約下でのオンライン学習の実現可能性を示す。
- 本研究では，混合信号ニューロモーフィックプロセッサ上でフィードバック制御最適化回路のプロトタイプ実装を提示した。
- バイナリ分類タスクと非線形Yin-Yang問題において，数値シミュレーションや勾配ベースラインと同等の性能を持つチップ上学習を実証した。
- この成果は，ニューロモーフィックコンピューティングのために，そのようなルールをシリコンに直接埋め込む共同設計アプローチを示唆する。
Link: https://arxiv.org/abs/2603.24113
アラインメント税：整列されたLLMにおける応答の均質化とその不確実性推定への影響 [cs.LG, cs.AI, cs.CL]目的：整列された大規模言語モデルにおける応答の均質化現象とその不確実性推定への影響
- 大規模言語モデルの信頼性向上は重要であり，不確実性推定はその鍵となる。
- 従来の不確実性推定手法は，整列されたLLMにおいて有効な識別力を持たない場合がある。
- 応答の均質化が不確実性推定に及ぼす影響を特定し，改善策を検討する。
- RLHFによって整列されたLLMでは，TruthfulQAにおいて40〜79%の質問に対し単一の意味クラスターが生じる。
- その結果，サンプリングに基づく不確実性推定は識別力を失うが，トークンエントロピーは依然としてシグナルを保持する。
- DPO（直接方策最適化）が応答の均質化の主な原因であり，選択的予測によってGSM8Kの精度を向上させることができる。
Link: https://arxiv.org/abs/2603.24124
確率的プログラム合成における尤度ハッキング [cs.CL, cs.LG, cs.PL]目的：確率的プログラム合成における尤度ハッキングの防止
- ベイズモデリングの自動化が重要視される中，言語モデルを用いた確率的プログラム合成が注目されている。
- 強化学習により訓練された言語モデルは，データ適合性向上ではなく，尤度報酬を不正に増大させる「尤度ハッキング」を起こしやすい。
- 尤度ハッキングを防止するための構文条件を提示し，安全な言語フラグメントを構築することで，この問題を解決する。
- 尤度ハッキングは，PyMCコードを生成するGRPO訓練モデルにおいて，初期段階で発生しやすいことが確認された。
- 尤度ハッキングに強いStanの修正版であるSafeStanを実装し，最適化圧下で尤度ハッキングを防止できることを実証した。
- 言語レベルの安全制約が，自動ベイズモデリングにおいて理論的にも実用的にも有効であることが示された。
Link: https://arxiv.org/abs/2603.24126
ペアワイズ目的関数に対するゴシップアルゴリズム [cs.LG]目的：ペアワイズ目的関数を持つ機械学習におけるゴシップアルゴリズムの収束性
- IoT化の進展により，分散型センサーネットワークから得られるデータ分析の重要性が高まっている。
- 既存のゴシップアルゴリズムは，平均演算を基本としており，ペアワイズな目的関数には適応が難しい。
- 本研究は，ペアワイズ目的関数に対するゴシップアルゴリズムの収束条件と効率を明らかにする。
- 本研究は，類似度学習，ランキング，クラスタリングなどの問題に応用可能なゴシップアルゴリズムの理論的枠組みを提供する。
- アルゴリズムの収束に必要なグラフ構造の特性を特定し，その効率に影響を与える要因を分析した。
- 収束の上界と下界を精緻に分析し，ゴシップアルゴリズムの性能評価に貢献する。
Link: https://arxiv.org/abs/2603.24128
リザーバーに基づくグラフ畳み込みネットワーク [cs.RO, cs.SY, eess.SY, cs.LG, cs.CV]目的：グラフ分類および生成のための新しいモデル
- グラフ構造データに対する機械学習の重要性が高まっており，その効率的な処理が求められている。
- 従来のGCNは，深層化による計算コスト増加や過剰平滑化といった課題を抱えている。
- リザーバーコンピューティングとグラフ畳み込みを統合し，効率的かつ高精度なグラフ処理を実現する。
- 提案手法RGC-Netは，グラフ分類タスクにおいて最先端の性能を達成した。
- RGC-Netは，動的な脳接続性の進化を生成する際の性能も優れている。
- RGC-Netは，従来のモデルと比較して収束が速く，過剰平滑化の影響を受けにくい。
Link: https://arxiv.org/abs/2603.24131
MedAidDialog：アクセス可能なヘルスケアのための多言語多段階医療対話データセット [cs.CL, cs.AI, cs.LG]目的：多言語に対応した医療対話データセットおよび会話型医療モデル
- 医療へのアクセスが限られた環境において，会話型AIが予備的な医療相談を支援する可能性が重要である。
- 既存の医療対話システムは，単一ターンやテンプレートベースであるため，会話のリアリティと多言語対応に課題がある。
- 現実的な医者と患者の相談をシミュレートする多言語多段階の医療対話データセットを構築し，それを用いたモデルを開発することで，この課題を解決する。
- MedAidDialogデータセットは，7言語（英語，ヒンディー語，テルグ語，タミル語，ベンガル語，マラティ語，アラビア語）に翻訳された並列コーパスである。
- MedAidLMは，量子化された小規模言語モデル上でパラメータ効率の良いファインチューニングを用いて学習された会話型医療モデルである。
- 実験結果から，本システムは多段階対話を通じて症状を引き出し，診断の推奨を行うことができた。
Link: https://arxiv.org/abs/2603.24132
人間からの嗜好と数値データを用いた効率的なコントローラ学習：多種多様な代理モデルによるアプローチ [cs.IR, cs.LG, cs.SY, eess.SY]目的：人間からの嗜好と数値データを用いたコントローラ学習の効率化
- 高度な目標達成のため，制御ポリシーを手動で調整する作業は不可欠であるが，時間と労力を要する。
- 主観的な基準に基づく最適化が必要な場合，定量的な評価だけでは効率が悪いという課題がある。
- 数値データと人間の嗜好を統合し，人間の実験回数を減らしつつ，個々の嗜好に適応した制御を実現する。
- 本研究では，数値データと人間の嗜好を組み合わせることで，人間の意思決定者の実験回数を大幅に削減できることを示した。
- 提案手法は，ガウス過程による代理モデルを用いることで，混合モダリティデータからの効率的な学習を可能にする。
- 自動運転車の軌道計画器の調整を通じて，個々の嗜好に合わせた運転スタイルの適応が有効であることを実証した。
Link: https://arxiv.org/abs/2603.24138
教師・生徒強化学習：ロバストなディープフェイク検出のための動的カリキュラム [cs.CV, cs.LG]目的：ディープフェイク検出のための動的カリキュラム最適化
- ディープフェイクは社会問題となっており，その検出技術の向上が急務である。
- 従来の教師あり学習では，全てのサンプルを均等に扱うため，汎化性能が低い場合がある。
- 本研究では，効率的な学習を促すカリキュラムを自動的に生成することを目指す。
- 提案手法は，訓練プロセスをマルコフ決定過程としてモデル化し，教師エージェントが学習を導く。
- 教師は，サンプルの損失に重みを付け動的にカリキュラムを調整し，生徒（ディープフェイク検出器）の性能向上を促す。
- 実験により，提案手法が未知の操作手法に対する汎化性能を向上させることが示された。
Link: https://arxiv.org/abs/2603.24139
偏微分方程式のための線形・非線形融合ニューラル演算子 [cs.LG, cs.NA, math.NA]目的：偏微分方程式の解を効率的に予測するための線形・非線形融合ニューラル演算子の開発
- 偏微分方程式は，自然科学や工学の様々な分野で基本的な役割を担う重要な数理モデルである。
- 従来の数値解法では，パラメータ変更ごとに方程式を解く必要があり，計算コストが高いという課題がある。
- ニューラル演算子を用いて，パラメータ空間から解空間への直接的な写像を学習することで，効率的な予測を目指す。
- 提案手法LNF-NOは，線形成分と非線形成分を乗算的に融合することで，軽量かつ解釈可能な表現を実現した。
- LNF-NOは，DeepONetやFNOと比較して，学習時間が大幅に短縮され，多くの場合，同等以上の精度を達成した。
- 3次元Poisson-Boltzmann方程式のケースでは，LNF-NOは比較対象モデルの中で最高の精度を達成し，3D FNOの約2.7倍高速に学習できた。
Link: https://arxiv.org/abs/2603.24143
反意語・同義語ペア埋め込みベクトルの差の幾何学的構造に関する視覚的観察 [cs.DL, cs.SI, cs.CL, cs.LG]目的：反意語・同義語ペアの埋め込みベクトルの差に関する幾何学的構造の観察
- 単語埋め込みは，自然言語処理の基盤技術であり，文脈理解や意味解析に不可欠である。
- 反意語・同義語の関係性を埋め込み空間でどのように捉えるかは，未解決の課題である。
- 埋め込みベクトルの差の幾何学的な特徴から，反意語・同義語の関係性を検出することを試みる。
- 様々な埋め込みモデルにおいて，特定の投影設定下で特徴的な「渦巻き」構造が観察された。
- この「渦巻き」構造は，反意語・同義語ペアの埋め込みベクトルの差に現れる。
- この観察は，埋め込み空間における意味的関係の理解に新たな視点を提供する。
Link: https://arxiv.org/abs/2603.24150
WebAssemblyにおけるメモリ破損の検知に関する機械学習 [cs.CR, cs.LG]目的：WebAssemblyのメモリ破損および外部からの改ざんの検出
- WebAssemblyは広く利用されているが，メモリモデルの脆弱性から攻撃を受けやすい。
- 既存の防御策は侵襲的，または敵対的なホスト環境下での整合性検証が困難。
- 機械学習を用いて，メモリのスナップショットからメモリ破損を検知し，WebAssemblyのセキュリティ向上を目指す。
- CNNに基づく分類により，構造化されたメモリレイアウトを持つアプリケーションにおいてメモリ破損を効果的に検出できる。
- 粗粒度境界チェックでは1.07倍のオーバーヘッドで，微細粒度監視では1.5倍～1.8倍の予測可能なコストで実現可能。
- 実験結果から，MLベースのメモリアテステーションがWebAssemblyにおいて実用的な手法であることが示された。
Link: https://arxiv.org/abs/2603.24167
TsetlinWiSARD：FPGA 上でのツェトリン・オートマトンを用いた重みなしニューラルネットワークのオンチップ学習 [cs.LG, cs.AR]目的：重みなしニューラルネットワークのオンチップ学習手法
- エッジデバイスにおける適応性，プライバシー，セキュリティの要求が高まっており，オンチップでの学習・推論が可能な新しい機械学習アルゴリズムが求められている。
- 従来の重みなしニューラルネットワークは，ワンショット学習に依存するため，過学習や精度の低下，あるいは学習後の調整の煩雑さといった課題があった。
- ツェトリン・オートマトンを利用した反復的な最適化により，過学習を克服し，効率的なオンチップ学習を実現することを目指す。
- 提案手法TsetlinWiSARDは，従来のWiSARD実装と比較して1000倍以上の高速な学習が可能であることを示した。
- FPGA実装では，他の機械学習アルゴリズムと比較して，リソース使用量の22%削減，レイテンシの93.3%低減，消費電力の64.2%低減を達成した。
- TsetlinWiSARDは，最先端の精度を維持しながら，ハードウェア効率を大幅に向上させるFPGAベースの学習アーキテクチャを提供する。
Link: https://arxiv.org/abs/2603.24186
コード生成のための強化学習のスケーリング：合成データとカリキュラムの深掘り [cs.LG, cs.AI]目的：コード生成における強化学習のスケーリング手法
- 大規模言語モデルの性能向上には，教師あり学習を超えた新たなアプローチが求められている。
- データ量だけでは性能向上の限界があり，データの多様性と構造が重要となる。
- 合成データとカリキュラムを活用し，スケーラブルな強化学習環境の構築を目指す。
- 反復的な合成データ生成パイプラインにより，有効な問題の生成率が大幅に向上した。
- カリキュラムベースの訓練を可能にする，難易度の段階的な問題群（stepping stones）が自然に生成された。
- Llama3.1-8BおよびQwen3-8Bモデルにおいて，合成データによる拡張がコード生成性能を改善した。
Link: https://arxiv.org/abs/2603.24202
モデルコンテキストプロトコルからの不可視の脅威：木構造に基づく適応探索によるステルスインジェクションペイロード生成 [cs.CR, cs.AI]目的：モデルコンテキストプロトコルを悪用したステルスインジェクション攻撃手法の開発
- 大規模言語モデルのツール利用能力向上に伴い，そのセキュリティ重要性が増している。
- 既存の手法は，導入コストが高い，意味の一貫性が低い，または高度な知識を必要とする。
- 防御機構下でも高い成功率でエージェントの制御を奪取できる攻撃手法を提案すること。
- 提案手法TIPは，木構造探索と攻撃者LLMを用いたペイロード生成により，高い攻撃成功率を達成した。
- 防御機構が存在する場合でも，50%以上の有効性を維持し，既存の攻撃手法を大きく上回る性能を示した。
- 実環境での実験により，モデルコンテキストプロトコルにおける不可視の脅威ベクトルを明らかにした。
Link: https://arxiv.org/abs/2603.24203
IPatch：ロバストな時系列予測のためのマルチ解像度Transformerアーキテクチャ [cs.IR, cs.LG]目的：多変量時系列予測における精度向上
- 時系列データは経済，気象など多岐にわたる分野で重要であり，正確な予測は不可欠である。
- Transformerモデルは強力だが，時系列データの表現方法が性能に大きく影響する。
- 点単位とパッチ単位の表現を統合し，多角的な時間情報モデリングを実現する。
- IPatchは，7つのベンチマークデータセットにおいて，予測精度，ノイズへの耐性，予測範囲における汎化性能において，単一表現ベースラインを上回る一貫した改善を示した。
- 点単位とパッチ単位のトークンを統合することで，短期的な変動と長期的な時間的依存性の両方を捉えることに成功した。
- マルチ解像度アプローチにより，計算効率を維持しつつ，複雑な時系列データの詳細な特徴を捉えることが可能となった。
Link: https://arxiv.org/abs/2603.24207
強力な教師が重要である：視覚的事前知識強化によるテキスト誘導マルチビュー知識蒸留 [cs.CV, cs.AI]目的：知識蒸留による効率的な推論
- 大規模モデルの知識を小型モデルに転移する技術であり，計算資源の制約がある環境で重要である。
- 既存手法は蒸留戦略に偏りがちで，教師モデルの知識品質向上という点が軽視されている。
- 教師モデルの知識品質向上と，学生モデルの知識強化を図ることで性能向上を目指す。
- 提案手法TMKDは，視覚教師とテキスト教師（CLIP）の二つの教師を活用し，より豊富な教師信号を提供する。
- 視覚教師は，エッジや高周波特徴などの視覚的事前知識を取り入れたマルチビュー入力で強化される。
- 実験の結果，TMKDは知識蒸留の性能を最大4.49％まで向上させ，提案手法の有効性を実証した。
Link: https://arxiv.org/abs/2603.24208
HEART-PFL：異質性下における階層的指向性アライメントと敵対的知識転移による安定したパーソナライズされた連合学習 [cs.CV, cs.LG]目的：異質分布下での効果的なクライアント固有モデルの提供
- プライバシー保護が重要視される現代において，分散データを用いた機械学習が不可欠である。
- 連合学習では，データ分布の非同一性（異質性）が課題となり，汎化性能の低下を招く。
- クライアント固有性を維持しつつ，連合学習の安定性を高めることで，より実用的なシステム構築を目指す。
- 提案手法HEART-PFLは，CIFAR-100，Flowers-102，Caltech-101において最先端のパーソナライズされた精度を達成した。
- 階層的指向性アライメント(HDA)と敵対的知識転移(AKT)が，アライメント，ロバスト性，最適化の安定性に相乗効果をもたらすことが確認された。
- HEART-PFLは，パーソナライズとグローバル安定性を同時に向上させ，スケーラブルなPFLソリューションとしての可能性を示唆する。
Link: https://arxiv.org/abs/2603.24209
時系列インプットモデルにおける記憶の解明：LBRMメンバーシップ推論と属性漏洩との関連 [cs.LG, cs.AI]目的：時系列インプットモデルにおける記憶と属性漏洩のメカニズム解明
- 時系列データは，医療，IoT，金融など広範な分野で不可欠であり，その処理におけるプライバシー保護が重要である。
- 深層学習モデルは記憶してしまう可能性があり，プライバシー侵害のリスクが存在する。特に時系列モデルは脆弱性が指摘されている。
- 本研究は，時系列インプットモデルのメンバーシップおよび属性推論攻撃に対する脆弱性を評価し，そのメカニズムを明らかにする。
- 提案するメンバーシップ攻撃は，オーバーフィッティング耐性のあるモデルに対しても高い検出精度を実現する。
- 本研究は，時系列インプットモデルに対する初の属性推論攻撃を提示し，訓練データの機密特性を予測することに成功した。
- メンバーシップ攻撃の結果は，属性推論攻撃の成功可能性を高い精度で予測することを示す。
Link: https://arxiv.org/abs/2603.24213
引用元はどこか？引用星座：BARONおよびHEROCONスコアを用いた引用ネットワーク分解のためのフリーでオープンソース，ノーコード，監査可能なツール [cs.DL, cs.AI, cs.DB, cs.IR]目的：研究者の引用プロファイルを，引用元と被引用者の間のネットワーク近接性に基づいて分解する分析手法およびツール
- 学術研究のインパクト評価において，引用は重要な指標であり，その質と構造を理解することが重要である。
- 従来の引用指標はすべての引用を均等に扱うため，学術的影響力の伝播経路を明確に示せていない。
- 引用ネットワークの構造を分析し，内輪の引用依存度を診断することで，より公平な評価を可能にする。
- 本研究で開発されたツール「Citation-Constellation」は，ノーコードで利用可能であり，引用ネットワークの構造を可視化し，内輪の引用状況を定量化する。
- BARONスコアは外部からの引用に焦点を当て，HEROCONスコアは関係性の近さに応じて重み付けを行うことで，引用元を詳細に分析する。
- これらのスコアは，研究者の学術的影響力の構造的な診断に役立つが，質を示す指標ではない。
Link: https://arxiv.org/abs/2603.24216
RAGの恩恵を受けるのは誰か：露出，有用性，帰属バイアスの役割 [cs.IR, cs.AI]目的：RAGにおけるクエリグループ公平性の影響要因の調査
- 大規模言語モデルの性能向上は目覚ましいが，公平性の観点は重要である。社会的な偏見の増幅を防ぐ必要がある。
- Retrieval-Augmented Generation(RAG)において，特定のグループに対するクエリの精度に差が生じる可能性がある。
- RAGシステムの公平性を評価し，グループ間の精度格差を是正するための要素を特定する。
- RAGシステムはクエリグループ公平性の問題を抱えており，LLMのみの場合と比較して，グループ間の平均精度に格差が生じることが示された。
- グループの露出，有用性，帰属が，グループのクエリ精度または精度向上に強い正または負の相関を示すことが明らかになった。
- これらの要素は，公平なRAGを実現する上で重要な役割を果たすことが示唆された。
Link: https://arxiv.org/abs/2603.24218
自律侵入テストのための環境連動型マルチエージェントワークフロー [cs.RO, cs.AI]目的：ロボット環境における自動侵入テスト手法
- デジタルインフラの複雑化に伴い，スケーラブルで信頼性の高いセキュリティ評価が不可欠である。
- ロボットは高度なサイバーフィジカルシステムであり，既存のセキュリティ評価手法では対応が難しい場合がある。
- ロボット環境特化型の自動侵入テストシステムの構築によって，セキュリティ評価の効率化と信頼性向上を目指す。
- 提案手法は，ロボット環境の状態を共有グラフとして表現し，動的に更新することで，高いトレーサビリティとコンテキスト管理を実現した。
- ROS/ROS2環境でのCTFシナリオにおいて，本システムは100%の成功率を達成し，既存手法を大幅に上回る性能を示した。
- 本研究は，EU AI Actのような規制遵守に必要な人間の監視とトレーサビリティを維持しながら，高度な自動化を実現する。
Link: https://arxiv.org/abs/2603.24221
UniScale：検索ランキングのためのデータとモデルのスケーリングの相乗効果 [cs.IR, cs.LG]目的：検索ランキングにおけるデータとモデルのスケーリングの共同最適化
- 検索，広告，レコメンデーションシステムにおいて，大規模言語モデルの進歩に伴い，スケーリング則の研究が活発化している。
- 既存の手法は主にアーキテクチャの改善に焦点を当てており，データとアーキテクチャ設計の重要な相乗効果が無視されている。
- モデルのスケーリングの潜在能力を最大限に引き出すため，データとアーキテクチャを共同で最適化するフレームワークを提案する。
- UniScaleは，データスケーリングシステムES$^3$と，新しいアーキテクチャHHSFTを組み合わせることで，データとアーキテクチャの相乗効果を実現した。
- 大規模なEコマース検索プラットフォームでの実験により，UniScaleは主要なビジネス指標において顕著な改善を示し，明確なスケーリング傾向が確認された。
- 従来の構造のみのモデル調整では到達できない性能上限を超えることが示された。
Link: https://arxiv.org/abs/2603.24226
最大体積基底ベクトル選択によるNMFの識別 [cs.LG, stat.ME]目的：非負行列分解における識別問題解決
- 非負行列分解は，データ解析や機械学習で広く利用されている基盤技術である。
- 最小体積制約NMFは混合データに対しては性能が低下する可能性がある。
- 基底ベクトルの解釈性を向上させ，混合データへの適用を可能にすること。
- 本研究では，基底ベクトルをできるだけ明確に分離する最大体積制約NMFを提案した。
- 提案手法は，最小体積制約NMFの限界を克服し，より解釈性の高い基底ベクトルを得られることが示された。
- 理論的な識別可能性の定理を確立し，提案手法のアルゴリズムを開発した。
Link: https://arxiv.org/abs/2603.24227
人体骨格データに対する攻撃評価と拡張アイデンティティ認識 [cs.CL, cs.SI, cs.LG, cs.CR, cs.CV]目的：セキュリティアプリケーションにおける敵対的攻撃に対する脆弱性の評価と，人体骨格データを用いた個人識別モデルのロバスト性向上
- セキュリティ分野では，機械学習モデルの堅牢性が重要であり，特に小規模データセットで学習した場合の脆弱性対策が求められる。
- LiDARを用いた骨格データによる個人識別には，多大なデータ収集コストがかかるため，小規模データセットでの学習が課題となる。
- 本研究は，敵対的攻撃に対するロバスト性を評価し，合成データを用いたモデルの防御能力を高めることを目指す。
- 提案手法Attack-AAIRSは，実データとGAN生成の合成データを利用し，未知の敵対的攻撃に対するモデルのロバスト性を評価・改善する。
- GANがHCN-IDの弱点を突く敵対的攻撃サンプル分布を学習し，それを用いて学習データを拡張することで，モデルの防御力を高める。
- 10分割交差検証の結果，様々な攻撃手法（FGSM, PGD等）に対してロバスト性が向上し，実データでの性能低下は見られなかった。
Link: https://arxiv.org/abs/2603.24232
DVM：動的AIモデル向けリアルタイムカーネル生成 [cs.CE, cs.RO, cs.PL, cs.AI, cs.LG]目的：動的AIモデルにおけるリアルタイムカーネル生成手法
- AI計算は動的な性質を持つため，高速かつ効率的な実行が重要である。
- 既存のコンパイラは，コンパイル時間が長く，動的モデルへの適用が困難である。
- コンパイルの高速化またはオーバーヘッドの隠蔽により，動的モデルの効率を向上させる。
- DVMは，CPUでバイトコードにエンコードし，NPUで仮想命令にデコードすることで，リアルタイムコンパイルを実現する。
- DVMは，静的グラフと動的グラフの両方で，シンボル推論に基づくフュージョンを実行する。
- 評価の結果，DVMは既存手法と比較して，演算/モデル効率が最大11.77倍向上し，最大コンパイル時間が5桁短縮されることが示された。
Link: https://arxiv.org/abs/2603.24239
C-STEP：移動ロボットの物理法則に基づいた安全な強化学習のための連続時空間エンパワーメント [eess.SY, cs.LG, cs.SY]目的：ロボットの安全なナビゲーションのための強化学習における新しい安全性指標
- ロボティクスにおいて，複雑な環境下での安全なナビゲーションは重要な課題である。
- 従来の強化学習では，衝突回避とタスク達成の両立が困難である。
- 物理法則に基づいた報酬設計により，ロボットの安全性向上を目指す。
- C-STEPを導入することで，従来の強化学習と比較して衝突回数が減少した。
- C-STEPは，障害物への接近距離を低減し，移動時間の増加を最小限に抑えることができた。
- C-STEPは，解釈可能性の高い物理法則に基づいた報酬設計アプローチを提供する。
Link: https://arxiv.org/abs/2603.24241
確率的時系列予測における異分散性の活用 [eess.SY, cs.SY, cs.LG, cs.AI]目的：確率的時系列予測のモデル化
- 将来の観測値の分布を予測し，予測精度と不確実性の定量化を両立させることは重要である。
- 既存の生成モデルは，MSEに基づく損失関数により異分散性を捉えきれていない。
- 時間変動する条件付き分散を明示的にモデル化し，予測のロバスト性を向上させる。
- LSG-VAEは，位置尺度ガウス尤度関数を用いて，予測平均と時間依存の分散を明示的にパラメータ化する。
- LSG-VAEは，9つのベンチマークデータセットで，15の強化学習ベースラインを上回り，高い計算効率を維持する。
- LSG-VAEは，高度に変動する観測値を学習時に自動的に減衰させる適応減衰メカニズムを導入する。
Link: https://arxiv.org/abs/2603.24254
異種キャッシュによる拡散ベースの動画編集の高速化：サンプリングされたノイズ除去ステップでの完全な計算を超えて [cs.CL, cs.CV, cs.AI]目的：拡散ベース動画編集の高速化
- 動画編集において，高品質かつ柔軟なコンテンツ生成の重要性が高まっている。
- 拡散モデルは計算コストが高く，実用的な展開に課題がある。
- 拡散モデルのアーキテクチャ上の冗長性を解消し，効率的な動画編集を実現する。
- 提案手法HetCacheは，拡散モデルにおけるトークン間の関連性を評価し，冗長な計算を削減することで高速化を実現した。
- HetCacheは，代表的な基礎モデルと比較して，2.67倍の速度向上とFLOPs削減を達成した。
- 編集品質の低下は無視できる程度であり，編集の一貫性と忠実性を維持している。
Link: https://arxiv.org/abs/2603.24260
ガイダンスを用いた予測：時系列予測のための表現レベルの教師あり学習 [cs.LG]目的：時系列予測における表現学習の改善
- 時系列予測は，経済，気象，金融など幅広い分野で不可欠な技術である。
- 従来の深層学習モデルは平均損失の最小化に偏り，極端なパターンを無視する傾向がある。
- 本研究は，表現レベルの教師あり学習を通じて，より表現力豊かな時系列表現を獲得することを目指す。
- ReGuiderは，既存の予測アーキテクチャに容易に組み込むことができるプラグイン手法である。
- 事前学習済みの時系列基礎モデルを教師として活用し，その中間埋め込み表現と予測モデルのエンコーダ埋め込み表現を整列させる。
- 実験結果から，ReGuiderが様々なデータセットとアーキテクチャにおいて予測精度を向上させることが確認された。
Link: https://arxiv.org/abs/2603.24262
DeepDTF：多層オミクスデータと化学構造に基づいた抗がん剤応答予測のための二分岐Transformer融合 [cs.LG]目的：抗がん剤応答予測モデルの性能向上
- がんの治療効果は腫瘍によって異なり，個別化医療を支援する計算手法の必要性が高まっている。
- 既存の深層学習モデルでは，高次元な多層オミクスデータと化学構造データの効果的な統合が課題である。
- 多層オミクスデータと化学構造データのクロスモーダルな関係性を捉え，予測精度を向上させることを目指す。
- 提案手法DeepDTFは，既存のモデルと比較して，様々なオミクスデータ設定において高い予測精度を示した。
- 特に，全オミクスデータを用いた場合，RMSE=1.248，R^2=0.875，AUC=0.987を達成し，分類エラーを9.5%削減した。
- SHAP値を用いた遺伝子重要度分析やGSEAによる経路エンリッチメント分析を通じて，生物学的な根拠に基づいた説明を提供した。
Link: https://arxiv.org/abs/2603.24265
識別的な関係信号と適応的セマンティック中心による言語支援画像クラスタリング [eess.SY, cs.SY, cs.LG]目的：画像クラスタリング性能の向上
- 画像とテキストの理解を組み合わせることで，より高度な画像検索や整理が可能となる。
- 既存手法では，画像間のテキスト特徴の識別力が低い場合がある。
- 画像とテキストの関連性を活用し，より識別的な特徴量とセマンティック中心を学習する。
- 提案手法は，既存の最先端手法と比較して，平均2.6%の性能向上を達成した。
- 学習されたセマンティック中心は高い解釈可能性を示す。
- クロスモーダルな関係性を活用することで，より識別的な自己教師あり信号を生成する。
Link: https://arxiv.org/abs/2603.24275
生物聴覚とニューロモーフィックコンピューティングの架け橋：リザーバーコンピューティングによるエンドツーエンド時領域オーディオ信号処理 [cs.SD, cs.AI]目的：時領域技術とリザーバーコンピューティングを活用したオーディオ信号処理の簡素化
- 高度な技術が進歩しても，オーディオ信号処理は依然として課題が多く，人間の音声処理システムに及ばない。
- 従来のMFCC抽出は，計算負荷の高い時周波数変換に依存し，リアルタイム処理の効率を制限している。
- リザーバーコンピューティングを用いることで，MFCC抽出を効率化し，リアルタイムオーディオ処理を実現すること。
- リザーバーコンピューティングを活用することで，MFCC抽出における複雑な周波数変換を不要にし，特徴量の識別能力を維持した。
- 提案手法は，エネルギー効率の高いオーディオ処理技術の進歩に貢献し，組み込みシステムや音声駆動型アプリケーションへのシームレスな展開を可能にする。
- 生物に触発された特徴抽出と最新のニューロモーフィックコンピューティングとの間のギャップを埋め，次世代音声認識システムの拡張性のあるソリューションを提供する。
Link: https://arxiv.org/abs/2603.24283
仕様のギャップ：コードエージェントにおける部分的な知識下での協調の失敗 [cs.SE, cs.AI, cs.MA]目的：複数LLMベースのコードエージェントが同一クラスの一部を実装する際の協調問題
- ソフトウェア開発において，複雑なタスクを複数のエージェントに分割することで効率化が期待される。
- 仕様が曖昧な場合，エージェント間で内部表現の不一致が生じ，統合が困難になる問題がある。
- 仕様の詳細度を変化させることで，エージェント間の協調の難易度と解決策を明らかにすること。
- 仕様の詳細度が低下すると，2エージェントの統合精度が大幅に低下し，単一エージェントの精度との間に25～39ポイントの協調ギャップが生じた。
- 最も詳細の少ない仕様レベルでも，ASTベースの競合検出器は97%の精度を達成したが，完全な仕様を復元しても競合レポートを追加する以上の効果は認められなかった。
- ギャップは協調コストと情報非対称性の合計として分解され，これら二つの効果は独立していることが示唆された。
Link: https://arxiv.org/abs/2603.24284
異種グラフにおけるコストを考慮した近傍集約：エッジごとのルーティングはいつ役立つか？ [cs.LG, cs.AI]目的：異種グラフにおけるノード分類性能向上
- グラフニューラルネットワークは様々な分野で活用されている。しかし，グラフ構造によっては性能が低下することが課題。
- 異種グラフでは，クラス間のエッジがノイズとなり，分類精度を損なう場合がある。
- エッジごとのルーティングによって，異種グラフの特性に応じた適切な情報伝達を実現する。
- 提案手法CSNAは，学習された射影空間での距離に基づいてエッジごとにメッセージをルーティングする。
- 実験結果から，CSNAは敵対的異種性データセットで最先端手法と同等の性能を示すことが示された。
- 一方，情報的異種性データセットでは性能が劣り，エッジごとのルーティングの有効性が限定的であることが示唆された。
Link: https://arxiv.org/abs/2603.24291
ロボットマニピュレータ汎用ニューラルモーションプランニング：課題と機会 [cs.RO, cs.AI]目的：ロボットマニピュレータの汎用モーションプランナーに関する現状分析と将来展望
- ロボットの自律的な作業能力向上には，複雑な環境下での動作計画が不可欠である。
- 従来の動作計画は計算コストが高く，未知の環境への適応が困難であるという課題がある。
- ニューラルモーションプランナーの汎化性能を高め，実用的なロボットシステムへの応用を促進すること。
- 最新の汎用操作ポリシーは，ロボットを構造化されていない環境に展開可能にした。
- 現在のニューラルモーションプランナーは，未知の状況への汎化に課題を抱えている。
- 本研究は，ニューラルモーションプランナーの限界を明らかにし，汎化性能向上のための方向性を示す。
Link: https://arxiv.org/abs/2603.24318
大規模言語モデルによるインセンティブを考慮した報酬設計：協調型マルチエージェント強化学習 [cs.LG, cs.AI, cs.SY, eess.SY]目的：協調型マルチエージェント強化学習における効果的な補助報酬の設計
- マルチエージェントシステムは複雑な問題を解決できるが，報酬設計が難しい
- 報酬の設計が不適切だと，最適な協調行動が得られず，性能が低下する
- 大規模言語モデルを用いて報酬を自動設計し，手動設計の負担を軽減する
- 提案手法は，Overcooked-AIの複数のマップで，従来の報酬設計よりも高いタスク報酬と配達数を達成した。
- 特に，インタラクションがボトルネックとなる環境において，顕著な改善が見られた。
- 生成された報酬成分の分析から，行動選択における相互依存性の向上と，協調が必要なタスクにおけるシグナルアライメントの改善が示された。
Link: https://arxiv.org/abs/2603.24324
粗視覚処理による文書解析効率と性能の向上 [cs.OH, cs.CV, cs.AI, cs.IR]目的：文書解析の効率と性能向上
- 文書認識は，デジタル化社会において重要な技術であり，情報へのアクセスを容易にする。
- 高解像度画像は性能向上に寄与するが，計算コストが指数関数的に増加する点が課題である。
- 視覚的に冗長な領域を抑制し，効率的な文書解析を実現することで，計算コストを削減する。
- 提案手法PaddleOCR-VLは，文書の重要な領域に焦点を当てることで，効率と性能を両立した。
- ページレベル解析と要素レベル認識の両方において，既存手法を上回る最先端の性能を達成した。
- 少ないトークン数とパラメータで高速な推論が可能となり，文書理解の効率化に貢献する。
Link: https://arxiv.org/abs/2603.24326
ゲームプレイQA：3D仮想エージェントのPOV同期マルチビデオ理解のためのベンチマークフレームワーク [cs.CL, cs.AI, cs.CV]目的：エージェント中心の知覚と推論の評価
- 3D環境における自律エージェントの応用が拡大しており，高度な知覚能力が不可欠である。
- 既存のベンチマークは，エージェントの視点からの迅速な状態変化の理解や，複数エージェントの同時行動の推論を十分に評価していない。
- マルチエージェント環境における知覚と推論能力を詳細に分析するためのフレームワークを提供する。
- GameplayQAは，1秒あたり1.22個のラベル密度で，状態，行動，イベントを時系列同期してアノテーションしたマルチプレイ3Dゲームプレイ動画のデータセットである。
- 最先端のマルチモーダルLLMの評価により，人間のパフォーマンスとの大きな隔たりが明らかになり，特に時間的・クロスビデオのグラウンディング，エージェントの役割の属性付けに課題があることが示された。
- 本研究は，身体化AI，エージェント知覚，世界モデル構築の交差点における今後の研究を促進することを目指している。
Link: https://arxiv.org/abs/2603.24329
ニューロンレベルのdropinと神経可塑性メカニズムによるディープフェイク音声検出の効率と性能の向上 [cs.HC, cs.SD, cs.AI]目的：ディープフェイク音声検出における効率と性能の向上
- 音声技術の発展に伴い，ディープフェイク音声による偽情報拡散のリスクが高まっている。
- 大規模モデルは高性能だが，パラメータ数増加に伴い計算コストが課題となっている。
- ニューロンレベルでの動的なパラメータ調整により，計算効率と性能のバランス改善を目指す。
- 提案手法dropinにより，計算効率の向上が確認された。
- dropinおよび神経可塑性アプローチにより，ASVSpoof2019データセットで最長約39%と66%の等価エラー率の相対的な削減が達成された。
- 本研究成果は，Githubで公開されている。
Link: https://arxiv.org/abs/2603.24343
継続的ロボット学習における「自己」の出現に関する証拠 [cs.RO, cs.AI, cs.LG]目的：継続学習におけるロボットの認知構造の変化
- 自己認識は知能研究の根幹であり，その定量的評価手法が課題であった。
- 既存手法では，「自己」を他の認知構造と区別する明確な基準が欠けていた。
- 認知変化の安定性に着目し，「自己」の概念を定量的に捉えることを目指す。
- 継続学習を行うロボットは，制御群と比較して，安定した不変サブネットワークを発達させた。
- この不変サブネットワークの安定性は統計的に有意な差を示した（p < 0.001）。
- 本研究は，他の認知AIシステムにおける「自己」探求への新たな視点を提供する。
Link: https://arxiv.org/abs/2603.24350
言語誘導構造認識ネットワークによる擬態物体検出 [cs.CV, cs.AI]目的：擬態物体検出における性能向上
- 画像中の擬態物体は，色やテクスチャが背景と一体化しており，検出が極めて困難である。
- 既存手法は多スケール融合や注意機構を用いるものの，テキストによる意味的先験知識の活用が不足している。
- 複雑なシーンにおいて，モデルが擬態領域に焦点を当てられるよう，テキスト情報を活用する。
- 提案手法は，PVT-v2を視覚バックボーンとし，CLIPを用いてテキストプロンプトとRGB画像からマスクを生成し，特徴抽出を誘導する。
- フーリエエッジ強調モジュール（FEEM）を設計し，周波数領域で高周波情報を統合することで，エッジ強調特徴を抽出する。
- 構造認識注意モジュール（SAAM）を提案し，物体構造と境界の認識能力を向上させ，粗いガイドによる局所的な洗練モジュール（CGLRM）で精度を高める。
Link: https://arxiv.org/abs/2603.24355
人間疲労検出のための解釈可能なマルチモーダル生理信号統合のためのニューロシンボリックシステム [cs.RO, cs.HC, cs.LG]目的：人間疲労検出における解釈可能なマルチモーダル生理信号統合
- 疲労は，安全性に重大な影響を与えるため，その検出は重要な課題である。
- 既存手法では，解釈可能性が低く，個人差への対応が困難である。
- 本研究は，正確かつ解釈可能な疲労検出モデルを開発し，個人差に対応することを目指す。
- 提案手法は，眼球運動とfNIRSデータから生理学的概念を学習し，微分可能な推論規則と組み合わせる。
- 18人の参加者(560サンプル)によるleave-one-subject-out評価で，72.1% +/- 12.3%の精度を達成した。
- 概念忠実度指標は，個人ごとの精度と強い相関関係を示した(r=0.843, p < 0.0001)。
Link: https://arxiv.org/abs/2603.24358
CoordLight：ネットワーク全体の交通信号制御のための分散協調学習 [cs.RO, cs.LG, cs.RO]目的：交通信号制御における分散協調メカニズムの学習
- 都市の拡大に伴い，交通渋滞の緩和と効率的な交通流の確保が重要課題となっている。
- 分散環境下における部分観測性と協調性の問題が，スケーラブルかつ効率的な制御戦略の構築を困難にしている。
- CoordLightは，地域内の交通を改善し，ネットワークレベルでの最適化を実現することを目的とする。
- CoordLightは，車両の待ち行列モデルに基づく新しい状態表現（QDSE）により，エージェントの交通状況の分析・予測能力を向上させる。
- Neighbor-aware Policy Optimization (NAPO)アルゴリズムは，隣接エージェント間の依存関係を識別し，協調的な意思決定と方策学習を促進する。
- 実際の交通データを用いた評価により，CoordLightが多様な交通ネットワークにおいて，最先端の制御手法を上回る性能を示すことが示された。
Link: https://arxiv.org/abs/2603.24366
MolEvolve：LLM誘導進化探索による解釈可能な分子最適化 [cs.LG, cs.AI, cs.CE]目的：解釈可能な分子最適化のためのLLM誘導進化探索フレームワーク
- 深層学習は化学分野で成果を上げてきたが，解釈性の欠如が課題となっている。
- 構造活性相関における小さな構造変化が大きな物性変化を引き起こす「アクティビティクリフ」の解決が困難である。
- LLMを活用し，透明性の高い化学的洞察を得ながら，分子最適化を自動的に行うことを目指す。
- MolEvolveは，LLMによる初期化とMCTSエンジンを活用し，化学操作の最適な経路を自律的に発見する。
- この過程で生成される推論チェーンは，複雑な構造変換を人間が理解できる化学的知見へと変換する。
- 実験結果は，MolEvolveが物性予測と分子最適化の両タスクにおいて，既存手法を上回る性能を示すことを示唆する。
Link: https://arxiv.org/abs/2603.24382
局所固有次元推定におけるバギングの利用について [cs.LG, stat.ML]目的：局所固有次元推定における分散削減
- データ解析や機械学習において，データの複雑さを理解する上で，局所固有次元は重要な指標である。
- 近傍のデータ数が少ない場合，局所固有次元推定の分散が大きくなるという課題がある。
- バギングを用いて，局所近傍距離分布を維持し，分散を削減することを試みる。
- バギング推定器は，非バギングのベースラインと比較して，広範囲のハイパーパラメータ空間において，有意に分散と平均二乗誤差を低減することが示された。
- サンプリングレートとk-NNサイズの選択が，推定性能に与える影響を理論的・実験的に分析した。
- バギングと近傍平滑化を組み合わせることで，局所固有次元推定の性能をさらに向上させることができた。
Link: https://arxiv.org/abs/2603.24384
AIと幼児教育の出会い：中国の幼稚園における大規模言語モデルを評価パートナーとして [cs.CL, cs.AI, cs.CY]目的：幼児教育の質評価におけるAIの活用可能性
- 幼児の発達には質の高い教師と子ども間の相互作用が不可欠である。継続的な評価は重要だが，リソースの制約から困難な場合がある。
- 大規模な幼児教育システムでは，専門家による評価のコストと時間が課題であり，頻繁な評価が困難である。
- AIを活用することで，幼児教育の質評価の効率化と継続的なモニタリングを実現し，改善を促すことを目指す。
- 本研究では，中国の幼稚園における教師と子どもの自然な相互作用の初の大規模データセット（TEPE-TCI-370h）を構築した。
- Interaction2Evalという大規模言語モデルベースのフレームワークを開発し，専門家による評価との88%の合意率を達成した。
- 実証実験により，AI支援による評価ワークフローは専門家による監査に比べて18倍の効率化を実現し，継続的なモニタリングへの移行の可能性を示した。
Link: https://arxiv.org/abs/2603.24389
公平なモデル表現と公平な推薦の関係性の探求 [cs.CY, cs.RO, cs.IR, cs.AI, cs.LG]目的：公平な推薦の実現に向けたモデル表現の関連性の解明
- 推薦システムは多様な情報に基づいて最適な提案を行うが，社会的な公平性の観点も重要である。
- モデル表現に潜在的に含まれる属性情報が，推薦結果に偏りをもたらす可能性がある。
- モデル表現の公平性を評価し，推薦結果の公平性との関連性を明らかにする。
- モデル表現の公平性を最適化することで，推薦結果の公平性が向上する傾向が確認された。
- しかし，表現レベルでの評価は，モデル間の公平性の影響を正確に測るための指標とはなりえない。
- 様々なモデルにおける推薦レベルの公平性指標の挙動について，詳細な分析結果が得られた。
Link: https://arxiv.org/abs/2603.24396