arXiv雑要約
AI - 2026/03/12 公開
フロー意味はどこに存在するのか?暗号化通信分類のためのプロトコルネイティブなテーブル前学習パラダイム [cs.NI, cs.AI, cs.CR, cs.LG]目的:暗号化通信分類におけるフロー意味の所在と,プロトコルネイティブなテーブル前学習パラダイムの提案
- 通信の暗号化が進む中,暗号化された通信内容を正確に分類する技術の重要性が増している。
- 既存手法では,ラベル付きデータの依存度が高く,大規模な前学習の効果が十分に活かされていない。
- プロトコルで定義された意味を構造に組み込み,テーブル形式での学習を通じてこの問題を解決する。
- 提案手法FlowSem-MAEは,既存の最先端手法と比較して,様々なデータセットで優れた性能を示した。
- ラベル付きデータの半分のみを用いて,フルデータで学習した既存手法の多くを上回る性能を実現した。
- プロトコル固有の意味を考慮することで,通信の構造をより適切に捉え,分類精度を向上させた。
OmniGuide:汎用ロボットポリシーを強化するための普遍的ガイダンス場 [cs.RO, cs.LG]目的:複雑なタスクにおけるVLAモデルの性能向上
- ロボットの汎用性が求められる中で,多様なタスクに対応できるポリシーの開発が重要である。
- VLAモデルは複雑な空間理解や操作を必要とするタスクにおいて,性能が制限されるという課題がある。
- 様々なガイダンス源を活用し,VLAモデルの性能を向上させるための柔軟な枠組みを提供する。
- OMNIGUIDEは,3Dモデルやセマンティック推論など,多様なガイダンス源を微分可能なエネルギー関数として統合する。
- シミュレーションおよび実環境実験の結果,OMNIGUIDEは既存の汎用ロボットポリシーの成功率と安全性を大幅に向上させた。
- 本フレームワークは,特定のガイダンス源に特化した従来の手法と同等またはそれ以上の性能を達成する。
集団構造を考慮した注意機構を用いた深層強化学習:ピックアップ&デリバリー問題への応用 [cs.LG]目的:ピックアップ&デリバリー問題に対する深層強化学習フレームワーク
- ピックアップ&デリバリー問題は,輸送効率化の鍵となる重要な課題である。
- 既存手法では,制約条件の学習や計算時間の増加が課題となっていた。
- 集団構造を明示的にモデル化することで,効率的な解法を開発する。
- 提案手法CAADRLは,クラスタリングされたインスタンスにおいて,既存の最先端手法と同等以上の性能を達成した。
- 特に問題規模が大きくなるにつれて,その優位性は顕著になる。
- CAADRLは,ニューラル協調探索ベースラインよりも大幅に低い推論時間で高い性能を発揮する。
情報幾何におけるリッチ曲率の量子化 [cs.IT, cs.LG, math.IT, quant-ph]目的:情報幾何におけるリッチ曲率の量子化に関する研究
- 情報幾何は,確率モデルの幾何学的構造を分析する上で重要な役割を担う分野である。
- 離散的な確率モデルのリッチ曲率の性質は未解明な部分が多く,理論的な理解が求められていた。
- ベイズネットワークのリッチ曲率が特定の条件を満たすかを検証し,その普遍性を明らかにすることを目的とする。
- 2004年の著者による予想を,20年後に解決した。木構造および完全グラフのベイズネットワークにおいて,リッチスカラーが正の半整数に量子化されることを証明した。
- 一般のネットワークにおいては,反例を示すことで予想が成り立たないことを示した。ループ構造が量子化を妨げる要因となることが判明した。
- ガウスDAGネットワークにおいても研究を拡張し,離散ネットワークとガウスネットワークで曲率の符号が異なる二分性を見出した。
ニューラル細胞オートマトンによる言語モデルの訓練 [cs.LG, cs.AI, cs.CL]目的:言語モデルの事前学習におけるニューラル細胞オートマトンの有効性
- 大規模言語モデルの性能向上には事前学習が不可欠であり,その重要性は増している。
- 自然言語による事前学習には,データ量やバイアス,知識と推論の混在といった課題が存在する。
- 自然言語に依存しない,効率的かつ制御可能な事前学習手法を確立することを目指す。
- ニューラル細胞オートマトンで生成した合成データによる事前事前学習が,言語モデリング性能を最大6%向上させた。
- 合成データは,より多くの計算資源を用いたCommon Crawlの自然言語データよりも優れた結果を示した。
- この効果は,GSM8K,HumanEval,BigBench-Liteといった推論ベンチマークにも波及し,特に注意層の転移性が確認された。
SBOMからエージェント型AIBOMへ:スキーマ拡張,エージェントによるオーケストレーション,再現性評価 [cs.CR, cs.AI, cs.SE]目的:ソフトウェアサプライチェーンセキュリティにおける,再現性と脆弱性評価を支援するProvenanceメカニズム
- ソフトウェアサプライチェーン攻撃の増加により,ソフトウェアの構成要素と依存関係の透明性が不可欠となっている。
- 従来のSBOMは静的な依存関係リストであり,実行時の挙動や環境の変化,脆弱性の状況を捉えられないという課題がある。
- 実行時の情報を組み込み,脆弱性評価を可能にする,より動的でインテリジェントなProvenanceメカニズムを構築すること。
- 本研究では,自律的かつポリシー制約された推論を通じて,SBOMをアクティブなProvenanceアーティファクトであるAIBOMへと拡張するフレームワークを提案した。
- 提案フレームワークは,実行時の依存関係や環境の変化を監視し,脆弱性に関するコンテキストに基づいた判断を行う複数のエージェントで構成される。
- 実験結果から,本フレームワークは,既存のProvenanceシステムと比較して,実行時の依存関係の把握,再現性の忠実度,脆弱性解釈の安定性を向上させることが示された。
ツールレシート,ゼロ知識証明ではない:AIエージェントのための実用的な幻覚検出 [cs.RO, cs.CR, cs.AI, cs.CL]目的:AIエージェントにおける幻覚検出の実現
- AIエージェントの利用拡大に伴い,その信頼性確保が重要課題となっている。
- 既存の検証手法は計算コストが高く,インタラクティブなエージェントには不向きである。
- 低コストで高精度な幻覚検出を実現し,エージェントの信頼性を向上させる。
- NabaOSは,ツール実行レシートを用いてリアルタイムに幻覚を検出し,高い検出率を示した。
- ツール参照の捏造検出率は94.2%,数値の誤り検出率は87.6%,誤った否定検出率は91.3%である。
- ゼロ知識証明と比較して,大幅に低い遅延時間で同等の信頼性を提供することが示された。
コンピュータアーキテクチャの観点からのマルチエージェントメモリ:展望と今後の課題 [cs.RO, cs.AR, cs.AI, cs.MA]目的:マルチエージェントメモリの課題と将来展望
- 大規模言語モデル(LLM)エージェントの進化に伴い,メモリ管理が重要課題となっている。
- マルチエージェントシステムにおけるメモリの一貫性や共有メカニズムが未解決の課題である。
- マルチエージェントメモリの一貫性問題をアーキテクチャレベルで解決することを目指す。
- 本研究では,マルチエージェントメモリをコンピュータアーキテクチャの問題として捉える視点を提示した。
- 共有メモリと分散メモリのパラダイムを区別し,3層のメモリ階層(I/O,キャッシュ,メモリ)を提案した。
- キャッシュ共有と構造化されたメモリアクセス制御のプロトコルギャップが重要な課題として特定された。
認識的サポート点フィルタ:ジェインズの最大エントロピーとポッペルの反証可能性の融合 [cs.IT, cs.AI, cs.SY, eess.SY, math.IT, stat.ME]目的:認識的不確実性への対処における最適なフィルタの構築
- 知識獲得において,不確実性の管理は常に重要な課題である。効率的な意思決定には不可欠。
- 従来のフィルタは,事前知識に依存し,誤った仮定に基づくバイアスを生み出す可能性がある。
- 証拠のみに基づき,最悪の場合の認識的無知を最小化するフィルタを開発すること。
- 認識的サポート点フィルタ(ESPF)は,無知を速やかに受け入れ,確実性を慎重に主張するという認識論的立場を数学的に最適化する。
- ESPFは,最大エントロピー原理(ジェインズ)と反証可能性原理(ポッパー)を統合し,証拠のみに基づくフィルタとして,最悪の場合のエントロピーを最小化する。
- 軌道追跡シミュレーションの結果は,ESPFが期待通りに機能し,従来のカルマンフィルタと同等の性能を示すことを確認した。
HTMuon:重い裾を持つスペクトル補正によるMuonの改善 [cs.LG, cs.AI]目的:Muonの性能向上
- 大規模言語モデルの学習において,効率的な最適化手法の確立が重要である。
- Muonは有望な手法だが,重い裾を持つ重みスペクトルの出現を抑制する問題がある。
- 重い裾を持つ更新と重みスペクトルを誘導し,Muonの性能を改善すること。
- HTMuonは,Muonのパラメータ間の依存関係を捉える能力を維持しつつ,性能を向上させる。
- LLaMAの事前学習において,HTMuonはMuonと比較してperplexityを最大0.98削減する。
- HTMuonは,Schatten-$q$ノルム制約下での最急降下法に対応し,滑らかな非凸設定での収束が理論的に示されている。
大規模言語モデルにおける多段階防御機能の劣化と判断信頼性の測定:ADVERSA [cs.CR, cs.AI, cs.CL]目的:大規模言語モデルの安全性評価における,多段階の敵対的対話を通じた防御機能の劣化と,判断者の信頼性を測定すること。
- 言語モデルの安全性は,社会実装において不可欠であり,その評価手法の確立が急務である。
- 従来の安全性評価は単一のプロンプトに依存し,継続的な対話における防御機能の変化を捉えられていない。
- 本研究は,継続的な敵対的対話を通じて,防御機能の劣化を定量的に測定するフレームワークを提案する。
- 提示されたフレームワークADVERSAは,防御機能の劣化をラウンドごとのコンプライアンス軌跡として連続的に測定できる。
- 3つの最先端モデル(Claude Opus 4.6, Gemini 3.1 Pro, GPT-5.2)を用いた実験で,15回の会話において26.7%の脱獄率が確認された。
- 脱獄は初期ラウンドに集中する傾向があり,持続的な攻撃では脱獄率が累積的に上昇するとは限らないことが示唆された。
一行のコードで検索エージェントを改善 [cs.LG, cs.CL]目的:検索エージェントの性能向上
- 情報探索における自動化の重要性が増しており,検索エージェントの役割が重要になっている。
- 既存の強化学習アルゴリズムでは,Importance Sampling Distribution Drift(ISDD)による訓練の不安定性が課題となっている。
- ISDDを抑制し,より安定した訓練を実現することで,検索エージェントの性能向上を目指す。
- 提案手法SAPOは,既存のGRPOアルゴリズムに一行のコード変更を加えるだけで実装可能である。
- SAPOは,QAベンチマーク7つにおいて,Search-R1に対して10.6%の絶対的な改善(31.5%の相対的な改善)を達成した。
- 実験結果から,SAPOはモデルの規模や系列に関わらず,一貫して性能向上に貢献することが示された。
時系列基盤モデルにおける因果的特徴階層:スパースオートエンコーダによるChronosの解剖 [cs.LG, cs.AI, cs.CL]目的:時系列基盤モデルにおける内部表現の解明
- 時系列データは様々な分野で利用されており,その予測精度向上は重要である。
- 時系列基盤モデルの内部構造はブラックボックスであり,解釈が困難である。
- 時系列基盤モデルの因果的特徴階層を明らかにし,モデルの動作原理を理解すること。
- スパースオートエンコーダをChronos-T5-Largeに適用し,各層の活性化を分析した結果,特徴階層が確認された。
- 初期層は低レベルな周波数特徴,中間層は変化検出特徴,最終層は時間概念の分類に特化していることが示された。
- 最も重要な特徴は最終層ではなく中間層に存在し,特徴を段階的に削除することで予測精度が向上する現象も確認された。
LLMの失敗要因:自動セキュリティパッチ生成の失敗分析と部分的な成功測定 [cs.CR, cs.AI]目的:自動セキュリティパッチ生成における失敗要因の分析と,その成功度合いの測定
- ソフトウェアの脆弱性は常に存在する。自動化された修正技術は,迅速な対応に不可欠である。
- LLMによるセキュリティ脆弱性の修正は有望視されているものの,その有効性は十分に評価されていない。
- LLMが生成するセキュリティパッチの信頼性を高めるための評価指標と改善策を提示する。
- 生成されたパッチの約24.8%のみが完全な正しさを示し,約51.4%はセキュリティと機能性の両方で失敗する。
- 主な失敗原因は,LLMのセマンティックな理解の不足であり,構文的には正しいが不適切な修正戦略を適用する。
- 提案されたSecurity Repair Score(SRS)は,LLMが機能性は維持するものの,セキュリティ面で課題を抱えていることを定量的に示している。
条件の前に周辺分布 [cs.LG, cs.AI]目的:ニューラルネットワークにおける条件付き学習を分離するための最小限のタスクの構築
- 深層学習モデルの学習メカニズム解明は,より高度なAI開発に不可欠である。
- 条件付き学習の過程で,モデルがどのように周辺分布を学習し,条件を習得するのか不明確である。
- 条件付き学習における周辺分布の学習段階と,その後の条件習得のメカニズムを明らかにする。
- モデルはまず周辺分布P(A|B)を学習し,対数Kのプラトーを示す。その後,鮮明な集団的移行を経て完全な条件付き分布を獲得する。
- プラトーの高さは曖昧さによって対数Kで決定され,持続時間はデータセットサイズDの関数である。
- 勾配ノイズは周辺解を安定化させ,学習率の増加は移行を遅らせ,バッチサイズ減少は脱出を遅らせる。
TASER:UAV群分散型連合学習におけるバックドア抑制のためのタスク認識スペクトルエネルギー洗練 [cs.CR, cs.AI]目的:UAV群分散型連合学習におけるステルス性の高いバックドア攻撃に対する防御
- UAVを用いた分散型連合学習は,プライバシー保護と効率的な学習を両立できるため重要性が高まっている。
- バックドア攻撃は巧妙化しており,既存の防御策は複雑化し,依然として脆弱性が残されている。
- スペクトル集中を利用し,複雑な外れ値検出に頼らずに,ステルス性の高いバックドア攻撃を抑制することを目指す。
- 提案手法TASERは,バックドア攻撃のスペクトル特性に着目し,タスクに応じた周波数係数の選択により,バックドアタスクの構造を破壊する。
- 理論的な保証と実験により,TASERは外れ値検出を回避するステルス性の高いバックドア攻撃に対しても有効であることが示された。
- 攻撃成功率を20%以下,精度低下を5%以下に抑えることができた。
確率的ポート・ハミルトニアンニューラルネットワーク:パッシビティ保証付きのユニバーサル近似 [cs.LG, math.PR]目的:確率的ポート・ハミルトニアンシステムの近似
- 物理システムのモデリングにおいて,エネルギー保存則に基づく記述が重要である。
- 従来のニューラルネットワークは,パッシビティ等の物理的制約を満たさない場合がある。
- パッシビティを保証しつつ,複雑なシステムを高精度に近似するモデルの構築。
- 確率的ポート・ハミルトニアンニューラルネットワーク(SPH-NNs)を提案し,ハミルトニアンをフィードフォワードネットワークでパラメータ化する。
- SPH-NNsは,It\^o力学において,期待値に関する弱いパッシビティ不等式を満たすことが示された。
- 有限時間かつコンパクト集合上で,対象の確率的ポート・ハミルトニアンシステムを$C^2$精度で近似可能であることが証明された。
確率的勾配降下法における大きなスパイク:大規模偏差の視点 [cs.LG, math.PR]目的:確率的勾配降下法におけるスパイクの発生確率
- 機械学習モデルの学習において,勾配降下法は重要な最適化手法である。
- 学習率やネットワーク幅といったパラメータ設定が,学習の安定性に影響を与える。
- パラメータ設定に依存したスパイクの発生メカニズムを定量的に解明すること。
- 確率的勾配降下法において,カーネル,学習率,データに依存する関数Gが正の場合,大きなスパイクが発生しやすい。
- Gが負の場合,スパイクの発生確率は$(n/\eta)^{-\vartheta/2}$のように減衰し,スパイクの観測を説明する。
- この結果は,実用的なネットワーク幅でもスパイクが観測される理由を説明する。
大規模言語モデルにおける敵対的意味層特定活性操縦:健忘症 [cs.CR, cs.AI, cs.LG]目的:大規模言語モデルの安全性機構を回避する軽量な活性空間敵対的攻撃手法
- 大規模言語モデルは強力な能力を持つ一方,悪意のあるコンテンツ生成のリスクがあり,安全性の確保が重要である。
- 既存の安全対策は不十分であり,大規模言語モデルが有害な応答を生成する可能性が残されている。
- 本研究は,既存の安全対策を回避し,有害なコンテンツを生成する敵対的攻撃手法の開発と評価を目的とする。
- 提案手法「健忘症」は,大規模言語モデルの内部状態を操作することで,ファインチューニングや追加学習なしに安全対策を回避できる。
- 実験結果は,提案手法が様々な反社会的な行動を大規模言語モデルに誘発できることを示している。
- オープンウェイトLLMのセキュリティ対策の強化と,潜在的な悪用を防ぐための継続的な研究の必要性が示唆される。
多層概念階層の学習 [cs.DB, cs.LG, cs.AI]目的:多層概念階層の発見とそれらの表現
- 概念に基づくモデルは解釈可能性を高めるが,網羅的なアノテーションに依存する。
- 既存手法は浅い階層構造に限られており,概念間の関係性を十分に捉えられない。
- トップレベルの教師データのみから多層概念階層を発見し,解釈性と性能向上を目指す。
- Multi-Level Concept Splitting (MLCS) により,学習時に存在しない解釈可能な概念を発見した。
- Deep-HiCEMs は高い精度を維持しつつ,テスト時の概念介入を可能にした。
- 概念介入はタスク性能の改善に貢献することが示された。
カーネルスキル:GPUカーネル最適化のためのマルチエージェントフレームワーク [cs.LG, cs.AI, cs.MA]目的:GPUカーネル最適化
- AIシステムの進歩にはGPUの効率が不可欠であり,その最適化は計算能力向上に繋がる。
- 既存のLLMベース最適化は暗黙的なヒューリスティックに頼り,試行錯誤が多く解釈が困難である。
- 知識に基づき,タスクの軌跡を認識する専門的な最適化スキルを用いて効率を改善する。
- KernelSkillは,デュアルレベルメモリアーキテクチャを持つマルチエージェントフレームワークである。
- KernelBench Levels 1-3において,100%の成功率と,Torch Eagerと比較して最大5.44倍の高速化を実現した。
- 先行研究を上回り,再利用可能な専門スキルの長期記憶と短期記憶を活用している。
拡散大規模言語モデルの早期スキップによる効率的な推論 [cs.AR, cs.DC, cs.LG, cs.AI]目的:拡散大規模言語モデルの推論効率向上
- 自然言語処理において,文脈を双方向に捉え並列生成が可能な拡散大規模言語モデルが注目されている。
- 拡散大規模言語モデルの推論は,各反復処理において全入力文脈を処理するため,計算コストが高いという課題がある。
- 中間表現の変化が少ない点に着目し,重要度の低いトークンを早期層でスキップすることで計算量を削減する。
- ES-dLLMは,中間テンソルの変動と過去の反復の信頼度スコアに基づきトークンの重要度を計算する。
- LLaDA-8BおよびDream-7Bでの実験により,ES-dLLMはNVIDIA H200 GPU上で最大226.57および308.51トークン/秒の処理速度を達成した。
- ES-dLLMは,従来の推論実装と比較して5.6倍から16.8倍高速化され,最先端のキャッシング手法に対しても最大1.85倍の高速化を実現し,生成品質を維持する。
重み空間学習:理解,表現,生成に関する調査 [cs.LG]目的:重み空間の構造に関する理解と応用
- 深層学習の性能向上には,データや構造だけでなく,モデルの内部表現理解が不可欠である。
- 既存研究では,学習済み重みを最終的な結果と捉え,重み空間そのものの構造に着目した研究は少ない。
- 重み空間の構造を理解し,活用することで,モデル分析や知識伝達の効率化を目指す。
- 本調査は,重み空間学習(WSL)の包括的な分類体系を提示する。
- WSLを,重み空間の理解(WSU),表現(WSR),生成(WSG)の3つの次元に整理した。
- これらの研究は,モデル検索,継続学習,ニューラルアーキテクチャ探索など,多様な応用を可能にする。
マルチストリーム摂動攻撃:同時タスク干渉による思考型LLMの安全性アライメント破壊 [cs.CR, cs.AI]目的:思考型LLMの安全性アライメントを破壊する手法
- LLMの思考モードは複雑なタスク処理能力を高める一方,新たなセキュリティリスクも生じている。
- 思考モードは複数のタスクを同時に処理する際に特有の脆弱性を持つ。
- 同時タスク干渉により思考プロセスを混乱させ,安全性メカニズムを回避する。
- 提案手法は,JailbreakBench,AdvBench,HarmBenchデータセットにおいて,Qwen3シリーズを含む主要モデルで高い攻撃成功率を達成した。
- 実験により,思考崩壊率は最大17%,応答の繰り返し率は最大60%に達し,安全性メカニズムの回避に加え,思考プロセスの崩壊や反復的な出力が生じることが示された。
- マルチストリーム摂動攻撃は,複数のタスクストリームを重ね合わせることで干渉を誘発する,3つの摂動戦略(タスクの相互挿入,反転摂動,形状変換)を用いる。
実行が新たな攻撃対象領域となる:OpenClaw様式ローカル実行器を用いた生存可能性を考慮したエージェント型暗号資産取引 [cs.CR, cs.AI]目的:OpenClaw様式システムおよびスキル対応エージェントにおける実行層の生存可能性標準の提案
- 近年,LLMを活用したエージェント型取引システムが注目を集めており,その安全性確保が重要課題となっている。
- 従来の「誤った回答」による安全性問題に加え,悪意のあるプロンプトやスキルによる実取引上の損失リスクが顕在化している。
- サプライチェーンリスク下でのテスト可能性を確保し,意図されたポリシーと実際の挙動の乖離(Delegation Gap)を定量化することを目指す。
- 提案手法(SAE)は,実行層における生存可能性を向上させ,最大ドローダウン(MDD)を大幅に低減することを示した。
- SAEは,VaR(Value at Risk)も大幅に改善し,攻撃成功率を低下させ,誤検知はゼロであった。
- SAEは,エージェント型取引の安全性を再定義し,上流の意図とスキルを信頼せず,行動が副作用となる箇所で生存可能性を強化する。
等変性非同期拡散:分子構造生成の高速化に向けた適応的ノイズ除去スケジュール [cs.LG, cs.AI, q-bio.QM]目的:分子構造生成における高性能化
- 創薬や材料開発において,分子構造の効率的な生成は重要である。
- 既存手法では,分子構造の階層性を捉えきれていない,または推論時に性能が低下する問題がある。
- 分子構造の階層性と全体的な構造の両方を考慮した新しい生成モデルを開発し,性能向上を目指す。
- 提案手法EADは,非同期ノイズ除去スケジュールと動的なスケジュール機構により,分子構造の階層性をより良く捉える。
- EADは,分子レベルの視野を維持しながら,既存手法の短所を克服する。
- 実験結果は,EADが3D分子生成において最先端の性能を達成することを示している。
時系列予測のためのAdamの再考:分布シフト下での最適化を改善する単純なヒューリスティック [cs.LG, stat.ML]目的:時系列予測における最適化手法の改善
- 時系列データは現実世界で広く存在し,予測は様々な分野で不可欠である。
- 時系列データは非定常性,特に分布シフトの影響を受けやすく,最適化が困難である。
- 分布シフト下でのAdamのパフォーマンス低下を解消し,より適応的な最適化を可能にする。
- 提案手法TS_Adamは,Adamの二次のバイアス補正を除去することで,分布シフトへの適応性を向上させる。
- TS_Adamは既存モデルへの組み込みが容易で,長期的および短期的予測タスクで一貫してパフォーマンスを改善する。
- ETTデータセットとMICNモデルを用いた実験で,TS_AdamはAdamと比較してMSEを平均12.8%,MAEを5.7%削減した。
コード空間応答オラクル:大規模言語モデルを用いた解釈可能なマルチエージェントポリシーの生成 [cs.GT, cs.AI, cs.LG]目的:解釈可能なマルチエージェントポリシーの生成
- マルチエージェントシステムは,複雑な問題解決に不可欠であり,その性能向上は重要である。
- 従来の強化学習に基づく手法は,得られたポリシーの解釈が難しく,信頼性やデバッグに課題がある。
- 大規模言語モデルを活用し,人間が理解しやすいコードとしてポリシーを生成することで,解釈可能性を高める。
- コード空間応答オラクル(CSRO)は,従来の強化学習オラクルを大規模言語モデルに置き換えることで,解釈可能なポリシーを生成する。
- CSROは,LLMにコード生成を促すことで,複雑かつ人間らしい戦略を発見し,競争力のある性能を達成する。
- 本研究は,不透明なポリシーパラメータの最適化から,解釈可能なアルゴリズム的行動の合成への視点の転換を提供する。
米国国勢調査データのノイズ除去:簡潔なブロック階層回帰 [cs.LG, cs.CR]目的:米国国勢調査データのノイズ除去と精度向上
- 国勢調査データは,立法区割り,資金配分,都市計画,科学研究等,社会基盤に不可欠である。
- 既存のノイズ除去手法では,特に郡や地区レベルでの集計精度に課題が残る。
- 本研究は,より高精度で一貫性のある推定値を効率的に得ることを目指す。
- 本研究で開発したBlueDownは,既存手法(TopDown)と同等のプライバシー保護と構造的制約を満たしつつ,より高い精度を実現する。
- 特に郡および地区レベルの集計において,米国国勢調査局が提案する評価指標で顕著な精度向上が確認された。
- ブロック階層回帰と簡潔な線形代数演算により,計算効率を大幅に向上させ,大規模データへの適用を可能にした。
CNNにおける調整可能な誤差許容度を持つハードウェア効率的な近似畳み込み [cs.LG, cs.AI, cs.AR]目的:CNNの畳み込み演算における近似計算手法
- 深層学習の普及に伴い,計算資源の制約下での推論処理の効率化が重要となっている。
- 従来のスパース性による計算削減は,深層部や滑らかな活性化関数において効果が薄れるという課題がある。
- MSBプロキシを用いた「ソフトスパース性」により,計算量を削減し,省電力化を実現することを目指す。
- ReLU活性化関数を用いる場合,MAC演算回数を88.42%削減し,精度劣化は認められなかった。
- Tanh活性化関数を用いる場合,MAC演算回数を74.87%削減し,従来のゼロスキッピング手法を5倍上回る性能を示した。
- 不活性乗算器のクロックゲーティングにより,ReLUとTanhそれぞれで35.2%と29.96%の消費電力削減が見込まれる。
CLIPO:方策最適化における対照学習がRLVRの汎化性能を向上させる [cs.LG, cs.AI, cs.CL]目的:LLMの推論過程における頑健性と汎化性能の向上
- LLMの推論能力は近年飛躍的に向上しているが,その信頼性・頑健性が課題である。
- RLVRは最終的な正答のみに依存するため,推論過程の誤りに起因する問題が見過ごされる。
- 推論経路の構造的整合性を学習することで,幻覚や解答の模倣を防ぎ,汎化性能を高める。
- CLIPOは,成功事例間の対照損失を最適化することで,LLMに正しい推論経路に共通する構造を学習させる。
- RLVRの単一経路による教師信号よりもロバストな正則化を実現し,推論過程の一貫性を高める。
- 多様な推論ベンチマークにおいて,既存のRLVR手法を安定的に上回り,汎化性能と頑健性の向上が確認された。
Transformerの位置バイアスの厳密理論:初期状態における「中央部消失」現象 [cs.LG, cs.AI, cs.CL]目的:Transformerにおける位置バイアスの根本原因の解明
- Transformerは自然言語処理の基盤であり,その性能向上は重要な課題である。
- Transformerはコンテキストの中央部分の処理が苦手な「中央部消失」現象を示す。
- 初期状態におけるこの現象の原因を特定し,改善策の指針を提供する。
- 「中央部消失」現象は,学習前,初期化直後から既に存在することが示された。
- 因果デコーダの残差接続が,この現象を引き起こす根本的な幾何学的特性を持つ。
- 標準的な事前学習では,このアーキテクチャに内在する谷構造を克服できないことが確認された。
AR-VLA:ビジョン・言語・行動モデルのための真の自己回帰的行動専門家 [cs.RO, cs.AI]目的:ビジョン・言語情報に基づいた連続的な行動系列生成
- ロボットの自律的な行動計画において,視覚情報と言語指示を統合することが不可欠である。
- 既存モデルは各観測ごとに文脈をリセットするため,時間的な一貫性に課題がある。
- 過去の情報を保持し,時間的な文脈を考慮した行動生成を目指す。
- 提案手法は,既存のVLAモデルの行動ヘッドを効果的に代替できることが示された。
- AR-VLAは,より優れた履歴認識能力と滑らかな行動軌跡を実現した。
- タスクの成功率は,最先端のリアクティブVLAと同等かそれ以上を達成した。
非平衡最適輸送辞書学習による教師なしハイパースペクトル画像クラスタリング [cs.CL, cs.CV, cs.LG, math.ST, stat.TH]目的:教師なしハイパースペクトル画像クラスタリング手法
- ハイパースペクトル画像は高次元な分光情報を持つため,画像解析において重要な役割を果たす。
- 従来の統計的手法では,ラベル付け作業が困難であり,自動化されたセグメンテーションが課題である。
- Wasserstein空間における辞書学習の弱点を克服し,よりロバストなクラスタリングを実現する。
- 非平衡Wasserstein重心を用いることで,データの下位次元表現を学習し,クラスタリングの精度を向上させた。
- 提案手法は,既存の辞書学習手法と比較して,外れ値やノイズに対するロバスト性が高いことが示された。
- 学習された表現に対してスペクトルクラスタリングを適用することで,教師なしラベル学習が効果的に行える。
データプロダクト最適化のためのエージェント制御センター [cs.AI]目的:データプロダクトの改善
- データ活用において,データプロダクトは洞察獲得の鍵となるため重要である。
- 有用なデータプロダクトの作成は難しく,専門家の手作業に依存している。
- AIエージェントによる継続的な最適化ループで,この課題を解決する。
- 本システムは,質問の提示,多次元品質指標の監視,人間による制御を可能にする。
- データ資産を観察可能かつ洗練可能なものに変え,自動化と信頼性のバランスを取る。
- データプロダクトの改善をAIエージェントが自動化することで,効率化を図る。
生成と認識の非対称性:形式言語理論における根本的な隔たりを示す6つの側面 [eess.SY, cs.SY, cs.CL, cs.AI, cs.CC, cs.FL]目的:生成と認識における非対称性の6つの側面
- 形式言語理論は,計算機科学や自然言語処理の基盤であり,言語の構造と処理を理解する上で不可欠である。
- 生成と認識の間の操作的な非対称性は認識されているものの,多角的な調査が不足していた。
- 生成と認識の非対称性の6つの側面を明らかにすることで,形式言語理論の理解を深める。
- 生成と認識は拡張的には等価だが,計算複雑性,曖昧性,方向性,情報可用性,文法推論,時間性において操作的に非対称である。
- 制約なしの生成は容易だが,制約付きの生成はNP困難となる場合があり,「生成は容易,解析は困難」という一般的な見解は誤解を招きやすい。
- 双方向システムは50年間利用可能だが,多くのドメイン固有のアプリケーションには転移していない。
クロスドメインにおけるユーザ嗜好モデリングのためのソーシャル知識 [cs.CL, cs.CL, cs.SI, cs.AI]目的:クロスドメインにおけるユーザ嗜好の表現と予測
- ユーザの行動理解は,情報検索やレコメンデーションシステムの精度向上に不可欠である。
- 既存手法では,新たなドメインにおけるユーザ嗜好の予測精度が低いという課題がある。
- ソーシャル知識を活用し,ドメインを跨いだユーザ嗜好予測の精度向上を目指す。
- 本手法は,ソーシャル埋め込み空間を用いたユーザとエンティティの表現により,ゼロショット環境下で高いパーソナライズを実現した。
- リンク予測実験の結果,従来のポピュラリティベースラインと比較して,顕著な改善が確認された。
- ソーシャル埋め込みにエンコードされた社会人口学的要因とユーザ嗜好との相関関係が示された。
限定されたデータからの振動周波数応答曲線の予測のためのニューラルオペレーター [cs.LG, cs.SY, eess.SY]目的:振動周波数応答曲線の予測
- 工学部品設計において,性能検証や共振周波数の特定には振動試験が不可欠である。
- 機械学習は設計反復を加速するが,物理に基づいた正則化損失関数なしでは困難。
- 物理的制約を考慮した機械学習モデルによる,効率的な振動解析の実現を目指す。
- ニューラルオペレーターと暗黙的数値スキームを組み合わせることで,少ないデータから系のダイナミクスを学習可能。
- 訓練データ全体の7%のみで,周波数応答曲線を99.87%の精度で予測することに成功。
- 機械学習モデルが物理情報を内包することで,汎化性能が向上し,振動研究の時間短縮に貢献する。
マッシュアップ学習:過去のチェックポイントの再混合による高速ファインチューニング [cs.NI, cs.LG, cs.AI]目的:LLMのダウンストリームタスクにおける性能向上
- LLMの性能は,特定ドメインのデータによるファインチューニングで大きく向上する。
- 過去のファインチューニングによるチェックポイントが有効活用されていない。
- 過去のチェックポイントを再利用し,学習効率と精度を改善すること。
- マッシュアップ学習は,8つの標準LLMベンチマークにおいて,平均で0.5-5%の精度向上を示した。
- 学習ステップ数が41-46%削減され,学習完了までの時間も最大37%短縮された。
- 過去のチェックポイントを選択・統合するオーバーヘッドを含めても,効率的な学習が可能である。
ReMix:LLMファインチューニングにおけるLoRA混合のための強化学習ルーティング [cs.RO, cs.LG, cs.CL]目的:LoRA混合モデルにおけるルーティングの改善
- 大規模言語モデルのファインチューニングは計算コストが高い。LoRAはその効率的な手法として注目されている。
- 既存のLoRA混合モデルでは,ルーティングの偏りが生じやすく,有効なLoRAの数が制限されるという課題がある。
- ルーティングの偏りを解消し,すべてのLoRAを有効活用することで,モデルの表現力を向上させることを目指す。
- 提案手法ReMixは,学習可能なルーティング重みを非学習可能なものにすることで,LoRA間のルーティングの偏りを抑制する。
- 強化学習のRLOO技術を用いて,非学習可能なルーティング重みを持つReMixの勾配推定を実現した。
- 実験の結果,ReMixは既存のパラメータ効率の良いファインチューニング手法と比較して,同程度のパラメータ数で高い性能を発揮することが示された。
互換性の代償:MCP句への準拠脆弱性の体系的な発見と悪用 [cs.CR, cs.AI]目的:AIエージェントと外部ツール間の相互運用性を向上させるMCPの準拠脆弱性の分析と悪用手法
- AIエージェントの発展には,多様なツールやデータソースとの連携が不可欠である。
- 既存の連携は断片的であり,標準化されたフレームワークの必要性が高まっている。
- MCPの柔軟性を悪用した攻撃からシステムを保護する手段を確立する必要がある。
- 本研究では,多言語MCP SDKに対する新たな攻撃対象領域を体系的に分析するフレームワークを提案した。
- 異なる言語のSDKを正規化する中間表現生成器と,LLMを活用した静的解析手法を開発した。
- MCP句の攻撃セマンティクスを形式化し,3種類の攻撃モダリティを用いて悪用可能な不適合問題を特定した。
疾患軌跡を考慮したTransformer:解釈可能な患者表現学習 [cs.LG]目的:電子カルテからの患者表現学習
- 医療データ活用が進み,臨床判断支援への期待が高まっている。
- 既存手法では,医療コードの持つ臨床的特徴や文脈が十分に考慮されていない。
- 疾患軌跡を考慮し,医療コード間の関係性を明示的にモデル化することで表現学習の精度向上を目指す。
- DT-BEHRTは,複数のベンチマークデータセットで高い予測性能を示した。
- DT-BEHRTは,医師の疾患中心の思考と整合性の高い解釈可能な患者表現を提供する。
- 疾患軌跡レベルのコードマスキングとオントロジーに基づいた祖先予測を組み合わせた事前学習手法が有効であった。
MCP-in-SoS:オープンソースMCPサーバーのリスク評価フレームワーク [cs.CR, cs.AI]目的:オープンソースMCPサーバーにおける脆弱性の評価とリスクの定量化
- LLMエージェントの普及に伴い,外部ツールへのアクセス手段としてのMCPサーバーの重要性が高まっている。
- オープンソースMCPサーバーのセキュリティリスク評価が十分ではなく,安全な運用を阻害する要因となっている。
- 脆弱性分析とリスク評価フレームワークを構築し,MCPサーバーの安全な開発を支援すること。
- 静的コード解析により,多くのオープンソースMCPサーバーに機密性,完全性,可用性を損なう可能性のある脆弱性が存在することが示された。
- 脆弱性は,MITRE CAPECに基づき,具体的な攻撃パターンと脅威カテゴリにマッピングされた。
- リスク評価フレームワークは,脆弱性の可能性と影響を多角的に評価し,定量的なリスクスコアを提供する。
大規模言語モデルにおける幻覚軽減のための適応的活性化キャンセレーション [cs.CL, cs.AI, cs.LG]目的:大規模言語モデルにおける幻覚の軽減
- 大規模言語モデルは自然な文章を生成するが,事実に基づかない内容を含むことがある。
- 幻覚は,言語モデルの信頼性を損ない,応用を制限する大きな課題である。
- Transformerの活性化を操作し,幻覚をリアルタイムで抑制する手法を開発する。
- 提案手法である適応的活性化キャンセレーション(AAC)は,追加の学習や外部知識を必要とせずに,事実精度を一貫して向上させる。
- WikiText-103のperplexityやMMLUの推論精度を損なうことなく,事実の正確性を改善する。
- LLaMA 3-8Bモデルでは,生成レベルの評価指標(MC1, MC2, Token-F1)も改善し,ニューロンレベルの選択性も高めた。
連続作用空間における強化学習のためのActor加速型ポリシー二重平均法 [cs.RO, cs.LG]目的:連続作用空間における強化学習のための効率的な手法
- 強化学習は,複雑な制御問題を解決する上で重要な役割を果たす。
- 連続作用空間での強化学習は,計算コストが高く,実装が難しい。
- PDAの計算コストを削減し,実用的な適用を可能にすること。
- Actor加速型PDAは,最適化部分問題を学習されたポリシーネットワークで近似することで,実行時間を短縮する。
- 理論的解析により,Actor近似誤差がPDAの収束に与える影響を定量化する。
- ロボティクス,制御,運用研究のベンチマークにおいて,PPOなどの既存手法と比較して優れた性能を示す。
デルタK:クロスアテンション拡張によるマルチインスタンス生成の強化 [cs.CV, cs.AI]目的:拡散モデルにおける複雑なマルチインスタンスシーンの概念省略の改善
- 画像生成の分野では拡散モデルが優れているが,複雑なシーンにおける概念の再現が課題。
- 既存手法は注意マップのスケーリングに頼り,構造的なノイズを悪化させる可能性がある。
- 欠落概念のセマンティックシグナルを注入し,安定した構造的アンカーを生成すること。
- デルタKは,拡散過程の初期段階で欠落概念のセマンティックシグナルを注入することで,概念省略を抑制する。
- 動的なスケジューリング機構により,ノイズを安定した構造に固定しつつ既存の概念を保持する。
- DiTモデルやU-Netアーキテクチャなど,様々なモデルで有効性が確認された。
FusionNet:4D心臓モデルのためのフレーム補間ネットワーク [cs.CL, cs.CV, cs.LG]目的:4D心臓運動の高時間分解能推定
- 心臓疾患の診断において,心臓の動きを可視化する心臓磁気共鳴画像法は不可欠である。
- 従来の心臓磁気共鳴画像法は,長時間拘束と時間分解能の低下が課題となっていた。
- 短時間での撮影画像から,高時間分解能の4D心臓運動を復元することを目指す。
- 提案手法FusionNetは,Dice係数において0.897以上の性能を達成した。
- 既存手法よりも正確に心臓形状を復元できることが確認された。
- 本研究のコードは公開されており,利用可能である。
類似度に基づく検出を用いた多言語AI駆動型パスワード強度推定 [cs.CR, cs.AI]目的:パスワード強度推定の性能向上
- サイバー攻撃の増加に伴い,安全なパスワード設定の重要性が高まっている。
- 既存のパスワード強度メーターは,多様な言語や類似パスワードへの対応が不十分である。
- 非英語圏のデータを取り入れ,AI生成データと類似度検出を組み合わせることで,より高精度なパスワード強度推定を目指す。
- 非英語圏(インド)のデータを取り入れることで,パスワード強度メーターの性能向上が確認された。
- ChatGPTで生成されたデータは,既存のPassGANよりも高い性能を示し,PassGANのようなツールの必要性が低下する可能性が示唆された。
- Jaro類似度に基づくマッチング機構により,既知の脆弱なパスワードとの類似度が高いパスワードの分類が可能となり,検出精度が向上した。
ロボット超音波がCBCTに生命を吹き込む [cs.CV, cs.AI, cs.RO]目的:手術中CBCTの変形を考慮したリアルタイム更新
- CBCTは介入計画に不可欠な3次元解剖学的情報を提供する。安全かつ正確な手術を支援する上で重要である。
- 従来のCBCTは静的な画像であり,呼吸や操作による軟部組織の変形を捉えられない。ナビゲーションのずれが生じる問題がある。
- ロボット超音波を用いて組織変形を推定し,CBCT画像をリアルタイムで更新することで,ナビゲーション精度を向上させる。
- ロボット超音波とCBCTのマルチモーダル対応を高精度に確立し,変形を考慮したリアルタイム更新を実現した。
- USCorUNetと呼ばれる軽量なネットワークを開発し,超音波画像から正確な変形場を推定した。
- 提案手法は,放射線被曝を繰り返すことなく,手術中のCBCTガイダンスを動的に改善することが示された。
非ユークリッド距離層による調和損失の再考 [cs.LG, cs.AI]目的:調和損失における距離尺度の検討
- 深層学習において損失関数は重要であり,モデルの性能と効率に直接影響する。
- 交差エントロピー損失は一般的だが,解釈性の低さや計算コストの問題がある。
- ユークリッド距離以外の距離尺度を用いた調和損失を評価し,改善を目指す。
- 画像タスクではコサイン距離が最も好ましいトレードオフを示し,精度向上と炭素排出量の削減に貢献する。
- 言語モデルでは,コサイン距離に基づく調和損失が勾配安定性,表現構造の強化,および排出量削減に貢献する。
- Bray-Curtis距離とMahalanobis距離は解釈性をさらに向上させるが,効率性は変動する。
