arXiv雑要約
AI - 2026/03/25 公開
MSR-HuBERT:多様なサンプリングレートへの適応のための自己教師あり事前学習 [cs.SD, cs.AI]目的:多様なサンプリングレートデータへの適応
- 音声処理技術は,人間と機械のコミュニケーションにおいて不可欠であり,その重要性は増している。
- 既存の自己教師あり学習法は単一のサンプリングレートに依存し,異なるレートのデータ混合に課題がある。
- 異なるサンプリングレートの音声データを統合的に処理できる事前学習手法の開発。
- MSR-HuBERTは,HuBERTの単一レートダウンサンプリングCNNを,多様なレートに対応するCNNに置き換えた。
- これにより,リサンプリングなしで異なるレートの波形を共有の時間分解能にマッピングし,統一的な事前学習とファインチューニングを可能にした。
- 実験の結果,MSR-HuBERTは16kHzから48kHzの範囲で,HuBERTよりも音声認識とフルバンド音声再構成で優れていた。
DBAutoDoc:統計分析と反復LLM改良による,未ドキュメント化されたデータベーススキーマの自動検出とドキュメント化 [cs.DC, cs.DB, cs.AI]目的:未ドキュメント化されたデータベーススキーマの自動検出とドキュメント化
- 多くの重要なデータベースシステムにおいて,適切なドキュメントが存在しない現状があり,運用や保守に支障をきたしている。
- プライマリキーの宣言不足,パフォーマンス向上のための外部キー制約の削除,曖昧なカラム名など,スキーマ理解を困難にする問題が多い。
- 統計分析とLLMの反復改良を組み合わせることで,ドキュメント不足のデータベーススキーマを効率的に理解し,ドキュメント化することを目指す。
- DBAutoDocは,スキーマ依存グラフを介して意味的な修正を反復的に伝播させることで,スキーマ理解の精度を高める。
- ベンチマークデータベースのテストにおいて,GeminiとClaudeを用いて全体加重スコア96.1%を達成した。
- 決定論的パイプラインは,LLMのみの外部キー検出と比較してF1スコアを23ポイント向上させ,システムの貢献度が高いことを確認した。
Minibal:対戦相手のモデリングなしでの均衡的なゲームプレイ [cs.AI]目的:均衡的なゲームプレイの実現
- ゲームAIの進化は目覚ましいが,人間とのインタラクションには課題がある。
- 既存のAIは人間を圧倒しやすく,娯楽性や教育的価値が低いという問題点がある。
- 人間とAIが互いに楽しめる,均衡のとれたゲームプレイを可能にする。
- Minibalは,Minimaxアルゴリズムの変種であり,均衡的なゲームプレイを目的として設計された。
- 7つのボードゲームにおける実験により,ある変種が最も均衡のとれたプレイを実現することが示された。
- 本研究は,エンターテイメントやシリアスゲームに適した,挑戦的で魅力的なAIエージェント設計の基盤となる。
ソフトウェア工学における燃え尽き症候群の早期発見のための機械学習モデル:体系的文献レビュー [cs.SE, cs.AI, cs.CY, cs.LG]目的:ソフトウェアエンジニアにおける燃え尽き症候群の早期発見に向けた機械学習手法の精度と有効性に関するレビュー
- ソフトウェアエンジニアの燃え尽き症候群は深刻な問題であり,生産性低下や離職率上昇につながるため,対策が急務である。
- 燃え尽き症候群の早期発見は困難であり,客観的な指標や効果的な検出手法が不足している。
- 本研究は,機械学習手法を用いた燃え尽き症候群の早期発見に関する既存研究を体系的に分析し,今後の研究の方向性を示す。
- 先行研究の多くは,感情の検出または感情的次元の利用を通じて燃え尽き症候群の検出または予測に焦点を当てていることが明らかになった。
- 機械学習アプローチの感情検出性能および,感情を捉えるためのデータセットの潜在力に関する比較分析を行った。
- 感情検出性能に優れる機械学習ツールとデータセットを特定することで,燃え尽き症候群の早期発見研究の進展に貢献できると考えられる。
心拍数に注意! クローのバックグラウンド実行が本質的に秘密裏のメモリ汚染を可能にする [cs.CR, cs.AI, cs.SI]目的:クロー型AIエージェントにおけるセキュリティ脆弱性の特定
- AIエージェントの普及に伴い,そのセキュリティ確保は不可欠である。
- AIエージェントが外部情報源から影響を受けやすい構造的欠陥が存在する。
- AIエージェントのメモリ汚染による行動変化を防ぐための対策を検討する。
- 心拍数に基づくバックグラウンド実行において,AIエージェントのメモリが外部コンテンツによって汚染される脆弱性を発見した。
- ソーシャルな信頼性の手がかりが短期的な行動に大きな影響を与え,誤った情報が最大61%の割合で影響を及ぼすことが示された。
- メモリ保存のルーチンが,短期的な汚染を最大91%の割合で長期メモリに浸透させ,セッションを跨いだ行動影響が76%に達することが確認された。
AuthorMix:層別アダプター混合によるモジュール式著述スタイル転移 [cs.CL, cs.AI]目的:著述スタイル転移のモジュール化と効率化
- 自然言語処理におけるスタイル制御は,多様な文章生成に不可欠である。
- 既存手法は,汎用性が低く,意味保持とスタイル転移のバランスが課題である。
- 少ないデータでターゲット特有のスタイルに適応できる手法を開発すること。
- AuthorMixは,層別アダプター混合により,低リソースのターゲット著者に対して既存の最先端手法を上回る性能を示す。
- 特に,意味保持の面で顕著な改善が認められる。
- GPT-5.1を含む既存モデルと比較しても,高い全体スコアを達成した。
非圧縮性ナビエ・ストークス方程式に対する物理情報ニューラルネットワークの一般化誤差について [cs.LG, cs.NA, math.AP, math.NA]目的:非圧縮性ナビエ・ストークス方程式の解近似における物理情報ニューラルネットワークの一般化誤差の上界
- 流体シミュレーションは,気象予測,航空力学,バイオエンジニアリングなど,幅広い分野で不可欠である。
- 従来の数値解法は計算コストが高く,高次元問題への適用が困難であるという課題がある。
- 物理情報ニューラルネットワークは,少ない計算資源で高精度な解を得る可能性を秘めている。
- 本研究では,深さ2のニューラルネットワークを用いたPINNの一般化誤差に対する初めての上界を導出した。
- 導出された一般化誤差は,ネットワークの幅に明示的に依存せず,流体の運動粘性や損失正則化パラメータで特徴付けられる。
- 次元に依存しないサンプル複雑性の上界が得られ,新しい活性化関数の利用が示唆された。
LLMはマイクロサービスインフラストラクチャパターンのインスタンスを検出できるか [cs.SE, cs.AI]目的:マイクロサービスアーキテクチャパターン検出のLLMの能力
- ソフトウェア開発において,アーキテクチャパターンは再利用性と保守性を高める重要な要素である。
- 既存のパターン検出ツールは,言語やアーティファクトの種類に制限があり,多様な環境での利用が困難である。
- LLMを活用し,言語やアーティファクトの種類に依存しないパターン検出手法を確立することを目指す。
- MicroPADを用いることで,複数の言語とアーティファクトタイプにわたるパターンインスタンスの検出が可能となった。
- パターン検出の性能は,パターンの出現頻度やアーティファクトの識別性に依存し,F1スコアは0.09から0.70まで変動した。
- 著名なアーティファクトに関連するパターンは,より確実に検出された。
MsFormer:産業機器向け堅牢な予知保全サービスを実現する [cs.HC, cs.LG]目的:産業機器の予知保全サービスの信頼性向上
- 製造業において,機器の稼働率を維持することは重要であり,予知保全は不可欠なAIサービスである。
- 既存の深層学習手法は,産業IoTセンサーデータの複雑な依存関係を捉えるための汎用的なサービス指向フレームワークを欠いている。
- マルチスケールな時間相関とデータ不足という課題に対処し,堅牢な予知保全サービスを提供することを目指す。
- 提案手法MsFormerは,マルチスケールサンプリングモジュールと位置エンコーディング機構により,マルチストリームデータの時間相関を捉える。
- データ不足環境に対応するため,軽量な注意機構とプーリング操作を採用している。
- 実データ実験の結果,MsFormerは最先端手法と比較して大幅な性能向上を示し,高い汎用性とQoSを維持している。
MedCausalX:自己反省を用いた適応的因果推論による信頼性の高い医用ビジョン言語モデル [cs.RO, cs.NI, cs.AI]目的:医用ビジョン言語モデルにおける信頼性の高い因果推論の実現
- 医療分野における正確な診断は,患者の治療成績に直結するため,高い信頼性が求められる。
- 既存の医用CoTモデルは,因果関係を明示的に表現・強化する仕組みがなく,誤った相関関係に依存しやすい。
- 表面的な相関関係にとらわれず,医学的根拠に基づいた因果推論を行うモデルを構築すること。
- MedCausalXは,CRMedデータセットを用いて,モデルが自律的に因果分析と検証を行う能力を獲得する。
- 診断の一貫性を+5.4ポイント向上させ,幻覚を10ポイント以上削減し,空間的根拠のIoUも最高値を達成した。
- エラーに起因する強化学習による軌跡レベルの因果修正により,真の因果関係とショートカットの関係を区別可能となった。
自己回帰型画像モデルにおける,インスタンスおよび分布レベルの報酬を用いたポリシーベースのチューニング [cs.LG, cs.CV]目的:自己回帰型画像モデルのサンプル品質と多様性の向上
- 画像生成において,自己回帰モデルは高い有効性を示す。品質と多様性の直接的な最適化が課題である。
- 強化学習による拡散モデルの調整は,出力多様性の崩壊を引き起こしやすい。自己回帰モデルも同様の問題を抱える。
- 分布レベルの報酬を導入し,サンプル多様性を明示的に促進し,モード崩壊を防ぐ。
- 提案手法では,グループ相対ポリシー最適化(GRPO)を用いて,トークンベースの自己回帰合成をマルコフ決定過程として定式化する。
- Leave-One-Out FID (LOO-FID)という新規の分布レベル報酬を導入し,特徴モーメントの指数移動平均を活用することで,サンプル多様性を促進する。
- LlamaGenとVQGANを用いた実験により,標準的な品質および多様性の指標において,わずか数百回のチューニング反復で明確な改善が示された。
SpecXMaster技術報告 [cs.CL, cs.LG]目的:NMR分子スペクトルの解釈自動化
- 物質構造とAIを結び,科学的発見を加速する上で,分光法は不可欠である。
- 従来のスペクトル解釈は,専門家依存,人的エラー,解釈者によるばらつきの問題がある。
- Agentic強化学習を用いて,スペクトル解釈の自動化と精度向上を目指す。
- SpecXMasterは,1Hおよび13Cスペクトルから多重度情報を自動で抽出可能である。
- 生データから化学構造への完全自動解釈パイプラインを構築した。
- 公開ベンチマークで優れた性能を示し,専門家による評価で改良された。
ルールと現実の間:LLMの道徳的判断における文脈依存性について [cs.AI, cs.CL, cs.CY, cs.HC]目的:LLMの道徳的判断における文脈依存性
- 道徳的判断は人間行動の根幹であり,AI倫理において不可欠な研究対象である。
- 既存研究では,LLMの道徳性評価が固定されたシナリオに限定され,文脈の影響が十分に考慮されていない。
- 本研究は,道徳心理学に基づき,人間の判断を変化させる文脈的要素を導入し,LLMの文脈依存性を評価・制御することを目的とする。
- 22のLLMを評価した結果,ほぼ全てのモデルが文脈の影響を受け,規則に反する行動への判断を変化させる傾向が確認された。
- モデルと人間の調査を比較した結果,両者は異なる文脈的要素に反応し,ベースケースで一致しても文脈依存性において一致するとは限らないことが示された。
- 活性化ステアリングという手法を用いて,モデルの文脈依存性を制御し,信頼性の高い調整が可能であることが示唆された。
ポラリス:経験抽象化によるポリシー修復を通じた小規模言語モデルのためのゲーデルエージェントフレームワーク [cs.LG]目的:小規模言語モデルにおける自己改善
- 言語モデルの能力向上は,多様なタスクへの適応と高性能化に不可欠である。
- 既存手法では,応答レベルの修正やパラメータ調整が主流であり,ポリシーレベルの体系的な改善が課題である。
- 経験抽象化によるポリシー修復を通じて,言語モデルの自己改善能力を高めることを目指す。
- ポラリスは,失敗事例を分析し,ポリシーを修正するサイクルを繰り返すことで自己改善を実現する。
- 経験抽象化により,失敗事例から得られた知見を再利用可能な戦略として凝縮し,未知の事例への応用を可能にする。
- MGSM,DROP,GPQA,LitBench等のベンチマークにおいて,ポラリスを搭載した70億パラメータモデルが,ベースポリシーや競合手法を上回る性能を達成した。
ドローンによる救急ネットワーク:スコットランドにおける心停止事例研究 [cs.LG, stat.AP]目的:ドローンを活用したAED搬送ネットワークの最適配置
- 救急医療における迅速な対応は,患者の生存率に直結するため,効率的なシステム構築が不可欠である。
- ドローンを活用した救急システムは初期費用や環境要因に左右され,実用化には課題が多い。
- 環境や運用状況に左右されない,信頼性の高いドローンネットワークの設計を目指す。
- ベイズ学習に基づいたフレームワークにより,最適なドローン基地局の配置を特定した。
- 地理的データを用いたシミュレーションの結果,都市部と農村部で最適な配置が異なることが示された。
- 費用対効果分析の結果,ドローンによるAED搬送は費用対効果が高く,救急対応の改善に貢献する可能性がある。
HGNet:科学文献からの自動知識グラフ生成のためのスケーラブルな基盤モデル [cs.CL, cs.LG]目的:科学文献からの自動知識グラフ生成
- 科学的知識の爆発的な増加に対応するため,効率的な知識整理が不可欠である。
- 既存手法では,複雑なエンティティ認識やドメイン汎化,知識の階層構造の扱いに課題がある。
- 科学分野特化型の知識グラフ構築における精度と効率性を向上させる。
- 提案手法Z-NERDは,テキスト中の意味的な転換を捉え,多語エンティティを正確に認識する。
- HGNetは,階層構造を考慮したメッセージパッシングにより,関係抽出の精度を高める。
- SciERC, SciER, SPHERE等のベンチマークにおいて,既存手法を大幅に上回る性能を達成した。
DAK-UCB:LLMおよび生成モデルのための多様性を考慮したプロンプトルーティング [cs.LG]目的:生成AIモデルのオンライン選択のための多様性考慮手法
- 生成AIの発展に伴い,ユーザーのプロンプトに応じた適切なモデル選択が重要になっている。
- 既存手法は生成品質に偏重し,多様性の欠如という問題を抱えている。
- 多様性を考慮したモデル選択により,生成結果の多様性不足を解消することを目指す。
- 提案手法DAK-UCBは,生成品質と多様性の両方を考慮したモデル選択を実現した。
- プロンプトと出力ペア間の二標本に基づく期待値を利用した多様性スコア関数を設計した。
- 実験結果から,DAK-UCBが多様性を促進しつつ,生成品質を維持できることが示された。
AI生成テキスト検出が失敗する理由:ベンチマーク精度の向こうにある説明可能なAIからの証拠 [cs.CL, cs.AI]目的:AI生成テキストの検出における問題点の解明
- 大規模言語モデルの普及に伴い,AI生成テキストの検出は喫緊の課題となっている。
- 既存の検出システムはベンチマークでは高い精度を示すものの,実環境での信頼性が不明である。
- データセット特有の要素に依存せず,AI生成テキストの本質的な特徴を捉える検出手法を開発する。
- 提案手法は,PAN CLEF 2025およびCOLING 2025のベンチマークで高い性能(F1スコア0.9734)を示した。
- しかし,クロスドメイン評価では,性能が著しく低下し,汎化性能の限界が明らかになった。
- SHAP値分析から,検出器がデータセット固有のスタイルに依存していることが示唆された。
記述・行動:蒸留された言語行動世界モデルによるプロアクティブなエージェント操縦 [eess.SY, cs.SY, cs.AI]目的:安全性に関わるエージェントの行動予測と操縦
- 安全性を重視したエージェント開発において,行動の結果を事前に予測することは重要である。
- 既存の世界モデルは,視覚シミュレーションに依存するため,計算コストが高く,リアルタイム性に課題がある。
- 視覚情報を介さずに,行動と潜在状態から将来の状態を予測し,迅速な操縦を実現する。
- DILLOは,視覚シミュレーションを回避し,テキストのみで推論を行うことで,14倍の高速化を達成した。
- MetaWorldおよびLIBEROにおける実験で,DILLOは高精度な状態記述を生成し,エピソード成功率を最大15%,平均9.3%向上させた。
- DILLOは「シミュレートして行動」から「記述して行動」というパラダイムシフトを実現した。
共形クロスモーダル能動学習 [cs.CV, cs.LG]目的:データ効率的な学習のための能動学習フレームワーク
- 画像認識の分野では,事前学習済みモデルが重要な役割を果たしている。
- 既存の能動学習法は,画像と言語の豊富な多Modal知識を十分に活用できていない。
- 画像と言語のModalを統合し,データ効率を向上させる。
- 提案手法であるCCMAは,教師あり学習におけるデータ効率を向上させる。
- CCMAは,不確実性の推定と多様性を考慮したサンプル選択により,既存の能動学習法を上回る性能を示す。
- 画像のみのモデルに対する教師モデルによる,意味に基づいた不確実性の推定を実現した。
活性化ウォーターマーキングによる言語モデルの堅牢な安全性監視 [cs.CR, cs.AI, cs.CY, cs.LG]目的:言語モデルの安全性監視における堅牢性の向上
- 大規模言語モデルの普及に伴い,悪用による情報漏洩のリスクが高まっているため。
- 既存の監視システムは,攻撃者が監視を回避しつつ有害な出力を引き出す適応的な攻撃に脆弱である。
- 攻撃者の知識を考慮したセキュリティゲームの枠組みに基づき,活性化ウォーターマーキングによる監視システムの堅牢化を目指す。
- 既存の言語モデル監視システムは,適応的な攻撃者に対して脆弱であることが示された。
- 活性化ウォーターマーキングは,監視アルゴリズムを知る攻撃者に対しても最大52%の性能向上を示す。
- 推論時に攻撃者に不確実性を導入することで,より堅牢な安全性監視を実現する。
長 horizon 確率的最適制御のためのシュレーディンガー固有関数法 [cs.CL, cs.LG, math.OC]目的:長 horizon 確率的最適制御問題に対する効率的な解法
- 高次元の確率的最適制御は,制御理論やロボティクスにおいて重要な役割を果たす。
- 従来の解法は,horizon の長さに対して線形に計算量が増加し,性能が指数関数的に低下する。
- この研究は,シュレーディンガー方程式との等価性を示すことで,長 horizon 問題を効率的に解くことを目指す。
- 制御対象のドリフトがポテンシャルの勾配である場合,ハミルトン・ヤコビ・ベルマン方程式は線形偏微分方程式に帰着する。
- この線形偏微分方程式を定義する演算子 $\mathcal{L}$ は,離散スペクトルを持つシュレーディンガー演算子 $\mathcal{S}$ とユニタリ同値であることが証明された。
- 対称線形二次レギュレータ (LQR) において,$\mathcal{S}$ は量子調和振動子のハミルトニアンと一致し,解析解が得られる。
SAiW:ソースに起因する不可視ウォーターマーキングによるプロアクティブなディープフェイク対策 [cs.AI]目的:ディープフェイクのプロアクティブな防御とメディアの来歴検証
- 情報環境において,メディアの信頼性確保は重要であり,ディープフェイクはその脅威となっている。
- 既存のディープフェイク検出法は事後対応的であり,生成技術の進化に追いつけない場合がある。
- メディア作成時に信頼性を担保し,ディープフェイクの拡散を抑制する技術が求められている。
- 本研究では,メディアの起源を埋め込むSAiWフレームワークを提案し,ウォーターマークの生成と埋め込みを可能にした。
- SAiWは,知覚的な品質を維持しつつ,圧縮,フィルタリング,ノイズ,幾何学的変換,敵対的摂動に対する高い堅牢性を示した。
- SAiWによってデジタルメディアと起源を紐付け,信頼性の高い認証と来歴の特定を実現する基盤を構築した。
意味的IDを用いた推論が生成推薦を強化する [cs.RO, cs.SY, eess.SY, cs.IR, cs.AI]目的:意味的IDに対する推論能力の強化
- 推薦システムにおいて,大規模なアイテム群から適切なアイテムを提示することは重要である。
- 意味的IDを用いた推薦では,IDと自然言語の対応関係が弱く,推論が困難である。
- IDと自然言語の対応を強化し,推論能力を高めることで推薦精度を向上させる。
- 提案手法SIDReasonerは,教師モデルを用いてIDと自然言語の対応を強化する。
- その上で,結果に基づいた強化学習により,効果的な推論経路を学習する。
- 実世界データセットでの実験により,提案手法の有効性が確認された。解釈性や汎化性能の向上も示唆された。
暗黙的RM:LLMアライメントのための暗黙的嗜好データからのバイアスなし報酬モデリング [cs.CL, cs.AI, stat.AP]目的:LLM(大規模言語モデル)のアライメントのための報酬モデルの学習
- LLMの性能向上には人間のフィードバックが不可欠であり,報酬モデリングはその重要な要素である。
- 従来の報酬モデリングは高コストな実験的フィードバックに依存しており,効率的な代替手段が求められている。
- 暗黙的な嗜好データからバイアスを取り除き,正確な報酬モデルを効率的に学習することを目指す。
- ImplicitRMは,暗黙的な嗜好データを潜在的なグループに分類することで,バイアスを軽減する。
- 提案手法は,尤度最大化による学習目的を導入し,理論的な公平性を保証する。
- 実験結果は,ImplicitRMが様々な暗黙的な嗜好データセットにおいて正確な報酬モデルを学習することを示す。
PhysSkin:自己教師ありニューラルスキニングによるリアルタイムかつ汎用的な物理ベースのアニメーション [cs.GR, cs.CV, cs.LG]目的:多様な3D形状と離散化に対応可能なリアルタイム物理ベースアニメーションの実現
- 3Dアニメーション制作において,物理シミュレーションは現実感と自然な動きを生み出す上で不可欠である。
- 従来の物理ベースアニメーションは形状やメッシュの離散化に依存し,汎用性に課題があった。
- 様々な形状に対してリアルタイムで適用可能な,汎用的な物理ベースアニメーション手法を開発すること。
- PhysSkinは,物理情報を組み込んだフレームワークであり,ハンドル変換によって定義されるモーション部分空間座標をフル空間の変形に写像する連続的なスキニング場を学習する。
- Transformerベースのエンコーダとクロスアテンションデコーダを用いたニューラルスキニング場オートエンコーダにより,メッシュフリーで離散化に依存しない,物理的に整合性のとれたスキニング場を生成する。
- 自己教師あり学習戦略とスキニング場正規化,および競合を意識した勾配補正により,エネルギー最小化,空間滑らかさ,直交性制約のバランスを効果的に実現し,リアルタイム物理ベースアニメーションを可能にする。
より疎で,高速,軽量なTransformer言語モデル [cs.LG, cs.CL]目的:Transformer言語モデルの効率化
- 大規模言語モデルは目覚ましい進歩を遂げているが,計算コストが課題である。
- モデルのパラメータ数が増加すると,計算量とメモリ使用量が増大する。
- モデルの疎性を高めることで,効率性とスケーラビリティを向上させる。
- フィードフォワード層に非構造化疎性を導入することで,計算コストを削減できる。
- L1正則化により99%以上の疎性を実現し,性能への影響は無視できるレベルである。
- 提案手法は,モデルの規模が大きくなるほど,スループット,エネルギー効率,メモリ使用量の改善に貢献する。
超低遅延な深層スパイクニューラルネットワークのための遅延符号化フレームワーク [eess.SY, cs.SY, cs.NE]目的:深層遅延符号化スパイクニューラルネットワークの効率的な学習手法
- スパイクニューラルネットワークは,エネルギー効率の高い神経処理を実現する生物学に基づいた計算パラダイムとして注目されている。
- 従来のTime-To-First-Spike (TTFS) 符号化モデルは,効率的な学習方法が不足しており,推論遅延が大きいという課題があった。
- 本研究は,深層ネットワークにおける勾配消失問題を軽減し,TTFS符号化の性能を向上させることを目指している。
- 提案手法は,既存のTTFS符号化スパイクニューラルネットワークと比較して,最先端の精度と超低遅延を実現した。
- 遅延符号化は,入力の破損に対するロバスト性も向上しており,迅速な応答が求められるシナリオでの応用が期待される。
- 本研究は,スパイクニューラルネットワークの時間的学習能力を活用するための貴重な知見を提供する。
多グループ学習へのワンインクルージョングラフアプローチ [cs.LG]目的:多グループ学習のサンプル複雑性に関する上限
- 機械学習において,多様なデータグループを扱うことは,現実世界の多くの問題に応用可能であるため重要である。
- 多グループ学習では,グループ構造を考慮した効率的な学習アルゴリズムの設計が課題となっている。
- 本研究は,多グループ学習における最適な学習率を達成し,サンプル複雑性を最小化することを目的とする。
- 本研究では,二部$b$-matchingの一般化を用いて,ワンインクルージョングラフ予測戦略を拡張したアルゴリズムを提案する。
- グループ実現可能性を仮定した場合,提案アルゴリズムは$\log n / n$という最適な収束率を達成することを示した。
- 学習目標を緩和した場合,グループ実現可能性のもとで,最適な$1/n$収束率を達成することを示した。
AIによる著者性の解読:LLMは文学と政治における人間の文体を真に模倣できるか [cs.CL, cs.LG]目的:LLMの文学および政治における著者スタイルの模倣能力の評価
- 生成AIの発展に伴い,著作権や情報の信頼性に関する問題が重要になっている。
- LLMによる人間様式の模倣は進んでいるが,その精度には限界がある。
- LLMの文体模倣における統計的差異を特定し,今後の改善の基準を提供する。
- AIが生成したテキストは,XGBoostモデルによって高い精度で識別可能であることが示された。
- 文体の識別において,パープレキシティが最も重要な指標であることが判明した。
- LLMは構文や可読性などの低次元特徴では人間の文体と収束するが,感情的なニュアンスや文体的な多様性の再現には至っていない。
可変体制下における学習理論:一般的な機械学習 [cs.LG, cs.AI, stat.ML]目的:体制変化下での学習に必要な学習理論的対象の定義とその最初の定理を支持する帰結の確立
- 機械学習は,様々な分野で重要な役割を果たしており,その理論的基盤の確立が不可欠である。
- 従来の学習理論は,体制が固定されていることを前提としており,変化する状況への対応が困難である。
- 本研究は,体制変化を考慮した学習理論の枠組みを構築し,理論的な基盤を確立することを目的とする。
- 可変体制下学習のための,許容可能な輸送,保護されたコアの維持,評価者認識型学習進化を中心とした枠組みが開発された。
- 忠実な固定オントロジー削減の構造的障害議論や,評価者因子分解に関する定理層の結果が示された。
- 二体制の例を用いて,許容性証明書,保護された評価コア,体制変動コストを具体的に示した。
PERMA:イベント駆動型嗜好と現実的なタスク環境によるパーソナライズされたメモリ・エージェントのベンチマーク [cs.AI]目的:パーソナライズされたメモリ・エージェントの性能評価
- 大規模言語モデルを実用的なエージェントとするには,長期的な記憶が不可欠である。
- 従来の評価では,嗜好関連の対話と無関係な会話が混在し,正確な嗜好抽出が困難であった。
- 時間経過に伴う嗜好の変化や,ノイズの多いコンテキスト下での嗜好の累積を評価する。
- PERMAベンチマークは,静的な嗜好の想起を超えて,時間経過に伴うペルソナの一貫性を評価するように設計された。
- 関連する対話をリンクさせることで,より正確な嗜好を抽出し,トークン消費量を削減できることが示された。
- しかし,時間的な深さやクロスドメイン干渉における首尾一貫したペルソナの維持には課題が残る。
GEM:オフライン強化学習における行動規範化された候補行動選択のためのガイデッド期待値最大化 [cs.LG]目的:オフライン強化学習における行動選択手法の改善
- 強化学習は,複雑な課題に対する自動意思決定を可能にする重要な技術である。
- 既存手法では,データセットの多様性が考慮されず,最適でない行動が選択される場合がある。
- データセット内の行動の多様性を捉え,よりロバストな行動選択を実現すること。
- GEMは,行動選択をマルチモーダルかつ制御可能にする分析的フレームワークである。
- GMMアクターを,批評家が誘導するアドバンテージ重み付けのEMスタイルの更新によって学習する。
- 候補ベースの選択により,計算コストと意思決定の質をトレードオフ可能にする。
MemCollab:コントラスト的軌跡蒸留によるエージェント間メモリ協調 [cs.AI, cs.LG]目的:エージェント間メモリ協調のためのフレームワーク
- 大規模言語モデルの応用拡大に伴い,過去の経験の再利用が重要。
- 既存手法ではエージェント固有の知識に偏り,知識共有が困難。
- エージェント間の知識を融合し,汎用的な推論リソースを構築。
- MemCollabは,異なるエージェントの推論軌跡を比較することで,エージェントに依存しないメモリを構築する。
- タスクに応じた検索機構により,関連性の高い制約のみを推論時に利用する。
- 数学的推論やコード生成において,多様なエージェント間で精度と効率が向上する。
人間による視覚パズル解決におけるオンラインライブラリ学習 [cs.AI]目的:人間による視覚パズル解決における効率的な抽象化の形成と再利用
- 複雑な課題解決において,抽象化は認知負荷を軽減し,効率的な学習を促進する重要な要素である。
- 既存研究では,課題解決における抽象化の形成過程や,その再利用メカニズムが十分に解明されていない。
- 本研究は,課題解決過程におけるオンラインでのライブラリ学習メカニズムを明らかにすることを目的とする。
- 実験の結果,参加者は初期段階で多くのヘルパー(中間構造)を作成し,徐々にその選択と利用を効率化していった。
- ヘルパーへのアクセスは,参加者が困難なパズルを解決する上で有効であることが示された。
- 計算モデルの結果,探索空間の大きさは課題解決時間と操作回数に影響する一方,プログラム長は失敗予測には寄与するが,労力には影響しないことが示唆された。
モデルベース強化学習における適応と計画のためのニューラル常微分方程式および確率微分方程式モデル [cs.LG, cs.AI]目的:モデルベース強化学習における,確率的ダイナミクスのモデリング
- 強化学習は,複雑な環境下での最適な意思決定を自動化する重要な技術である。
- 従来のモデルベース強化学習は,環境の不確実性を十分に捉えきれない場合がある。
- ニューラルODE/SDEを用いて環境の確率的ダイナミクスをより正確にモデル化し,性能向上を目指す。
- ニューラルSDEは,遷移ダイナミクスの固有な確率性をより効果的に捉え,困難なシナリオで高い性能とサンプル効率を実現した。
- ニューラルODE/SDEを用いることで,環境ダイナミクスの変化に対するポリシーの適応を効率的に行うことができた。
- 潜在SDEモデルは,既存のモデルベースおよびモデルフリーのアプローチと比較して,良好な結果を示した。
ギャップ認識生成を用いた異種DAGスケジューリング学習手法 [cs.LG, cs.AI, math.OC]目的:異種環境におけるDAGスケジューリングの効率化
- 計算資源の制約下でDAGを効率的に実行することは,科学計算やデータ処理等の分野で重要である。
- 環境変化への適応性と迅速なスケジューリングが求められる一方で,既存手法では最適解からの乖離が生じやすい。
- タスクと計算資源の適合性を考慮し,生成時の最適性ギャップを解消するスケジューリング手法を提案する。
- 提案手法WeCANは,タスクと計算資源間の適合係数を考慮し,単一パスで効率的なスケジューリングを実現する。
- 生成マップの到達可能解集合を解析し,最適性ギャップが発生するメカニズムを解明。ギャップ解消の条件を導出した。
- 実験結果から,WeCANは既存手法と比較して,makespanの短縮と高速な推論時間を実現することが示された。
AIは人間の表現に追いついているか:英語とアラビア語における感情,性格,著者性,言語様式に関する6つの大規模言語モデルの探求 [cs.CL, cs.LG]目的:感情,性格,著者性,言語様式に関する大規模言語モデルの能力評価
- 言語処理技術の進展は,人間とAIのコミュニケーションにおいて重要な役割を果たす。
- AI生成テキストと人間が作成したテキストの区別が困難になりつつある。
- AIが人間らしい表現をどれだけ模倣できるか,その限界を明らかにすること。
- AI生成テキストは人間が作成したテキストと識別可能であった(F1>0.95)。
- 感情や性格の分類において,人間データで訓練された分類器はAI生成テキストに対して性能が低下した。
- AI生成データで訓練を補強することで,アラビア語の性格分類タスクの性能が向上し,低リソース言語への応用可能性が示唆された。
NTN O-RANにおけるSplit-RICオーケストレーションのためのAIライフサイクル対応実現可能性フレームワーク [cs.NI, cs.AI]目的:非地上ネットワーク(NTN)におけるSplit-RICアーキテクチャを通じたO-RAN制御階層の分散の実現可能性
- 衛星通信は,広範なエリアへの接続を可能にする重要な技術であり,災害対策や遠隔地での利用に不可欠である。
- 衛星のSWaP(サイズ,重量,電力)制約とフィードリンク容量の限界により,AI統合が困難であるという課題が存在する。
- 本研究は,衛星上でのAI推論と学習ループを物理的に優先させる条件を明確にすることを目指している。
- 地上中心制御,地上-LEO Split-RIC,GEO-LEO多層制御の3つの展開シナリオを比較検討した。
- 各シナリオにおいて,トレーニングデータ転送,モデル配信,ニアリアルタイム推論を考慮したライフサイクルエネルギーとライフサイクル遅延の閉形式表現を導出した。
- フィードリンク条件,モデル複雑性,軌道間欠性に関する感度分析から,オペレーターにとって有益な実現可能性領域が明らかになった。
置換対称性を考慮した拡散による無条件分子生成 [cs.LG]目的:無条件分子生成における置換対称性のモデリング
- 分子表現において,置換対称性は重要な性質であり,分子の記述に不可欠である。
- 既存の拡散モデルでは,置換対称性を直接的に扱うことが難しく,間接的な方法に頼っている。
- 本研究では,置換対称性を考慮した拡散モデルを提案し,効率的な分子生成を目指す。
- 商多様体上での拡散を直接モデリングすることで,既存手法と比較して効率が向上した。
- 置換対称性を考慮したスコア関数の近似には,置換空間におけるMCMCを用いた。
- QM9データセットにおける実験で,提案手法は競争力のある生成品質を示した。
SynForceNet:リチウムイオン電池の故障診断のための力駆動型グローバル・ローカル潜在表現フレームワーク [cs.LG]目的:リチウムイオン電池のオンライン安全故障診断手法
- 電気自動車の普及に伴い,リチウムイオン電池の安全性確保が不可欠である。
- 実際の運用における複雑かつ稀な安全上の重大な状態での故障診断が困難である。
- 複雑な故障特性の把握と,正常状態の境界をよりコンパクトに表現することを目指す。
- 提案手法は,20台の電気自動車から収集された860万件の有効なデータを用いて検証された。
- 既存の高度な手法と比較して,TPR,PPV,F1スコア,AUCにおいてそれぞれ平均7.59%,27.92%,18.28%,23.68%の改善が確認された。
- 故障表現の空間的分離を分析し,潜在空間内の多様体構造を学習することで,フレームワークの堅牢性を高めた。
SafeSeek: 言語モデルにおける安全性回路の普遍的な帰属 [cs.LG, cs.AI]目的:言語モデルにおける安全性回路の特定
- 大規模言語モデルの安全性確保は,社会実装において不可欠である。
- 既存手法は汎用性に欠け,信頼性が低いという課題がある。
- 安全性に関わる機能回路を特定し,効率的な安全性改善を目指す。
- 本研究で提案するSafeSeekは,最適化を通じて言語モデル内の機能的に完全な安全性回路を特定する。
- バックドア攻撃の実験では,0.42%の疎性を持つ回路を特定し,削除により攻撃成功率を100%から0.4%に低減させた。
- 安全性アライメントの実験では,回路削除により攻撃成功率が0.8%から96.9%に上昇し,安全性回路を除外した学習により96.5%の安全性を維持した。
全てのトークンが等しくない:LLMに対するクエリ効率の良い脱獄ファジング [cs.CR, cs.AI, cs.LG]目的:LLMの脱獄プロンプト探索における効率向上
- LLMは広く利用されているが,ポリシー違反出力のリスクが存在し,安全性評価が重要である。
- 従来のファジング手法は全てのトークンを均等に扱い,効率的な探索が困難であった。
- トークンごとの貢献度を考慮し,少ないクエリで脱獄プロンプトを発見することを目指す。
- トークンレベル分析により,トークンの貢献度に偏りがあることが示された。
- 代替モデルを用いてトークン貢献度を推定することで,脱獄ファジングの効率を向上させた。
- 提案手法TriageFuzzは,既存手法と比較して同等の攻撃成功率で,大幅に少ないクエリ数で結果を得た。
人間とマルチエージェントのインタラクションのためのマルチモーダルフレームワーク [cs.RO, cs.AI]目的:人間とマルチエージェントのインタラクション
- ロボット技術は社会実装が進んでおり,人間との自然な協調が重要である。
- 既存システムでは,マルチモーダル知覚と協調的行動の一体化が困難である。
- マルチエージェント間の協調と,人間らしい自然なインタラクションを実現する。
- 提案フレームワークは,各ロボットを自律的な認知エージェントとして機能させる。
- LLMを活用した計画立案と,身体表現を統合することで,より自然なインタラクションを可能にする。
- 集中型協調メカニズムにより,ロボット間の発話や行動の衝突を防ぎ,円滑なインタラクションを実現した。
LLMベースのソーシャルネットワークにおける脆弱性の発生:Moltbookの事例 [cs.RO, cs.SI, cs.AI]目的:LLMベースのエージェント間のソーシャルネットワークの構造と脆弱性
- 大規模言語モデルの発展により,AIエージェントが自然言語で交流する環境が実現し,集団行動の研究に新たな機会を提供している。
- 既存のソーシャルネットワークでは,中心的なノードへの攻撃に対する脆弱性が問題視されている。
- LLMベースのソーシャルネットワークにおける構造的脆弱性を明らかにし,集中化の傾向を分析すること。
- Moltbookのネットワーク分析により,ノード間の接続度に大きな偏りが見られ,少数ノードが大部分の接続を集中させている。
- ネットワークはランダムなノード削除には比較的強いが,高次数ノードへの攻撃に対しては非常に脆弱である。
- AIエージェントのソーシャルシステムは,強い集中化と構造的脆弱性を生み出す可能性が示唆された。
気温と相対湿度の時間別予測における機械学習モデルの比較研究 [cs.LG, cs.AI]目的:気温と相対湿度の時間別予測のための機械学習モデルの性能評価
- 都市管理において,気温と相対湿度の正確な短期的予測は不可欠であり,特に地形の複雑な都市において重要である。
- 地形が複雑な都市においては,気象予測の精度が課題となっている。
- 本研究は,構造化された気象時系列データの予測において,tree-based ensemble learningの有効性を示す。
- XGBoostが,気温予測で0.302℃,相対湿度予測で1.271%のMAEを達成し,全体的に最も優れた性能を示した。
- 両方の予測タスクにおいて,平均R2は0.989という高い値を示した。
- tree-based ensemble learningが,山岳都市における知的な気象予測に有効であることが示された。
LLMオリンピアッド:モデル評価が厳封試験を必要とする理由 [cs.AI, cs.CL]目的:大規模言語モデルの評価方法
- 自然言語処理分野の進歩を測る上で,客観的な評価が不可欠である。
- ベンチマークのスコアが,実力ではなく最適化やデータ汚染の影響を受けている可能性がある。
- 信頼性の高い評価を通じて,モデルの真の能力を正確に把握することを目指す。
- 厳封試験形式の評価イベント(オリンピアッド)を提案し,結果の信頼性と再現性を高める。
- 問題と評価コードを公開することで,結果の検証と監査を可能にする。
- ベンチマーク追跡やテストデータの流出といった問題を抑制し,より公平な評価を目指す。
3Dガウススプラッティングに対するドロップイン知覚最適化 [cs.CV, cs.LG, eess.IV]目的:3Dガウススプラッティングの知覚的な品質向上
- 3Dコンテンツのリアリティは重要であり,人間の視覚体験に直接影響する。
- 既存の3DGS手法は,ピクセルレベルの損失関数に依存しており,結果として画像がぼやけることがある。
- より知覚的に優れた損失関数を探索し,3DGSのレンダリング品質を向上させる。
- 正則化されたWasserstein Distortion(WD-R)が,他の損失関数と比較して,微細なテクスチャの再現において優れた性能を示した。
- WD-Rは,元の3DGS損失やPerceptual-GSよりも,人間の評価者から2.3倍以上の好意を得た。
- WD-Rは,Mip-SplattingやScaffold-GSなどのフレームワークにおいても,知覚品質を向上させ,ビットレートを約50%削減した。
カリキュラム駆動型3D CTレポート生成:言語非依存型ビジュアルグラフティングとゾーン制約圧縮 [cs.CV, cs.AI]目的:3D CTボリュームからの放射線科レポートの自動生成
- 医療画像診断の効率化が求められており,レポート作成の自動化は重要な課題である。
- 大規模言語モデルはテキスト情報に偏りやすく,画像情報を十分に活用できていない点が課題である。
- 画像情報を活用し,より正確なレポートを生成するフレームワークの構築を目指す。
- 提案手法 Ker-VLJEPA-3B は,CT-RATEベンチマークにおいて既存の最先端手法を3.6%上回るマクロF1値0.429を達成した。
- 閾値最適化により,さらにマクロF1値は0.448(+8.2%)に向上し,高い性能を示した。
- 生成品質の56.6%は患者固有の視覚コンテンツに由来することが示唆され,視覚情報の重要性が確認された。
適応階層的画像-テキスト表現:ARGENT [cs.NI, cs.CV, cs.LG]目的:画像とテキストの階層的表現の学習
- 視覚と言語概念は階層構造を持つため,それを捉える表現が重要である。
- ユークリッド空間では階層構造を歪曲してしまうという課題がある。
- 双曲幾何学を用いたVLMsにおける階層崩壊を防ぎ,信頼性の高い評価手法を確立する。
- 適応的エンタイトルメント損失とノルム正則化により,階層崩壊を抑制し,双曲VLMの性能を向上させた。
- 角度に基づく確率的エンタイトルメントプロトコル(PEP)を導入し,階層的理解の評価を改善した。
- 画像分類,テキスト-画像検索,階層的指標において,既存の最先端の双曲VLMを上回る結果を示した。
