arXiv雑要約
AI - 2025/10/13 公開
サブスペース最適化によるVision Transformerの効率的なリソース制約下での学習 [cs.LG]目的:Vision Transformerの学習におけるリソース制約の緩和
- AI技術の普及に伴い,エネルギー消費量とデータプライバシーの確保が重要課題となっている。
- 大規模なニューラルネットワークがオンデバイス学習の大きな障壁となっている。
- Transformerモデルにおけるメモリボトルネックを解消し,効率的な学習を可能にすること。
- 提案手法WASIは,従来の学習と同等の精度を維持しつつ,メモリ使用量を最大62倍削減する。
- WASIは,計算コスト(FLOPs)を最大2倍削減し,推論効率を向上させる。
- Raspberry Pi 5上での実験により,WASIは従来の学習よりも約1.5倍高速な学習と推論を実現した。
AIによる医療指導における社会的不平等:Dr. Bias [cs.AI, cs.CY]目的:AI医療指導における社会集団間の格差の分析
- 医療資源の格差が深刻であり,誰もが公平な医療を受けられる社会が求められている。
- AI医療指導は普及が期待されるが,社会的な背景やバイアスが考慮されていない。
- AI医療指導におけるバイアスが,特定の社会集団に不利益をもたらす可能性を検証する。
- LLMを用いた医療指導において,回答内容が社会集団によって系統的に異なることが示された。
- 先住民やインターセックスの患者に対しては,より読みにくく,複雑なアドバイスが生成される傾向が見られた。
- 複数の社会属性が重なる集団においては,この傾向がさらに顕著になることが確認された。
階層的リベースにおける頑健性と正則化 [cs.LG]目的:モデル統合スキームの性能向上
- 機械学習モデルの組み合わせは,性能向上や汎化性能の向上に繋がる重要な手法である。
- 既存のモデル統合手法では,統合されたモデルの頑健性が十分に確保されていない場合がある。
- 階層的リベースを用いることで,モデルの頑健性を高めることを目指す。
- 提案手法は,標準的なMergeManyアルゴリズムを大幅に上回る性能を示すことが確認された。
- リベースによって,統合されたモデルに敵対的摂動に対する頑健性が誘導されることが示された。
- しかしながら,実験結果からは,オリジナル論文で報告されているよりも大きな性能低下が観察された。
ペアワイズ接続を超えて:グローバル制約下での高次機能的脳ネットワーク構造の抽出 [cs.LG]目的:高次機能的脳ネットワーク構造の抽出
- 脳機能ネットワーク解析は,認知神経科学における重要な研究分野であり,脳の活動パターン理解に不可欠である。
- 既存の脳ネットワークモデリングは,局所的なペアワイズ相互作用に依存しており,高次の依存関係を捉えることが困難である。
- グローバル制約を考慮した高次脳ネットワーク構造抽出により,より正確で効率的な脳機能解析を目指す。
- 提案手法GCMは,5つのデータセットと2つのタスク設定において,相対精度が最大30.6%向上し,計算時間が96.3%削減された。
- GCMは,信号同期,被験者識別,期待されるエッジ数,データラベルといった4種類のグローバル制約を組み込むことで,異なるモデリング解像度レベルに対応する。
- 本研究は,脳機能ネットワーク構造学習に関する新たな視点を提供し,認知神経科学の学際的な応用を促進する基盤となる。
RepDL:ビットレベルで再現性のある深層学習の学習と推論 [cs.LG, cs.SE]目的:深層学習の学習と推論における再現性の確保
- 深層学習は高い性能を発揮するが,再現性の問題が実用上の課題となっている。
- ランダム性制御は可能だが,浮動小数点演算の非一貫性が再現性を阻害する。
- 浮動小数点演算における丸め誤差と演算順序依存性を解消し,ビットレベルでの再現性を実現する。
- RepDLは,様々な計算環境において決定論的かつビットレベルで再現可能な深層学習を可能にするオープンソースライブラリである。
- 正しい丸め処理と演算順序の不変性を強制することで,浮動小数点演算の非一貫性を克服している。
- RepDLを用いることで,異なるプラットフォーム間での学習・推論結果の一致性が保証される。
深層継続学習における破滅的忘却の暗黙の敵対性について [cs.LG, cs.AI]目的:深層継続学習における破滅的忘却の根本原因の解明
- 機械知能において,人間のように新しいスキルを継続的に獲得することが求められている。
- 深層ネットワークにおいて,破滅的忘却の根本原因が未だ十分に解明されていない。
- 破滅的忘却が,新しいタスクの学習が古いタスクの知識に対する暗黙の敵対攻撃であることの解明。
- 新しいタスクの学習は,古いタスクの損失関数の鋭い方向と自動的に正確に一致し,破滅的忘却を引き起こすことが示された。
- この敵対的な一致は,損失関数の鋭い方向が稀にしか分布していないため,偶然によって起こりえない。
- 提案手法backGPは,勾配投影法よりも平均して10.8%の忘却を削減し,12.7%の精度向上を実現した。
クリケットショット分類のための最新深層学習アプローチ:包括的なベースラインスタディ [cs.CY, cs.HC, cs.CL, cs.CV, cs.AI]目的:クリケットショット分類のための深層学習アプローチの比較検討
- スポーツ映像解析は,競技パフォーマンスの評価や戦略分析に不可欠であり,その重要性は増している。
- 既存研究における評価指標と,実際の実装結果との間に大きな乖離が見られ,再現性の問題が深刻である。
- 標準化された評価プロトコルと最新アーキテクチャにより,クリケットショット分類の精度向上を目指す。
- 先行研究で報告されている精度(96%,99.2%,93%)に対し,再現実験ではそれぞれ46.0%,55.6%,57.7%という結果となった。
- EfficientNet-B0とGRUを組み合わせた最新SOTAアプローチは,92.25%の精度を達成し,大幅な改善の可能性を示した。
- PyTorch Lightningを用いた再現可能な研究プラットフォームを構築し,標準化された評価の重要性を明らかにした。
データ拡張とニューラルネットワークによるロバストな疫病予測:イタリアのCOVID-19への応用 [cs.RO, cs.MA, cs.CL, math.NA, cs.LG, cs.NA]目的:ニューラルネットワークの学習段階改善と,それによる予測精度向上
- 感染症の発生予測は,公衆衛生上の対策を講じる上で不可欠であり,社会への影響を最小限に抑えるために重要である。
- 既存の予測モデルは,データ不足や不確実性の影響を受けやすく,予測精度が十分でない場合がある。
- データ拡張により,学習データを増やし,モデルのロバスト性を高めることで,予測精度を向上させる。
- データ拡張によって学習されたニューラルネットワークは,予測性能が大幅に向上することが示された。
- 非線形自己回帰(NAR)モデルは,短期予測において特に効果的であり,物理的制約を組み込むことなくデータから直接ダイナミクスを学習する。
- 物理情報ニューラルネットワーク(PINN)は,定量的予測の精度は低いものの,長期的なシステムの定性的挙動を捉えるのに適している。
より安全で理解可能な運転者の意図予測に向けて [cs.CV, cs.AI, cs.HC]目的:運転者の意図予測における解釈可能性の向上
- 自動運転技術の発展に伴い,人間とシステムの円滑なインタラクションが不可欠となっている。
- 深層学習ベースのシステムでは,環境やタスクに対する理解が困難であり,解釈可能性が課題となっている。
- 運転者の意図予測の解釈可能性を高め,安全な自動運転システムの開発に貢献すること。
- 新たなマルチモーダルデータセットDAAD-Xを構築し,運転者の視線と車両視点からの説明を提供した。
- Video Concept Bottleneck Model (VCBM)というフレームワークを提案し,一貫性のある説明生成を可能にした。
- Transformerベースのモデルが,従来のCNNベースのモデルよりも高い解釈性を持つことを示した。
マルチモーダルプロンプト最適化:MLLMのための複数モダリティ活用について [cs.LG, cs.AI, cs.CL]目的:マルチモーダルプロンプト最適化
- LLMの発展により,画像や動画などテキスト以外の情報も扱えるMLLMが登場し,応用範囲が広がっている。
- 既存のプロンプト最適化手法はテキストに限定されており,MLLMの潜在能力を十分に引き出せていない。
- テキストと非テキストの両方を最適化することで,MLLMの性能向上を目指す。
- 本研究では,マルチモーダルプロンプト最適化のためのフレームワークMPOを提案した。
- MPOは,アラインメントを維持した更新によりマルチモーダルプロンプトを同時に最適化する。
- また,ベイズベースの選択戦略を用いて候補プロンプトの選択をガイドし,既存手法を上回る性能を示した。
Flow-Opt:フローマッチングと微分可能最適化を用いたスケーラブルな集中型マルチロボット軌道最適化 [cs.RO, cs.LG]目的:マルチロボット軌道最適化の計算効率向上
- 複数ロボットの協調制御において,滑らかな軌道を生成し,複雑な環境での作業を可能とする点が重要。
- 集中型軌道最適化は計算コストが高く,ロボット数が増えると実用化が困難となる問題がある。
- フローマッチングと学習に基づき,集中型軌道最適化の計算効率を向上させることを目指す。
- 提案手法Flow-Optは,数十機のロボットの軌道を,従来の集中型最適化手法よりも大幅に高速に生成可能。
- 生成される軌道は,競合手法と比較して滑らかであり,拡散モデルベースの手法よりも高速である。
- 各コンポーネントのバッチ処理が可能であり,多数の問題インスタンスを短時間で解決できる点が特徴。
データポイズニング攻撃に対する証明可能なウォーターマーキング [cs.RO, cs.CR, cs.LG]目的:データポイズニング攻撃におけるウォーターマーキングの実現可能性と有効性の証明
- 機械学習システムのセキュリティ確保は重要であり,データ改ざん攻撃からの防御が不可欠である。
- データポイズニング攻撃が巧妙化し,悪意のないものと区別がつきにくくなっている。
- データポイズニング攻撃の生成者が自身のデータセットを主張できるよう,ウォーターマーキングを導入し,不正利用を防止する。
- 本研究では,データポイズニング攻撃に対する2つの実用的かつ証明可能なウォーターマーキング手法(後処理型と同時型)を提案した。
- 理論的解析により,ウォーターマーキング長が特定の条件を満たす場合,ウォーターマークの検出可能性とポイズニングの効果を同時に保証できることを示した。
- 複数の攻撃,モデル,データセットを用いた実験により,提案手法の有効性を検証した。
DICE:SLM誘導によるCoT修正を通じたLLMの構造化推論 [cs.CL, cs.AI]目的:LLMの出力に対する構造化された要求への適合性向上
- 大規模言語モデルの応用拡大に伴い,特定の出力形式への適合が重要となる。
- LLMは推論能力を優先し,詳細な指示への適合が不十分な場合がある。
- SLMを用いてLLMの出力を修正し,構造化された要求への適合を改善すること。
- DICEは,LLMの知識と推論能力を維持しつつ,出力の構造化を保証する。
- 構造化CoT適応データセットを構築し,SLMを二段階チューニングすることで,構造化出力生成能力を向上させた。
- 実験の結果,DICEはLLMの出力形式精度と内容の正確性をそれぞれ35.4%,29.4%向上させ,最先端の性能を達成した。
IRIS:表形式データなしにおける検証可能な因果発見のための反復統合フレームワーク [cs.CL, cs.LG]目的:因果関係発見のための反復統合フレームワーク
- 科学研究の根幹であり,現象の理解や予測に不可欠な分野である。
- 既存手法は,データ収集コストや既知関係の再計算,非現実的な仮定などが課題となっていた。
- 初期変数のみからリアルタイムで因果関係を発見し,既存手法の課題を解決することを目指す。
- IRISは,文献検索とLLMを活用し,既知と新規の関係の両方を効率的に発見する。
- 欠損変数提案コンポーネントにより,因果グラフを拡張し,より包括的な分析を可能にする。
- 表形式データに依存せず,初期変数からリアルタイムで因果関係を発見できる。
FM-IRL:強化学習における報酬モデリングと方策の正則化のためのフローマッチング [cs.RO, cs.LG]目的:強化学習における報酬モデリングと方策の正則化
- 強化学習は,自律的な意思決定システムの開発に不可欠であり,様々な分野で応用が期待されている。
- 模倣学習は,専門家の行動から学習するが,未踏の状況への汎化性能が課題となる場合がある。
- 本研究は,フローマッチングの表現力を活用し,効率的なオンライン探索と安定した方策学習を実現する。
- 提案手法は,シンプルなMLP構造の方策を用いて環境を探索し,オンラインで更新することで,学習効率を大幅に向上させる。
- 教師となるフローマッチングモデルを用いて方策を正則化することで,方策学習の安定性を高めている。
- 特に,最適ではない専門家のデータから学習する場合において,汎化性能と頑健性が向上することが確認された。
救助活動における医療知識融合のための知識ソース統合手法の比較 [cs.AI]目的:医療知識融合の最適化
- 医療現場では,専門知識と患者情報に基づいた迅速な意思決定が重要である。
- 医療知識は複雑多様であり,統合的な活用方法が課題となっている。
- 救助活動における知識ソースの統合による,迅速かつ的確な意思決定支援を目指す。
- 本研究では,医療知識融合のための概念モデルを複数提案した。
- 知識グラフ構造に基づき,多様な知識ソースの統合方法を評価した。
- 知識融合によって,救助活動における情報提供能力の向上が期待される。
反応実現可能性予測のための素因子説明 [cs.LG]目的:化学反応の実現可能性を予測するための素因子説明の定式化と計算手法
- 自動合成計画において,化学反応の実現可能性予測は重要な役割を担っている。
- 既存の予測モデルは高い精度を示す一方,透明性や解釈性に課題がある。
- 反応実現可能性予測における必要十分な理由を特定し,モデルの解釈可能性向上を目指す。
- 素因子説明は,反応実現可能性を予測する上で本質的な分子属性を捉えることが示された。
- 提案手法は,真の素因子説明を保守的に捉えることが確認された(冗長な要素を含む場合もある)。
- 小規模反応予測タスクにおける素因子説明の計算アルゴリズムが提案された。
RegexPSPACE:LLMのPSPACE完全正規表現問題における推論能力評価ベンチマーク [cs.AI, cs.FL]目的:LLMおよびLRMの空間計算能力の限界の評価
- 自然言語処理,数学的推論,プログラミングにおけるLLMの性能向上
- LLMの有限なコンテキストウィンドウによる空間計算能力の制約
- PSPACE完全正規表現問題を用いたLLM/LRMの空間計算限界の実証的検証
- LLMおよびLRMは,PSPACE完全な正規表現問題において,冗長性や反復といった共通の失敗パターンを示すことが判明した。
- 本研究は,LLM/LRMの空間計算能力の限界を定量的に評価するための新たな枠組みを提示する。
- 100万件を超える正規表現インスタンスから構成される,厳密なフィルタリングを施したベンチマークデータセットを構築した。
クリアな道路,クリアな視界:スマート交通のためのマルチウェザー復元技術の進歩 [cs.CV, cs.AI]目的:悪天候による画像・映像劣化の軽減策に関する研究
- 自動運転など,視覚情報に依存する交通システムの安全性向上は重要である。
- 悪天候時の視覚情報の劣化が,交通システムの性能低下を招く問題がある。
- 多様な悪天候下での画像・映像復元技術の現状と課題,今後の展望を示す。
- 従来の技術と最新のデータ駆動型モデル(CNN,Transformer,拡散モデル等)を分類し,復元手法を体系的に整理した。
- 単一タスク,複数タスク,オールインワンの各フレームワークの特性と課題を明確にした。
- 複合的な劣化やリアルタイム処理,エージェントAIなど,今後の研究方向性を提示した。
マルチモーダル大規模言語モデルとコンシューマーグレードカメラを用いた肩関節障害の診断 [cs.RO, cs.CV, cs.AI, cs.CL, cs.LG]目的:肩関節障害の予備診断
- 世界的に肩関節障害は有病率が高く,特に高齢者や反復作業を行う労働者に多い。
- 医療資源が乏しい地域では,早期かつ正確な診断が困難であり,低コストで拡張性のある診断支援が求められている。
- コンシューマーグレードカメラの映像を用いて,肩関節障害の低コスト診断を可能にすること。
- 提案手法HMVDxは,直接的な動画診断と比較して肩関節損傷の診断精度を79.6%向上させた。
- 本研究では,医療における意思決定プロセスに基づいた新規指標「ユーザビリティ指数」を提案した。
- 低コストMLLMの医療応用における潜在的な価値を,医療従事者の視点から示した。
不確実性モデリングとクラウドソーシング計測による5Gユーザーのスループット特性評価 [cs.NI, cs.LG]目的:5Gにおけるユーザーのスループット特性評価手法
- 次世代ネットワークでは,高品質な通信体験の提供が重要であり,そのためにはスループットの正確な把握が不可欠である。
- 従来の測定方法では,コストや測定範囲の限界,エンドツーエンドの品質を捉えられないといった課題が存在する。
- クラウドソーシング計測を活用し,スループットの不確実性を考慮した予測モデルを構築することで,これらの課題を解決する。
- 本研究では,クラウドソーシングデータを用いて,4Gにおける既存手法を改良し,R^2値を8.7%向上させた。
- さらに,この手法を5G NSAおよび5G SAに拡張し,5Gクラウドソーシングデータセットのベンチマークを初めて提供した。
- 分析の結果,スループットのボトルネックが無線アクセスネットワークから,伝送およびサービス層へと移行していることが明らかになった。
時間に応じた公平性をデータ共有に組み込むインセンティブ [cs.LG, cs.GT]目的:データ共有における時間的要素を考慮した公平なインセンティブ設計
- 機械学習の性能向上には,複数機関のデータ連携が不可欠である。
- 従来の枠組みでは,参加タイミングの異なる状況に対応できない。
- 早期参加者のリスクを考慮し,適切な報酬を与えることでデータ共有を促進する。
- 本研究では,データ共有の早期参加者に高い報酬を与えることで,参加意欲を向上させる枠組みを提案した。
- 時間に応じた報酬決定手法を開発し,その実現可能性を合成データと実データで検証した。
- 提案手法は,公平性と個々の合理性を満たし,データ共有の促進に貢献することが示された。
深層学習モデルを用いた運動イメージ脳波デコーディングにおける合理的拡張離散ウェーブレット変換の影響調査 [cs.HC, cs.LG]目的:深層学習モデルを用いた運動イメージ脳波デコーディングにおける合理的拡張離散ウェーブレット変換の影響
- 脳波を用いたブレイン・マシン・インターフェースは,麻痺患者の運動機能回復に貢献しうる重要な技術である。
- 脳波信号はノイズが多く,個人差や時間変動の影響を受けやすく,正確なデコーディングが困難である。
- 合理的拡張離散ウェーブレット変換により脳波信号の前処理を行い,デコーディング精度向上を目指す。
- RDWTは,いくつかの深層学習アーキテクチャ(EEGTCNet,MBEEG\_SENet)において,BCI-IV-2aデータセットで平均的に明らかな性能向上を示した。
- BCI-IV-2b,HGDデータセットにおいても,RDWTは深層学習モデルの精度をわずかながら一貫して向上させた。
- 特に,不安定な記録に対してRDWTが効果的であり,局所的なノイズの軽減とリズム特有情報の強調に貢献することが示された。
CrisiText:緊急時コミュニケーションにおけるLLM訓練のための警告メッセージデータセット [cs.CL, cs.AI]目的:緊急時における警告メッセージ生成のための大規模データセット
- 自然災害やテロなど,危機的状況下での人命保護は喫緊の課題である。
- 自然言語処理技術は危機管理に応用されてきたが,警告メッセージの生成には焦点を当てられていない。
- 多様な危機シナリオに対応した警告メッセージ生成モデルの訓練と評価を可能にすること。
- 13種類の危機シナリオに対応する40万人以上の警告メッセージを含む大規模データセットCrisiTextを構築した。
- 専門家のガイドラインに基づき,正確性と事実に基づいた警告メッセージを生成している。
- 教師ありファインチューニング,ゼロショット,数ショットなどの手法で実験を行い,モデルの性能を評価した。
自律型LLMエージェント構築の基礎 [cs.AI]目的:大規模言語モデルを活用した自律エージェントのアーキテクチャと実装手法
- 実世界タスクへの応用を目指し,LLMの能力拡張が重要視されている。
- 従来のLLMは,複雑なタスクの自律実行に限界がある。
- 人間の認知能力に匹敵する,自律的な行動を可能にするエージェント開発。
- LLMエージェントの主要構成要素(知覚,推論,記憶,実行)を明らかにした。
- Chain-of-ThoughtやTree-of-Thoughtといった推論技術の有効性を示した。
- これらのシステム統合により,より高度で汎用的なソフトウェアボットが実現可能となる。
主成分分析に基づくデータ予測手法 [cs.LG]目的:欠損値の予測
- データ分析において,データの欠損は頻繁に発生し,分析結果に影響を与えるため,適切な処理が重要である。
- 欠損値の補完には様々な手法が存在するが,データの構造を考慮した適切な手法の選択が課題である。
- 本研究では,主成分分析を利用し,欠損値を含むデータセット全体の構造を捉えた予測手法を提案する。
- 提案手法は,既存データの主成分空間における線形部分空間間の距離に基づいて欠損値を予測する。
- ユークリッド距離を用いる場合の解法が提示されている。
- 伝統的な数学と機械学習の要素を組み合わせた新たな欠損値補完手法である。
Vision-Languageモデルによるゼロショット画像プライバシー分類 [cs.CY, cs.CV, cs.LG, cs.MM]目的:画像プライバシー分類の性能評価
- 画像に含まれるプライバシー保護は重要であり,技術的な対応が求められている。
- 汎用的なVision-Languageモデルの性能が,専用モデルと比較して十分に評価されていない。
- Vision-Languageモデルのプライバシー分類における限界を明らかにすること。
- Vision-Languageモデルは,パラメータ数が多いにも関わらず,専用モデルに比べてプライバシー予測の精度が低い。
- 一方で,Vision-Languageモデルは画像への摂動に対して,より高い頑健性を示すことがわかった。
- 本研究は,ゼロショットベンチマークを確立し,公平な比較を可能にした。
動的運動原始関数と強化学習を用いた障害物回避 [cs.RO, cs.AI]目的:滑らかで最適に近い3次元 Cartesian 軌道の生成
- ロボットの自律的な動作において,効率的で安全な経路計画は不可欠である。
- 従来の経路計画手法は,計算コストが高い,または多様な状況への対応が難しい場合がある。
- 単一の人工デモンストレーションから多様な軌道データセットを生成し,迅速な学習を実現すること。
- 本研究では,動的運動原始関数(DMP)を強化学習で反復的に再構成することで,様々な障害物配置に対応する軌道データセットを生成する。
- 生成されたデータセットを用いてニューラルネットワークを訓練し,障害物の形状や位置を DMPパラメータに変換する。
- シミュレーションと実機実験において,RRT-Connectと比較し,計算時間,実行時間,軌道長において優れた性能を示した。
大規模言語モデルの強化学習後学習におけるデータ汚染の検出 [cs.CL, cs.AI, cs.LG]目的:大規模言語モデルの強化学習後学習におけるデータ汚染の検出手法
- 大規模言語モデルの性能評価において,信頼性は極めて重要である。その評価の正確性を損なうデータ汚染の検出は不可欠である。
- 既存のデータ汚染検出法は,主に事前学習や教師ありファインチューニング段階に焦点を当てており,強化学習後学習段階の対策が不足している。
- 本研究は,強化学習後学習におけるデータ汚染を検出するための新たな手法を提案し,評価の信頼性向上を目指す。
- 提案手法Self-Critiqueは,モデルの出力エントロピー分布の崩壊に着目し,強化学習後のポリシーの収束を調査することでデータ汚染を検出する。
- 実験の結果,Self-Critiqueは既存手法と比較して大幅なAUC改善を示し,特に強化学習段階の汚染検出において顕著な性能を発揮した。
- 本研究で構築したベンチマークRL-MIAは,強化学習におけるデータ汚染の特性を再現し,今後の研究を促進すると期待される。
RLHFにおける感情に配慮したトリガー合成による汎化可能なバックドア攻撃 [cs.CR, cs.LG]目的:RLHFにおける汎化可能なバックドア攻撃手法
- 近年の大規模言語モデルの進化に伴い,RLHFによる調整が不可欠となっている。
- 既存のバックドア攻撃は,特定のトークンに依存し,現実的なシナリオでの有効性が低い。
- 感情的なトリガーを活用することで,より効果的かつ汎化可能なバックドア攻撃を実現する。
- GREATは,潜在埋め込み空間でトリガーを特定するパイプラインにより,代表的なトリガーを効率的に抽出する。
- Erinyesという高品質なデータセットを構築し,多様な感情的トリガーの収集を可能にした。
- ベンチマークデータセットにおける実験で,GREATは既存手法を上回り,未学習のトリガーに対しても高い攻撃成功率を示した。
SynthID-Image:インターネット規模での画像ウォーターマーキング [cs.CR, cs.AI]目的:AI生成画像に対する不可視ウォーターマークシステムの開発
- AI生成コンテンツの増加に伴い,その出所を特定する技術の重要性が高まっている。
- AI生成画像の信頼性確保が難しく,誤情報の拡散や悪用といった問題が生じている。
- 大規模な画像データに対する,効果的かつ堅牢なウォーターマーク技術の実用化を目指す。
- SynthID-Imageは,Googleのサービスにおいて100億以上の画像・動画フレームにウォーターマークを付与している。
- 外部モデルのSynthID-Oは,既存のウォーターマーキング手法と比較して,画質と堅牢性の両面で優れた性能を示している。
- 本研究の知見は,画像だけでなく音声を含む様々なメディアへの応用が可能である。
Placeit!: ロボットの物体配置スキルの学習のためのフレームワーク [cs.CL, cs.RO, cs.LG]目的:ロボットの物体配置スキルの学習フレームワーク
- ロボット工学は進歩しているが,物体配置のような基本的なスキル習得が課題である。
- 大規模かつ高品質なデータの取得が困難であり,手作業による労力が大きい。
- 多様で有効な配置姿勢を自動生成し,データ取得の効率化を目指す。
- Placeit!は,品質多様性最適化により,既存手法を上回る多様な有効姿勢を生成する。
- 構築したピッキング&プレースパイプラインは,実環境での120回の試行で90%の成功率を達成した。
- Placeit!は,オープン環境におけるピッキング&プレースタスクやシミュレーション用データ生成に役立つ。
視覚言語行動モデルに対する物理オブジェクトを用いた目標指向バックドア攻撃 [cs.CR, cs.CV, cs.LG]目的:視覚言語行動モデルへの物理的トリガーの注入による,目標指向的なバックドア攻撃の実現
- 近年のVLAモデルの発展は,ロボットの自律性を高め,様々なタスクを可能にしているため,その安全性が重要である。
- 既存のVLAに対するバックドア攻撃は,ホワイトボックス環境を前提とし,タスクの失敗を招くものであり,具体的な行動の操作が困難である。
- 本研究は,物理的なトリガーを用いて,特定の目標を達成させるバックドア攻撃の可能性を示すことで,VLAのセキュリティ脆弱性を解消することを目指す。
- 提案手法GoBAは,物理的トリガーが存在する場合,97%の入力でバックドア目標を達成できることを示した。
- クリーンな入力に対しては性能劣化が発生せず,実用的な脅威であることを示した。
- 行動軌跡やトリガーの色が攻撃性能に影響を与える一方,トリガーのサイズは影響が小さいことが明らかになった。
過大評価か真の性能か:動的評価による医療診断ベンチマークの再考 [cs.CL, cs.AI]目的:医療診断ベンチマークにおける動的評価の必要性
- 医療診断は患者ケアに不可欠であり,その質は人命に関わるため,高精度な評価が重要である。
- 既存のベンチマークは,現実の臨床現場とは異なり,試験問題に偏っているため,過大評価につながる可能性がある。
- 現実の臨床状況を反映した動的評価フレームワークを構築し,LLMの性能をより正確に評価すること。
- DyReMeは,現実の臨床現場を模倣した多様な症例を生成し,既存の静的ベンチマークの限界を克服する。
- DyReMeは,正確性だけでなく,真実性,有用性,一貫性といった臨床的に重要な側面も評価する。
- 実験結果から,最先端のLLMの性能と実際の臨床現場との間に大きな乖離があることが明らかになった。
CLARity:推論の一貫性のみで強化学習エキスパートを訓練する [cs.CL, cs.AI]目的:強化学習によるエキスパートLLMの推論品質向上
- データ不足の分野におけるエキスパートLLMの訓練は困難であり,高品質な推論能力が不可欠である。
- 従来の強化学習は精度向上は期待できるが,論理的な一貫性といった推論品質を損なう可能性がある。
- 推論の一貫性に着目し,小規模な汎用LLMを用いて,費用対効果の高い学習フレームワークを開発する。
- CLARityは,一貫性を重視した報酬メカニズムと,段階的な訓練パイプラインにより推論の一貫性を高める。
- 実験により,CLARityがベースラインと比較して,応答の一貫性を16.5%,精度を7.5%向上させることが示された。
- 人間による評価においても,一貫性とプロフェッショナリズムの総合的な向上が確認された。
発展途上国における合成データと外れ値を用いたモデルドリフトの軽減 [cs.CL, cs.LG]目的:発展途上国における金融モデルの安定性向上
- 金融モデルの精度は経済成長に不可欠であり,予測性能の維持が重要である。
- 発展途上国では,経済ショックが頻繁に発生し,金融データの分布が変動しやすい。
- 予測性能の低下を防ぐため,データ分布の変化に対するモデルの安定化を目指す。
- 合成外れ値を少量加えることで,ベースラインモデルと比較してモデルの安定性が一般的に向上した。
- 最適な外れ値の量は,データセットやモデルによって異なることが示された。
- 本研究は,中央アジア・コーカサス地域の金融データセットに対するドリフト軽減手法の調査において先行研究の一つである。
CapGeo:キャプション支援による幾何学的推論 [cs.CV, cs.AI, cs.CL]目的:幾何学的推論の精度向上
- 多岐にわたる分野で図形の理解が不可欠であり,AIによる自動化が求められている。
- 既存のマルチモーダル大規模言語モデルは,幾何学問題解決において性能が低い。
- 視覚情報をテキスト形式のキャプションに変換し,推論能力のボトルネックを解消する。
- CapGeoフレームワークにより,Qwen2.5-VL-72Bは8.6%から59.0%へ,Claude-Opus-4は44.8%から73.0%へと精度が向上した。
- 高品質な幾何学的キャプションモデルを評価するためのCapGeo-Benchデータセットを提案した。
- CapGeo-Benchのキーポイントベース評価指標は,幾何学的キャプション能力と高い相関関係を示す。
AI活用ヘルスケアプラットフォームのためのモデル駆動エンジニアリングアプローチ [eess.SY, cs.SY, cs.SE, cs.AI, cs.LG]目的:AI搭載ヘルスケアプラットフォームの構築手法
- 医療分野におけるAIの活用は,診断精度向上や個別化医療の実現に貢献し,医療の質を大きく改善する可能性を秘めている。
- 医療データの分散性,厳格なプライバシー規制,信頼性のある臨床システム構築の技術的複雑さが,AIの導入を阻害する要因となっている。
- 医療データの相互運用性を確保し,プライバシーを保護しながらAI活用を促進する実践的な道筋を提示することを目標とする。
- モデル駆動エンジニアリング(MDE)フレームワークにより,高水準な仕様から実行可能なソフトウェアへの自動変換を実現した。
- グラフィカルDSLであるMILAと連合学習アーキテクチャの組み合わせにより,生データ交換なしでの機関間連携を可能にし,プライバシーを保護しながら意味の一貫性を維持した。
- がん免疫療法に関する多施設研究において,SVMは主要なタスクで98.5%および98.3%の精度を達成し,手動コーディングの労力を大幅に削減した。
思考の連鎖の検証:計算グラフによる検証 [cs.CL, cs.AI, cs.LG]目的:思考の連鎖の推論における計算グラフの構造的特徴
- 大規模言語モデルの推論能力の信頼性評価は重要である。
- 既存手法では,推論の誤りの原因を特定することが困難である。
- 計算グラフの構造的特徴から推論エラーを検出し,原因を解明すること。
- 正誤の思考連鎖ステップにおける帰属グラフの構造的特徴に差異が認められた。
- 構造的特徴を学習した分類器により,推論エラーを高い精度で予測できた。
- エラーの構造的特徴はタスクに依存しており,異なるエラーパターンが明らかになった。
大規模言語モデルのプロンプトデータセット:詳細な分析と洞察 [cs.LG, cs.CL]目的:大規模言語モデルのプロンプトデータセットに関する分析
- 大規模言語モデルの利用拡大に伴い,その性能はプロンプトの質に大きく依存する。
- プロンプトデータセットは多様化しているが,体系的な分析は十分ではない。
- プロンプト構造の共通点と相違点を明らかにし,プロンプト最適化手法を提案する。
- 多様なチャネルからプロンプトデータセットを収集・分析し,タスク,言語,手法などの分類を行った。
- プロンプトは文学作品やウェブテキストとは異なる特徴を持つことが示された。
- 構文埋め込みを用いたプロンプト最適化により,モデル出力の妥当性が向上することが確認された。
代数ループ解法の残差に基づく学習 [cs.LG, cs.NA, math.NA]目的:代数ループの代替となるニューラルネットワーク代理モデル
- 物理現象の数理モデル化において,複雑な代数ループは計算コストの増大を招く。
- 代数ループの解は一意に定まらず,シミュレーションの安定性や収束性に問題が生じることがある。
- 残差に基づいてニューラルネットワークを学習することで,効率的かつ安定な解法を提供すること。
- 本研究では,残差を損失関数に直接組み込むことで,教師データなしでの学習を実現した。
- IEEE 14-Busシステムへの適用により,従来シミュレーションと比較して,シミュレーション時間を60%削減した。
- 誤差制御機構により,精度を維持しながら高速化を実現した。
データからの均衡学習のレート最適性 [cs.LG, cs.AI]目的:マルチエージェント模倣学習における均衡点学習の限界と,サンプル計算量においてほぼ最適なインタラクティブアルゴリズム
- 複数エージェント環境下での意思決定は複雑であり,効率的な学習手法の確立が重要である。
- 非インタラクティブな模倣学習では,学習効率の理論的限界が明確でなかった。
- 既存手法のサンプル計算量の高さを改善し,効率的な学習アルゴリズムを開発すること。
- 非インタラクティブ学習において,Behavior Cloning (BC) がレート最適であることが証明された。
- インタラクティブ学習アルゴリズム MAIL-WARM を提案し,サンプル計算量を大幅に改善した (ε⁻⁸からε⁻²へ)。
- 数値実験により,提案手法の有効性が検証され,BCが失敗する環境での学習成功が示された。
ランダム化されたHyperSteiner: 双曲線上のSteiner最小木の確率的Delaunay三角形分割ヒューリスティック [cs.CG, cs.AI]目的:双曲空間におけるSteiner最小木の構築
- 測地線距離に基づいたネットワーク解析やデータ可視化など,様々な応用において重要である。
- 既存手法は決定論的であり,局所最適解に陥りやすいという課題がある。
- 確率的な探索により,よりロバストで効率的なSteiner最小木構築を目指す。
- 提案手法RHSは,MST,Neighbour Joining,既存のHyperSteinerよりも優れた性能を示すことが実験的に確認された。
- 特に境界付近のデータにおいて,HyperSteinerと比較して総長を32%削減できるという結果が得られた。
- これにより,RHSが多様なデータに対して有効かつ堅牢であることが示された。
安全ゲーム:LPソルバーを用いたブラックボックスエージェントAIにおける安全と情報性のバランス [cs.LG]目的:安全要件と情報性のバランス
- LLMの安全な利用は重要であり,社会実装の鍵となる。
- 既存手法は再学習が必要で,変化への対応が難しい。
- モデル内部にアクセスできない状況下での安全確保を目指す。
- 本研究では,モデルに依存しないブラックボックスな安全アラインメントフレームワークを提案した。
- 安全と情報性のトレードオフを二者ゼロサムゲームとして定式化し,最適戦略を導出した。
- 推論時に線形計画法ソルバーを活用することで,安全性を確保しつつ有用な応答を生成できることを示した。
FLRC:効率的なLLM推論のための細粒度低ランク圧縮 [cs.CL, cs.AI]目的:大規模言語モデルの効率的な推論
- 近年の自然言語処理の発展を支える大規模言語モデルは,その高い性能から注目を集めている。
- モデルの巨大なパラメータ数は,リソースに制約のある環境での利用を困難にしている。
- 層ごとに最適な圧縮率を決定し,推論時の性能劣化を抑制することを目的とする。
- 提案手法FLRCは,既存の低ランク圧縮手法と比較して,要約タスクにおいてROUGE-Lスコアを最大17%向上させた。
- 層ごとの細粒度なランク割り当てと,漸進的な低ランクデコーディングにより,テキスト生成品質を維持している。
- FLRCは,大規模言語モデルの推論をより堅牢かつ効率的に行うためのフレームワークを確立した。
ノイズを含むペアワイズ比較からの効率的なベイズ推論 [cs.LG, cs.CV]目的:生成モデルの評価における信頼性向上
- 生成モデルの評価は重要だが,既存の指標では人間の選好を反映できない場合がある。
- 人間の評価は信頼性が高いが,コストがかかり,ノイズの影響を受けやすい。
- 評価者の質を考慮し,ノイズの影響を軽減することで,より堅牢なランキングを実現する。
- BBQは,評価者の質を明示的にモデル化し,信頼性の低い参加者を適切に処理することで,より迅速な収束を実現する。
- 不確実性の推定精度が向上し,既存のBradley-Terryモデルと比較して,よりロバストで解釈可能なランキングが得られる。
- このフレームワークにより,生成モデルの人間による評価をより信頼性が高く,費用対効果の高い方法で実施することが可能となる。
ローカリストLLM:動的な局所性制御のための数学的フレームワーク [cs.AI, cs.LG]目的:局所性と分散性のスペクトル全体を網羅する,連続的に調整可能な内部表現を持つ大規模言語モデルの学習手法
- LLMの性能向上が不可欠であり,解釈可能性と効率性の両立が求められている
- 従来のLLMは,解釈可能性と汎化性能のトレードオフを抱えている
- 解釈性と高性能モード間の連続的な補間を可能にし,透明性と能力を両立させる
- 局所性制御のための「局所性ダイヤル」を導入し,モデルの再学習なしに局所性の程度を動的に制御することを可能にした
- 注意メカニズムに対するグループスパース制約,情報理論的なアンカー設計,動的なルール注入により,その実現を数学的に証明した
- グループスパース制約がある閾値を超えると,注意が意味的に関連するブロックに集中し,低エントロピーかつ高忠実度を達成することを証明した
言語モデルにおける演繹的推論のメカニズム的説明に向けて [cs.AR, cs.ET, cs.AI, cs.CL]目的:言語モデルにおける演繹的推論のメカニズム
- 自然言語処理の発展に伴い,論理的思考能力を持つモデルの実現が重要視されている。
- 大規模言語モデルの推論過程はブラックボックスであり,内部メカニズムの解明が課題となっている。
- 演繹的推論タスクを通して,言語モデルの内部表現と計算回路を低レベルで解明すること。
- 小規模言語モデルが,統計的学習ではなく,基礎的なルールを学習することで演繹的推論を達成することを示した。
- モデルの内部表現において,帰納ヘッドがルール補完とルール連鎖に重要な役割を果たしていることが明らかになった。
- これにより,論理推論に必要なステップが,モデルの内部でどのように実装されているかを理解できる。
高密度ネットワークにおける列車の遅延の空間的・時間的カスケード効果を特定するための深層学習 [cs.CL, eess.SY, cs.SY, cs.LG]目的:列車の遅延伝播の予測
- 鉄道網は現代経済の基盤であり,その効率的な運用が不可欠である。
- 列車の遅延は連鎖的に拡大しやすく,リアルタイムな交通管理を困難にしている。
- ネットワーク全体規模での多段階予測と,意思決定支援のための解釈可能性を両立すること。
- 提案するGATv2モデルは,単純な持続モデルと比較して,誤差の点で劣る場合がある。
- しかし,遅延事象の分類において一貫して高い精度を実現しており,信頼性の高い意思決定支援ツールとして有効である。
- 本研究では,オランダ鉄道ネットワークの40%以上を網羅する実データを用いてモデルを評価し,ライブ展開の実現可能性を検証した。
シーケンス変数:ルーティングとシーケンシングのための制約プログラミング計算ドメイン [cs.CL, cs.AI]目的:ルーティングおよびシーケンシング問題に対する制約プログラミング計算ドメイン
- 物流効率化は経済活動の基盤であり,その最適化は重要課題である。
- 従来の制約プログラミングでは,オプション訪問や挿入ヒューリスティックの扱いに限界があった。
- オプション訪問や挿入ヒューリスティックを効率的に扱える新たな計算ドメインの構築。
- 本研究で提案するシーケンス変数は,オプション訪問や挿入ヒューリスティックを有効に扱うことができる。
- シーケンス変数のドメイン定義,更新操作,および整合性レベルが明確に示された。
- シーケンス変数を組み込んだ実装が説明され,Dial-a-Ride問題で競争力のある性能が確認された。