arXiv雑要約
AI - 2025/12/18 公開
高速・低速を超える:大規模言語モデルのための認知に触発された弾力的な推論 [cs.AI]目的:大規模言語モデルにおける効率性と正確性のバランスの取れた推論戦略
- 言語モデルの性能向上は,自然言語処理の発展に不可欠である。
- 既存手法では,クエリの難易度に応じた推論戦略の柔軟な選択が困難である。
- クエリの難易度を考慮した動的な推論戦略選択によって,性能改善を目指す。
- CogERは,クエリの複雑さを評価し,適切な処理戦略を選択するフレームワークである。
- 強化学習を用いてCogER-Agentを訓練し,解答の質と計算コストのバランスを最適化した。
- 実験結果から,CogERは最先端のテスト時スケーリング手法を上回り,精度向上を確認した。
特徴中心の,ホモフィリーの仮定なしのノード表現学習 [cs.LG, cs.AI]目的:ノード表現の学習
- グラフ構造データの解析において,ノードの埋め込み表現は重要な役割を果たす。
- 従来のグラフ畳み込みは,ホモフィリーなグラフに依存し,特徴が異なるノードが類似した埋め込みになる問題がある。
- グラフ畳み込みの利用度を適応的に学習し,埋め込み空間でのノードクラスタの分離を目指す。
- 提案手法FUELは,グラフ畳み込みの利用度を適応的に学習することで,ノードの特徴に基づいたクラスタリングを促進する。
- FUELは,15のベースライン手法と14のベンチマークデータセットを用いた実験で,様々なホモフィリーレベルのグラフにおいて最先端の性能を達成した。
- ダウンストリームタスクにおいて,クラス内類似性とクラス間分離性を向上させる効果が確認された。
SSMを構成するヘッド数はいくつであるか:AttentionとState Space Modelのための統一的フレームワーク [cs.LG, cs.AI]目的:系列モデリングにおける表現力と学習可能性のトレードオフに関する統一的な理論的理解
- 系列モデリングは,自然言語処理や時系列分析など,様々な分野で不可欠な技術である。
- 既存のモデルの表現力や学習可能性に関する理論的な理解が十分でない点が課題である。
- AttentionとSSMを含む広範な系列モデルを統一的に捉え,その特性を明らかにすることを目指す。
- 本研究では,Unified Factorized Framework(明示的な混合)とStructured Dynamics(暗黙的な状態空間再帰)という2つの構築パターンを明確化した。
- Unified Factorized Frameworkでは,単一ヘッドAttentionは低次元の演算子空間に制約され,特定の構造的な動的写像を表現できないことを示した。
- 線形SSMの表現に必要なヘッド数を理論的に導き,長さnの系列においてk次元の部分空間を張るSSMはH=k個のヘッドで実現可能であることを示した。
FADTI:フーリエ変換と注意機構駆動型拡散による多変量時系列データの欠損値補完 [cs.LG, cs.AI]目的:多変量時系列データの欠損値補完
- 医療,交通予測,生物学的モデリングなど,欠損値は頻繁に発生し,データ分析の精度を低下させる。
- Transformerや拡散モデルは汎化性能が課題であり,構造的な欠損パターンや分布の変化に対応しにくい。
- 周波数情報を活用し,よりロバストな欠損値補完手法を開発することで,分析の信頼性を向上させる。
- FADTIは,学習可能なフーリエバイアス射影(FBP)モジュールを導入することで,周波数情報を特徴量に組み込む。
- FBPは複数のスペクトル基底をサポートし,定常的および非定常的なパターンを適応的にエンコードする。
- 複数のベンチマークデータセットにおいて,FADTIは最先端の手法を凌駕し,特に欠損率が高い場合に優れた性能を発揮する。
「そばにいるよ」:関係性に着目した会話型AIが,特に社会的に・感情的に脆弱な若年層にどのように訴求するか [cs.HC, cs.AI, cs.RO]目的:若年層における会話型AIの利用状況と,会話スタイルが人間化や感情的な依存に及ぼす影響
- 若年層のメンタルヘルス問題が深刻化しており,新たな支援手段の必要性が高まっている。
- 会話型AIは感情的なサポートを提供するが,人間化による過度な依存のリスクが懸念されている。
- 会話スタイルが人間化や信頼感に与える影響を明らかにすることで,AIの安全性向上に貢献する。
- 若年層は,相手に寄り添う関係性重視の会話スタイルを,透明性の高いスタイルよりも好む傾向があった。
- 保護者は若年層と異なり,透明性の高い会話スタイルを好む傾向がみられた。
- 関係性重視の会話スタイルは,人間らしさ,好感度,信頼感,感情的な親密さを高める効果が示された。社会的に・感情的に脆弱な若年層ほど,関係性重視のスタイルを好む傾向があった。
多目的人間ヒューリスティクスからの自動報酬形成 [cs.LG, cs.AI]目的:多目的環境における効果的な報酬関数の設計
- 強化学習の性能は報酬関数の設計に大きく依存する。良い報酬関数が重要。
- 多目的環境では,複数の目標をバランスさせる報酬関数の設計が困難である。
- 人間が設計したヒューリスティック報酬を自動的に組み合わせることで,その問題を解決する。
- 提案手法MORSEは,複数のヒューリスティック報酬を統合し,統一された報酬関数を自動的に形成する。
- MORSEは,タスクの性能を最適化するため,報酬関数の更新とポリシーの学習を繰り返す二層最適化問題を解く。
- MuJoCoとIsaac Sim環境での実験により,MORSEが手動で調整された報酬関数と同等の性能を示すことが示された。
TrajSyn:連合学習モデルの軌跡からのプライバシー保護データ蒸留によるサーバーサイド敵対的学習 [cs.LG]目的:サーバーサイド敵対的学習のためのプロキシデータセットの合成
- エッジデバイスにおける深層学習の利用拡大に伴い,安全性への配慮が不可欠である。
- 連合学習では,クライアントデータのプライバシー保護とデバイスの計算能力が課題となる。
- クライアントの生データを必要とせず,サーバー側での敵対的学習を可能にする。
- TrajSynは,クライアントモデルの更新軌跡からプロキシデータセットを合成し,プライバシーを保護しながら効果的なサーバーサイド敵対的学習を実現する。
- 画像分類ベンチマークにおいて,TrajSynは敵対的ロバスト性を一貫して向上させる。
- クライアントデバイスに追加の計算負荷をかけることなく,敵対的ロバスト性の向上が可能である。
HD-Prot:連続構造トークンを用いた結合シーケンス-構造モデリングのためのタンパク質言語モデル [cs.CE, cs.AI]目的:タンパク質におけるシーケンスと構造の同時モデリング
- タンパク質の機能解明には,アミノ酸配列だけでなく,その立体構造の情報が不可欠である。
- 既存手法では,構造情報を離散化する必要があり,細かな構造情報が失われるという課題があった。
- 連続的な構造情報を言語モデルに組み込み,より高精度なタンパク質モデルを構築することを目指す。
- HD-Protは,離散的なシーケンスと連続的な構造情報を同時に扱うことで,既存のマルチモーダルタンパク質言語モデルと同等の性能を達成した。
- 限られた計算資源下でも優れた性能を示すことから,今後のマルチモーダルタンパク質言語モデルの新たな方向性を示唆する。
- シーケンス生成,モチーフ-スキャフォールディング,構造予測,逆折り畳みといった様々なタスクで高い性能を示した。
孤立からエンタングルメントへ:解釈可能性手法はいつ既知の概念を識別し,分離するか [cs.LG, cs.AI, cs.CL]目的:ニューラルネットワークにおける概念表現の回復と評価
- AIの信頼性向上には,モデルの判断根拠を理解することが不可欠である。
- 既存手法は概念間の独立性を仮定しており,現実の複雑な関連性を捉えきれていない。
- 概念間の相関関係が変化する状況下での解釈可能性手法の性能を評価し,概念の分離能力を検証する。
- 概念と特徴の関係は一対多であり,1つの概念が複数の特徴に分散していることが示された。
- スパースオートエンコーダ(SAE)の特徴量は,操作実験において多くの概念に影響を与える傾向があり,選択性や独立性に課題があることが示唆された。
- しかし,特徴量は互いに素な部分空間に影響を与えるため,完全な混同ではないことが確認された。
ドイツにおける作物の収量と異常予測のための機械学習モデルにおける汎化性能と特徴量の寄与度 [cs.LG]目的:ドイツのNUTS-3地域における作物の収量および収量異常予測のための機械学習モデルの汎化性能と解釈可能性の評価
- 農業生産の最適化や食料安全保障の確保には,正確な収量予測が不可欠である。
- 機械学習モデルは高い予測精度を示す一方,未知のデータへの汎化性能が課題となっている。
- 時系列データの汎化性能を評価し,解釈性の信頼性を検証することで,より実用的なモデル構築を目指す。
- 従来のテストセットでは良好な性能を示すモデルも,時間的に独立した検証データでは性能が低下することが示された。
- 高いテスト精度を持つモデルでも,時間的な汎化性能が低い場合があり,特徴量の重要度解釈に誤りをもたらす可能性がある。
- モデルの解釈性を信頼するには,未踏の時空間条件下への汎化性能を明示的に示す必要性が強調された。
連合学習に対する効率的な勾配ベースの推論攻撃 [cs.LG, cs.CR]目的:連合学習におけるメンバーシップ推論および離散属性推論の脆弱性
- 機械学習のプライバシー保護は重要であり,連合学習はその有力な手法の一つである。
- 連合学習ではモデル更新の交換過程で機密情報が漏洩する可能性がある。
- 本研究は,連合学習における勾配情報の時間的変化を利用した推論攻撃を解決する。
- 提案手法は,学習記録のラウンドごとの勾配パターンを学習し,メンバーシップ推論に成功する。
- 属性推論についても,勾配応答を比較することで,離散属性を推測できる。
- 実験結果から,多ラウンドの連合学習は推論攻撃に対して脆弱であり,集約者がより大きな脅威であることが示された。
言語サロゲートモデルと暗示的Q学習を用いたオフライン多タスク多目的データ駆動型進化アルゴリズム [cs.NE, cs.AI]目的:多タスク多目的最適化問題におけるサロゲートモデリングの高性能化
- 最適化問題解決において,計算コストが高い場合に,データ駆動型手法が注目されている。
- 多数の目的関数を持つ複雑な最適化問題では,既存のサロゲートモデリングは近似の反復作業に限界がある。
- 言語モデルを活用し,効率的かつ汎用的なサロゲートモデリング手法を提案し,その有効性を検証する。
- 提案手法Q-MetaSurは,代表的なサロゲートモデリング手法と比較して,目的関数の近似精度において優れている。
- Q-MetaSurは,基盤となる進化アルゴリズムの最適化収束性とパレート最適性の向上に貢献する。
- 二段階のオフライン学習戦略により,モデルの安定性と汎化性能が向上することが示された。
MCP-SafetyBench:リアルワールドのMCPサーバーを用いた大規模言語モデルの安全性評価ベンチマーク [cs.CL, cs.AI]目的:大規模言語モデルの安全性評価
- 大規模言語モデルが外部ツールと連携する重要性が増しており,その安全性確保が不可欠である。
- 既存のベンチマークは単独攻撃に焦点を当てており,現実世界の複雑な多サーバー環境での安全性を十分に評価できない。
- 現実的な多段階評価を通じて,MCP環境における新たな安全リスクを特定し,軽減策の基礎を確立すること。
- MCP-SafetyBenchは,ブラウザ自動化,金融分析など5つの領域におけるリアルな多段階評価を可能にする。
- このベンチマークを用いることで,主要なオープンソースおよびクローズドソースのLLMにおいて安全性に大きな差があることが明らかになった。
- タスクの複雑さとサーバー間の連携が増すにつれて,脆弱性が深刻化することが示唆され,より強力な防御策の必要性が強調された。
暗黙的ニューラル表現におけるNTK分散の理解 [cs.LG]目的:暗黙的ニューラル表現におけるニューラル接線カーネル(NTK)分散の理解
- 暗黙的ニューラル表現は,画像や信号処理など様々な分野で活用が期待されている。
- 従来の暗黙的ニューラル表現は,収束が遅い,高周波成分の再現が難しいといった課題がある。
- NTKの分散を制御することで,学習の安定化と高速化,高周波成分の再現性の向上を目指す。
- 様々なINR機構は,NTKの固有値分散を決定するペアワイズ類似度因子とスケーリング項に影響を与えることが示された。
- 位置エンコーディング,球面正規化,ハダマール変調が,それぞれ異なる方法でNTK分散を低減することが明らかになった。
- 実験結果は,予測された分散減少を裏付け,より高速かつ安定した収束と,改善された再構成品質を示した。
拡散モデルによるドラフト,自己回帰モデルによる検証:DEER [cs.NI, eess.SY, cs.SY, math.OC, cs.LG, cs.AI]目的:LLM駆動のエージェント/推論システムの効率性向上
- LLMを活用したシステムの普及には,実用的な効率性が不可欠である。
- 自己回帰デコーディングの遅延が,効率性を大きく阻害する。
- 拡散モデルの並列処理能力を用いて,高速化を実現する。
- DEERは,最大32トークンのドラフト受容長を達成し,EAGLE-3を大幅に上回る。
- Qwen3-30B-A3Bを用いたHumanEvalの評価で,5.54倍の高速化を実現した。
- 拡散モデルをドラフト生成に利用することで,信頼性の低下と逐次処理の問題を克服した。
ESDD 2026チャレンジのためのレイヤー融合BEAT2AASISTモデル [cs.SD, cs.LG]目的:環境音のディープフェイク検出
- 近年,音声生成技術の進歩により,環境音の操作リスクが増加している。
- 環境音ディープフェイクの検出に関する大規模なベンチマークが存在しなかった。
- ディープフェイク検出の精度向上と,未知の改ざん手法へのロバスト性向上を目指す。
- 提案手法BEAT2AASISTは,BEATs-AASISTを拡張し,周波数またはチャネル次元で分割したBEATs表現を二つのAASISTブランチで処理する。
- トップkトランスフォーマー層融合により,特徴表現を強化している。
- ボコーダーベースのデータ拡張により,未知の改ざん手法に対するロバスト性を向上させている。
急速な技術変化の統治:欧州AIガバナンスの未来に関する政策デルファイ [cs.CY, cs.AI]目的:欧州におけるAIガバナンス開発における専門家の見解の主要な緊張点
- AI技術の急速な進歩は,政策立案者に特有の課題を提示しており,適切な統治が不可欠である。
- AI技術の進歩速度に対して,規制が追いつけないという課題が存在する。
- 将来にわたって有効なAI規制は,技術的な詳細よりも実質的な実施と法執行に依存するというコンセンサスを導き出す。
- 政策デルファイ調査により,欧州のAIガバナンスに関する多様な視点が明らかになった。
- 市民参加の促進など,望ましい政策目標と,その実現可能性との間に乖離が認められた。
- この乖離は,望ましい規制と,技術変化に追いつくことの難しさとの間の緊張を示唆する。
最大重独立集合問題のための緩和決定図に対するクラスタリングに基づく変数順序付けフレームワーク [cs.AI, math.OC]目的:最大重独立集合問題に対する緩和決定図の変数順序付け手法の提案
- 離散最適化問題の効率的な厳密解法は,強固な双対限界に大きく依存する。
- 緩和決定図の品質(双対限界の厳密性)は,変数順序付けとノードマージに強く左右される。
- 変数全体の動的順序付けの計算コストを削減するため,クラスタリングを利用した新しいフレームワークを開発する。
- 提案手法では,変数をクラスタに分割し,その構造的分解を利用して順序付けプロセスを効率化する。
- クラスタ間処理とクラスタ内代表変数選択・ソートという2つの戦略を検討し,MWISPにおける決定図のサイズ増加に関する理論的考察に基づき,クラスタ数設定ポリシーを提案した。
- ベンチマークインスタンスにおいて,標準的な動的変数順序付けと比較して計算コストを低減できることを示した。
Chorus:IoTにおけるデータフリーなモデルカスタマイズのための文脈とセンシング信号の調和 [cs.LG]目的:IoT環境におけるデータフリーなモデルカスタマイズ手法
- IoTデバイスの普及に伴い,多様な環境下でのセンサデータ活用が重要となっている。
- センサデータは環境に大きく左右され,展開後の環境変化に対応できない場合がある。
- 新たな環境下でも性能を維持するため,データなしでモデルを適応させることを目指す。
- Chorusは,センサデータと文脈埋め込み間のクロスモーダル再構成により,頑健な文脈表現を獲得する。
- 軽量なゲートヘッドを用いて,センサデータと文脈の貢献度を動的に調整し,性能向上を実現した。
- 文脈キャッシュ機構により推論遅延を抑制し,スマートフォンやエッジデバイスでの実用性を示した。
変化するデータに対するラベル整合クラスタリング [eess.SY, cs.SY, cs.DS, cs.LG]目的:変化するデータに対するクラスタリング解の一貫性維持
- データ分析は反復的であり,新たなデータに応じて解を継続的に洗練する必要がある
- 既存解の更新時に,急激な変化を最小限に抑える一貫性維持が課題となる
- 以前の解からの変更を制限しつつ,クラスタリングコストを最小化する手法を提案する
- 本研究では,$k$-center問題におけるラベル整合クラスタリングを考察し,近似アルゴリズムを提案した
- 提案アルゴリズムは,以前のクラスタリング解からの変更数を最大$b$に制限しながら,クラスタリングコストを最小化する
- 実世界データセットを用いた実験により,提案手法の有効性が確認された
RFKG-CoT: 関係駆動型適応ホップ数選択と少数の事例を用いたパス誘導による知識認識型QA [cs.RO, cs.NI, cs.CL, cs.AI]目的:知識認識型QAにおける幻覚抑制と精度向上
- 大規模言語モデルの性能向上には,外部知識の活用が不可欠である。
- 既存手法は,知識グラフのパス探索におけるホップ数の固定化や,推論パスの活用不足に課題がある。
- 関係駆動型ホップ数選択とパス誘導により,知識グラフの情報をより有効に活用し,正確な回答生成を目指す。
- RFKG-CoTは,知識グラフの関係性を考慮して推論ステップ数を動的に調整する関係駆動型適応ホップ数選択器を導入した。
- 少数の事例を用いたCoTによるパス誘導メカニズムにより,LLMが推論パスを理解する能力を向上させた。
- WebQSP等の4つのKGQAベンチマークにおいて,KG-CoTと比較して最大14.7ppの精度向上を達成した。
WMT 2024 低リソースインド言語翻訳タスクへのYes-MTの提出 [eess.SY, cs.SY, cs.CL, cs.AI]目的:低リソースインド言語翻訳の性能向上
- グローバル化が進む中で,多様な言語間のコミュニケーションは不可欠である。
- 低リソース言語の翻訳は,データ不足により性能が低いという課題がある。
- 本研究は,低リソースインド言語翻訳における効果的な手法を模索する。
- 事前学習済みモデルのファインチューニング,LoRA,プロンプティング,Transformerのゼロからの学習など,様々なアプローチを実験した。
- LLMのファインチューニングが特に有効であり,低リソース翻訳の可能性を示唆した。
- 評価指標SacreBLEUとCHRFを用いてWMT23のテストデータで評価を行い,課題と展望を明確にした。
平衡吸着構造の直接生成によるハイスループット触媒スクリーニングの加速 [cs.LG]目的:触媒の大量スクリーニングのための記述子としての吸着エネルギーの予測精度向上
- 触媒設計において,計算コストを削減し,効率的な触媒探索を行うことが重要である。
- 機械学習原子間ポテンシャル(MLIP)の学習データが平衡構造に偏っており,吸着構造の予測精度が低いという課題がある。
- MLIPの学習データを拡張し,より高精度な吸着構造の生成を実現することを目指す。
- DBCataは,周期的なブラウン橋フレームワークと等変グラフニューラルネットワークを統合した深層生成モデルである。
- DBCataは,Catalysis-Hubデータセットにおいて,既存のMLIPモデルよりも約3倍優れた精度で吸着構造を生成できる。
- DBCataは,ハイブリッドな化学的ヒューリスティックと自己教師あり外れ値検出により,予測精度を0.1 eV以内で向上させることができた。
O-EENC-SD:話者分離のための効率的なオンラインエンドツーエンドニューラルクラスタリング [cs.LG, cs.SD, eess.SP]目的:話者分離のためのオンラインエンドツーエンドニューラルクラスタリングシステム
- 会話や会議の音声データから,誰がいつ話しているかを正確に把握することは重要である。
- 従来のシステムは,パラメータ調整が煩雑であったり,計算コストが高く実用性に課題があった。
- ハイパーパラメータ調整が不要で,計算効率の良いオンライン話者分離システムの開発を目指す。
- 提案システムO-EENC-SDは,既存の手法と比較してハイパーパラメータ調整が不要である。
- O-EENC-SDは,計算コストの高い既存のオンラインエンドツーエンド手法よりも効率的である。
- CallHomeデータセットを用いた評価により,O-EENC-SDが最先端技術と同等の性能を持つことが示された。
CangLing-KnowFlow:包括的なリモートセンシング応用のための知識とフローを融合した統一エージェント [cs.AI]目的:大規模リモートセンシングデータの自動的・知的な処理
- 地球観測において,リモートセンシングデータの利用は不可欠であり,その重要性は増している。
- 既存の自動システムは特定のタスクに限定され,データ前処理から高度な解釈までの多様なワークフローを統一的に管理できない。
- 本研究は,多様で複雑なタスクに対して適応・学習し,信頼性の高い運用を実現するエージェントを開発し,その可能性を示す。
- CangLing-KnowFlowは,1,008件の専門家検証済みワークフロー事例を含む手続き的知識ベースを活用し,一般的なエージェントに多いハルシネーションを大幅に削減した。
- 動的ワークフロー調整により,ランタイム時のエラーを自律的に診断し回復戦略を再計画,進化型メモリモジュールが継続的に学習することで性能を向上させた。
- KnowFlow-Benchを用いた評価の結果,CangLing-KnowFlowはReflexionベースラインと比較してタスク成功率を少なくとも4%上回る性能を示した。
医療画像疾患分類における視覚言語モデルの交差的公平性 [cs.CL, cs.CV, cs.AI]目的:医療画像疾患分類のための視覚言語モデルにおける交差的な公平性の向上
- 医療AIは診断精度向上に貢献するが,特定の患者層で偏りが生じることが課題である。
- 既存の公平性介入は,公平性と診断性能の両立が困難な場合がある。
- 交差的な患者層間で診断確信度を標準化し,公平性と精度を両立することを目指す。
- 提案手法(CMAC-MMD)は,皮膚病変画像データセットにおいて,交差的な見逃し診断の差を0.50から0.26に縮小した。
- 同時に,AUC(曲線下面積)を0.94から0.97に向上させ,診断性能の改善も達成した。
- 緑内障スクリーニングにおいても同様に,見逃し診断の差を縮小し,AUCの向上を実現した。
基礎モデルと単純な融合による多Modal生理信号解析 [cs.LG, cs.AI]目的:多Modal生理信号解析における性能向上
- 健康と認知機能の理解に不可欠であり,医療や感情計算への応用が期待される。
- 多Modalデータ不足と,各Modalの特性の違いが統合の課題となっている。
- ラベル付きデータが少ない状況下でも,効果的な多Modal学習を実現すること。
- 大規模自己教師あり学習により,ECGとEEGそれぞれで強力な基礎表現を獲得した。
- 単純な埋め込み連結による融合により,クロスコマールな相互作用を学習し,高い認識精度を実現した。
- 提案手法は感情認識において最先端の性能に匹敵し,生理信号の包括的な活用可能性を示唆する。
特殊なカウントアーキテクチャと視覚言語モデルの視覚列挙能力の評価 [cs.AR, cs.CY, cs.CV, cs.LG]目的:視覚列挙能力の評価
- 画像内の物体数を数えることは,コンピュータビジョンの基本的な課題であり,応用範囲が広い。
- 従来のカウントアーキテクチャは,特定の物体カテゴリに依存し,汎用性に欠ける。
- 大規模な視覚言語モデルが,より柔軟なオープンセット物体カウントの代替手段となるか検証する。
- 多くの視覚言語モデルは,画像内の物体数を近似的に列挙でき,専門的なコンピュータビジョンアーキテクチャと同等かそれ以上の性能を示す。
- 視覚言語モデルが中間表現(位置とラベル)を生成するように促すと,列挙精度が大幅に向上する。
- 複雑な視覚シーンにおいては,どのモデルも物体数を確実にカウントできず,更なる研究の必要性を示唆する。
VLA-AN:複雑な環境における自律航空のための効率的かつオンボードなビジョン・言語・行動フレームワーク [cs.RO, cs.AI]目的:複雑な環境における自律ドローンナビゲーションのための効率的かつオンボードなビジョン・言語・行動フレームワーク
- ドローン技術は,物流,監視,災害対応など,幅広い分野で活用が期待されている。
- 既存のナビゲーションモデルは,データドメインのずれや安全性,リアルタイム処理能力に課題があった。
- データギャップの解消,安全性向上,そしてリアルタイムなオンボード展開を実現する。
- 本研究では,3D Gaussian Splattingを用いて高精度なデータセットを構築し,ドメインギャップを効果的に克服した。
- 段階的なトレーニングフレームワークと軽量な行動モジュールにより,安全性と安定性を確保しつつ,効率的なナビゲーションを実現した。
- オンボード展開パイプラインの最適化により,推論速度を8.3倍に向上させ,軽量な航空ロボットにおける完全閉ループ自律性の実現に貢献した。
蒸留による構造転移:スパース分散メモリを超えた継続学習 [cs.HC, cs.MM, cs.LG]目的:継続学習における構造転移手法
- 効率的な継続学習の実現は,AIの応用範囲拡大に不可欠である。
- スパースなニューラルネットワークは効率的だが,知識の再利用が限定される。
- スパース性を維持しつつ,構造的再配置による知識共有を可能にすること。
- 提案手法(SSD)は,知識蒸留を構造的情報伝達手段として活用する。
- SSDは,高頻度活性化ニューロンに注目し,過去のサブネットワークから選択的に知識を蒸留する。
- 実験結果から,SSDが精度,保持率,表現カバレッジを向上させることが示された。
ペアワイズ比較からのランキングに対するモデル推論 [cs.SI, cs.LG, stat.ML]目的:ペアワイズ比較に基づくランキング問題におけるモデル推論
- ランキングは,検索,推薦,意思決定など,様々な分野で重要な役割を担う。
- ペアワイズ比較データにはノイズが含まれることが多く,正確なランキングが難しい。
- 隠れたスキルと結果への影響を同時に推論し,よりロバストなランキングを可能にする。
- 提案手法は,スキルと確率の対応関係を効率的に推論するアルゴリズムを提供する。
- ベイズアプローチの結論は,モデル仕様の違いに対してロバストであることが実験的に示された。
- 実世界のデータセットを用いたケーススタディを通じて,手法の有効性を検証した。
LLM推論のための事前最適化による強化学習:好発進は半ば成功 [cs.CL, cs.AI]目的:LLMの推論能力を向上させるための,事前トークン最適化を用いた強化学習手法の開発
- 大規模言語モデル(LLM)は,その汎用性から様々な分野で活用が期待されている。推論能力の向上が重要な課題である。
- 従来の強化学習によるLLMの学習では,全てのトークンを均等に扱っており,効率性が低いという問題があった。
- LLMの推論における「初期段階の思考がその後の思考を大きく制約する」という現象に着目し,事前トークンに焦点を当てた最適化を目指す。
- 提案手法であるPPPOは,代表的なRLVR手法と比較して,様々な推論タスクで高い性能を発揮した。
- PPPOは,学習に使用するトークン数の26.17%で,精度を18.02%向上させた。
- PPPOは,事前トークンの保持割合を徐々に増加させる手法と,複数回の継続による報酬バイアスの軽減手法を導入している。
教師なし埋め込み品質評価のためのトポロジカル指標 [cs.RO, cs.HC, cs.LG, cs.IR]目的:教師なし埋め込みの品質評価
- 表現学習は一般的になり,その評価が重要である。
- ラベルなしデータでの埋め込み品質評価は困難である。
- 埋め込み空間の幾何学的構造とトポロジーを定量化する。
- 提案手法Persistenceは,既存の教師なし指標を上回る相関を示す。
- Persistenceは,線形分離可能性を仮定しないため,多様な組織構造を捉えられる。
- モデルやハイパーパラメータ選択の信頼性向上に貢献する。
量子機械学習によるサイバーセキュリティ:分類と将来展望 [cs.LG, cs.AI, cs.CR]目的:サイバーセキュリティにおける量子機械学習技術の分類と将来の研究方向性
- サイバー攻撃の増加と巧妙化に対応するため,高度な防御技術が求められている。
- 古典機械学習では,高次元データの処理や変化する攻撃パターンへの追従が困難である。
- 量子力学に基づく量子機械学習を用いて,サイバーセキュリティの課題解決を目指す。
- 本調査は,量子ニューラルネットワーク,量子サポートベクターマシンなど,セキュリティ関連の量子機械学習技術を網羅的に概観する。
- これらの手法を,教師あり学習,教師なし学習,生成学習のパラダイムと,侵入検知などの主要なサイバーセキュリティタスクにマッピングする。
- クラウドコンピューティングセキュリティへの応用可能性や,量子機械学習の限界と今後の方向性についても議論する。
効率的な有向コントローラ合成のためのグラフ文脈強化学習 [cs.AI]目的:有向コントローラ合成における効率向上
- 形式手法による自動設計が重要であり,安全性や信頼性が求められるシステム開発に不可欠である。
- 従来の探索方策は,現在の特徴量のみに依存しており,探索効率が低いという課題があった。
- 本研究は,過去の探索履歴をグラフ構造として捉え,文脈情報を活用することで探索効率を高めることを目指す。
- 提案手法GCRLは,グラフニューラルネットワーク(GNN)を用いてLTS探索履歴をグラフ構造としてエンコードする。
- GCRLは,5つのベンチマークドメインのうち4つにおいて,最先端手法と比較して学習効率と汎化性能が優れていることを示した。
- 高い対称性と厳密な局所的相互作用を持つドメインにおいては,GCRLの性能は他の手法と同程度であった。
ChatGPTとGeminiが韓国の大学修学能力試験(地学I)に参加 [cs.AI, cs.CL, cs.CY]目的:生成AIの科学的推論能力と認知的な限界の分析
- 教育現場におけるAI利用の拡大に伴い,評価の妥当性確保が重要課題となっている。
- AIによる不正利用が懸念される中,AIの弱点を突いた評価方法の確立が求められている。
- AIの認知的な脆弱性を明らかにし,AIに耐性のある問題設計の指針を示す。
- 大規模言語モデルは,非構造化データ入力においてOCRエラー等により性能が著しく低下した。
- 最適化された条件でも,図表の象徴的な意味の解釈における「知覚-認知の乖離」が確認された。
- 計算能力は高くとも,基礎概念の理解や視覚的検証の欠如といった課題が明らかになった。
LLMQ:コンシューマーGPU向け効率的な低精度事前学習 [cs.DC, cs.LG]目的:コンシューマーGPU上での言語モデル事前学習の効率化
- 大規模言語モデルの普及には,高性能な計算資源が不可欠である。
- データセンター向けGPUは高価であり,手軽に入手できないという課題がある。
- コンシューマーGPUでも大規模言語モデルを効率的に学習できる環境を構築する。
- LLMQは,3Bから32Bパラメータ規模の言語モデルを,手頃な価格のコンシューマーGPUで学習可能にする。
- 16GBのゲーミングカードで7Bモデル,4つのRTX 4090を搭載したワークステーションで32Bモデルの学習・微調整を実現した。
- 標準的な8ビット学習パイプラインを実行し,FLOP使用率は約50%を維持し,クラウドGPUと比較に匹敵する効率を達成した。
グラフトランザクション設定におけるNo-repeated-anythingセマンティクス下でのグラフパターンに基づくアソシエーションルール [cs.DB, cs.AI]目的:グラフパターンに基づくアソシエーションルールの評価
- 知識グラフの有効活用は,情報検索や推論において重要である。
- 既存のアソシエーションルールは,グラフ構造の複雑さを十分に捉えられていない。
- グラフ構造を考慮したより精度の高いアソシエーションルールの抽出を目指す。
- グラフパターンに基づくアソシエーションルールを定義し,RDFグラフなどの有向ラベルマルチグラフに適用できることを示した。
- No-repeated-anythingセマンティクスを導入することで,グラフのトポロジーをより効果的に考慮した評価が可能になった。
- 信頼度,リフト,レバレッジ,確信度などの指標を確率的な枠組みで導出し,古典的な項目集合ベースの指標との関係を分析した。
ゼオライト合成イベント抽出のためのLLM評価:プロンプティング戦略の体系的な分析 [cs.CL, cs.AI]目的:ゼオライト合成実験手順からの構造化情報抽出
- 材料発見において,実験手順からの情報抽出は不可欠である。
- 既存手法では,LLMをこの特定分野のタスクに体系的に評価していない。
- LLMを適用した科学情報抽出におけるプロンプティング戦略の有効性を評価する。
- イベントタイプ分類では高い性能(F1スコア80-90%)を示したが,詳細な抽出タスク(引数役割,引数テキスト抽出)では中程度の性能(F1スコア50-65%)であった。
- GPT-5-miniはプロンプトに対する感受性が極めて高く,F1スコアに11-79%の変動が見られた。
- 高度なプロンプティング戦略は,ゼロショットアプローチと比較して大きな改善をもたらさず,LLMのアーキテクチャ上の限界が示唆された。
エンドツーエンド敵対的学習による時間変化型オーディオエフェクトモデリング [cs.SD, cs.LG]目的:時間変化型オーディオエフェクトのモデリング
- オーディオエフェクトは音楽制作や音響処理において不可欠であり,高品質なモデリングが求められる。
- 時間変化するエフェクトは,制御信号の抽出が必要で,学習が困難である。
- 制御信号なしで時間変化型オーディオエフェクトを正確にモデリングすること。
- 敵対的生成ネットワーク(GAN)フレームワークを用いて,制御信号の抽出なしで時間変化型エフェクトをモデリングすることに成功した。
- 初期の敵対的学習段階で変調動作の分布を学習し,状態予測ネットワーク(SPN)による微調整でモデルを同期させた。
- チャープ信号に基づく新しい評価指標により,変調の精度を定量的に評価することが可能となった。
MRIにおける自動モーションアーチファクトチェック(AutoMAC-MRI):モーションアーチファクト検出と重症度評価のための解釈可能なフレームワーク [cs.CV, cs.AI]目的:モーションアーチファクトの検出と重症度評価
- MRI画像診断において,画質は診断精度に大きく影響する。モーションアーチファクトは画質劣化の主要因である。
- 既存の自動品質評価法は二値化判断に留まり,アーチファクトの原因や程度を詳細に把握することが困難である。
- モーションアーチファクトの重症度を定量化し,画像品質の自動的な品質管理を実現することを目的とする。
- AutoMAC-MRIは,様々なMRIコントラストと向きに対応可能な,解釈可能なフレームワークである。
- 教師あり対照学習を用いてモーションの重症度を識別し,各グレードへの親和性スコアを算出することで透明性と解釈可能性を確保する。
- 5000以上の専門家アノテーションMRI画像を用いた評価により,親和性スコアが専門家の判断と一致することが示された。
曖昧性の管理:ローグ変数検出に基づく量子に着想を得た認知メカニズムを用いた人間とAIの共生的意味理解の概念実証 [cs.HC, cs.AI]目的:曖昧性の管理と,人間とAIの共生的意味理解
- VUCAの時代において,変化の兆候を早期に捉えることは組織の存続に不可欠である。
- 既存のAIシステムは予測と解決に最適化されており,高い曖昧性下では早期の解釈的終結を招く。
- 曖昧性をエラーや危機に発展させる前に,人間とAIシステムが責任を持って管理する方法を提示する。
- LAIZAシステムは,曖昧性を認知の非崩壊状態として捉え,解釈の破綻(ローグ変数)を検知する。
- 自律的な推論が信頼できなくなった場合に,構造化された人間介入を活性化させる。
- 曖昧性の維持が,特許保護を含むシナリオベースの準備を可能にし,迅速かつ中断のない対応を支援した。
実験における直尺の正確な読み取りのためのビジョンベースモジュール [cs.CV, cs.AI]目的:実験における直尺の正確な読み取り
- ロボットの自律性を高めるには,視覚情報から定量的な測定を行う能力が不可欠である。
- 画像から正確な定量測定を行うモデルは稀であり,課題である。
- 人間の視覚による測定を模倣し,実験環境での直尺の読み取りを実現する。
- シリンジやメスシリンダーの目盛りを対象に,画像の姿勢補正を行った。
- 関心領域を直尺に絞り込み,主要な目盛り,数字,液面位置などの特徴量を抽出した。
- 本システムによる読み取り値と人間の読み取り値との間に高い一致性が見られた。
プライバシーのためのビット:学習後量子化のメンバーシップ推論による評価 [cs.LG, cs.CR]目的:学習後量子化におけるプライバシーとユーティリティの関係
- 深層学習モデルの効率的な展開には,モデルサイズの削減が不可欠である。
- 量子化がプライバシーに与える影響に関する研究は十分ではない。
- 低ビット幅量子化がプライバシー漏洩を軽減できる可能性を検証する。
- 学習後量子化は,モデルの精度低下を伴いながらプライバシー漏洩を減少させることが示された。
- 特に,低ビット幅モデルは,フル精度モデルと比較してメンバーシップ推論に対する脆弱性が大幅に低下する。
- 最終層のみ高精度で量子化することで,プライバシーとユーティリティのトレードオフを細かく制御できる。
大規模マルチ目的VNF配置問題に対するルーティング主導進化アルゴリズム [cs.NE]目的:大規模データセンターにおける仮想ネットワーク機能の最適な配置
- 現代のデータセンターは膨大な電力消費を伴うため,環境負荷軽減のためには効率的なリソース利用が重要である。
- データセンターの規模拡大に伴い,最適なVNF配置の計算コストが増大しており,現実的な時間で解を見つけることが困難である。
- 本研究は,大規模データセンターにおけるVNF配置問題を効率的に解決し,リソース利用の最適化を図ることを目指す。
- 提案手法は,QoSを考慮した高速な評価関数と,大規模ネットワークに対応可能なメモリ効率の良いデータ構造を用いることで,64,000台規模のデータセンターに対しても高品質な解を探索可能である。
- ルーティングを重視した進化アルゴリズムと並列メタヒューリスティクスを用いることで,高速かつ効率的なVNF配置を実現している。
- 簡便で高速なヒューリスティクスにより,大規模問題インスタンスに対しても競争力のある解が得られることが確認された。
没入型拡張現実におけるLLM搭載会話エージェントのユーザ受容性と懸念点に関する調査 [cs.HC, cs.AI, cs.CY]目的:LLM搭載会話エージェントに関するユーザの受容性と懸念点の理解
- 生成AIとLLMの進化は,日常生活への浸透を加速させている。拡張現実(XR)への応用も進んでいる。
- 自然な会話を通じて個人情報が漏洩する可能性や,センサデータとの組み合わせによる新たなプライバシー問題が存在する。
- XRにおけるLLM搭載会話エージェントの受容性と懸念点を明らかにし,安全な利用に向けた提言を行う。
- ユーザは概ねLLM搭載会話エージェントを受け入れる傾向にあるものの,セキュリティ,プライバシー,社会的影響,信頼性に関して懸念を抱いている。
- 日常的に生成AIを利用している人は受容性が高い一方,XRデバイスの所有経験がある人は受容性が低い傾向が見られた。
- 男性は女性よりも受容性が高く,懸念も少ないと報告された。位置情報に対する懸念が最も強く,仮想オブジェクトの状態への懸念は最も弱かった。
回転機械の故障診断における位相情報のインパクトに関する実証的研究 [cs.LG, cs.AI, eess.SP]目的:回転機械の故障診断における位相情報の効果検証
- 機械の予防保全は重要であり,振動信号はその鍵となるデータである。
- 従来の学習手法では,位相情報を十分に活用できていない問題がある。
- 多軸振動データの位相変動に対応し,故障診断精度向上を目指す。
- 3軸独立位相調整法は,Transformerモデルで一貫した性能向上(+2.7%)を示した。
- 単軸基準位相調整法は,空間位相関係を維持することで,最大96.2%の高い精度(+5.4%)を達成した。
- これらの結果から,位相調整戦略は実用的かつスケーラブルな改善策となり得ることが示された。
拡張と剪定:生成モデルにおける効果的なGRPOのための軌道多様性の最大化 [cs.CV, cs.LG]目的:生成モデルにおける効果的なGRPOのための軌道多様性の最大化
- 生成モデルの性能向上は,様々な応用において不可欠であり,その最適化手法の探求が重要である。
- GRPOは強力な手法だが,グループサイズと計算コストのトレードオフが課題となっていた。
- 報酬が集中する軌道を早期に除外し,計算コストを削減する手法を提案することで,この問題を解決する。
- 報酬のクラスタリング現象を観察し,多くの軌道がグループ平均報酬に収束することを発見した。
- 高分散な軌道のサブセットが,より大きなグループよりも優れた性能を発揮することを示した。
- Pro-GRPOにより,軌道の多様性を最大化しつつ,計算コストを削減できることを実証した。
大規模言語モデルにおける脱獄オペレーターとしてのポルトガル語の敵対的韻文 [cs.CL, cs.AI]目的:大規模言語モデルに対する敵対的攻撃手法の有効性評価
- 言語モデルの安全性確保は,社会実装において不可欠であり,その脆弱性評価は重要である。
- 既存の安全性評価は,表面的なパターンに依存しており,わずかな形式変更で回避される場合がある。
- ポルトガル語特有の韻律構造に着目し,その脆弱性を明らかにすることで,安全性向上に貢献する。
- 敵対的韻文を用いることで,通常は拒否される指示を実行させることが可能となり,安全性の失敗率が大幅に増加した。
- 手動で作成された詩は,約62%の成功率を示し,自動生成された詩も43%の成功率を記録した。一部のモデルでは90%を超える成功率を達成した。
- 韻文化はプロンプトを疎な潜在領域に移動させ,表面パターンに依存したガードレールが脆弱であることを明らかにした。
画像複雑度を考慮した適応的検索による効率的なビジョン言語モデル [cs.IR, cs.AI, cs.CV, cs.LG, cs.MM]目的:ビジョン言語モデルにおける画像検索の効率化
- ビジョン言語モデルは画像とテキストの理解において重要な役割を担うが,計算コストが高い。
- 既存モデルは画像の内容に関わらず一律の計算量を消費するため,効率性に課題がある。
- 画像複雑度に応じた計算量を調整し,効率性と性能の両立を目指す。
- 提案手法ICARは,画像複雑度に応じて処理深度を調整することで,計算量を削減する。
- 画像複雑度の判定にはConvNeXt-ICを使用し,人間の判断との高い相関を示す。
- 実世界データを用いた評価により,性能維持と20%の高速化を両立している。
