arXiv雑要約
AI - 2026/03/13 公開
文脈依存多様体学習:神経調節制約付き自己符号化器アプローチ [cs.LG]目的:文脈依存多様体学習の実現
- データ解析において,高次元データの低次元表現は重要な課題である。
- 従来の制約付き自己符号化器は,文脈変化に対応できず,表現能力が制限される。
- 本研究は,文脈に応じて多様体の形状を変化させることで,その問題を解決する。
- 神経調節機構を導入したNcAEは,静的な文脈情報に基づいて幾何学的制約を適応的にパラメータ化する。
- 実験結果から,NcAEは異なる状態間で多様体の形状の変化を正確に捉え,厳密な投影特性を維持することが示された。
- この結果は,神経調節がグローバルな文脈パラメータと局所的な多様体表現を効果的に分離することを示す。
安定スパイク:ビットごとのAND演算による双一貫性最適化 - スパイクニューラルネットワーク向け [cs.NE, cs.AI]目的:スパイクニューラルネットワークにおける表現能力の低下を引き起こす不整合の軽減
- スパイクニューラルネットワークは低消費電力で時間パターンを捉えるが,不整合が課題。
- スパイクの発火タイミングの変動による不整合が,ネットワークの性能を低下させている。
- 安定したスパイク構造を活用し,不整合を減らすことで,認識性能の向上を目指す。
- 提案手法では,ハードウェアに優しいAND演算を用いて,安定スパイク構造と変動スパイクマップを分離。
- 変動スパイクマップを安定スパイク構造に収束させることで,時間軸方向の一貫性を高める。
- 振幅を考慮したスパイクノイズを注入し,一貫性を保ちつつ表現力を高めることで汎化性能を向上。
制御から予見へ:人間とエージェントの協調におけるシミュレーションの新パラダイム [cs.HC, cs.AI, cs.CL]目的:人間とエージェントの協調におけるシミュレーションの有効性
- 複雑なタスク遂行において,AIエージェントの活用が不可欠となっている。
- 現状の人間とエージェントの協調は,逐次的な指示と修正に依存し,長期的影響の把握が困難である。
- シミュレーションを通じて将来予測を可能にし,より情報に基づいた意思決定を支援すること。
- シミュレーションを介した協調は,反応的な対応から情報に基づいた探索へと介入方法を変革する。
- これにより,潜在的な制約やユーザーの嗜好を明らかにすることが期待される。
- 本稿は,現在のパラダイムの限界を指摘し,シミュレーションに基づく協調の概念的枠組みを提示する。
LLMによる強力な表現構築と,効率的な教師あり学習の実現 [cs.AI]目的:入力表現の設計における課題解決
- 現実世界のデータは複雑化しており,効果的な表現が学習の鍵となる。
- 多様なデータ形式への対応には,専門知識を要する手作業が必要となる。
- LLMを活用し,データ形式を標準化することで,学習プロセスを効率化する。
- LLMが生成したルールに基づき,入力データを標準化することで,従来のモデルを大幅に上回る性能を達成した。
- この手法は,EHRSHOTベンチマークの15の臨床タスクにおいて,特に優れた結果を示した。
- ルールは監査が容易で,大規模な展開コストを抑えられ,表形式データへの変換も可能である。
エントロピー保存型強化学習 [cs.LG, cs.AI]目的:言語モデルの推論における強化学習アルゴリズムの多様性維持
- 言語モデルの推論能力向上には,多様な解決策探索が不可欠であり,強化学習が重要な役割を果たす。
- 既存の強化学習アルゴリズムは学習が進むにつれてエントロピーが減少し,探索の多様性を失う傾向がある。
- エントロピーを制御し,多様性を維持することで,より高性能で継続学習能力の高い方策を獲得することを目指す。
- 本研究では,主要な方策勾配目的関数がエントロピーに与える影響を分析し,数値精度がエントロピー挙動に与える影響を明らかにした。
- エントロピーを制御するメカニズムとして,利得関数を修正するREPOアルゴリズムと,非対称クリッピングを用いるADAPOアルゴリズムを提案した。
- 提案手法を用いた学習により,学習を通じて多様性を維持し,性能向上と新たな環境への適応能力の向上が確認された。
テキスト読み上げにおける因果的韻律媒介:FastSpeech2における持続時間,ピッチ,エネルギーの反実仮想的訓練 [cs.SD, cs.AI, cs.LG]目的:表現豊かなテキスト読み上げ合成のための因果的韻律媒介フレームワーク
- 自然な音声合成は,人間と機械の円滑なコミュニケーションに不可欠であり,その重要性は増している。
- 感情表現を含む韻律制御は難しく,感情と内容を分離したモデル構築が課題である。
- 感情に起因する韻律変化を明確化し,制御可能な音声合成を実現することを目指す。
- 提案手法は,韻律操作と感情表現においてベースラインのFastSpeech2モデルを大幅に上回る性能を示した。
- 因果的損失関数により,韻律の帰属が分離され,解釈可能なモデルが実現し,自然性を損なうことなく感情編集が可能となった。
- 話者間での感情転送時においても,明瞭度(低いWER)と話者一貫性が向上することが確認された。
SemBench:LLM評価のための普遍的意味フレームワーク [cs.CL, cs.CL, cs.AI]目的:LLMのセマンティック理解度を評価するためのフレームワーク
- 自然言語処理の進歩はLLMに依る所が大きいが,その真の理解度評価は依然重要である。
- 既存の評価指標は作成にコストがかかり,高資源言語に偏りがちである。
- 辞書定義と文エンコーダーのみで自動的に評価指標を生成し,言語非依存性を実現する。
- SemBenchは,英語,スペイン語,バスク語の3言語で有効性が確認された。
- SemBenchによるランキングは,標準的なWiCデータセットの結果と強い相関関係を示した。
- 安定したランキングを得るには,比較的少ないサンプル数で十分であることが示された。
ゼロショットタスクにおけるMLLMの検証と強化のための明示的論理チャネル [cs.AI]目的:MLLMの検証,選択,および性能向上
- 視覚と言語の理解はAIの重要な課題であり,その応用範囲は広い。
- MLLMはブラックボックスとして利用されることが多く,その挙動の理解が困難である。
- 明示的な論理チャネルを導入し,MLLMの推論過程を検証・改善すること。
- 提案手法である明示的論理チャネル(ELC)と一貫性評価指標(CR)が,MLLMの検証,選択,改善に有効であることが示された。
- ELCは,視覚的証拠に基づいた事実,反事実,関係性の推論を可能にし,説明可能性と信頼性を向上させる。
- MC-VQAとHC-RECのベンチマークにおいて,複数のオープンソースMLLMで有効性が確認された。
STAIRS-Former:インターリーブされた再帰構造を持つ空間的・時間的注意機構によるオフラインマルチタスクマルチエージェント強化学習 [cs.AI]目的:オフラインマルチタスクマルチエージェント強化学習における性能向上
- マルチエージェントシステムは,複雑なタスクを効率的に達成するために不可欠であり,その学習は重要である。
- タスク間でのエージェント数や環境の変化に対応できる汎化性能が課題となっている。
- エージェント間の協調と長期的な依存関係の学習を強化することで,汎化性能を高める。
- 提案手法STAIRS-Formerは,空間的・時間的な階層構造を取り入れたTransformerアーキテクチャである。
- 重要なトークンへの注意機構を強化し,エージェント間の長期的なインタラクション履歴を捉えることができる。
- 様々なマルチエージェントベンチマークにおいて,既存手法を凌駕し,最先端の性能を達成した。
OSCBench:テキストから動画生成における物体状態変化のベンチマーク [cs.CV, cs.AI, cs.CL]目的:テキストから動画生成モデルにおける物体状態変化の評価
- 動画生成技術の発展は,視覚的リアリティと意味理解の両立が重要である。
- 既存の評価指標は,物体状態変化というアクション理解の重要な側面を捉えられていない。
- 物体状態変化に特化したベンチマークを通じて,動画生成モデルの課題を明確化する。
- 既存のテキストから動画生成モデルは,セマンティックな整合性やシーンの構成は優れているものの,正確かつ時間的に一貫した物体状態変化の再現に苦慮している。
- 特に,学習データにない新しい状況や複雑な組み合わせにおいて,その課題が顕著になる。
- 物体状態変化は,テキストから動画生成における重要なボトルネックであり,OSCBenchがその診断のためのベンチマークとして機能する。
EvoFlows:タンパク質工学のための進化に基づく編集フローマッチング [cs.LG]目的:タンパク質工学のための新しい系列モデリング手法
- タンパク質は生命活動の根幹を担うため,その機能改変は医療や産業に応用可能である。
- 既存のタンパク質モデルは,多様な変異を生成する能力や自然な変異パターンを捉える点で課題がある。
- 進化の過程を模倣することで,自然な変異を生成し,タンパク質の機能改変を効率化することを目指す。
- EvoFlowsは,テンプレートタンパク質系列に対して,制御可能な挿入,削除,置換を行うことで変異を生成する。
- UNIREFとOASの多様なタンパク質コミュニティにおける評価で,EvoFlowsは主要なマスク言語モデルと同等の性能を示す。
- EvoFlowsは,テンプレートから自然な変異体を生成する能力が向上していることが示された。
教育AIエージェントのスケール則 [cs.AI]目的:教育AIエージェントの能力向上に関するスケール則の解明
- 教育現場における個別最適化された学習支援のニーズが高まっている
- LLMベースの教育エージェントの能力向上には,モデルサイズ以外の課題がある
- 教育エージェントの能力を体系的に向上させるための構造化されたアプローチの確立
- 教育エージェントの能力は,単にモデルサイズだけでなく,役割定義,スキル,ツール,実行能力,専門知識の注入といった構造化された要素によってスケールすることが示された。
- AgentProfileという構造化された仕様を用いることで,教育エージェントの能力を体系的に向上させることが可能となった。
- EduClawプラットフォームを用いた実験により,プロファイルの構造的豊富さが教育エージェントのパフォーマンスと相関することが確認された。
OpenClaw が病院で:動的な臨床ワークフローのためのエージェント型オペレーティングシステムへ [cs.AI]目的:病院環境におけるエージェント型オペレーティングシステムのアーキテクチャ
- 医療現場での効率化が求められ,AIによるワークフロー自動化への期待が高まっている。
- 自律エージェントの信頼性,セキュリティ,長期記憶メカニズムが,臨床現場への導入の課題となっている。
- 安全性を確保しつつ,臨床ワークフローを調整可能な計算層の基盤を構築すること。
- 提案アーキテクチャは,Linuxのマルチユーザーシステムに触発された制限付き実行環境を採用している。
- 患者と臨床医のエージェントを結びつけるドキュメント中心のインタラクションパラダイムを導入している。
- 長期的な臨床的文脈管理のためのページインデックス化されたメモリアーキテクチャを開発している。
高解像度PM2.5予測のためのクロス解像度注意ネットワーク [cs.CV, cs.LG]目的:高解像度PM2.5予測の精度向上
- 環境モニタリングにおいて,大陸規模の高解像度データは不可欠である。広範囲をカバーする予測は重要性が高い。
- 従来のVision Transformerは計算量の制約から,高解像度・広範囲な環境データへの適用が困難であった。
- 気象データとPM2.5データを効率的に統合し,物理的に整合性のある特徴表現を学習することで予測精度を高める。
- CRAN-PMは,25kmの気象データと1kmのPM2.5データをクロス解像度注意を用いて効率的に融合する。
- ヨーロッパ全域の2900万ピクセル規模のPM2.5マップを単一GPUで1.8秒で生成可能である。
- 2022年のヨーロッパにおけるPM2.5予測において,予測時間T+1でRMSEを4.7%,T+3で10.7%削減し,複雑な地形におけるバイアスを36%低減した。
バッファと無制限乗り換えのためのダイクストラ法の適応 [cs.DS, cs.AI, cs.RO]目的:公共交通機関における,無制限乗り換えを伴う経路探索
- 経路探索は,都市生活や交通システムの効率化に不可欠であり,その重要性は高い。
- 従来のダイクストラ法は,時刻表ベースの手法に取って代わられ,体系的な比較が不足していた。
- バッファ時間を考慮したダイクストラ法の改良により,より正確かつ効率的な経路探索を実現する。
- 時間依存ダイクストラ法(TD-Dijkstra)がMRよりも優れた性能を示すことが示された。
- バッファ時間を持つ停留所において,従来の接続フィルタリングが不適切であることが判明した。
- Transfer Aware Dijkstra(TAD)により,バッファ時間を正確に扱いながら,MRよりも2倍以上の高速化を達成した。
生成AI支援による採用プロセスにおけるジェンダーバイアス [cs.AI]目的:生成AI支援による採用プロセスにおけるジェンダーバイアスの評価と測定
- 労働市場における多様性の確保は,公平性と経済成長に不可欠である。
- 既存の労働市場にはジェンダーバイアスが根強く残存しており,機会の不平等を生んでいる。
- 生成AIがバイアスを増幅する可能性があり,公平な採用を阻害する恐れがある。
- 最新の生成AIモデル(GPT-5)は,候補者の性別と職務経験に基づいて職業を提案する際,ジェンダーに基づいた言語パターンを示すことが明らかになった。
- 女性候補者には感情的,共感的な特徴が,男性候補者には戦略的,分析的な特徴が結び付けられる傾向が確認された。
- AIモデルの採用プロセスへの利用は倫理的な問題を提起し,透明性と公平性の確保が重要である。
CINDI:電力網データにおける条件付き代入とノイズ耐性確保 [cs.CL, cs.AI, cs.LG]目的:電力網データのノイズ耐性確保とデータ整合性の回復
- 電力網のような重要インフラの安定運用には,高精度なデータが不可欠である。
- 現実の時系列データはノイズや異常値を含み,下流タスクの性能を低下させる。
- ノイズや異常値を考慮した,よりロバストなデータ処理手法の確立。
- CINDIは,条件付き正規化フローを用いて,異常検知と代入を統合した単一のシステムである。
- CINDIは,データの条件付き尤度をモデル化することで,統計的に整合性の高い代替値を効率的にサンプリングする。
- ノルウェーの電力網データを用いた評価で,CINDIが既存手法よりも堅牢な性能を示すことが確認された。
圧縮は真実よりも一貫性を優先する:言語モデルが正しい情報を選択するタイミングと理由 [cs.CL, cs.AI]目的:言語モデルにおける正誤の選択傾向
- 言語モデルの性能向上は,自然言語処理の発展に不可欠である。
- 言語モデルは学習データに含まれる誤った情報に影響を受けやすい。
- 言語モデルが正しい情報を選択するメカニズムの解明。
- 言語モデルは,学習データの圧縮性と内部一貫性を優先する傾向がある。
- 誤った選択肢の構造が複雑になると,正しい情報を選択する傾向が強まる。
- 一貫性のある誤ったルール系を用いると,正しい情報を選択する傾向は消失する。
多重性の負担軽減:分類器のキャリブレーションによる予測多重性の低減における役割 [cs.LG]目的:分類器の予測多重性の軽減
- 機械学習の応用拡大に伴い,予測の信頼性と安定性が不可欠となっている。
- 同じデータに対し,複数の最適解が存在し,予測結果にばらつきが生じる問題がある。
- キャリブレーションが予測の多様性を抑制し,公平性を高める可能性に着目する。
- 予測多重性は,予測信頼度が低い領域に集中する傾向が確認された。
- 少数クラスのデータにおいて,予測多重性の負担が大きいことが示された。
- Plattスケーリングや等方回帰などのキャリブレーション手法が,予測多重性を効果的に低減することが明らかになった。
潜在空間における誘導的バイアスを用いた時系列データの異常検知 [cs.AI, cs.LG]目的:多変量時系列データにおける異常の検知
- 時系列データは様々な分野で重要な役割を担うため,その異常検知は不可欠である。
- 従来の異常検知手法は,観測空間における尤度を最大化するため,時間的な構造を考慮できていない。
- 潜在空間に誘導的バイアスを導入し,時間的ダイナミクスに基づいた異常検知を実現する。
- 条件付き正規化フローに明示的な誘導的バイアスを導入することで,潜在表現の時間的進化を制約した。
- 異常検知を,潜在軌道の分布への適合性という統計的に妥当な適合度検定に帰着させた。
- 合成データおよび実データにおける実験により,周波数,振幅,観測ノイズにおける異常を信頼性高く検知できることを示した。
社会バンドット学習における非専門家および多様なエージェントの専門知識の活用:自由エネルギーアプローチ [cs.LG, cs.AI, stat.ML]目的:社会バンドット学習における自由エネルギーに基づくアルゴリズムの提案
- 人間や動物に見られる社会学習能力は,AIの性能向上に不可欠である。
- 既存の強化学習アルゴリズムは個々の学習に焦点を当て,社会学習の活用が不十分である。
- 他者の行動観察から学習する社会学習アルゴリズムを開発し,学習効率を向上させる。
- 提案アルゴリズムは,報酬を知らなくても他者の専門性を評価し,自身の経験と統合する。
- 理論的には最適な方策への収束が証明され,実験的評価で既存手法よりも優れていることが確認された。
- 特に,非専門家エージェントの存在下で,学習性能が大幅に向上し,ログリグレットを維持する。
情報探索における試行錯誤的ナビゲーションのモデル化:情報香りの逐次決定モデル [cs.HC, cs.IR, cs.LG]目的:情報香りの逐次決定モデル
- 情報アーキテクチャは,ユーザーが情報を効率的に見つける上で重要である。
- リンクの曖昧さや階層の深さが,情報探索の困難さを招く。
- 限られた時間と記憶の中で,ユーザーがどのようにナビゲーションするかを解明する。
- 本モデルは,ユーザーがページ全体をスキャンせず,戦略的に情報を探索するという行動を再現する。
- 早すぎる選択,誤った方向への進路,そしてバックトラックからの回復といったナビゲーション行動を説明できる。
- 試行錯誤的な行動は,ナビゲーション問題の逐次性と制約を考慮することで,情報香りの概念で十分に説明できる。
m-集合セミバンディット問題に対する両者の良い点を兼ね備えた効率的なアルゴリズム [cs.LG, stat.ML]目的:m-集合セミバンディット問題におけるFollow-the-Perturbed-Leader (FTPL) ポリシーの最適性と複雑性
- オンライン学習は,変化する環境下での意思決定において重要であり,その効率的なアルゴリズムが求められている。
- FTPLは有望なアルゴリズムだが,最適性が証明されておらず,FTRLと比較して理論的な保証が不足している。
- FTPLの最適性を示すと共に,計算量の削減を目指し,より実用的なアルゴリズムを開発すること。
- FTPLと幾何学的リサンプリング (GR) を組み合わせることで,最悪の場合の期待後悔が$O(\sqrt{mdT})$となることが示された。
- 特定のパラメータを持つFr\'{e}chet分布とPareto分布を用いることで,確率的設定下では対数的な後悔を達成し,FTPLのBest-of-Both-Worlds最適性を証明した。
- 条件付き幾何学的リサンプリングを導入することで,計算量を$O(d^2)$から$O(md(\log(d/m)+1))$に削減することができた。
Wikidata修飾子の理解:分析と分類 [cs.AI]目的:Wikidata修飾子の意味論と実際の利用に関する分析
- 知識グラフの構造化と意味的な表現において,修飾子は重要な役割を担う。
- 適切な修飾子を選択し,知識グラフを効率的にクエリする点が課題である。
- 修飾子の選択,クエリ,論理推論を支援する分類体系の構築を試みる。
- 分析の結果,上位300の修飾子を,文脈的,認識論的,構造的,追加的なカテゴリに分類した。
- 構築された分類体系は,Wikidataにおける修飾子の理解と利用を構造化的に行う上で有効である。
- この分類は,貢献者のステートメント作成,修飾子推薦システムの改善,知識グラフ設計手法の強化に役立つと考えられる。
LLMエージェントにおける進化するメモリの管理:リスク,メカニズム,および安定性と安全性が管理されたメモリ(SSGM)フレームワーク [cs.AI]目的:LLMエージェントのメモリ管理におけるリスク軽減と信頼性向上
- LLMエージェントの自律性を高める上で,長期記憶は重要な役割を担う。
- 動的な環境下では,メモリの破損,意味ドリフト,プライバシー侵害のリスクが存在する。
- メモリの整合性検証,時間的減衰モデリング,動的なアクセス制御によるメモリ管理を実現する。
- 本研究では,SSGMフレームワークを提案し,メモリ進化と実行を分離することで,知識漏洩のリスクを軽減できることを示した。
- SSGMは,反復的な要約による知識の劣化である意味ドリフトの防止にも貢献する。
- メモリ破損リスクの包括的な分類と,安全で永続的,信頼性の高いエージェントメモリシステム展開のためのパラダイムを確立した。
階層分類体系,ニューラルネットワーク,ドキュメント埋め込みに基づく自動テキスト分類法:NETHICツール [cs.AI, cs.CL]目的:自動テキスト分類法
- テキストデータの爆発的な増加に伴い,効率的な情報整理が不可欠となっている。
- 従来のテキスト分類法では,大規模データへの対応や分類精度の向上が課題であった。
- 階層構造を活用し,ニューラルネットワークとドキュメント埋め込みを組み合わせることで,より高精度かつ効率的な分類を実現する。
- NETHICツールは,スケーラブルなニューラルネットワークと階層分類体系の表現力を活用した自動テキスト分類法である。
- 汎用およびドメイン固有のコーパスを用いた実験により,その有効性と効率性が確認された。
- ドキュメント埋め込み機構の追加により,個々のネットワークと階層モデル全体の性能が向上した。
議論から熟議へ:タイプ化された認識行為による構造化された集団推論 [cs.CL, cs.CG, cs.CL, cs.CL, cs.AI, cs.CL, cs.MA]目的:多主体LLMシステムにおける構造化された集団推論の実現
- 複雑な問題解決において,複数エージェントの協力が不可欠となる場面が増加している。
- 既存システムでは,熟議としての段階的なプロセス,意見の保存,合意形成が不十分である。
- 熟議構造を導入し,説明責任のある意思決定を可能にすることを目指す。
- DCIは,非定型タスクにおいて,非構造化議論と比較して有意に高い性能を示すことが確認された。
- 特に,隠れプロファイルタスクにおいて,他のシステムを上回る成果を挙げ,多様な視点の統合に有効であることが示された。
- DCIは,構造化された意思決定パッケージや少数意見報告書を常に生成するが,トークン消費量が課題として残る。
HELM:グラフ学習による階層的・明示的なラベルモデリング - マルチラベル画像分類 [cs.CV, cs.AI]目的:マルチラベル画像分類における,階層的・明示的なラベルモデリング
- リモートセンシング分野では,複雑なラベル間の依存関係を捉えることが重要であり,階層的マルチラベル分類が不可欠である。
- 既存手法は,複数の分岐に属するインスタンスに対する対応や,ラベルなしデータの活用が不十分であるという課題がある。
- 本研究は,多岐にわたるラベル階層構造を効果的に学習し,ラベルなしデータも活用することで,分類精度向上を目指す。
- HELMは,Vision Transformerとグラフ畳み込みネットワークを組み合わせることで,ラベル間の複雑な関係性を捉えることに成功した。
- 複数のリモートセンシング画像データセットにおいて,既存の最先端手法を上回る性能を示し,特にラベル数の少ない状況でその効果が顕著であった。
- 自己教師あり学習を組み込むことで,ラベルなしデータの活用を可能にし,半教師あり学習においても優れた結果を達成した。
リプレイを用いた言語生成:モデル崩壊に関する学習理論的見解 [cs.LG, stat.ML]目的:モデル崩壊
- 大規模言語モデルの性能向上には大量のデータが必要であり,学習データ不足が課題となる。
- 生成されたコンテンツが再学習データに含まれることで,性能劣化やモデル崩壊のリスクが生じる。
- リプレイ攻撃による生成能力の限界を学習理論的に明確化し,対策の有効性を検証する。
- リプレイは,均一な生成においては問題とならないが,非均一な生成や極限学習においては分離を引き起こすことが示された。
- データクリーニング,ウォーターマーキング等の実用的な対策は,この理論的結果と整合性があることが示唆された。
- これらの対策が有効でない状況についても,理論的に分離が示された。
非教師あり対称群発見による,潜在表現の分離学習 [cs.LG]目的:環境変換の群構造を利用した潜在的変動要因の発見
- 表現学習は,AIの汎化性能向上に不可欠であり,特に潜在表現の分離が重要視されている。
- 既存手法は対称群構造の事前知識,または部分群に関する制約を必要とし,汎用性に課題があった。
- 環境との相互作用を通じて,エージェントが自律的に対称群構造を発見し,表現を分離することを可能にする。
- 提案手法は,最小限の仮定下で真の対称群分解の識別可能性を証明し,新たなアルゴリズムを導出した。
- 実験の結果,提案手法は既存のLSBDアプローチと比較して,異なる群分解を持つ環境において優れた性能を示した。
- 本研究は,事前知識に頼らない潜在表現の分離学習の可能性を提示し,よりロバストなAIシステムの構築に貢献する。
CLIPのビジョンエンコーダにおけるアテンションヘッドレベルでの人口統計学的バイアスの特定 [cs.CV, cs.AI, cs.CY]目的:CLIPのビジョンエンコーダにおける人口統計学的バイアスの局在化
- 基礎モデルの公平性確保は重要であり,社会における差別や不公平を助長するリスクを軽減するため不可欠である。
- 既存の公平性評価ではバイアスの存在は示せるが,ネットワーク内のどこにバイアスが存在するかの特定が困難である。
- アテンションヘッドレベルでのバイアス局在化により,モデルの透明性と制御性を高め,公平性を改善することを目指す。
- 提案手法により,CLIP ViT-L-14エンコーダにおいて,性別のバイアスを示す特定のアテンションヘッドを特定できた。
- 特定されたアテンションヘッドを削除することで,全体的なバイアスが軽減(Cramer's V: 0.381 -> 0.362)され,精度もわずかに向上した(+0.42%)。
- 年齢バイアスについても候補ヘッドは特定されたが,アブレーションによる効果は性別バイアスほど顕著ではなかった。
DocSage:複数ドキュメント複数エンティティ質問応答のための情報構造化エージェント [cs.IR, cs.DC, cs.AI]目的:複数ドキュメント複数エンティティ質問応答における情報構造化
- 複雑な質問に答えるためには,複数のドキュメントに分散した情報を統合する必要がある。
- 既存の手法では,重要な事実の欠落や,複雑な関係性の効率的な統合が課題となっていた。
- ドキュメント間の関係性を正確に推論し,より正確な回答を導き出すことを目指す。
- DocSageは,動的なスキーマ発見,構造化された情報抽出,スキーマを意識した関係推論を統合したエージェントフレームワークである。
- SQLを活用したインデックスにより正確な事実の特定,リレーショナルテーブルによるドキュメント間エンティティの結合を自然にサポートする。
- MDMEQAベンチマークにおいて,最先端のLLMやRAGシステムを27%以上上回る精度を達成した。
指数型族メンバーシップ推論:LiRAとRMIAからBaVarIAへ [cs.LG, cs.CR]目的:機械学習モデルのプライバシー監査におけるメンバーシップ推論攻撃の評価と改善
- 機械学習モデルのプライバシー保護は重要であり,その評価手法の確立が求められている。
- 既存のメンバーシップ推論攻撃は,攻撃手法の選択が難しく,性能にばらつきが見られる。
- 既存の攻撃手法を統一的に理解し,低予算・オフライン環境下での性能向上を目指す。
- LiRA,RMIA,BASEは,指数型族尤度比の枠組みにおける異なる分布仮定とパラメータ推定数の違いに過ぎないことが示された。
- BaVarIAは,共役正規逆ガンマ事前分布を用いることで,パラメータの閾値に基づいた切り替えを置き換え,安定した性能を実現する。
- BaVarIAは12のデータセットと7のシャドウモデル予算において,LiRAやRMIAと同等以上の性能を示し,特に低予算・オフライン環境下で大きな改善が見られた。
マルチエージェント制御に対する準分散型アプローチ [cs.AI]目的:協調的エージェントの準分散型制御
- 複数エージェント間の協調制御は,ロボティクスや分散システムの実現に不可欠である。
- 通信の不確実性下では,エージェント間の情報共有が困難となり,最適な制御が難しくなる。
- 通信の不確実性を考慮した,より現実的なマルチエージェント制御手法を確立すること。
- 準分散型制御の理論的基盤を明確化し,様々なマルチエージェント通信問題への応用可能性を示した。
- 準分散型POMDP(SDec-POMDP)を導入し,分散型とマルチエージェントPOMDP,既存の明示的通信メカニズムを統合した。
- 最適なSDec-POMDPポリシーを生成するための,正確なアルゴリズムである再帰的ステップバイステップ準分散型A*(RS-SDA*)を提示し,ベンチマークで評価した。
リモートセンシングVLMsのためのOSMに基づくドメイン適応 [cs.CV, cs.LG]目的:リモートセンシング画像とテキストのドメイン適応
- リモートセンシング分野では,画像とテキストの関連性を理解するモデルの重要性が高まっている。
- 高品質なリモートセンシング画像のラベル付けは困難であり,コストが高いという課題がある。
- 既存手法の教師モデルへの依存を解消し,低コストで高性能なドメイン適応を実現する。
- OSMDAは,OpenStreetMapのデータを活用し,教師モデルなしで自己完結型のドメイン適応を可能にする。
- モデルは,航空画像とOSMタイルを組み合わせることで,自己生成されたキャプションを用いて学習する。
- 10のベンチマークにおいて,既存手法を凌駕する性能を示し,訓練コストも大幅に削減されることが確認された。
大規模なオープンソースエージェントリポジトリのマイニングによるスキル獲得の自動化:マルチエージェント手続き的知識抽出のためのフレームワーク [cs.CY, cs.AI]目的:エージェントスキルの自動獲得フレームワーク
- AIの展開において,汎用モデルからスキルを備えたモジュール型エージェントへの転換が重要視されている。
- 汎用モデルは豊富な知識を持つ一方,自律的なワークフローにおける専門的な手続き知識が不足している。
- オープンソースリポジトリから手続き的知識を抽出し,LLMの能力を向上させることを目指す。
- GitHub等のオープンソースリポジトリから,可視化や教育能力といったエージェントスキルを抽出するフレームワークを開発した。
- 抽出された手続き的知識は,標準化されたSKILL.md形式に変換され,LLMの再学習なしに能力を拡張することが可能である。
- エージェント生成の教育コンテンツは,知識伝達効率を40%向上させ,人間の作成したチュートリアルと同等の教育品質を維持する。
RADAR:セマンティックプランニングと自律的因果環境リセットによる閉ループロボットデータ生成 [cs.RO, cs.AI, cs.CV]目的:ロボット学習に必要な大規模物理的インタラクションデータの効率的な収集
- ロボットの学習には大量のデータが必要であり,物理的インタラクションデータの収集が重要な課題である。
- 従来の人間が介入するデータ収集方法では,コストや拡張性に限界がある。
- 人間を介在させずに,自律的にデータを収集できるシステムの開発。
- RADARは,人間による介入なしに,セマンティックプランニングと環境リセットを組み合わせた閉ループシステムを実現した。
- シミュレーション実験では,複雑なタスクにおいて90%の成功率を達成し,従来のベースラインを大幅に上回った。
- 実世界での実験では,少量のデータで,ドメイン固有の調整なしに多様なスキルを実行できることを示した。
VisiFold: 時間的フォールディンググラフとノード可視性による長期的交通予測 [cs.AI]目的:長期的交通予測のための手法
- 交通予測は知的交通システムの根幹であり,都市計画や交通管理に不可欠である。
- 既存研究は短期予測に注力する一方,長期的予測は計算資源と複雑な時空間依存性の問題がある。
- VisiFoldは,計算資源の制約を打破し,より現実的な長期的交通予測を可能にすることを目指す。
- VisiFoldは,時間的なスナップショットを単一のグラフに統合する時間的フォールディンググラフを導入することで,計算資源の消費を大幅に削減する。
- ノードレベルのマスキングとサブグラフサンプリングによるノード可視性メカニズムは,大規模なノード数による計算のボトルネックを克服する。
- 実験により,VisiFoldは既存手法と比較して,長期的予測タスクにおいて優れた性能を示すことが確認された。
深層学習モデルとXAIを用いた卵巣悪性病変の自動検出 [cs.AI, cs.CV]目的:卵巣癌の正確な検出と識別
- 近年,医療現場における診断能力向上が喫緊の課題である。
- 卵巣癌は,非侵襲的検出の精度が低く,正確な診断に時間と侵襲性が必要である。
- 深層学習とXAIを活用し,卵巣癌の早期かつ正確な検出法の確立を目指す。
- 拡張データセットにおいて,InceptionV3モデルがReLU活性化関数とともに,全ての評価指標で平均94%の最高結果を示した。
- LIME,Integrated Gradients,SHAPといったXAIモデルを用いて,選択されたモデルの判断根拠を比較分析した。
- 本研究は,卵巣癌の検出方法の改善に貢献することが期待される。
エネルギー市場におけるハイブリッド人間・エージェントの社会的ジレンマ [cs.MA, cs.AI, cs.GT]目的:エネルギー市場における人間と自律エージェントが混在する環境下での協調行動の発生メカニズムの解明
- エネルギー需給の最適化は,持続可能な社会の実現に不可欠であり,そのための効率的な需要管理が重要である。
- 従来の需要管理は個々のエージェントの最適化に偏りがちで,全体としての協調が困難であるという課題がある。
- 本研究は,協調を促進する人工エージェントを導入することで,エネルギー市場における社会的ジレンマの解決を目指す。
- 人工エージェントが,全体を俯瞰した情報に基づき協調行動を促し,学習ダイナミクスを協調的な結果へと導くことを示した。
- 人工エージェントの導入が初期段階でも,導入側が不利になることなく,全体的な成果の向上に貢献する可能性があることを示した。
- 導入側の協調行動が非導入側にも利益をもたらす場合があり,AI技術導入における戦略的な配慮の重要性を示唆した。
情報システムにおける生成AIの現状:二次レビューと研究課題の統合 [cs.CL, q-fin.GN, cs.CY, cs.AI]目的:生成AIに関する知識の現状と研究課題
- 企業における生成AIの急速な導入が進む中で,その影響を理解し,効果的な活用方法を探ることが重要である。
- 生成AIの技術的な信頼性,倫理的リスク,およびガバナンスの欠如が,その普及を妨げる要因となっている。
- 技術と社会システムの間のミスマッチを解消し,生成AIと組織,社会,規制の協調的進化を促す。
- 生成AIは生産性とイノベーションに変革をもたらす可能性を秘めているが,技術的な信頼性や倫理的リスクなどの課題を抱えている。
- 技術サブシステムと社会サブシステムの適応速度のずれが,課題の根本にあることが示唆された。
- 人間とAIのハイブリッド,状況に応じた検証,確率的システムの設計原則,適応型ガバナンスが,今後の研究課題として提唱された。
ODEパラメータ最適化のための逆ニューラル演算子 [cs.LG]目的:ODEパラメータの復元
- 複雑なシステムの挙動を記述する微分方程式のパラメータ同定は,科学技術の発展に不可欠である。
- パラメータ同定は計算コストが高く,特に強強烈なシステムでは勾配消失や不安定性が発生しやすい。
- スパースな観測データから効率的にODEパラメータを復元し,計算コストを削減することを目指す。
- 提案手法であるINOは,勾配法や既存のアモルタイズド法と比較して,パラメータ復元の精度で優れている。
- INOは,ITERATIVE gradient descentに比べ487倍高速な0.23秒の推論時間でパラメータを復元できる。
- 実際の化学反応モデルや遺伝子制御ネットワークの実験で,その有効性が確認された。
複数ステーションWiFi CSIセンシングフレームワーク:ステーションごとの特徴消失と限られたラベルデータへの耐性 [cs.LG]目的:複数ステーション環境におけるWiFi CSIセンシングの課題解決
- WiFi CSIセンシングは,低コストで高精度な環境認識を可能にするため,様々な分野で注目されている。
- 実際の環境では,ステーションの故障や電波状況により,CSIデータの欠損が発生しやすく,センシング精度を低下させる。
- ステーションごとの特徴消失とラベルデータの不足という課題を同時に解決し,実用的なセンシングシステムを構築する。
- 提案手法では,教師なし学習とデータ拡張を組み合わせることで,欠損データの影響を軽減し,ロバストな性能を実現した。
- 欠損に強い表現学習とステーションごとのマスキング拡張を組み合わせることで,欠損とラベル不足の両方に対して高い性能を発揮する。
- このフレームワークは,実世界のWiFi CSIセンシングにおける,より実用的で頑健な基盤を提供する。
指示されたからやった:LLMエージェントにおける指示テキスト誘発のプライベートデータ漏洩の測定 [cs.CR, cs.AI]目的:LLMエージェントにおける指示テキストを介したプライベートデータ漏洩の程度
- LLMエージェントは業務自動化に利用され,その信頼性は増しているが,セキュリティ上の問題も懸念されている。
- LLMエージェントは指示の正当性を判断できず,悪意のある指示も実行してしまうという根本的な脆弱性が存在する。
- ドキュメント埋め込み型指示注入による脅威を定量化し,LLMエージェントのセキュリティ対策の必要性を示す。
- 実世界のREADMEファイルを対象としたベンチマークテストにより,最悪85%のデータ窃取成功率が確認された。
- 異なるプログラミング言語や注入位置に依存せず,一貫して高い成功率を示す結果となった。
- ユーザースタディや防御策の評価から,現在の技術では信頼性の高い検知は困難であることが示唆された。
CreativeBench:自己進化型課題による機械の創造性のベンチマークと向上 [cs.AI]目的:機械の創造性評価のためのベンチマークと,創造性向上戦略
- 高品質な学習データの限界から,創造性を継続的に進化させるシステムへの注目が高まっている。
- 機械の創造性を定量的に評価する厳密な基準やベンチマークが存在しない。
- 機械の創造性を客観的に評価し,その能力向上を目指す。
- CreativeBenchは,コード生成における機械の創造性を評価するベンチマークである。
- モデルの規模拡大は組み合わせ的創造性を向上させるが,探索的創造性には限界があることが示された。
- EvoRePEという推論時ステアリング戦略により,機械の創造性を一貫して向上させることが可能となった。
AIエージェントにおける社会的,法的,倫理的,共感的,文化的規範の運用化 [cs.AI, cs.SE]目的:AIエージェントの規範要件の特定,検証,実装,および検証のための体系的なSLEEC規範運用化プロセス
- 医療や法執行など,AI利用が拡大する中で,人間の規範との整合性が不可欠となっている。
- 国際的な枠組みはあるものの,抽象的な原則を具体的な要件に変換する手法が不足している。
- AIエージェントを人間規範と価値観に合致させ,機能性と倫理性を両立させるための枠組みを確立する。
- 本研究では,SLEEC規範の運用化プロセスを提案し,そのための方法とツールを調査した。
- このプロセスにより,AIエージェントの行動を人間規範に沿って検証可能にすることが可能となる。
- また,今後の研究課題と政策課題を明確にし,AI開発の方向性を示すことを目的とする。
可逆インスタンス正規化の役割について [cs.CE, cs.LG]目的:時系列予測における正規化の役割の解明
- 深層学習において不可欠なデータ正規化だが,時系列予測への応用は十分な理解が得られていない。
- 時系列予測において,時間的分布シフト,空間的分布シフト,条件付き出力分布シフトが課題である。
- 広く用いられる可逆インスタンス正規化(RevIN)の改良による,頑健性と汎化性能の向上を目指す。
- RevINの構成要素の一部が無駄であるか,むしろ性能を悪化させることを,消去実験により明らかにした。
- これらの観察に基づき,RevINのロバスト性と汎化性能を改善するための新たな視点を得た。
AdaFuse:トークンレベルの事前ゲーティングと融合カーネル最適化による動的アダプター推論の高速化 [cs.AI]目的:大規模言語モデルにおける動的アダプター推論の効率化
- 大規模言語モデルの性能向上には,MoEのような動的構造とアダプターの組み合わせが有効である。
- 動的構造とアダプターの組み合わせは,推論速度の大幅な低下を引き起こすという課題がある。
- AdaFuseは,推論速度の低下を抑制し,モデル性能と推論効率のギャップを埋めることを目指す。
- AdaFuseは,トークンレベルでの事前ゲーティング戦略により,各トークルの実行パスを静的に最適化する。
- カスタムCUDAカーネルを用いて,選択されたLoRAアダプターのパラメータをバックボーンモデルに効率的に融合する。
- 実験結果から,AdaFuseは最先端の動的アダプターと同等の精度を維持しつつ,デコーディング速度を2.4倍以上に向上させる。
大規模疎多目的最適化のための確率的焼きなまし進化アルゴリズム [cs.NE]目的:大規模疎多目的最適化問題に対する探索手法
- 現実世界の様々な問題に応用可能であり,効率的な最適化が求められている。
- 変数数が多く,非ゼロ変数の特定が困難であり,探索と利用のバランスが課題である。
- 探索と利用のバランスを調整し,重要な非ゼロ変数を効率的に特定することを目指す。
- 提案アルゴリズムは,収束性と多様性の両面において,既存の進化アルゴリズムよりも優れた性能を示す。
- 2つの確率ベクトルを組み合わせることで,探索と利用の動的なバランスを実現している。
- 確率的焼きなましにより,適応的な探索から局所的な改良への移行を可能にしている。
ミラーデザインパターン:プロンプトインジェクション検出のための厳密なデータ幾何学とモデル規模 [cs.CR, cs.AI]目的:プロンプトインジェクションの検出
- 大規模言語モデルの安全性確保は重要であり,プロンプトインジェクション対策は不可欠である。
- 既存のプロンプトインジェクション対策は,モデル規模に依存し,高速性や透明性に課題がある。
- 厳密なデータ幾何学に基づき,高速かつ信頼性の高いプロンプトインジェクション検出を実現する。
- ミラーデザインパターンを用いて,厳密にキュレーションされたデータセットを構築した。
- 線形SVMモデルを使用し,サブミリ秒単位の低遅延で95.97%の再現率と92.07%のF1スコアを達成した。
- 大規模モデルと比較して,データ幾何学がプロンプトインジェクションの初期スクリーニングにおいて重要であることが示された。
