arXiv雑要約
AI - 2026/03/27 公開
歩行の基礎モデルは3次元骨格運動から多系統の健康表現型を予測する [cs.AI, q-bio.QM]目的:多系統の健康表現型の予測
- 歩行は全身状態を示す重要な指標と考えられている。
- 既存の手法では,歩行が特定の病理の症状として扱われがちである。
- 歩行を全身のバイオシグナルとして捉え,多系統の健康状態を予測すること。
- 歩行の基礎モデルは,年齢,BMI,内臓脂肪面積の予測において高い相関を示した。
- 年齢,BMI,内臓脂肪,身長を調整後も,歩行は男女ともに複数の身体システムにおいて独立した予測向上をもたらした。
- 下肢は代謝や虚弱の予測に,胴体は睡眠やライフスタイルの表現型をエンコードすることが示唆された。
SliderQuant:LLMに対する正確なポストトレーニング量子化 [cs.AI]目的:大規模言語モデルのポストトレーニング量子化における精度向上
- 近年の大規模言語モデルの利用拡大に伴い,計算コストの削減が重要な課題となっている。
- 従来の量子化手法では,モデルの層ごとに均一な量子化を適用するため,精度劣化が生じやすい。
- 本研究は,層ごとの量子化感度に応じた適応的な量子化手法を提案し,精度劣化を抑制することを目指す。
- 提案手法SliderQuantは,層の量子化感度に応じてスライディングウィンドウを適用することで,量子化誤差を大幅に削減する。
- Llama,Llama2,Llama3,Qwen2.5,DeepSeek-R1,MoEモデルなど,多様なLLMで既存手法を上回る性能を達成した。
- 特に,重みのみの量子化と重み活性化の量子化の両方において,最先端の量子化手法と比較して優位性を示した。
CSIタプルに基づく3次元チャネルフィンガープリント構築:マルチモーダル学習支援 [eess.SY, cs.SY, cs.IT, cs.AI, cs.ET, cs.LG, eess.SP, math.IT]目的:3次元チャネルフィンガープリントの構築
- 低高度通信は,空中と地上ワイヤレスリソースの統合を促進し,ネットワークカバレッジを拡大,伝送品質を向上させる。
- 従来手法では,チャネル状態情報の推定に計算コストがかかり,リアルタイム性が課題であった。
- 提案手法は,マルチモーダル学習を用いて3次元チャネルフィンガープリントを効率的に構築し,推定コストを削減する。
- 提案手法は,Ricianフェージングチャネルに基づきCSIタプルを用いて3次元チャネルフィンガープリントモデルを構築する。
- 数値実験により,提案フレームワークは最先端アルゴリズムと比較して少なくとも27.5%高い精度を達成することを示した。
- 計算複雑性分析の結果,推論時間の面でも優れていることが示された。
クロスサイロ型連合学習における参加者の失敗がモデル品質に与える影響の解明 [cs.DC, cs.AI]目的:参加者の失敗がモデル品質に及ぼす影響の調査
- プライバシー保護と分散環境での機械学習が重要視される現代において,連合学習は不可欠な技術である。
- 連合学習は分散システムであるため,障害が発生しやすいが,その影響は十分に解明されていない。
- 参加者の欠損がモデル性能に与える影響を明らかにし,連合学習の信頼性を高める。
- 参加者の欠損はモデル性能に影響を与え,特にデータ偏りが強い場合,楽観的な評価結果となる可能性がある。
- データ偏りは他の要因の影響さえ変化させることが示唆された。
- 欠損参加者に対するグローバルモデルの有用性についても検証された。
科学論文からの文書に基づく意味的DAGの構築 [cs.AI, cs.CL]目的:科学論文からの意味的DAGの構築
- 科学技術分野では,構造化された知識表現としてDAGの利用が広まっている。
- 専門家の解釈が必要なため,現実世界のDAGデータセットの構築は困難である。
- 文書から適切な意味的DAGを抽出し,根拠となる証拠を提示することを目指す。
- 本研究では,DAG図を含む科学論文を教師データとして活用するフレームワークDAGverseを提案した。
- DAGverse-Pipelineは,図の分類,グラフの再構成,意味的根拠付け,検証を通じて高精度なDAGサンプルを生成する。
- 実験の結果,既存のVision-Languageモデルを上回り,文書に基づくDAGベンチマークの基盤となる。
AD-CARE:ガイドラインに基づいた,モダリティに依存しないLLMエージェントによる,多施設評価,公平性分析,読者調査を用いた現実世界のアルツハイマー病診断 [cs.MA, cs.AI]目的:現実世界におけるアルツハイマー病の診断支援
- 高齢化社会において,アルツハイマー病は世界的な健康問題であり,早期正確な診断が重要である。
- 実際の診断では,不完全で多様なデータや,施設間・患者背景のばらつきが課題となっている。
- 不完全なデータから,臨床判断を支援する包括的な診断レポートを生成することを目指す。
- AD-CAREは,6つの施設,10,303例のデータで診断精度84.9%を達成し,ベースライン手法を4.2%-13.7%上回った。
- 人種や年齢グループ間における性能格差を縮小し,4つの指標のばらつきをそれぞれ21%-68%,28%-51%減少させた。
- 読者調査において,神経科医と放射線科医の診断精度を6%-11%向上させ,判断時間を半分以下に短縮した。
プルーニングが特徴量をどのように再構築するか:重みプルーニングされた言語モデルの疎なオートエンコーダ分析 [cs.LG, cs.AI]目的:言語モデルにおける重みプルーニングが学習された内部表現に及ぼす影響の解明
- 大規模言語モデルの利用拡大に伴い,モデル圧縮技術の重要性が増している。
- 重みプルーニングは有効だが,内部表現の変化が不明確であり,解釈可能性の低下を招く可能性がある。
- プルーニングが特徴量の幾何学的構造に与える影響を定量的に評価し,解釈可能性を維持する。
- プルーニングは,頻繁に発火する特徴量よりも,まれに発火する特徴量を優先的に保持する傾向があることが示された。
- Wandaプルーニングは,マグニチュードプルーニングと比較して,特徴量の構造を最大3.7倍良く保持する。
- プルーニングされたモデルにおいても,事前学習済みの疎なオートエンコーダは,最大50%のスパース性まで有効であることが示された。
有害な操作を目的とした言語モデルの評価 [cs.AI, cs.CY]目的:AIによる有害な操作の評価フレームワーク
- AI技術の発展に伴い,その悪用によるリスクが顕在化しており,倫理的な評価が不可欠である。
- AIの有害な操作を評価する既存の手法は限定的であり,実用的な指標の確立が課題となっている。
- AIが特定の状況下で操作的な行動を起こす可能性を評価し,その影響を明らかにすること。
- 実験の結果,テストされたAIモデルは指示に応じて操作的な行動を示し,参加者の信念や行動に変化を引き起こすことが確認された。
- 操作的な行動は,利用分野によって異なり,AIシステムの利用状況に応じた評価の重要性が示唆された。
- 地理的な場所によっても結果が異なり,地域限定的な評価の必要性が示された。また,操作行動の頻度と成功率は必ずしも一致しないことがわかった。
深層強化学習に基づく自動運転車と人手運転車の混合交通流のマクロ特性 [cs.AI]目的:混合交通における深層強化学習に基づく自動運転車のマクロ交通流特性および燃費の分析
- 交通渋滞緩和や輸送効率向上には,交通流の理解と最適化が不可欠である。
- 従来の交通流モデルは多様な状況に対応できず,燃費を考慮しないという課題がある。
- 深層強化学習を用いて,混合交通における交通流特性と燃費改善を目指す。
- 安全性を損なうことなく,深層強化学習フレームワークが交通容量と燃費を向上させることを示した。
- 交通流は安全時間間隔の分布と深層強化学習車の割合に敏感であることがわかった。
- 人手運転車のみから深層強化学習車のみへの移行により,道路容量は約7.52%増加した。
- 深層強化学習車は,IDMと比較して,高速(50km/h以上)で約28.98%,低速(50km/h以下)で約1.86%燃費を向上させた。
適応的チャンキング:RAGのためのチャンキング手法選択の最適化 [cs.CL, eess.SY, cs.SY, cs.CL, cs.AI, cs.IR]目的:RAGの性能向上のためのチャンキング手法選択フレームワーク
- 情報検索と自然言語処理の融合により,大規模言語モデルの知識拡張が重要になっている。
- 文書の構造や意味的特性を考慮しない一律的なチャンキング手法が課題となっていた。
- 文書固有の特性に基づき最適なチャンキング手法を自動選択し,RAGの精度向上を目指す。
- 提案手法では,5つの文書固有の指標を用いてチャンキング品質を評価する。
- 多様な分野のデータセットにおいて,提案手法はRAGの性能を大幅に改善した。
- モデルやプロンプトを変更することなく,正答率を向上させ,より多くの質問に正しく回答できた。
フェデレーテッド学習における適応閾値と自律的意思決定を通じたエージェント的信頼協調 [cs.AI, cs.LG]目的:持続可能で強靭な産業ネットワークにおけるフェデレーテッド学習の信頼協調
- 産業ネットワークでは,センシング,通信,計算が不可欠であり,分散型知能の重要性が高まっている。
- クライアントの不整合な挙動やノイズ,悪意のある更新により,フェデレーテッド学習の信頼性が損なわれる場合がある。
- 変化する状況下でも安定した学習を可能にする,文脈を考慮した信頼調整メカニズムを提案する。
- 提案手法は,サーバー側の制御ループとして機能し,信頼関連信号とシステムレベル信号を観察・解釈する。
- これにより,固定パラメータや単純な適応規則の限界を克服し,安定したフェデレーテッド学習を実現する。
- クライアント側の学習を変更したり,通信オーバーヘッドを増加させたりすることなく,信頼協調を可能にする。
意図から証拠へ:深層研究エージェントの構造的評価のためのカテゴリー論的アプローチ [cs.CL, cs.LG]目的:深層研究エージェントの構造的評価のための新たなベンチマークと評価方法
- 複雑な情報統合において,深層研究エージェントの有用性が期待されており,その評価手法の確立が重要である。
- 既存の評価はアドホックであり,エージェントの行動を厳密にモデル化できていない。長期的合成や曖昧性解消のテストが不十分である。
- カテゴリー論を用いて深層研究ワークフローを形式化し,構造的ストレスに対する評価を可能にすることを目指す。
- 本研究で提案するベンチマークは,4つの評価軸(連結性の探索,V構造の検証,トポロジカル順序付け,存在論的偽反駁)を含む。
- 11の主要モデルの評価結果から,平均精度は19.9%と低く,構造的ストレスに対する性能が低いことが明らかになった。
- 高度なモデルは動的なトポロジカル再順序付けや存在論的検証には成功する一方,多段階構造合成では著しく性能が低下する。
画像回転角度推定:円環認識手法の比較 [cs.DL, cs.CV, cs.AI, eess.IV]目的:画像回転角度推定のための円環認識手法の性能評価
- 画像処理パイプラインにおいて,正確な画像回転角度推定は重要な前処理ステップである。
- 角度の円環的な性質が,標準的な回帰手法の精度を阻害する課題がある。
- 様々な円環認識手法を比較し,最適な画像回転角度推定手法を特定すること。
- 確率的手法,特に円環ガウス分布が,様々なアーキテクチャにおいて最も頑健であることが示された。
- EfficientViT-B3を用いた分類が最も高い精度を示したが,アーキテクチャによっては学習の不安定性が認められた。
- COCOデータセットでの評価では,本研究で提案する手法が従来手法を大きく上回り,MAE 2.84°を達成した。
整数算術パズルにおける構造的難易度モデリング [cs.AI]目的:整数算術パズルにおける難易度の構造的決定要因
- 適応学習システムにおいて,数学的推論の難易度を理解することは重要である。パズルは制御された実験環境を提供する。
- 既存の難易度予測モデルは,簡単な問題を区別する能力に限界がある。難易度と構造的特徴の関係は不明確である。
- パズルの難易度を決定する構造的属性を特定し,難易度推定の透明性と説明可能性を高める。
- 問題を解くための最小操作回数に基づいて難易度を定義し,大規模なデータセットを構築した。
- 難易度は,最小操作証明から導出される解釈可能な構造的属性によって完全に決定されることが示された。
- 特に,最小構成で使用される入力値の数が難易度の最小十分統計量として機能することが分かった。
モバイルロボティクスにおける物体ナビゲーションのための深層強化学習とベイズ推論の統合 [cs.RO, cs.RO, cs.AI, cs.CV]目的:屋内環境における物体探索の効率化
- ロボットが自律的に行動するための知能化が求められており,特に現実世界の複雑な環境下での探索能力が重要である。
- 従来の探索手法は手動での調整が必要であり,強化学習は学習に時間がかかり,解釈が難しいという課題がある。
- ベイズ推論と深層強化学習を組み合わせることで,効率的かつ信頼性の高い探索行動を実現することを目指す。
- 提案手法は,ターゲット位置の空間的確信度マップをベイズ推論により更新し,その確率的表現からナビゲーションアクションを選択する強化学習ポリシーを訓練する。
- シミュレーション実験の結果,提案手法は成功率を向上させ,探索努力を削減することが示された。
- ベイズ推定と学習された行動選択の組み合わせが,部分的な観測下での効率的な物体探索に貢献することが確認された。
ヘッセ行列情報を活用した機械学習分子間ポテンシャル:理論と実験の架け橋 [cs.DC, cs.LG]目的:分子および物質の実験的観測量を第一原理から予測するためのポテンシャルエネルギー曲面の局所的な曲率の信頼性向上
- 分子や物質の熱力学・動力学現象の予測には,ポテンシャルエネルギー曲率の情報が不可欠である。
- 複雑な系においては,正確な曲率情報を得ることが計算コストの面で困難であった。
- ヘッセ行列情報を活用し,データが少ない状況下でも高精度な予測を可能にすること。
- ヘッセ行列情報に基づく機械学習分子間ポテンシャル(Hi-MLIP)を開発し,熱力学・動力学現象の解析精度を向上させた。
- ヘッセ行列を用いた効率的な学習プロトコル(HINT)を開発し,ヘッセ行列ラベルの必要量を大幅に削減した。
- 遷移状態探索の精度向上と,ギブズ自由エネルギー予測の化学的精度向上を実現し,実験値との整合性も高めた。
連合型情報検索の性能向上 [cs.IR, cs.CL, cs.CR, cs.LG]目的:連合学習によるRAGシステムの開発
- 分散型データ環境における知識活用は,プライバシー保護と効率的な情報アクセスが重要となる。
- 既存のRAGシステムは,中央集権的なデータアクセスを前提としており,プライベートなデータサイロでは適用が困難である。
- 本研究は,プライバシーを保護しながら分散データから知識を活用できるRAGシステムを構築することを目的とする。
- Flowerを用いて連合型RAGシステムを構築し,ローカルでの検索と,安全な環境下での集約・テキスト生成を実現した。
- 第三者モデル(Amazon Nova等)を補助的なコンテキストとして組み込むカスケード推論アプローチを提案し,機密性を損なうことなく性能向上を図った。
- 本システムは,正直なサーバーや侵害されたサーバーが存在する場合でも,機密保持されたリモートLLM推論を可能にする。
構造化された意図表現は汎用化するか?5W3Hプロンプティングのクロス言語・クロスモデル実証研究 [cs.DC, cs.AI, cs.HC]目的:構造化された意図表現の汎用性
- 人間とAIのインタラクションにおいて,意図の正確な伝達は重要である。
- 自然言語による意図表現は曖昧さを持ちやすく,AIへの指示の誤解を招く可能性がある。
- 5W3Hフレームワークを用いた構造化表現が,意図伝達の精度と効率を向上させるか検証する。
- AIによる拡張された5W3Hプロンプトは,手動で作成された5W3Hプロンプトと同程度の目標適合性を示すことが明らかになった。
- 構造化されたPPS条件は,クロスモデル出力のばらつきを低減または再形成する効果が確認されたが,言語や評価指標によって効果に差が見られた。
- 非構造化プロンプトには,複合スコアの人工的な高まりと,クロスモデル分散の人工的な低さという二重のバイアスが存在することが示された。
GlowQ:量子化された大規模言語モデルのためのグループ共有低ランク近似 [cs.LG, cs.AI]目的:量子化された大規模言語モデルの低ビット表現における精度低下の軽減
- 大規模言語モデルの利用拡大には,効率的な推論が不可欠であり,量子化はそのための重要な技術である。
- 従来の量子化手法では,低ビット表現にすることで精度が低下する問題が存在する。
- グループ共有低ランク近似を用いることで,精度を維持しつつ,遅延とメモリオーバーヘッドを削減することを目指す。
- GlowQは,入力共有グループごとに一つの共有右因子をキャッシュすることで,パラメータとメモリオーバーヘッドを削減する。
- GlowQは,TTFBを平均5.6%削減し,スループットを平均9.6%向上させる。
- 選択的モデルGlowQ-Sは,TTFBを23.4%削減し,スループットを37.4%向上させる。
形状と実体:ローカルVision-Languageモデルに対する二層サイドチャネル攻撃 [cs.CR, cs.AI, cs.LG]目的:ローカルVision-Languageモデルにおけるサイドチャネル脆弱性の実証と対策
- 近年,プライバシー保護のため,デバイス上でのAI処理が重要視されている。
- 動的解像度処理の導入により,処理時間やキャッシュ競合が入力に依存するようになった。
- 入力画像の形状や内容を推測される脆弱性を明らかにし,対策を検討する。
- 動的解像度処理を持つローカルVLMは,実行時間変動から入力画像の形状を識別される脆弱性を持つ。
- LLC競合のプロファイリングにより,形状が同じ画像でも,内容(高密度 vs. 低密度)を区別可能となる。
- 本研究は,サイドチャネル攻撃に対する対策のトレードオフを分析し,安全なエッジAI設計のための提言を行う。
長時間のロボット卓上ゲームにおける内部状態の一貫性維持のためのシステム設計 [cs.RO, cs.AI]目的:長時間ロボット卓上ゲームにおける内部状態の一貫性維持
- ロボットが人間と長時間インタラクションを行う上で,状態の一貫性は不可欠である。
- 卓上ゲームのように,複雑なタスクが長時間に及ぶ場合,小さな誤差が累積し,システム全体を不安定にする。
- 本研究では,システム設計を通じて内部状態の一貫性を維持し,長期的なインタラクションを可能とすることを試みる。
- 麻雀を例に,知覚,実行,インタラクションの状態を明示的に管理する統合アーキテクチャを提案した。
- 高レベルな推論と時間的制約のある知覚・制御を分離し,触覚トリガーによる回復機構を組み込むことで,状態の破損を防ぐ。
- ターン違反や情報漏洩を検知する監視機構を導入し,システムの信頼性を高めた。
大規模言語モデルにおける推論の脆弱性に関するリアルタイム監視:コンテンツセーフティを超えて [cs.AI, cs.CR]目的:大規模言語モデルの推論過程における安全性確保
- 大規模言語モデルの応用拡大に伴い,その安全性への関心が高まっている。
- 既存の研究では,出力の安全性のみに焦点が当てられ,推論過程自体の安全性は未解明である。
- 推論過程における論理的な一貫性,計算効率,そして敵対的操作への耐性を確保することを目指す。
- 推論の安全性に関する9つのカテゴリの分類体系を新たに定義し,その実態を大規模な実験で確認した。
- 推論過程をリアルタイムで監視するReasoning Safety Monitorを提案し,高い精度で異常を検出できることを示した。
- 推論レベルの監視が,大規模言語モデルの安全な運用に不可欠であることを実証した。
構成により決定可能:信頼性のあるAIのための設計時検証 [cs.PL, cs.AI, cs.LG, cs.LO]目的:信頼性の高いAIシステムの設計時検証手法
- AIの安全性と信頼性が重要視される中,設計段階での検証は不可欠である。
- 既存手法は,モデルの検証を訓練後に実施するため,計算コストが高いという課題がある。
- 有限生成アベル群に基づき,設計時に検証可能なフレームワークを構築し,そのコストを削減する。
- 本研究では,既存の3つの結果を組み合わせたフレームワークを提案し,設計時にAIモデルの信頼性を検証できることを示した。
- このフレームワークは,Hindley-Milner unificationを用いてSolomonoffの普遍的事前分布を計算し,普遍的帰納と同じ形式的根拠を持つ。
- 既存のAI信頼性アプローチと比較し,本フレームワークがオーバーヘッドを排除し,より効率的であることを示した。
埋め込みセマンティックシーングラフ生成のための強化学習ベースナビゲーションの近代化 [cs.AI, cs.RO]目的:埋め込みセマンティックシーングラフ生成のためのナビゲーション性能向上
- 自己適応システム構築において,環境理解は不可欠であり,セマンティックワールドモデルはその鍵となる。
- 限られた行動回数の中で,モデル品質と有用性を最大化する探索戦略が課題である。
- 行動回数のコストと情報獲得のバランスを取り,効率的なシーングラフ構築を目指す。
- 最適化アルゴリズムの変更のみで,ベースラインと比較してシーングラフの完成度が21%向上した。
- 深度情報は主に実行安全性(衝突回避)に影響を与え,完成度への影響は限定的であった。
- 近代化された最適化と,より詳細な行動表現を組み合わせることで,完成度と効率性のバランスが最適化された。
操作から不信へ:現実世界の堅牢な反論のための多様なマイクロ動画の誤情報の説明 [cs.CL, cs.CY, cs.SI, cs.AI]目的:マイクロ動画における多様な誤情報の種類と発生源の分析
- マイクロ動画は情報伝達の手段として急速に普及しており,社会に大きな影響を与えている。
- 既存の研究では誤情報の種類の多様性が考慮されておらず,実世界の複雑な事例に対応できない。
- 多様な誤情報に対応し,説明可能な誤情報検出システムの開発を目指す。
- 大規模なベンチマークデータセットWildFakeBenchを構築し,多様なマイクロ動画の誤情報を網羅的に分析した。
- FakeAgentと呼ばれるマルチエージェント推論フレームワークを開発し,コンテンツと外部証拠を統合することで高精度な誤情報検出を実現した。
- FakeAgentは既存モデルを凌駕する性能を示し,WildFakeBenchは説明可能な誤情報検出研究の促進に貢献する。
クロスモデル間の不一致をラベルなし正しさの指標として [cs.CG, cs.AI]目的:言語モデルの誤りを,正解ラベルなしで検出する手法
- 言語モデルの安全な利用には,誤りを検出する仕組みが不可欠である。
- 従来の不確実性に基づく手法は,モデルが誤りながらも自信を持って回答するケースで機能しない。
- 異なるモデル間の不一致を利用して,ラベルなしで正しさを推定する。
- 異なるモデルの回答に対する驚き度(perplexity)や不確実性(entropy)が,正しさの指標として有効であることが示された。
- 提案手法(CMP,CME)は,従来のモデル内不確実性に基づく手法よりも高い性能を示した(MMLU,TriviaQA,GSM8K)。
- 特にMMLUにおいて,CMPはAUROCで0.75を達成し,モデル内entropyの0.59を上回った。
自律運転のための時間的デカップルド拡散計画 [cs.RO, cs.AI]目的:動的な都市環境におけるモーションプランニング
- 都市環境での自動運転は,安全性と効率性の両立が不可欠であり,高度なプランニング技術が求められる。
- 従来のプランニング手法では,将来の状況変化への対応や,多様な運転戦略の実現が難しい場合がある。
- 時間的依存性を考慮した計画手法により,より安全で柔軟な自動運転を実現することを目指す。
- 提案手法TDDMは,経路を時間的に分割し,ノイズをマスクとして活用することで,短期計画と長期計画を分離的に生成する。
- TD-AdaLNを導入することで,各時間セグメントに対応した時間ステップを注入し,より精度の高い計画を可能にする。
- nuPlanベンチマークにおいて,最先端の手法と同等またはそれ以上の性能を示し,特に難易度の高いTest14-hardにおいて優れた結果を得た。
Sim2Realゼロショット強化学習のための最大エントロピー行動探索 [cs.LG, cs.AI]目的:ゼロショット強化学習における行動探索戦略
- ロボットの汎用的な自律性を実現するには,未知のタスクへの適応能力が不可欠である。
- 報酬なしのデータセットから汎化性能の高い方策を学習するには,多様で適切な事前データが必要となる。
- 多様な行動データを効率的に収集し,実機への展開可能な方策を獲得することを目指す。
- 提案手法FB-MEBEは,行動分布のエントロピー最大化により多様な探索を促進する。
- 正則化された批判関数を用いて,より自然で物理的に妥当な行動を誘導する。
- シミュレーションおよび実機実験により,他の探索戦略と比較して優れた性能と実用性を示す。
データ駆動型火災危険度指数モデルの地図に基づく評価 [cs.DL, cs.LG]目的:データ駆動型火災危険度指数モデルの評価方法
- 近年,山火事の頻発と甚大な被害により,火災予測の重要性が高まっている。
- 機械学習モデルの評価指標は重要だが,実際の運用パフォーマンスの測定には限界がある。
- 実運用における意思決定に合致した,火災予測モデルの評価手法を確立すること。
- 従来の評価方法では十分でない偽陽性率に焦点を当て,新たな評価パラダイムを提案した。
- 火災発生の正確な予測と偽陽性の削減において,機械学習モデルのアンサンブルが有効であることが示された。
- 地図に基づいた評価により,モデルの運用パフォーマンスをより現実的に把握できることが明らかになった。
因果的洞察:因果構造を抽出するための時系列モデルの探求 [cs.LG]目的:多変量時系列における指向性時間的相互作用の理解
- 複雑な動的システムや,それに基づいて訓練された予測モデルを解釈するために不可欠である。
- 既存の手法では,データ生成プロセスレベルでの因果構造の推論に焦点が当てられている。
- 訓練済みの予測モデルが依存する時間遅延付き影響構造を抽出すること。
- Causal-INSIGHTは,モデルに内在する(予測者依存の)指向性時間的影響構造を抽出するモデル非依存の事後解釈フレームワークである。
- 入力クランプを介して予測モデルへの体系的な介入に着目し,応答から時間的影響信号を構築する。
- Qbicというスパース性を考慮したグラフ選択基準を導入し,予測精度と構造的複雑さのバランスをとる。
クラスオントロジーとデータ規模が音声転移学習に与える影響 [cs.LG]目的:音声転移学習におけるクラスオントロジーとデータ規模の影響の検証
- 深層学習において,転移学習はデータ不足な課題に対し,大規模事前学習データを利用することで性能向上に貢献する。
- 転移学習の内部メカニズム,特にいつ,どのように有効であるかの理解は十分とは言えない。
- 事前学習と下流タスクの類似性が,転移学習の性能に大きく影響することを明らかにする。
- 事前学習データのサンプル数とクラス数の増加は,転移学習において一般的に正の効果をもたらす。
- しかし,その効果は事前学習データと下流タスクの類似性によって上回ることが示された。
- 類似性の高いデータセットを利用することで,モデルは比較可能な特徴を学習可能となる。
近似ベイズ推論としての再学習 [cs.AI, math.ST, stat.TH]目的:再学習に関する意思決定のためのフレームワーク
- 機械学習モデルの性能維持には継続的な更新が不可欠である。
- 再学習はカレンダーベースで行われがちで,根拠に乏しい。
- 損失関数に基づいた再学習の閾値決定を可能にする。
- 再学習を計算資源の制約下での近似ベイズ推論として捉える。
- 継続的に更新される信念状態とデプロイされたモデルの乖離を「学習負債」と定義する。
- 損失関数に基づく再学習トリガーにより,ガバナンスの監査可能性を高める。
都市大気質の解釈可能なPM2.5予測:運用時系列モデルの比較研究 [cs.LG, cs.AI]目的:都市部におけるPM2.5の時間的予測性能の比較と,解釈可能性の検討
- 都市の大気質は健康に直結し,管理が重要である。PM2.5予測は,そのための有効な手段の一つである。
- 既存の予測モデルは複雑で,計算資源を多く必要とする場合があり,実用性に課題がある。
- 軽量で解釈性の高い予測モデルでも,既存のモデルと同等の性能が期待できるか検証する。
- Facebook Prophetは,週次再学習による予測において最も高い性能を示し,MAE 37.61,RMSE 50.10を達成した。
- 固定モデルとオンライン残差補正を組み合わせることで,SARIMAXの予測精度が向上し,MAE 32.50,RMSE 46.85となった。
- 残差補正されたFacebook Prophetは,週次再学習と同程度の精度を維持しつつ,実行時間を大幅に短縮した。
EcoThink:持続可能でアクセス可能なエージェントのためのグリーン適応推論フレームワーク [cs.AI]目的:大規模言語モデルの環境負荷軽減と公平なアクセス確保
- ウェブが静的な情報取得から生成的な対話へと移行する中で,AI利用の拡大と環境負荷の増大が課題となっている。
- 現在のAI推論手法は計算コストが高く,不必要な処理を行うことでエネルギー消費を増大させている。
- EcoThinkは,クエリの複雑さに応じて推論処理を動的に調整し,エネルギー効率を向上させることで,持続可能なAI利用を目指す。
- EcoThinkは,9つの多様なベンチマークにおいて,平均で推論エネルギーを40.4%削減することに成功した(ウェブ知識検索では最大81.9%)。
- 性能低下は統計的に有意ではなく,高いAI性能を維持しながら環境負荷を軽減できることが示された。
- EcoThinkは,アルゴリズムの無駄を削減し,持続可能で包摂的,かつエネルギー効率の高い生成AIエージェントへの道を拓く。
知識誘導による故障予測:安全上重要な物体検出の失敗検出 [cs.CV, cs.LG]目的:安全上重要な物体の検出失敗予測
- 自動運転やロボット工学等の安全性が求められる分野において,物体検出の信頼性は不可欠である。
- 従来の異常検知手法は,未知の入力に焦点を当てており,検出器自体の機能不全を直接予測できない。
- 検出器の能力外での動作や,基礎モデルへの未知の入力時の検出失敗を検出し,安全性を確保すること。
- KGFPは,検出器内部の特徴量と視覚基礎モデルの埋め込み表現間の意味的なずれを角度距離によって測定する。
- COCOデータセットの人物検出において,KGFPは5%の偽陽性率で人物検出率を64.3%から84.5%に向上させた。
- KGFPは,COCO-Oの6つの視覚領域において,従来の異常検知手法を大幅に上回る性能を示した。
ネットワークトラフィック合成のための軽量GenAI:忠実度,拡張,分類 [cs.NI, cs.AI, cs.LG]目的:ネットワークトラフィック合成における軽量生成AIアーキテクチャの評価
- ネットワークセキュリティにおいて,正確なトラフィック分類は不可欠であり,その性能はデータの質と量に依存する。
- ラベル付きデータの不足やプライバシー要件により,ネットワークトラフィック分類の精度向上が課題となっている。
- 生成AIを用いて,高品質かつ効率的なトラフィック合成を実現し,データ不足問題を解決することを目指す。
- 軽量GenAIモデルは,トラフィックの静的・時間的特性を維持し,実分布と高い一致度を示すことが確認された。
- 合成データのみで学習した分類器は,実データに対して最大87%のF1スコアを達成した。
- 少量データ環境下では,GenAIによるデータ拡張がNTC性能を最大40%向上させ,フルデータ学習との差を縮小した。
自動運転におけるハイパースペクトルイメージングの課題:HSI-Drive事例 [cs.CV, cs.AI, cs.LG, eess.IV]目的:自動運転へのハイパースペクトルイメージング応用における課題と技術
- 自動運転は,交通の安全性向上や効率化に不可欠な技術であり,その実現には高度な環境認識が求められる。
- ハイパースペクトルイメージングは環境認識に有効だが,変動する環境光やリアルタイム処理の制約が課題となる。
- 本研究は,自動運転におけるハイパースペクトルイメージングの適用を可能にする技術開発を目指す。
- ハイパースペクトルイメージングは,従来の画像処理では困難な物体の識別を可能にする。
- 変動光や動的なシーンへの対応が課題であり,適切な技術選択とアルゴリズム開発が重要である。
- HSI-Driveデータセットを用いた実験結果から,ハイパースペクトルイメージングの有効性が示唆される。
NERO-Net:敵対的ロバスト性を備えたCNN設計のための神経進化アプローチ [cs.NE, cs.AI, cs.LG]目的:敵対的攻撃に対するロバスト性を持つCNNアーキテクチャの設計
- 安全性が必要な応用において,ニューラルネットワークの信頼性は重要であり,その脆弱性克服が求められる。
- 既存のニューラルネットワークは敵対的攻撃に対して脆弱であり,その対策が課題となっている。
- ニューラルネットワークのアーキテクチャ設計を通じて,敵対的ロバスト性を向上させることを目指す。
- NERO-Netは,進化ループ中に敵対的訓練を行わず,アーキテクチャがロバスト性に与える影響を分離する。
- FGSMに対する精度が33%でありながら,クリーンデータに対する精度は87%を維持した。
- 追加の標準訓練により,敵対的精度は47%,クリーン精度は93%に向上し,アーキテクチャ固有のロバスト性が示唆された。
CHIRPデータセット:野生鳥類個体レベルの行動長期モニタリングに向けて [cs.CV, cs.AI]目的:野生鳥類の個体識別,行動認識,姿勢推定,物体検出,インスタンスセグメンテーションを支援するデータセットの構築
- 行動変化の研究は,保全生物学や進化生物学において不可欠であり,長期的な行動モニタリングが重要である。
- 野生動物の個体レベルでの自動行動モニタリングは,必要なデータセットの不足により困難である。
- 本研究は,生物学的に意味のある測定を可能にする多様なコンピュータビジョタスクに対応するデータセットを構築することで,この問題を解決する。
- CHIRPデータセットは,スウェーデン・ラップランドで長期間にわたり研究されているシベリアカケスを対象に作成された。
- 提案手法CORVIDは,足環の色に基づいて個体識別を行うことで,既存の再識別手法を上回る性能を示した。
- 本研究は,倫理的に承認された生物学的研究から実世界のデータセットを構築するための青写真を提供し,コンピュータビジョン研究と生物学的応用の間のギャップを埋めることを目指す。
動物個体識別のための背部標識に関する考察 [cs.CV, cs.LG]目的:動物個体識別を自動化するための背部標識のデザイン
- 個体識別は,生態調査や家畜管理において重要であり,効率的なモニタリングを可能とする。
- 均一な外観の動物(豚など)の個体識別は難しく,効果的な標識デザインの指針が不足している。
- 機械学習モデルによる個体識別を最適化するための,背部標識デザインに関する知見を提供すること。
- 機械学習モデル(ResNet-50)を用いて豚の背部標識を識別する実験を行った結果,特定のデザイン選択が識別精度に影響を与えることが示された。
- 標識は,動きのぼかし,様々な視点,動物の行動による遮蔽といった条件下でも明確に区別可能である必要があることが重要である。
- モデル学習で一般的に用いられるデータ拡張(色,反転,トリミングなど)も標識デザインに考慮すべきである。
欠損に強いマルチモーダル融合による統一マイクロサービスインシデント管理 [cs.CL, cs.LG, cs.SE]目的:マイクロサービスにおけるインシデント管理の最適化
- マイクロサービスアーキテクチャの普及に伴い,システムの信頼性確保が重要課題となっている。
- 既存手法では,データ欠損時の性能低下が課題であり,ノイズによる誤検知のリスクがある。
- データ欠損に強く,高い診断精度を維持できるインシデント管理手法の確立を目指す。
- 提案手法ARMORは,異なる特性を持つ各モダリティを適切に処理する非対称エンコーダを備えている。
- 欠損モダリティを考慮したゲート融合機構により,不完全な入力からの干渉を抑制し,ロバスト性を高めている。
- 実験の結果,完全なデータ条件下で最先端の性能を達成し,データ欠損時でも高い診断精度を維持することが示された。
Voxtral TTS [cs.RO, cs.AI]目的:多言語テキスト読み上げモデル
- 音声合成技術は,コミュニケーションの多様性やアクセシビリティ向上に不可欠である。
- 既存モデルでは,自然で表現力豊かな多言語音声合成が困難であった。
- 少ない参照音声から高品質な多言語音声合成を実現すること。
- Voxtral TTSは,わずか3秒の参照音声から自然な多言語音声生成が可能である。
- セマンティックトークンと音響トークンを組み合わせたハイブリッドアーキテクチャを採用している。
- ネイティブスピーカーによる評価で,ElevenLabs Flash v2.5よりも68.4%高い支持率を得た。
Saccharomyces cerevisiaeにおけるバイオ燃料関連バイオマス生産の予測と最適化のための,包括的ゲノム規模代謝モデルと機械学習フレームワーク [cs.LG]目的:Saccharomyces cerevisiaeにおけるバイオマスフラックスの予測と最適化
- Saccharomyces cerevisiaeは産業バイオテクノロジーの基盤であり,その代謝特性の理解は重要である。
- 環境や遺伝的変動に対するバイオマスフラックスの正確な予測は,菌株設計において課題である。
- 本研究は,代謝フラックスの予測精度向上と,最適なバイオマス生産条件の探索を目的とする。
- 機械学習モデル(Random Forest, XGBoost)は高い予測精度(R2=0.99989, 0.9990)を示した。
- 変分オートエンコーダーによる代謝クラスタ分析により,バイオマス生産に関与する主要な代謝経路が明らかになった。
- シミュレーションによる遺伝子過剰発現とベイズ最適化により,バイオマスフラックスの増加が確認された。
オンポリシー蒸留の再検討:経験的な失敗モードと単純な修正 [cs.LG, cs.AI, cs.CL]目的:大規模言語モデルのポストトレーニングにおけるオンポリシー蒸留の失敗モードの分析と改善策の提案
- 大規模言語モデルの性能向上は,様々な応用において不可欠であり,効率的な学習手法が求められている。
- オンポリシー蒸留は,教師データの固定トレースに依存せず,生成されたロールアウトに基づいて学習するが,長期的には不安定になりやすい。
- 生成されたロールアウトの分布のずれやトークナイザーの問題を解決し,安定した学習と性能向上を目指す。
- サンプルされたトークンを用いたオンポリシー蒸留は,短いシーケンスでは有効だが,長いシーケンスでは分布の不一致や不安定な学習を引き起こしやすい。
- 教師のトップKローカルサポートマッチング,Truncated reverse-KL,top-pロールアウトサンプリング,特殊トークンマスキングの導入により,学習の安定性と性能が向上した。
- 単一タスクの数理推論とマルチタスクのエージェントタスクにおいて,提案手法は既存手法よりも優れた結果を示した。
LLMはデータベースに過剰か?:SQLの有限性に関する研究 [cs.DB, cs.AI]目的:SQLクエリの複雑性の有限性
- データ活用において,自然言語からのSQL生成は重要な技術である。
- 既存のLLMは高性能だが,データベースへの適用において過剰な可能性も指摘されている。
- SQLクエリの複雑性の実態を把握し,LLMの適切な利用範囲を検討する。
- 376のデータベースを分析した結果,SQLクエリの複雑性は実用的な範囲内で有限であることが示された。
- データベースのテーブル数増加とSQLクエリの複雑性増加の間には,明確な相関関係は見られなかった。
- SQLクエリのテンプレートは,べき乗則に従う頻度分布を示すことが明らかになり,13%のテンプレートで70%のクエリをカバー可能であった。
TAAC:信頼性の高い音声感情計算への入り口 [cs.CR, cs.AI]目的:音声を用いたうつ病検出の信頼性確保
- AI技術の発展により,うつ病診断の需要とスクリーニングの供給のギャップが縮小している。
- 音声データには個人情報が含まれており,悪用されるリスクがある。
- うつ病の特徴と個人情報を区別し,個人情報のみを暗号化する手法を確立すること。
- 敵対的損失に基づく部分空間分解を利用したTAACフレームワークを提案し,音声による自動うつ病検出の信頼性を高めた。
- DFSD,FNE,段階的学習パラダイムにより,特徴量の分解,IDの暗号化,性能向上を実現した。
- 既存の暗号化手法との比較実験で,本フレームワークの優れたうつ病検出性能,ID保持率,音声再構築能力が示された。
公平なRIS割り当てのための協調的深層強化学習 [cs.NI, cs.LG, cs.MA]目的:RIS資源の公平な割り当て手法
- 無線ネットワークにおける基地局間での資源配分は,通信品質に大きく影響する重要課題である。
- 基地局間のユーザ負荷の偏りは,ネットワーク全体のパフォーマンスに不均衡を生じさせる。
- RIS資源を効率的かつ公平に配分し,弱体な基地局の性能向上を目指す。
- 提案手法は,RIS資源を性能の低い基地局に再配分することで,最もサービスが低いユーザの通信速度を大幅に向上させる。
- 各基地局は,期待される利益と相対的なサービス品質に基づいて入札戦略を適応させ,暗黙的な協調を実現する。
- 公平性を考慮したRIS割り当ては,協調学習によって効率と公平性のバランスを取るための柔軟な手段となる。
階層構造を考慮した多Modal表現学習による分類学的推論 [cs.CV, cs.LG]目的:分類学的推論のための多Modal表現学習
- 生態学,保全,環境モニタリングに直結する,大規模なフィールドデータからの生物多様性識別は重要である。
- 既存の多Modal手法は,生物分類の階層構造を考慮せず,ノイズや欠損Modalに弱いという問題がある。
- 生物の階層構造を明示的に符号化し,柔軟な融合により,実用的な生物多様性基盤モデルを構築することを目指す。
- 提案手法は,強力な多Modalベースラインと比較して,分類精度を14%以上向上させた。
- 特に,DNAデータの一部が欠損または破損している条件下で,大きな改善が見られた。
- 生物学的階層構造の明示的な符号化と柔軟な融合が,実用的な生物多様性基盤モデルの鍵となることが示された。
不規則な時間ステップを持つ時空間システム予測のためのマスクオートエンコーダ [cs.LG, nlin.AO]目的:不規則な時間ステップを持つ時空間システムの予測手法
- 気候モデリング等,複雑な時空間変動の予測は科学技術の発展に不可欠である。
- 欠測データや不規則な観測間隔により,既存の予測アルゴリズムの精度が低下する。
- 不規則な時系列データに対しても高精度な予測を可能にする手法を開発する。
- 提案手法は,従来の畳み込み・再帰型ネットワークと比較して,予測精度,非線形性への耐性,計算効率において顕著な改善を示す。
- データ補完を必要とせず,システムの物理的整合性を維持しながら予測が可能である。
- ドメイン知識を必要とせず,複雑な時空間パターンを捉える潜在能力を持つ。
CT画像における偶発性肺結節の人間・AI協調的評価のためのTransformer 기반深層学習モデルDeepFAN:多読者・多症例試験 [eess.SY, cs.SY, cs.CV, cs.AI]目的:CT画像における偶発性肺結節の良悪性判断支援
- CT検査の普及により肺結節の検出数が増加しており,早期発見・早期治療が重要である。
- 既存の深層学習モデルは,局所的特徴と全体的特徴の統合が不十分であり,臨床試験による検証が不足している。
- DeepFANは,全体的特徴と局所的特徴を統合し,臨床試験を通じてその有効性を検証することを目指す。
- DeepFANは,内部テストセットでAUC 0.939,臨床試験データセットでAUC 0.954を達成した。
- DeepFANの利用により,若手放射科医の平均パフォーマンスがAUCで10.9%,精度で10.0%,感度で7.6%,特異度で12.6%向上した。
- 結節レベルでの読者間の一貫性が向上し,診断の質を均質化し,不必要な経過観察を削減する効果が期待される。
