arXiv雑要約
AI - 2026/03/16 公開
母体保健支援チャットボットの開発と評価 [cs.AI, cs.CL, cs.IR]目的:母体保健医療を支援するチャットボットの開発および評価
- 低リソース地域では,保健リテラシーが低く医療へのアクセスが限られているため,信頼できる母体保健情報の提供が重要である。
- ユーザーの質問が短く,言語が混在しており,地域固有の情報が必要となるため,チャットボットの展開は技術的に困難である。
- 本研究は,限られた専門家の監督下で,高リスクな状況下でのチャットボットの安全な運用を可能にする評価手法を確立する。
- トリアージベンチマークにおいて,緊急事案の検出率86.7%を達成し,緊急事案の見逃しと過剰なエスカレーションのトレードオフを明確に示した。
- 合成された多角的根拠検索ベンチマークを用いて,証拠レベルでのラベル付けを行い評価を行った。
- 臨床医が設計した基準を用いて,実質の質問に対してLLMを評価することで,多言語かつノイズの多い環境における信頼性の高い医療アシスタントの必要性を明らかにした。
エージェント型AIにおける意味的不変性 [cs.AI, cs.CL]目的:大規模言語モデル(LLM)エージェントの推論の安定性評価
- AIエージェントの応用拡大に伴い,その信頼性確保が重要となっている。
- 既存の評価方法は,問題形式の固定化により,意味的な変動に対する脆弱性を捉えきれていない。
- LLMエージェントの推論における意味的不変性を評価する新たな手法を開発し,頑健性を検証する。
- モデルの規模は必ずしも頑健性と相関せず,より小規模なQwen3-30B-A3Bが最も高い安定性を示した。
- 8種類の意味保存変換を用いたメタモルフィックテストフレームワークを構築し,7つの基盤モデルを評価した。
- 科学分野における19の問題で,LLMエージェントの推論の変動を分析し,その脆弱性を明らかにした。
MXNorm:MXFPブロックスケールを再利用した効率的なテンソル正規化 [cs.LG, cs.AI, cs.NE]目的:テンソル正規化における効率化
- 深層学習の規模拡大に伴い,行列積演算の高速化は重要な課題である。
- 行列積演算の性能向上は著しいが,約減演算や要素ごとの演算の性能向上は遅れている。
- MXFP8キャストで計算されたブロックスケールを再利用し,正規化に必要な約減演算を削減する。
- MXNormはRMSNormの代替として利用可能であり,正規化に必要な約減サイズを32分の1に削減できる。
- Llama 3モデルの事前学習において,MXNormはRMSNormと同等の学習精度を維持している。
- torch.compileを用いた場合,MXNormはRMSNormと比較して最大2.4倍のカーネル速度向上を示し,Llama 3 8B transformer層でMXFP8において1.3%,NVFP4で2.6%の速度向上が確認された。
学習性とプライバシー脆弱性は少数の重要な重みで絡み合っている [cs.LG, cs.AI, cs.CR]目的:ニューラルネットワークにおけるプライバシー保護のメカニズム
- 深層学習モデルの普及に伴い,プライバシー保護の重要性が高まっている。
- 既存手法では,全ての重みを更新する必要があり,コストが高い。
- 重要な重みを特定し,限定的な調整でプライバシーと精度を両立することを目指す。
- プライバシー脆弱性は,ごく一部の重みのみに存在することが確認された。
- その重みは,同時にモデルの性能にも大きく影響している。
- 本手法は,メンバーシップ推論攻撃に対して高い耐性を示し,実用的な精度を維持する。
LLMに基づく憲法型マルチエージェントガバナンス [cs.MA, cs.AI]目的:LLMを用いたマルチエージェントシステムにおける協調行動の倫理的安定性の確保
- 社会システムにおいて,エージェント間の協調は不可欠であり,その実現方法が重要視されている。
- LLMによる影響戦略が,エージェントの自律性や公平性を損なう可能性が指摘されている。
- LLMの介入による協調行動が,倫理的に安定した結果をもたらすためのガバナンス手法を確立すること。
- 提案手法CMAGは,協調性,自律性,整合性,公平性を考慮した倫理的協調スコア(ECS)を導入することで,倫理的な問題を改善した。
- CMAGは,未制約の最適化と比較してECSを14.9%向上させ,自律性と整合性をほぼ維持しながら協調性を実現した。
- 本研究は,協調性のみを追求するのではなく,ガバナンスの重要性を示し,倫理的な安定性を確保する必要性を強調した。
Visual-ERM:視覚的同等性に対する報酬モデリング [cs.MA, cs.CV, cs.AI]目的:視覚入力からコードを生成するタスクにおける報酬モデリング
- 視覚的情報をコードに変換する技術は,データ分析や自動化において重要性が増している。
- 従来の報酬関数は,視覚的な差異を捉えきれず,モデルが不正な方法で高い報酬を得てしまう問題がある。
- 本研究は,視覚空間における微細な差異を捉え,より正確な報酬を与えるモデルを開発し,その問題を解決する。
- 提案手法Visual-ERMは,チャートからコードへの変換においてQwen3-VL-8B-Instructの性能を8.4ポイント向上させた。
- テーブルやSVGの解析においても一貫した性能向上を示し(平均+2.7,+4.1),推論時のリフレクションと修正による性能向上も確認された。
- VisualCritic-RewardBenchにおける評価では,Visual-ERMがQwen3-VL-235B-Instructを上回り,商用モデルに匹敵する性能を示した。
時空間物理システムの表現学習 [cs.LG, cs.CV]目的:時空間物理システムの表現
- 物理現象の予測や制御は科学技術の根幹であり,高精度なモデル構築が不可欠である。
- 既存の物理システムモデルは,計算コストが高く,誤差の蓄積といった問題点を抱えている。
- 物理パラメータ推定を通して,モデルの物理的妥当性を定量的に評価する手法を確立する。
- 物理パラメータ推定タスクにおいて,汎用的な自己教師あり学習法が物理モデリングに特化した手法よりも優れた性能を示すことがわかった。
- 潜在空間で学習する手法(例:JEPAs)は,ピクセルレベルの予測を最適化する手法よりも有効である。
- 表現学習の有効性を,物理関連タスクの精度によって定量的に評価する新たな視点を提供した。
PhysMoDPO:嗜好度最適化による物理的に妥当なヒューマノイドモーション [cs.LG, cs.AI, cs.CV, cs.RO]目的:物理的に妥当かつ指示に沿ったヒューマノイドモーション生成
- 大規模データと拡散モデルによりテキストからのモーション生成が進展。キャラクタアニメやロボット制御への応用が期待される。
- 従来のWBCによる物理適合化は,元のモーションからの逸脱を引き起こす場合がある。
- WBCを訓練パイプラインに組み込み,物理法則とテキスト指示の両方に適合するモーション生成を目指す。
- PhysMoDPOは,シミュレーション環境におけるテキストからのモーション生成と空間制御タスクにおいて,物理的リアリズムとタスク関連指標の両方で一貫した改善を示した。
- PhysMoDPOは,シミュレーションにおけるゼロショットモーション転送およびG1ヒューマノイドロボットを用いた実世界展開において,大幅な改善をもたらすことが示された。
- 本手法では,物理ベースおよびタスク固有の報酬を用いて合成軌道の嗜好度を決定する。
時系列温度・圧力データを用いた足潰瘍の予測分析 [q-bio.OT, cs.AI, cs.LG]目的:糖尿病性足潰瘍リスクの早期発見
- 糖尿病は深刻な健康問題であり,足潰瘍はその重篤な合併症である。
- 足潰瘍の早期発見が困難であり,重症化すると切断に至る場合がある。
- ウェアラブルセンサーで得られるデータを用いて,足潰瘍リスクを早期に予測すること。
- Isolation Forestは微小な異常を検出し,KNNは極端な逸脱を検出することを示した。
- 温度と圧力の相関関係は,両方のセンサーを組み合わせた監視の有効性を示唆する。
- 本研究は,リアルタイムな糖尿病性足部健康監視の基盤となり,早期介入を可能にする。
DIMEアーキテクチャ:ニューラル表現,ダイナミクス,制御および統合のための統一的な操作アルゴリズム [q-bio.NC, cs.AI]目的:知覚,記憶,予測,価値評価,意識といった神経科学的現象を統合する操作アーキテクチャ
- 現代神経科学は進歩したが,これらの現象を統合する包括的な理論的枠組みが不足している。
- 既存の理論は部分的な機能に焦点を当てており,アーキテクチャレベルでの統合が困難である。
- 知覚,記憶,価値評価,意識アクセスを共通の操作サイクルで組織するアーキテクチャを提案する。
- DIME(Detect-Integrate-Mark-Execute)アーキテクチャは,エングラム,実行スレッド,マーカーシステム,ハイパーエングラムの4つの要素から構成される。
- このフレームワークは,海馬インデックス,皮質再帰処理,リプレイ現象,大規模ネットワーク統合などの実験的証拠と整合性がある。
- DIMEは,表現,価値評価,時間的シーケンスが統一的なメカニズムから生じる人工知能やロボット工学への応用も期待される。
完全結合ニューラルネットワークにおけるプルーニング誘起相:正神,失神,及び狂神 [cond-mat.dis-nn, cs.LG, cs.NE]目的:完全結合ニューラルネットワークにおけるプルーニングによる相転移の存在とその普遍性クラスの特定
- 現代のニューラルネットワークは過剰パラメータ化されており,効率的な利用が課題である。
- プルーニングは圧縮手法として有効だが,その過程で起こる相転移は未解明である。
- プルーニングが誘起する相構造を明らかにし,統計力学的な視点から理解を目指す。
- 訓練と評価段階におけるドロップアウト率を変化させ,相図を明らかにすることができた。
- 正神,失神,狂神の3つの相を識別し,それらはクロスエントロピー損失のスケーリングによって明確に区別された。
- 正神相から失神相への遷移はスケール不変性を示し,ベレズンスキー・コステルツ・タウレス型相転移の兆候が見られた。
確率的共同および個別変動の説明 (ProJIVE) によるデータ統合 [stat.ML, cs.LG, q-bio.QM, stat.CO, stat.ME]目的:複数データセット間の共同変動と個別変動の推定
- ゲノミクス,メタボロミクス,神経画像など,多岐にわたる科学分野で複数データ種の統合が重要視されている。
- 既存手法では,共同変動と個別変動の分離が不十分であり,データの解釈に課題が残る場合がある。
- 共同変動と個別変動を正確に分離し,より包括的なデータ分析を可能にすることを目指す。
- 提案手法ProJIVEは,期待値最大化(EM)アルゴリズムを用いて,確率モデルによるデータ統合を実現する。
- アルツハイマー病の脳形態計測と認知能力のデータへの適用により,生物学的に意味のある変動パターンが学習された。
- 共同変動スコアと既存のバイオマーカーとの間に強い相関が認められ,ProJIVEの有用性が示唆された。
履歴依存型構成則の信頼性のある学習のための最適実験計画 [cond-mat.mtrl-sci, cs.LG, cs.NA, math.NA, physics.comp-ph, stat.CO]目的:履歴依存型構成則の信頼性のある学習のための最適実験計画の確立
- 材料のミクロメカニクス効果を包括的に記述するため,構成則は不可欠である。
- 実験予算が限られているため,構成則を特徴付ける十分なデータが得られない場合がある。
- 実験計画を最適化することで,パラメータの不確実性を低減し,信頼性のある学習を実現する。
- ベイズ最適実験計画法は,パラメータの不確実性の低減や情報量の最大化を通じて実験計画の有用性を定量化する。
- ガウス近似と代理モデル近似を用いることで,高度な材料試験への適用を可能にした。
- 数値シミュレーションの結果,最適化された実験計画が,ランダムな実験計画と比較してパラメータの識別可能性を大幅に向上させることを示した。
広告パーソナライズにおける位置情報追跡のプライバシーと有用性のトレードオフ [econ.EM, cs.LG]目的:広告パーソナライズにおける位置情報と行動データの価値評価
- 個人の行動や地理的データ収集は増加の一途を辿っており,プライバシー保護とデータ活用が重要課題となっている。
- 位置情報と行動データの組み合わせによるプライバシーリスクが高まる中,それぞれのデータの価値が不明確である。
- 位置情報と行動データの相補性・代替性を定量的に評価し,プライバシー保護と広告効果の両立を目指す。
- 位置情報は,行動履歴が少ない初期段階において特に有用であり,行動データと相補的にターゲティング精度を約20%向上させる。
- 行動履歴が豊富になるにつれて,位置情報の役割は変化し,行動データのみで代替可能となる。
- 本研究は,広告パーソナライズにおけるプライバシーと有用性のトレードオフを明らかにし,位置情報追跡の価値判断に資する。
畳み込みニューラルネットワークにおけるバイアスと信頼性の問題:癌病理画像分析 [eess.IV, cs.AI, cs.CV, cs.LG]目的:癌病理画像における畳み込みニューラルネットワークの評価手法の妥当性検証
- 癌の診断支援において,画像認識技術,特に畳み込みニューラルネットワークの応用が期待されている。
- 畳み込みニューラルネットワークの内部構造が複雑であるため,判断根拠が不明確であり,その評価は経験則に頼りがちである。
- 癌病理画像に対する畳み込みニューラルネットワークの評価において潜在するバイアスを明らかにし,信頼性の高い評価方法を模索する。
- 癌のベンチマークデータセットを用いて検証した結果,臨床的情報を含まない背景部分の画像でも高い精度を示すモデルが存在した。
- 一部の畳み込みニューラルネットワークアーキテクチャは,他のアーキテクチャよりもバイアスに敏感であることが示された。
- 従来の機械学習評価手法が,癌病理画像分析において誤った結論を導き出す可能性があることが示唆された。
FloeNet:気候変動に対応可能な質量保存型全球海氷エミュレータ [physics.ao-ph, cs.LG]目的:全球海氷の挙動を模倣する機械学習エミュレータ
- 地球温暖化による極域の変化予測は喫緊の課題であり,高精度な海氷モデルが不可欠である。
- 従来の海氷モデルは計算コストが高く,大規模な気候モデルへの組み込みが困難である。
- 計算効率と精度の両立を目指し,質量保存性を重視した海氷エミュレータを開発する。
- FloeNetは,南極で0.96,北極で0.76という高い体積異常相関を示し,海氷の状態,トレンド,年々変動を再現する。
- 質量保存性を考慮することで,非保存型モデルよりも優れた性能を発揮する。
- 海氷表面温度や融解エネルギーフラックスなど,物理的に解釈可能な高精度な変数を生成する。
CLARE:分類に基づく回帰による電子温度予測 [physics.space-ph, cs.AI]目的:電子温度予測モデルの開発
- 宇宙天気予報において,上層大気中の電子温度は重要なパラメータである。
- 宇宙天気機械学習分野において,電子温度の研究は十分に進んでいない。
- 公開データを用いて,高精度な電子温度予測モデルを構築すること。
- CLAREは,分類ベースの回帰アーキテクチャを用いることで,従来の回帰モデルと比較して予測精度が6.46%向上した。
- AKEBONO衛星データを用いたテストにおいて,予測値が真値の10%以内に収まる割合は69.67%であった。
- 1991年1月30日から2月7日の地磁気嵐期間においても,46.17%の精度を達成した。
エネルギーベースモデルに基づく RANSAC (EB-RANSAC) [physics.optics, cs.SY, eess.SY, stat.ML, cond-mat.dis-nn, cs.LG]目的:ロバスト推定手法の開発
- 外れ値を含むデータからの正確なモデル推定が重要であるため。
- RANSAC はサンプリングに依存するため計算コストが高い。
- サンプリング不要でパラメータ調整が容易な手法を提案する。
- 提案手法 EB-RANSAC は,RANSAC と同様の幅広い問題に対応可能である。
- EB-RANSAC は,RANSAC と異なり,煩雑なサンプリング手順を必要としない。
- 線形回帰と最尤推定の実験により,EB-RANSAC の有効性が確認された。
スパース逆問題に対する変分ガロート法 [stat.ML, cs.CV, cs.LG]目的:スパース逆問題におけるスパース性事前分布の効果
- 不完全または破損した測定値から逆問題を解く上で,スパース正則化は重要な役割を果たす。
- 事前分布の選択が復元性能に影響し,データ本来のスパース性と一致しない場合がある。
- 変分ガロート法とL1正則化を比較し,より良好な復元性能を得ることを目指す。
- 変分ガロート法は,L1正則化と比較して,一般化誤差を低減し,不安定性を改善する傾向がある。
- 特に,正確なサポート回復が重要な,強い未決定条件下で優位性を示す。
- スパース性事前分布が,スパイク・アンド・スラブ構造に近いほど有利になる場合があることが示唆された。
ファウンデーションモデルに基づくインコンテキスト活性学習による材料発見の加速 [cond-mat.mtrl-sci, cs.LG]目的:材料発見の加速
- 材料開発は,新技術の進歩に不可欠であり,効率的な探索手法が求められている。
- 従来の活性学習は,データ数の少ない状況下で,モデルの性能と不確実性の推定に課題がある。
- 本研究は,事前学習済みのファウンデーションモデルを用いて,活性学習の性能向上を目指す。
- 提案手法(ICAL)は,10種類の材料データセットにおいて,既存手法(GP,RF)を8/10で上回る成果を示した。
- 実験回数を平均でGPに対して52%,RFに対して29.77%削減することに成功した。
- ICALの優位性は,より正確な不確実性推定によるものであり,交差検証によって確認された。
マルチスケール構造ガイドによる潜在拡散を用いたマルチモーダルMRI変換 [eess.IV, cs.AI, cs.CV]目的:マルチモーダルMRI変換のための構造情報に基づく潜在拡散モデルの提案
- MRIは疾患診断や治療において不可欠であり,多角的評価が重要であるから。
- 既存手法では,任意モダリティ欠損時の解剖学的矛盾やテクスチャの劣化が課題である。
- 構造情報を活用し,詳細な境界と解剖学的構造を正確に再現することを目指す。
- 提案手法MSG-LDMは,既存のMRI合成手法と比較して,構造の完全な再構成において優れた性能を示す。
- 潜在空間におけるスタイルと構造の分離機構により,モダリティ固有のスタイルと共有構造表現を明確化。
- スタイル一貫性損失と構造認識損失の導入により,安定した構造表現の学習を実現。
バッチカーネル化バンディット:改良と拡張 [stat.ML, cs.IT, cs.LG, math.IT]目的:ノイズのあるバッチ形式でのフィードバックが得られるブラックボックス最適化問題に関する研究
- 機械学習において,未知の関数を効率的に最適化することは重要な課題である。
- バッチ処理を行う場合,既存手法ではバッチサイズや後悔の上界に課題があった。
- 本研究は,最適なバッチ数とよりタイトな後悔の上界を導き出すことを目指す。
- バッチ数が時間horizon Tに対してO(log log T)で十分であることが,定数項まで含めて最適化された。
- 適応的なバッチサイズを用いた場合でも,固定バッチサイズの場合と同等の後悔のスケーリングが示された。
- 摂動に対するロバスト性を考慮したアルゴリズムを提案し,既存手法よりも低い後悔の上界を達成した。
音声生成と知覚における統一的な脳-テキストデコーディングに向けて [q-bio.NC, cs.AI, eess.SP]目的:音声生成と知覚の両モダリティにおける脳-テキストデコーディングの統一的フレームワーク
- 言語はコミュニケーションの根幹であり,脳の言語処理メカニズムの解明は重要である。
- 従来の脳-テキストデコーディング研究は単一モダリティに限定され,表音文字言語に偏っていた。
- 本研究は,表語文字である中国語において,両モダリティを統合したデコーディングを可能とする。
- 本フレームワークは,単一字データでの学習のみで文レベルのデコーディングを可能にし,未知の文字や音節にも対応する。
- 70億パラメータのLLMを用いた改良により,数千億パラメータの商用LLMを超える性能を達成した。
- 音声生成は知覚よりも広範な皮質領域の神経活動を伴い,両モダリティ共通のチャネルは類似した活動パターンを示した。
AIサプライチェーン規制の経済学 [econ.TH, cs.AI, cs.CY, cs.HC, econ.EM]目的:AIサプライチェーンにおける政策介入が消費者の余剰に与える影響分析
- AI技術の発展は経済成長の重要な推進力であり,その健全な発展が不可欠である。
- AIサプライチェーンにおける過剰な利益獲得や,規制のあり方に関する明確な指針が不足している。
- AIサプライチェーンの経済的効率性と社会的便益を最大化するための政策提言を行う。
- 下流市場の価格競争を促進する政策は,計算コストやデータ前処理コストが高い場合にのみ,消費者の余剰を増加させる。
- 計算コストの補助金は,これらのコストが低い場合に効果的であり,両方の政策は互いに補完的である。
- 下流市場の品質競争を促進する政策は,常に消費者の余剰を向上させる。
マルコフ決定過程の弱時間結合近似 [math.OC, cs.LG]目的:高次元外生不確実性および内生状態を持つ有限水平線マルコフ決定過程の拡張性向上
- オペレーションや金融分野におけるオプション評価など,複雑な意思決定問題に不可欠な枠組みである。
- 時間的結合により,計算コストが水平線長に依存し,大規模問題への適用が困難となる場合がある。
- 時間結合を弱めることで,水平線長に依存しない計算コストを実現し,問題の規模を拡大することを目指す。
- 提案手法である弱時間結合近似(WTCA)は,既存手法であるALPよりも厳密で,POよりも緩い上限値を達成する。
- WTCAは,基底関数の種類が増えるにつれて,最適なポリシー値に収束することが示された。
- WTCAに並列決定ブロック座標降下法を適用することで,水平線長に依存しない計算複雑性を実現した。
自己教師あり音声モデルは位置依存的な直交部分空間を通して音韻的文脈を符号化する [eess.AS, cs.CL, cs.LG, cs.SD]目的:自己教師あり音声モデルにおける音素と周囲の文脈の符号化機構
- 音声認識の精度向上には,音声の文脈を考慮したモデルが不可欠である。
- 自己教師あり学習モデルの文脈化の仕組みは未だ明確に解明されていない。
- 音声の文脈がどのようにモデル表現に組み込まれるかを明らかにすること。
- 自己教師あり音声モデルは,音素情報を位置依存的な直交部分空間に符号化していることが示された。
- 隣接する音素の音韻情報が,単一フレーム表現に重ね合わされることで文脈が符号化される。
- 位置間の直交性や,暗黙的な音韻境界の出現など,特有の構造が確認された。
VecMol:3D分子生成のためのベクトル場表現 [stat.ML, cs.LG]目的:3次元分子のベクトル場表現
- 創薬や材料科学において,3次元分子の生成は重要な課題である。
- 既存手法では,分子を3Dグラフとして扱い,原子種と座標を同時に生成するため,学習が困難である。
- ベクトル場を用いることで,グラフ生成を回避し,構造学習と原子配置を分離することを目指す。
- 提案手法VecMolは,分子をユークリッド空間上の連続ベクトル場として表現する。
- ベクトル場はニューラルネットワークでパラメータ化され,潜在拡散モデルを用いて生成される。
- QM9とGEOM-Drugsの評価により,本手法の有効性が確認された。
ウェアラブルヘルスモニタリングのための解釈可能な構成要素を用いた説明可能なAI [eess.SP, cs.RO, eess.SP, cs.LG]目的:ウェアラブルデバイスを用いたヘルスモニタリングにおける説明可能なAI手法
- ウェアラブルデバイスの普及により,リアルタイムな健康状態のモニタリングが期待されている。
- 時系列データの複雑さから,AIの判断根拠を説明することが困難である。
- モデルの性能を維持しつつ,解釈可能性の高いAI手法を確立すること。
- 本研究では,解釈可能な構成要素(IIC)を用いることで,時系列データに対するAI予測の説明性を向上させた。
- IICは,ドメイン固有の解釈可能な概念を内包し,性能低下を抑制しつつ概念に基づいた説明を可能にする。
- ウェアラブルヘルスモニタリングに特化したIICを定義し,状態評価やてんかん発作検出への応用を示した。
拡散モデルにおける学習データ統計の理論:易から難へ [stat.ML, cond-mat.dis-nn, cs.IT, cs.LG, math.IT]目的:拡散モデルにおける学習データ統計の学習メカニズム
- 拡散モデルは強力な生成モデルだが,その学習ダイナミクスは未解明な点が多い。
- 自然画像のような複雑なデータにおいて,どのような統計情報が,どの順序で学習されるか不明である。
- 拡散モデルが複雑な分布を学習する際の,サンプル複雑性(学習に必要なデータ量)のメカニズムを解明する。
- 標準的な拡散モデルは,高次の相関に進む前に,単純なペアごとの入力統計を学習するというバイアスを持つことが示された。
- 「拡散情報指数」と呼ばれるスカラー不変量が,ペアごとの統計と高次の相関の学習のサンプル複雑性を制御することが特定された。
- ペアごとの統計は線形なサンプル複雑性で学習される一方,高次の統計は少なくとも立方的なサンプル複雑性が必要となることが証明された。
大規模事前学習とターゲット特定微調整による拡散確率モデルを用いた脳卒中MRIの高速化 [eess.IV, cs.CV, cs.LG, physics.med-ph]目的:拡散確率モデルを用いたデータ効率の良いMRI再構成戦略
- 脳卒中は迅速な診断と治療が重要であり,MRIは不可欠な検査である。
- 臨床脳卒中MRIでは,限られたデータ量で高速スキャンを実現することが課題である。
- データ制約下で,拡散確率モデルによるMRI再構成の精度を向上させる。
- 大規模データセットでの事前学習と,少量のターゲットデータでの微調整により,高精度な再構成が可能となった。
- 臨床脳卒中MRIデータを用いた盲検評価では,提案手法は標準的な画像品質と同等であることが示された。
- 本手法は,ターゲットアプリケーションに特化した大規模データセットの必要性を大幅に削減する。
セルフリーシステムにおけるプリコーダ学習のためのアソシエーションを考慮したGNN [eess.SP, cs.LG]目的:セルフリーシステムにおけるプリコーダ設計
- 無線通信システムにおいて,多用波ビームフォーミングは重要な技術である。
- 従来のセルラーシステムでは,UE-APアソシエーションの柔軟性が不十分であった。
- 動的なUE-APアソシエーション状況を考慮したプリコーダ設計を可能にする。
- 提案手法であるアソシエーションを考慮したグラフニューラルネットワーク(AAGNN)が,従来の学習手法よりも学習性能と汎化性能に優れていることが示された。
- AAGNNは,セルフリープリコーディングポリシーの置換不変性を利用することで,学習複雑さを軽減している。
- また,アテンションメカニズムにより,AAGNNの汎化性能が向上している。
文脈的確率的最適化に対する関数学習法の収束レート [math.OC, cs.LG]目的:文脈的確率的最適化における関数学習法の収束レート
- 機械学習や統計モデリングにおいて,複雑なデータから最適な決定を行う上で重要である。
- 条件付き分布からの直接サンプリングが困難な場合が多く,効率的な学習方法が課題である。
- 観測データのみを用いて,条件付き期待値を近似し,最適化問題を効率的に解くことを目指す。
- 提案手法は,観測データ数Nに対して,収束レートが$\mathcal{O}\big(1/\sqrt{N}\big)$であることを理論的に示した。
- この結果は,実用的な状況下での効率的な学習と最適化が可能であることを示唆する。
- 同時学習と最適化のアプローチが有効であることを確認した。
大規模言語モデルの評価と認知科学の発展に向けたPsyCogMetrics AI Labの開発:3サイクルアクションデザインサイエンス研究 [q-bio.NC, cs.AI]目的:大規模言語モデル評価のための心理測定および認知科学的手法を運用可能なクラウドベースプラットフォーム
- AI技術の進化に伴い,その能力を客観的に評価する手法の確立が不可欠である。
- 既存の評価方法は,限界が多く,関係者のニーズに応えきれていない現状がある。
- LLM評価の信頼性と妥当性を高め,AIと人文科学の融合を促進すること。
- 本研究は,心理測定と認知科学に基づいたLLM評価プラットフォーム「PsyCogMetrics AI Lab」を開発した。
- ポパーの反証可能性,古典的テスト理論,認知負荷理論などを活用し,設計目標を導出した。
- このプラットフォームは,AI,心理学,認知科学,社会行動科学の研究に貢献する新たなITアーチファクトである。
高度な特徴抽出と次元削減手法を用いた天体軌道合成データのクラスタリング [astro-ph.EP, astro-ph.IM, cs.AI]目的:土星衛星系の軌道安定性と共鳴相互作用の研究
- 惑星動力学の理解深化に不可欠であり,太陽系外惑星系の探査にも応用可能である。
- 既存手法は,現代的な大規模データセットの複雑さへの対応が困難である。
- 機械学習を用いたパイプラインにより,大規模軌道データセットの効率的な解析を目指す。
- MiniRocketを用いることで,複雑な時間的パターンを捉え,高次元の特徴空間を効率的に構築した。
- このパイプラインは,土星衛星系の安定領域や共鳴構造を明らかにし,長期的なダイナミクス進化に関する新たな知見をもたらした。
- 計算ツールと伝統的な天体力学を統合し,大規模軌道データセット解析への拡張性と解釈性を提供する手法を確立した。
実験から専門知識へ:AI駆動型計算研究のための科学的知識の統合 [physics.comp-ph, cond-mat.mtrl-sci, cs.AI]目的:AI駆動型計算研究における科学的知識の統合
- 材料科学研究の効率化には,実験やシミュレーション結果から得られる知識の体系化が不可欠である。
- 従来のAI研究では,各計算を独立して扱い,過去の知見を十分に活用できていない。
- 本研究は,AIエージェントが実験から得られた知見を統合し,効率的な研究を可能にすることを目指す。
- QMatSuiteは,AIエージェントが実験結果を記録し,過去の知見を活用することで,推論のオーバーヘッドを67%削減した。
- 既存の量子力学シミュレーションにおいて,精度を文献値との偏差47%から3%に向上させた。
- 未知の材料への適用では,パイプラインの失敗なく1%の偏差を達成し,知識の転移可能性を示した。
部分観測マルチエージェント強化学習における情報共有 [cs.LG, cs.GT, cs.MA]目的:部分観測確率的ゲームにおける,マルチエージェント強化学習の理論的保証
- マルチエージェントシステムは,現実世界の複雑な問題を解決する上で不可欠である。
- 部分観測環境下でのマルチエージェント強化学習は,計算困難性が高く,実用化が難しい。
- エージェント間の情報共有によって計算効率を向上させ,実用的なアルゴリズムを開発すること。
- エージェント間の情報共有の必要性と,部分観測下での効率的な強化学習を可能にする可視性に関する仮定を明らかにした。
- 真のモデルでの計画の非効率性に着目し,共有情報の近似によってPOSGの近似モデルを構築し,準多項式時間で近似均衡を導出した。
- 準多項式時間・サンプル複雑性を持つ,部分観測マルチエージェント強化学習アルゴリズムを開発し,チーム最適解への拡張も示した。
なぜソフトマックス注意機構が線形注意機構を上回るのか [cs.CL, cs.LG]目的:ソフトマックス注意機構と線形注意機構の性能差の理論的解明
- 自然言語処理において,Transformerモデルは高い性能を達成しており,注意機構はその重要な要素である。
- 線形注意機構は計算効率が良いが,ソフトマックス注意機構と比較して性能が大幅に低下する点が課題である。
- ソフトマックス注意機構が線形注意機構を上回る理由を理論的に解明し,性能差を埋めることを目指す。
- ソフトマックス注意機構と線形注意機構の比較分析により,ソフトマックス注意機構が優れた性能を発揮する要因が明らかになった。
- 線形注意機構は,ソフトマックス注意機構と比較して,トークン間の相互作用を十分に捉えきれていない可能性がある。
- 本研究は,ソフトマックス注意機構の優位性を理論的に説明し,線形注意機構の改善に向けた方向性を示唆する。
ノイズ除去拡散による変分推論:拡散モデルを表現力豊かな事後分布として [cs.LG, q-bio.QM, stat.ML]目的:潜在変数モデルに対する,ブラックボックス変分推論手法
- 複雑なデータ分布を扱う上で,変分推論は重要な役割を果たす。
- 従来の変分推論では,表現力の低い事後分布しか扱えない場合がある。
- 拡散モデルを用いて,より表現力の高い事後分布を構築し,推論精度を向上させる。
- DDVIは,正規化フローや敵対的ネットワークに基づく近似事後分布よりも優れた性能を示す。
- 一般的なベンチマークに加え,ヒトゲノムからの潜在的な祖先を推論する生物学的なタスクにおいて,DDVIは強力なベースラインを上回る。
- DDVIは実装が容易であり,ブラックボックス変分推論と互換性がある。
グラフオン信号処理におけるサンプリングと一意性集合 [cs.LG, eess.SP]目的:グラフオンにおけるサンプリング集合の性質
- 大規模グラフの解析は,社会ネットワークや情報科学など,多様な分野で重要性を増している。
- グラフの構造が複雑な場合,効率的な信号サンプリングが困難となる。
- グラフオンを用いて,グラフ間のサンプリング集合を比較し,最適なサンプリングを可能にすること。
- グラフオンの理論とグラフ極限の概念を活用し,サンプリング集合の特性を解析した。
- バンドリミットされたグラフオン信号について,一意性集合と除去可能集合の定義を拡張し,条件を提示した。
- グラフオン表現により,異なるグラフのサンプリング集合を比較可能であり,近似最適サンプリング集合を算出するアルゴリズムを提案した。
オフライン強化学習における条件付き教師あり学習のための適応的$Q$-支援 [cs.LG]目的:オフライン強化学習における条件付き教師あり学習の性能向上
- 強化学習は,複雑な課題に対する自動化技術として重要であり,様々な分野での応用が期待されている。
- オフライン強化学習は,既存のデータセットのみで学習するため,データの質や分布に依存しやすいという課題がある。
- 本研究は,条件付き教師あり学習の弱点である「つなぎ合わせ」能力の欠如を,$Q$-関数を用いて改善することを目的とする。
- 提案手法QCSは,条件付き教師あり学習の安定性と,$Q$-関数のつなぎ合わせ能力を効果的に組み合わせている。
- 実験結果から,QCSはRCSLや価値ベースの手法と比較して,オフライン強化学習の様々なベンチマークにおいて,一貫して高い性能を示すことが明らかになった。
- $Q$-関数の過剰一般化を分析し,軌跡の報酬に基づいて損失関数に$Q$-支援を適応的に統合することで,安定した学習を実現している。
ビジョン言語モデルのロバスト性を高める部分的な再集中ソフトマックス損失 [cs.CL, cs.AI]目的:ビジョン言語モデルにおける敵対的攻撃に対するロバスト性の向上
- 大規模言語モデルの発展に伴い,マルチモーダル技術が注目されている。
- マルチモーダルモデルは敵対的攻撃に脆弱であり,わずかな入力の変化で出力が大きく変動する。
- 損失関数を修正することで,事前学習済みモデルのロバスト性を高めることを目指す。
- トップKのソフトマックス出力を制限する損失関数により,事前学習済みモデルのロバスト性を大幅に改善できる。
- ファインチューニング後,一般的な攻撃に対して高い防御効果が確認された。
- 今後の課題として,出力の多様性,汎化性能,ロバスト性と性能のトレードオフに関する研究が必要である。
活性化から初期化へ:ニューラルフィールド最適化のためのスケーリングに関する考察 [cs.CV, cs.LG]目的:ニューラルフィールドの最適化に関する理論的基盤
- 画像認識分野において,ニューラルフィールドは信号表現のための強力な手法として注目を集めている。
- ニューラルフィールドの応用は進むものの,その理論的基盤は未だ十分に確立されていない。
- ニューラルフィールドの設計において,初期化と活性化の相互作用を理解し,最適化を促進することを目的とする。
- ネットワークの初期化,アーキテクチャ,最適化プロセス間の深い関係性が明らかになった。
- 効果的なニューラルフィールドの設計には,全体的なアプローチが不可欠であることが示唆された。
フラメンコ音楽ジャンルの計算辞書分析 [cs.CL, cs.AI, cs.IR]目的:フラメンコ音楽ジャンルの分類と特徴の抽出
- フラメンコは無形文化遺産であり,文化アイデンティティの重要な表現である。
- フラメンコ音楽の伝統的な様式における定量的な研究が不足している。
- フラメンコ歌詞の言語的特徴を分析し,ジャンル間の関係性を明らかにすること。
- 多項ナイーブベイズ分類器を用いて,歌詞の語彙的特徴から各ジャンルを高精度に識別できた。
- 自動的な語彙使用頻度分析により,各ジャンルを特徴づける意味領域を特定できた。
- ジャンル間の距離を定量化する指標を用いたネットワーク分析から,歴史的な繋がりやジャンルの進化が示唆された。
相構造に基づくジオモデルのパラメータ化とデータ同化のための潜在拡散モデル [cs.CV, cs.AI, cs.CE, cs.LG, physics.geo-ph]目的:相構造に基づくジオモデルのパラメータ化とデータ同化
- 地質モデルは資源探査や開発において不可欠であり,その精度向上が重要である。
- 従来のジオモデル作成は計算コストが高く,データ同化が困難であるという課題があった。
- 潜在拡散モデルを用いて,効率的かつ高精度なジオモデルのパラメータ化とデータ同化を実現する。
- 潜在拡散モデルは,ジオモデリングソフトウェアからのサンプルと視覚的に一貫性のある実現を生成できることが示された。
- 空間統計量やフロー応答統計量に関する定量的な評価の結果,拡散モデルによる実現と参照実現の間には全体的な一致が見られた。
- アンサンブルに基づくデータ同化において,有意な不確実性の低減と,観測データを包含する事後予測が得られた。
有向グラフにおける良好な位置エンコーディングとは何か? [cs.LG]目的:有向グラフにおける位置エンコーディングの表現力向上
- グラフニューラルネットワークの性能は,ノード間の相対的な空間関係の捉え方に大きく左右される。
- 有向グラフにおける位置エンコーディングの研究は,無向グラフに比べて遅れており,十分な検討がなされていない。
- 有向グラフの構造的特徴を捉え,プログラム解析や回路性能予測などの応用における課題を解決すること。
- 本研究では,有向グラフに対する新たな位置エンコーディングであるMulti-q Magnetic Laplacian PEを提案した。
- 提案手法は,既存の位置エンコーディングの限界を克服し,Walk Profileと呼ばれる有向グラフ特有の構造的特徴を表現可能である。
- ソートネットワーク充足可能性問題や回路ベンチマークにおいて,提案手法の有効性が実験的に確認された。
トポロジーおよび静電的特徴を持つDNNバイオフィジクスモデル [cs.LG, math-ph, math.MP]目的:タンパク質の特性予測
- タンパク質の構造と機能理解は,創薬や生命科学研究において不可欠である。
- タンパク質の特性予測は計算コストが高く,高精度なモデル開発が課題である。
- トポロジーと静電的特徴を用いたDNNモデルにより,高精度かつ効率的な予測を実現する。
- 17,000以上のタンパク質で訓練したクーロンエネルギー予測モデルは,高い精度を示した (MSE: 0.024, MAPE: 0.073, $R^2$: 0.976)。
- 4,000以上のタンパク質で訓練した溶媒和エネルギー予測モデルも,同様に優れた性能を発揮した (MSE: 0.064, MAPE: 0.081, $R^2$: 0.926)。
- 開発された特徴量生成アルゴリズムは,タンパク質特性予測の機械学習を支援する汎用ツールとしての応用が期待される。
表面的な安全性整合仮説 [cs.CL, cs.AI, cs.CR, cs.CY, cs.LG]目的:大規模言語モデルの安全性確保に関するメカニズムの解明
- LLMの応用拡大に伴い,安全性確保が喫緊の課題となっている。
- 既存研究では,安全性調整の脆さや特性が十分に考慮されていない。
- LLMにおける安全性の基盤となる要素を特定し,効率的な調整方法を提案する。
- 安全性調整は,モデルが要求を遂行するか拒否するかという二値分類問題として捉えられる。
- 安全性に重要な要素を特定し,微調整時に凍結することで安全性を維持しながらタスク適応が可能。
- 事前学習済みモデルの冗長な要素を「調整予算」として活用し,安全性と性能のトレードオフを軽減できる。
注意機構の再考:Transformer における softmax の多項式による代替案 [cs.LG, cs.CV, stat.ML]目的:Transformer における注意機構の代替案の検討
- 自然言語処理の発展において,Transformer は重要な役割を果たしている。
- softmax 注意機構は計算コストが高く,効率性が課題となっている。
- softmax の効果の真の要因を解明し,より効率的な代替案を提示する。
- softmax の性能は確率分布の生成よりも,Frobenius ノルムの正則化による安定性にあることが示唆された。
- 特定の多項式が softmax の代替として機能し,優れた性能を発揮することが理論的に証明された。
- 実験結果は,多項式による代替が Transformer の様々な応用において有効であることを裏付けている。
潜在変数を用いた能動的因果構造学習:自律ロボットにおける迂回学習に向けて [cs.AI, cs.LG]目的:潜在変数を用いた能動的因果構造学習
- 汎用人工知能実現には,環境変化への適応能力が不可欠である。
- 環境構造の変化に対応できる因果モデルの自動構築が課題である。
- 未知の状況下での効率的な問題解決を可能にする因果モデル構築を目指す。
- 本研究では,ロボットが透明な障害物に遭遇した際の迂回行動を,能動的因果構造学習によって獲得できることを示した。
- 環境とのインタラクションを通じて新たな因果関係を発見し,因果モデルを構築することで,効率的な行動計画を立案する。
- 予期せぬ状況を予測可能な状況へと変容させ,最適な運用計画を策定することが可能となる。
境界条件付き動作推論による物理的に整合性の高い動画生成: Motion Dreamer [cs.RO, cs.CV, cs.AI]目的:境界条件付き動作推論
- 自動運転や具現化された知能において,将来のシナリオ生成は不可欠である。
- 既存手法は,明示的な制約を無視するか,完全な入力が必要で実用的でない。
- 部分的な情報から物理的に整合性の高い動作を推論し,現実的な動画を生成する。
- Motion Dreamerは,動作推論と視覚合成を分離する2段階フレームワークである。
- インスタンスフローにより,部分的な動作情報の統合と他のオブジェクトの動作推論が可能となった。
- 既存手法を大幅に上回り,動作の妥当性と視覚的なリアリズムを向上させた。
