arXiv雑要約

AI - 2026/03/09 公開

  • スケーラブルなアテンションベースのMLIPのレシピ:全ノードアテンションによる長距離精度向上 [cs.LG, cond-mat.mtrl-sci, cs.CE, physics.chem-ph, q-bio.QM]目的:機械学習原子間ポテンシャルの長距離相互作用の正確な捕捉
    • 機械学習原子間ポテンシャルは材料科学におけるシミュレーションの精度と効率を向上させる上で重要である。
    • 大規模システムにおいて,従来のMLIPは長距離相互作用の正確なモデリングに課題を抱えている。
    • データ駆動型アテンション機構を用いて長距離相互作用を捉え,MLIPの精度とスケーラビリティを向上させる。
    • AllScAIPは,最大1億の訓練サンプルまでスケール可能な,単純かつエネルギー保存的なMLIPモデルである。
    • データ量が少なくモデルが小さい場合は誘導的バイアスがサンプル効率を向上させるが,データ量とモデルサイズが大きくなると効果は薄れるか逆転する。
    • AllScAIPは,分子系,材料系,触媒系において最先端のエネルギー/力精度を達成し,実験的観測値の再現性も高い。

    Link: https://arxiv.org/abs/2603.06567

  • SUREON:外科的推論のためのベンチマークおよびビジョン言語モデル [cs.CV, cs.AI]目的:外科手術の場面における推論能力を評価するためのベンチマークデータセットおよびビジョン言語モデル
    • 外科手術の質の向上には,熟練した外科医の知識と判断能力が不可欠である。
    • 既存の外科AIは,手術における意図やリスク評価といった高次の推論を欠いている。
    • 手術教育ビデオに含まれる専門家の解説を活用し,外科AIの推論能力を向上させる。
    • SUREONデータセットは,170種類の手術,134.7Kのクリップ,206.8KのQAペアで構成される大規模なデータセットである。
    • SureonVLMおよびSureonVLM-R1は,SUREONベンチマークで84%以上の精度を達成し,汎用モデルを上回る性能を示した。
    • SureonVLM-R1は,視覚的文脈から手術の意図を推論するなど,明示的な推論行動を示すことが確認された。

    Link: https://arxiv.org/abs/2603.06570

  • シーンコンテキストを考慮した漸進型Few-Shot 3Dセグメンテーション [cs.CV, cs.LG]目的:漸進型Few-Shot 3Dセグメンテーションにおける性能向上
    • 3D点群処理は,ロボティクスや自動運転等の応用において重要性が高まっている。
    • Few-Shot学習では,少数サンプルからの学習が課題であり,3D点群データでは特に困難である。
    • 背景領域を活用し,少ないラベルサンプルでも汎化性能を向上させる。
    • 提案手法SCOPEは,既存のプロトタイプベース手法に組み込めるプラグアンドプレイ型フレームワークである。
    • 背景領域からの疑似インスタンスを利用し,プロトタイププールを構築することで,Catastrophic Forgettingを抑制する。
    • ScanNetとS3DISでの実験により,新規クラスのIoUが最大6.98%向上し,SOTA性能を達成した。

    Link: https://arxiv.org/abs/2603.06572

  • Fly360:ドローン視点における全方向障害物回避 [cs.RO, cs.AI]目的:ドローンによる全方向障害物回避手法の開発
    • 空間知能の重要性が高まるにつれ,ドローンの自律飛行における障害物回避は不可欠な能力となっている。
    • 既存手法は視野の狭いセンサーに依存しており,ドローンの進行方向と機体の向きが異なる状況での全方位認識が困難である。
    • 全景認識が可能なパノラマドローン向けに,全方向からの障害物回避を可能にする手法を開発し,その性能を検証する。
    • 提案手法Fly360は,全方向障害物回避を安定的に実現し,従来の前方視点ベースラインと比較して全てのタスクで優れた性能を示した。
    • Fly360は,RGB画像を中間表現として深度マップに変換する知覚段階と,深度マップから速度指令を出力する軽量なポリシーネットワークからなる二段階パイプラインである。
    • シミュレーションと実機実験の両方で有効性が確認されており,開発コードは公開されている。

    Link: https://arxiv.org/abs/2603.06573

  • BEVLM:LLMからの意味的知識をバードアイビュー表現へ蒸留 [cs.CV, cs.AI, cs.LG, cs.RO]目的:LLMとバードアイビュー表現の接続による,自動運転における推論能力の向上
    • 自動運転において,複雑な状況判断やレアケースへの対応には,高度な推論能力と意味理解が不可欠である。
    • 既存手法では,LLMへの入力が冗長になり,視点間の一貫性が失われ,3次元空間推論の精度が制限される。
    • 本研究は,空間構造と意味的理解を両立させ,LLMによるより効果的な推論を実現することを目指す。
    • BEVLMは,統一された入力としてバードアイビュー特徴量を用いることで,LLMのクロスビュー運転シーンにおける推論精度を46%向上させた。
    • LLMからの意味的知識をバードアイビュー表現に蒸留することで,安全性が重要なシナリオにおいてエンドツーエンド運転性能を29%向上させた。

    Link: https://arxiv.org/abs/2603.06576

  • 為替レート予測のための混合周波数アプローチ [stat.AP, cs.LG]目的:為替レート予測の統計モデル
    • 金融政策や中央銀行の意思決定において,正確な為替レート予測が不可欠である。
    • 為替レートの変動予測は難しく,「ミース・ロゴフのパズル」と呼ばれる課題が存在する。
    • 時間集約による情報損失を克服し,より精度の高い予測手法を確立すること。
    • 混合周波数モデルを用いたアプローチが,従来の予測手法と比較して有効であることが示された。
    • カナダドル/米ドル為替レートの予測において,本手法の優位性が確認された。
    • 時間集約による情報損失を軽減することで,予測精度を向上させることに成功した。

    Link: https://arxiv.org/abs/2106.00283

  • 生成AIの評価におけるパラドックス:解決できることは必ずしも評価できない [cs.CL, cs.AI, cs.HC]目的:大規模言語モデルの生成能力と評価能力の乖離
    • AI技術の発展は,質問応答システムの性能向上に不可欠であり,その評価は重要である。
    • 大規模言語モデルの評価は自動化が求められるが,その信頼性には疑問が残る。
    • 生成能力の高いモデルが,必ずしも信頼性の高い評価者とは限らない点を明らかにする。
    • 大規模言語モデルは,生成タスクに比べて評価タスクにおいて有意に低い性能を示すことが判明した。
    • モデルは,自身の得意分野以外でも正確に評価できる場合があり,評価の忠実性に課題があることが示唆された。
    • 生成AIの優れた生成能力と評価能力の相関関係,およびモデル評価における忠実性の検証が必要である。

    Link: https://arxiv.org/abs/2402.06204

  • LLMは帰納的定義を含む制約解決に役立つか? [cs.RO, cs.SY, eess.SY, cs.LO, cs.AI]目的:帰納的定義を含む制約解決へのLLMの活用
    • 形式検証やプログラム解析において,帰納的定義の制約解決は不可欠である。
    • 従来のSMT/CHCソルバーは,特に抽象データ型を含む場合,帰納的定義の制約解決が苦手である。
    • LLMを活用し,帰納的定義の推論に必要な補助的な補題を生成することで解決を目指す。
    • 構造化されたプロンプトにより,LLMが帰納的定義に関する推論に必要な補助的な補題を生成することが可能となった。
    • LLMと制約ソルバーを統合した神経記号的アプローチにより,既存のソルバーの性能を向上させることができた。
    • 実験結果から,本手法は帰納的定義を含む制約解決タスクにおいて,約25%の解法率向上を達成した。

    Link: https://arxiv.org/abs/2603.03668

  • 化学および材料科学におけるAIのための分子表現:NLPの視点 [quant-ph, cs.ET, cs.NI, cs.CL, cs.FL, physics.chem-ph, cs.AI, cs.CE]目的:化学および材料科学におけるAI応用のための分子表現
    • 近年,AI技術は化学や材料科学を含む様々な分野で重要性を増している。
    • 分野横断的な研究を阻害する,分子情報をAIが読み取り可能な形式で表現する手法が課題となっている。
    • 自然言語処理の知見に基づいた分子表現を紹介し,AI応用の指針を示す。
    • 本稿では,化学情報科学で利用される代表的なデジタル分子表現を紹介している。
    • これらの分子表現は,自然言語処理(NLP)に触発されたものが多く,AIベースの応用に活用されている。
    • 本レビューは,化学表現に不慣れな研究者にとって,学際的なプロジェクトにおける参考となる。

    Link: https://arxiv.org/abs/2603.05525

  • 医薬品探索におけるAI手法の信頼性:構造および結合親和性予測のためのBoltz-2の評価 [physics.chem-ph, cs.AI]目的:医薬品探索におけるAI手法の信頼性評価
    • 医薬品探索の加速には,タンパク質とリガンドの構造予測と結合親和性予測が不可欠である。
    • AI技術は進歩しているが,AIによって発見された医薬品が規制当局の承認を受けていないという課題がある。
    • AIモデルの精度向上と,物理ベース手法との連携による信頼性確保を目指す。
    • Boltz-2は高速な初期スクリーニングが可能であるが,リード化合物の特定に必要なエネルギー分解能に乏しい。
    • 構造解析の結果,Boltz-2は単一の収束ポーズではなく,複数のタンパク質コンフォメーションとリガンド結合位置を予測することが示された。
    • 全体的なデータセットでは,弱い相関しか見られず,上位100化合物の詳細分析でも有意な相関は確認されなかった。

    Link: https://arxiv.org/abs/2603.05532

  • 小児ループス腎炎予後予測のためのドメイン適応型MAEを用いた臨床注入Transformer [eess.IV, cs.CV, cs.LG]目的:小児ループス腎炎における治療反応(完全寛解,部分寛解,無反応)の三種分類
    • 全身性エリテマトーデスに伴う重篤な合併症であり,小児患者への影響が大きい。
    • 既存の研究では,小児ループス腎炎の予後予測は計算病理学において未開拓の分野である。
    • ルーチンなPAS染色標本と臨床データのみを用いて,高精度な予後予測を目指す。
    • 提案手法は,臨床情報を自己注意機構に注入する臨床注入Transformer(CIT)と,ドメイン適応型Masked Autoencoder(MAE)を導入。
    • 71名の小児ループス腎炎患者コホートにおいて,三種分類の正解率90.1%とAUC 89.4%を達成。
    • 本手法は,高精度かつ費用対効果の高い予後予測ツールとしての可能性を示す。

    Link: https://arxiv.org/abs/2603.05535

  • ブライヤー・スコアを用いた予測検証におけるYates共分散分解の直感的な再構成 [stat.ME, cs.LG, stat.AP]目的:確率的予測の評価
    • 気象予測や金融予測など,不確実性を含む分野において,予測の精度評価は不可欠である。
    • 既存の評価指標では,予測のどの側面が改善すべきか明確にならない場合がある。
    • ブライヤー・スコアの分解を通じて,予測の改善点と最適条件を明確にすること。
    • ブライヤー・スコアを,分散の不一致,相関の欠如,大規模なキャリブレーションのずれという3つの非負項に分解する新しい方法を提案した。
    • 最適な予測は,結果の分散と一致し,結果との完全な正の相関を達成し,結果の平均と一致する必要があることが明確になった。
    • これらの条件からの逸脱は,ブライヤー・スコアの増加に寄与することが示された。

    Link: https://arxiv.org/abs/2603.05544

  • 多源データ統合による最適な個別化治療ルール学習 [stat.ML, cs.LG]目的:最適な個別化治療ルールの推定
    • 医療現場での意思決定の効率化に貢献し,患者への最適な治療選択を支援する重要性がある。
    • データソース間の分布のずれ(ポステリアシフト)が,治療効果の推定精度を低下させる問題がある。
    • ポステリアシフトに強く,よりロバストな個別化治療ルールを推定することを目的とする。
    • 提案手法PDRO-ITRは,最悪ケースにおけるポリシー値を最大化することで,ポステリアシフト下でのロバスト性を保証する。
    • 源データの分布を組み合わせた不確実性集合を構築し,ロバストな治療ルールを導出する閉形式解が得られた。
    • シミュレーションと実データ解析の結果,既存手法と比較して優れた性能が確認された。

    Link: https://arxiv.org/abs/2603.05568

  • 多発性硬化症のクロス組織バルクおよび単一細胞トランスクリプトミクスデータの機械学習による解析 [q-bio.GN, cs.LG]目的:多発性硬化症患者と健常対照群の識別
    • 多発性硬化症は,その分子メカニズムが未解明な慢性自己免疫疾患であり,病態解明が重要である。
    • 従来の解析方法では,多種多様なトランスクリプトミクスデータを統合的に解析し,メカニズムを解明することが困難である。
    • 機械学習と説明可能なAIを用いて,多発性硬化症の新たな病態仮説とバイオマーカーを特定することを目指す。
    • 機械学習モデルは,特に脊髄液中のB細胞において高い識別性能を示した(AUC=0.94)。
    • SHAP法による遺伝子選択は,従来のDEAによる結果を補完するものであることが示された。
    • 免疫活性化,非典型的な免疫チェックポイント,リボソーム機能など,多発性硬化症に関連する複数の遺伝子クラスターが特定された。

    Link: https://arxiv.org/abs/2603.05572

  • 予測力に基づく条件付き推論 [stat.ML, cs.LG]目的:限られたラベル付きデータと豊富なラベルなし共変量,そしてブラックボックス機械学習予測子を用いた条件付き関数値の統計的推論
    • データ分析において,条件付き分布の推定は重要な課題であり,様々な分野で応用されている。
    • ラベル付きデータが少ない状況では,正確な条件付き推論を行うことが困難である。
    • 機械学習予測子を活用し,ラベル不足下における条件付き推論の精度と効率を向上させる。
    • 提案手法は,カーネル法による局所化と予測に基づく分散削減を組み合わせることで,効率的な推論を可能にする。
    • 予測子の情報量に応じて分散が減少し,予測子の精度に関わらず妥当性が保たれる。
    • シミュレーションおよび実データ実験により,妥当な条件付きカバレッジとよりシャープな信頼区間が得られたことが示された。

    Link: https://arxiv.org/abs/2603.05575

  • 行動制約型分解線形動的システムモデル:ニューラル活動と行動部分制約 [q-bio.NC, cs.LG, stat.AP, stat.ML]目的:ニューラル活動と行動の関係性の解明
    • 脳活動と行動の関係は,脳機能理解の根幹であり,神経科学研究において重要である。
    • 脳活動は行動と直接関係する部分と,内部計算の部分が混在しており,解き分けが困難である。
    • 行動生成に関わる神経回路と内部計算を分離し,それぞれの役割を明らかにすること。
    • b-dLDSはシミュレーションデータにおいて,行動と内部計算を効果的に分離できることが示された。
    • ゼブラフィッシュの脳幹大規模記録データへの適用により,行動に関連する動的結合ネットワークを特定した。
    • b-dLDSは,最先端モデルと比較して,行動に基づく動的制御において優位性を示した。

    Link: https://arxiv.org/abs/2603.05612

  • 脳MRIにおける3D領域認識拡散による縦断的病変インペインティング [eess.IV, cs.AI, cs.CV]目的:脳MRI縦断的病変のインペインティング手法
    • 脳MRIは神経変性疾患の診断・進行評価に不可欠であり,正確な解析が求められる。
    • 病変の経時的な変化が自動解析の精度を低下させ,信頼性のある定量評価を妨げる。
    • 病変を自然に補完し,縦断的な変化を考慮した高精度なMRI解析を実現する。
    • 提案手法は,既存手法(FastSurfer-LIT)と比較して,知覚的な忠実度を大幅に向上させた。
    • 縦断的安定性も高く,理想値に近いTemporal Fidelity Index(1.024)を示した。
    • RAD機構により処理効率が向上し,LITの10倍の速度で処理を完了した。

    Link: https://arxiv.org/abs/2603.05693

  • ランダムドット積グラフを力学系として捉える:限界と可能性 [stat.ME, cs.LG, math.ST, stat.TH]目的:時間変化するネットワークの背後にある微分方程式の学習
    • ネットワーク科学は,現実世界の複雑なシステムを理解するための基盤となる。
    • 潜在的な位置やダイナミクスが未知である場合,ネットワークの時間発展を正確にモデル化することが難しい。
    • ランダムドット積グラフにおける時間変化するネットワークのダイナミクスを捉える際の限界と可能性を明らかにすること。
    • ランダムドット積グラフでは,潜在的な位置の回転的な曖昧さ,確率行列の構造上の制約,スペクトル埋め込みによる軌跡回復の歪みが,ダイナミクスの学習を妨げる根本的な障害となる。
    • これらの障害を形式化する幾何学的フレームワークとして,主ファイバー束に基づくアプローチを開発し,不可視なダイナミクスを偏対称な生成子として特定した。
    • 対称的なダイナミクスは偏対称なゲージ汚染を吸収できず,ダイナミクス構造がゲージの曖昧さを解消できることを証明し,アンカーベースのアラインメントとUDEパイプラインで検証した。

    Link: https://arxiv.org/abs/2603.05703

  • 気象・気候情報におけるAIの台頭とその世界的格差への影響 [physics.ao-ph, cs.AI, cs.LG]目的:気象・気候情報の世界的格差拡大のリスク
    • 地球システム科学におけるAI活用は,気候変動への理解と対策に不可欠である。
    • AI開発は先進国に偏り,データや計算資源の格差が深刻化している。
    • 気候変動への対策における公平性を確保するためのAI開発のあり方を模索する。
    • AI開発のインフラやデータが先進国に集中し,南北格差を助長する可能性がある。
    • 歴史的に偏ったデータに基づくモデルは,脆弱な地域で性能に差が生じやすい。
    • データ不足や偏った検証により,誤った対策や不適切な適応策を招く恐れがある。

    Link: https://arxiv.org/abs/2603.05710

  • 再構築!エンコードしない:高明瞭度・低遅延ストリーミングニューラルオーディオコーデックのための自己教師あり表現再構築損失 [q-fin.CP, cs.MA, eess.AS, cs.AI]目的:高明瞭度かつ低遅延を実現するストリーミングニューラルオーディオコーデックの性能向上
    • 近年の音声処理技術の発展により,ニューラルオーディオコーデックの研究が活発化している。
    • メルスペクトログラム再構築に最適化されたコーデックは,明瞭度を損なう場合がある。
    • 自己教師あり表現再構築損失を用いることで,明瞭度を維持しつつ学習を加速させる。
    • 自己教師あり表現再構築損失 (SSRR) は,コーデックの学習収束を大幅に加速し,単一のGPUでも良好な結果を得ることを可能にする。
    • SSRRは,コーデック出力から蒸留された自己教師あり表現を再構築することにより,明瞭度を向上させる。
    • SSRRにより,ストリーミングTransformerベースのコーデックで追加の先読みなしに高明瞭度を実現し,リアルタイム展開に適したゼロ先読みアーキテクチャを可能にする。

    Link: https://arxiv.org/abs/2603.05887

  • StreamVoiceAnon+: フレームレベル音響蒸留による感情を保持するストリーミング話者匿名化 [quant-ph, cs.CC, eess.AS, cs.AI, eess.SP]目的:ストリーミング話者匿名化における感情内容の保持
    • プライバシー保護の重要性が増す中,音声データの匿名化技術が求められている。
    • 従来のストリーミング話者匿名化は,感情表現を損なうという課題があった。
    • 本研究は,感情表現を保持しつつ,効率的な音声匿名化を実現することを目指す。
    • 提案手法では,中立的な感情の音声を教師データとして利用し,フレームレベルでの感情蒸留を行う。
    • これにより,VoicePrivacy 2024プロトコルにおいて,UAR(感情保持率)が24%相対的に向上した。
    • 推論時の遅延はゼロであり,プライバシー保護性能も高い(EER 49.0%)。

    Link: https://arxiv.org/abs/2603.06079

  • 球面上のランダム二次形式:共通ノイズによる同期 [math.PR, cs.LG, math.DS]目的:球面上のランダム二次形式の同期現象
    • 深層学習モデルの解析において,線形層の役割理解が重要である。
    • Transformerモデルにおける自己注意メカニズム以外の同期メカニズムが不明である。
    • 共通ノイズによる同期現象を理解し,Transformerのクラスタリング現象を説明する。
    • ランダム二次形式は,球面上の確率微分方程式として定式化される。
    • このモデルにおいて,二点運動は非自明な同期振る舞いを示すことが示された。
    • 自己注意メカニズムを用いなくても,トークンがクラスタリングすることが確認された。

    Link: https://arxiv.org/abs/2603.06187

  • SPPCSO:高次元相関データに対する適応的ペナルティ推定法 [astro-ph.EP, astro-ph.IM, cs.SY, eess.SY, stat.ML, cs.LG]目的:高次元相関データにおけるモデルの安定性と予測精度向上
    • 高次元データは近年増加しており,統計モデリングの重要な課題となっている。
    • 多重共線性により,推定の不安定性や予測精度の低下が起こりやすい。
    • 高次元・高ノイズデータにおける変数選択と係数推定の安定化を目指す。
    • 提案手法SPPCSOは,主成分回帰とL1正則化を組み合わせ,適応的に縮小因子を調整する。
    • 理論的に,選択の一貫性と,従来のペナルティ推定法よりも小さい推定誤差界限が示された。
    • 数値実験により,SPPCSOが高ノイズ環境下でも安定した推定と変数選択を実現することが確認された。

    Link: https://arxiv.org/abs/2603.06251

  • 二値分類のための有界非対称弾性ネット損失に基づくロバストなサポートベクターモデル [stat.ML, cs.LG]目的:二値分類におけるロバスト性向上
    • 機械学習において,分類精度と汎化性能の向上が重要課題である。
    • 従来のSVMは,外れ値やノイズに弱く,幾何学的な不合理性を持つ場合がある。
    • ノイズに強く,幾何学的に定義されたロバストな分類モデルを構築すること。
    • 提案手法であるBAEN-SVMは,ノイズを含むデータに対して有効に機能することが示された。
    • BAEN-SVMの違反許容度上限(VTUB)の証明により,モデルの幾何学的な妥当性が確認された。
    • 影響関数の有界性により,ノイズに対するロバスト性が理論的に保証された。

    Link: https://arxiv.org/abs/2603.06257

  • AIによる1秒未満の全自動放射線治療計画 [eess.IV, cs.AI, cs.LG, cs.SY, eess.SY, physics.med-ph]目的:人工知能を用いた放射線治療計画の迅速化と標準化
    • 放射線治療計画は,がん治療において重要な役割を担うが,熟練した専門知識と時間を要する。
    • 従来の自動化手法では,計画生成に数分を要し,臨床ワークフローの効率化が課題であった。
    • 本研究は,CT画像と輪郭情報から1秒未満で実行可能な放射線治療計画を生成することを目指す。
    • AIRTは,深層学習フレームワークを用いて,画像情報から直接放射線治療計画を生成する。
    • 10,000件以上の前立腺症例で学習した結果,RapidPlan Eclipseと同等以上の計画品質が確認された。
    • 本研究は,超高速な標準化された放射線治療計画と効率的な臨床ワークフローの実現に向けた重要な一歩である。

    Link: https://arxiv.org/abs/2603.06338

  • U6G XL-MIMO放射伝搬路マップ予測:マルチ構成データセットとビームマップアプローチ [eess.SP, cs.LG]目的:U6G XL-MIMOにおける無線伝搬路マップの予測
    • 次世代無線通信システムにおいて,6GHz帯の利用と大規模MIMO技術の導入が重要視されている。
    • 既存のデータセットは小規模アレイに限定され,将来的な1024素子アレイに対応できていない。
    • データ不足と汎化性能の限界を克服し,様々な環境下での予測精度向上を目指す。
    • 大規模なデータセットを構築し,実環境における様々なシナリオを網羅したベンチマークフレームワークを確立した。
    • 物理情報に基づいた空間特徴量であるビームマップを提案し,アレイ固有の放射パターンを解析的に計算することで汎化性能を高めた。
    • ビームマップを既存のアーキテクチャに統合することで,未知の構成や環境への汎化において,平均絶対誤差を最大60.0%および50.5%削減した。

    Link: https://arxiv.org/abs/2603.06401

  • 量子拡散モデル:ガウス力学におけるスコア反転は無償ではない [quant-ph, cs.LG, math-ph, math.MP]目的:拡散モデルにおけるスコア反転の条件
    • 生成モデルの理論的基盤を確立し,高性能なモデル開発に不可欠である。
    • 量子極限アッテネータにおいて,完全陽性性の条件を満たすことが難しい。
    • スコア反転に必要な追加拡散量を理論的に評価し,最適化を目指す。
    • 完全陽性性を満たすためには追加の拡散が必要であり,その量は熱パラメータと絞り込みの関数として定まる。
    • 絞り込みパラメータが熱パラメータを超えると,完全陽性性が破れ,追加拡散が必要となる。
    • 追加拡散量は,決定情報量によって制約を受けることが示された。

    Link: https://arxiv.org/abs/2603.06488

  • 意味を考慮した概念学習のためのキャッシュ [stat.ML, cs.LG]目的:概念学習におけるインスタンス検索の効率化
    • 知識ベースを利用した機械学習であり,複雑な概念の学習に不可欠である。
    • 膨大な概念空間の探索に多数のインスタンス検索が必要となり,計算コストが高い。
    • 意味情報を活用したキャッシュにより,検索回数を削減し,学習時間を短縮する。
    • 提案手法は,サブサムプションを考慮したキャッシュにより,概念検索と学習の実行時間を大幅に短縮する。
    • 5つのデータセットと4つの記号推論器,1つのニューロシンボリック推論器,5つのページネーションポリシーを用いた実験で有効性が確認された。
    • 記号推論器とニューロシンボリック推論器の両方において,実行時間を1桁削減できることが示された。

    Link: https://arxiv.org/abs/2603.06506

  • トランスフォーマーによる原子間遷移の予測 [cond-mat.mtrl-sci, cs.LG]目的:材料および材料表面における原子間遷移経路の予測
    • 材料科学の様々な問題解決に,原子レベルでの遷移経路の正確な知識が不可欠である。
    • 従来のシミュレーション手法は計算コストが高く,適用範囲が限定されている。
    • 機械学習モデルを用いた,低コストでの原子間遷移予測手法の確立。
    • トランスフォーマーモデルが,ナノクラスターの原子間遷移予測に有効であることが示された。
    • 予測の物理的妥当性を評価する手法と,モデルへの入力データ変更による多様な微小状態生成が可能であることが確認された。

    Link: https://arxiv.org/abs/2603.06526

  • LiveSense:汎用ノートPCでのレンジドップラーリアルタイムWi-Fiセンシングプラットフォーム [eess.SP, cs.SY, eess.SY, eess.SP, cs.AI]目的:汎用ノートPCを用いたセンチメートル級のレンジドップラーセンサーによるセンシング
    • Wi-Fi環境を活かしたセンシング技術は,新たなインタラクションやモニタリングの可能性を秘めている。
    • 既存のWi-Fiセンシングは,精度やリアルタイム性に課題があり,応用範囲が限定されていた。
    • 本研究は,汎用ノートPCで高精度かつリアルタイムなレンジドップラーセンシングを実現することを目指す。
    • LiveSenseは,市販のWi-Fi NICをセンチメートル級レンジドップラーセンサーに変換し,通信を維持する。
    • 40Hz以上のCSI抽出,デバイス上での時間軸合わせと自己干渉除去,リアルタイムデータストリームを実現。
    • 数メートル以内の人や呼吸,ハンドジェスチャーの距離測定を実証。

    Link: https://arxiv.org/abs/2603.06545

  • 胎児超音波画像分類器のための認知的な説明モジュール:医学的概念に基づく [cs.LG, cs.AI]目的:胎児超音波画像分類における,医学的概念に基づいた説明性の提供
    • 妊婦健診における胎児超音波検査は重要だが,専門知識と熟練が必要とされている。
    • 深層学習モデルは有用だが,判断根拠が不明瞭で,臨床応用が限られている。
    • 医学的背景知識を取り入れ,臨床医にとって理解しやすい説明を提供すること。
    • 提案手法は,臨床医の認知に基づいた説明を提供し,判断根拠を明確化する。
    • キーとなる医学的概念間の関係性をグラフ畳み込みニューラルネットワークを用いて構築した。
    • 実験結果から,提案手法が臨床医に分かりやすい洞察を提供することが示された。

    Link: https://arxiv.org/abs/2201.07798

  • 参照値を用いた平均に基づく不完全ペアワイズ比較法 [cs.AI, cs.DM]目的:不完全ペアワイズ比較行列に対する重みベクトル算出手法
    • 意思決定において,複数の基準間の相対的評価は重要である。多基準意思決定を定量的に支援する。
    • ペアワイズ比較行列が不完全な場合,重みベクトル算出が困難になる場合がある。
    • 参照値を用いることで,不完全なペアワイズ比較行列からの重みベクトル算出を可能にする。
    • 提案手法は,参照対象の数や比較範囲を柔軟に設定できる。
    • 新たに導入した幾何学的HRE法は,不完全データに対して最適解を与えることが証明された。
    • 算術的HRE法の変種に対しても,解の存在に関する十分条件が示された。

    Link: https://arxiv.org/abs/2207.10783

  • 専門家支援による祖先グラフの因果探索 [cs.LG, stat.ML]目的:祖先グラフの因果探索アルゴリズムの開発
    • 科学的応用に不可欠だが,既存手法は信頼性に課題がある。
    • 専門家の知識と矛盾する場合が多く,費用対効果が低い。
    • 不確実な専門家の知識を統合し,探索精度を向上させる。
    • 提案手法AGFNは,潜在的交絡因子を含む祖先グラフの分布推論を可能にする。
    • AGFNは,事前知識と事後知識の両方を統合できる。
    • シミュレーション実験の結果,既存手法と同等以上の性能を示す。

    Link: https://arxiv.org/abs/2309.12032

  • 任意の線形サンプルからの非線形モデルクラスの学習のための統一的枠組み [cs.LG, cs.IT, math.IT]目的:非線形モデルクラスからの学習に関する統一的枠組み
    • データから未知の対象を学習することは,機械学習や統計学における基盤的な課題である。
    • 既存の研究では,特定のモデルクラスや測定方法に依存しており,汎用性に欠ける場合がある。
    • モデルクラスの構造的性質と必要なデータ量を結びつける統一的枠組みを提示し,汎化性能を向上させる。
    • 本研究では,任意のヒルベルト空間における対象,線形測定,非線形モデルを包含する統一的な枠組みを提案した。
    • モデルクラスの変動とエントロピー積分を組み合わせることで,新たな学習保証を確立し,既存の結果を一般化・洗練させた。
    • マトリックススケッチングや圧縮センシングなど,様々な問題に対して,既存の結果を直接的な帰結として導出した。

    Link: https://arxiv.org/abs/2311.14886

  • TT-SNN:スパイクニューラルネットワーク効率的学習のためのテンソルトレイン分解 [cs.NE]目的:スパイクニューラルネットワークの効率的な学習手法
    • ニューラルネットワークの消費電力削減が重要視されており,スパイクニューラルネットワークは有力な選択肢となる。
    • スパイクニューラルネットワークは,時空間的なダイナミクスにより,メモリと計算コストが大きいという課題がある。
    • テンソルトレイン分解によりモデルサイズを削減し,計算効率と省エネルギー化を実現することを目指す。
    • 提案手法TT-SNNは,パラメータ数,FLOPs,学習時間,学習エネルギーを大幅に削減できることを実証した。
    • N-Caltech101データセットにおいて,それぞれ7.98倍,9.25倍,17.7%,28.3%の削減率を達成し,精度劣化は軽微であった。
    • TT-SNNの並列性を最大限に活用するための学習アクセラレータも提案し,その有効性を示唆した。

    Link: https://arxiv.org/abs/2401.08001

  • RAG-Driver:マルチモーダル大規模言語モデルにおける検索拡張型文脈学習による汎用的な運転説明 [cs.RO, cs.AI]目的:運転行動の説明,根拠,制御信号予測の性能向上
    • 自律型ロボットの信頼性は重要であり,説明可能性は透明性と受容性を高める鍵となる。
    • 高コストなアノテーションやデータセット間のドメインギャップにより,汎用的なシステムの開発が困難である。
    • 検索拡張型文脈学習により,未知の環境へのゼロショット汎化能力を実現する。
    • RAG-Driverは,検索された専門家のデモンストレーションを活用することで,最先端の運転説明性能を達成した。
    • 従来のモデルと比較して,追加の学習なしに未知の環境への適応能力が著しく向上した。
    • 大規模言語モデルの訓練コストや破滅的忘却の問題を軽減し,汎用性を高めることに貢献する。

    Link: https://arxiv.org/abs/2402.10828

  • ニューロモーフィック学習メモリにおけるエネルギー消費下限の推定 [cs.LG, cs.AI, cs.AR]目的:ニューロモーフィック学習メモリ最適化におけるエネルギー効率の理論的限界
    • AIの発展に伴い,大規模な計算資源と電力消費が課題となっている。
    • 従来のメモリアクセスのボトルネックに加え,最適化におけるメモリ書き込みも大きな負担となる。
    • メモリ更新と情報統合のダイナミクスを最適化し,エネルギー効率の上限を導く。
    • 本研究では,物理メモリのエネルギー障壁を調整することで実現される理想的なニューロモーフィック最適化器のエネルギー効率を理論的に評価した。
    • 導出されたエネルギー効率の推定は,モデル更新回数,パラメータ数,収束速度,解の精度にのみ依存するモデルに依存しないものである。
    • 大規模なAIワークロードへの適用例を通して,実用的な有用性を示した。

    Link: https://arxiv.org/abs/2402.14878

  • 漫画キャラクター画像における視覚的幻覚をポーズ情報で認識する [cs.CV, cs.AI, cs.LG, cs.MM]目的:漫画キャラクター画像における視覚的幻覚の検出
    • 画像合成や3D再構成など,大規模テキスト画像生成モデルの利用が一般的になっている。
    • 特に漫画やピクセルアートのような非写実的レンダリングでは,深刻な視覚的幻覚が問題となっている。
    • ポーズ情報を用いた文脈学習により,視覚的幻覚検出の精度向上を目指す。
    • 提案手法であるPA-ICVLは,GPT-4vおよびGemini pro visionにおいて,幻覚検出精度をそれぞれ50-78%,57-80%向上させた。
    • 文脈学習にポーズ情報を加えることで,VLMの判断精度が向上し,より正確な幻覚検出が可能になった。
    • この研究は,視覚的幻覚の軽減を通じてテキスト画像生成モデルの実用化を促進し,非写実的レンダリングへの応用範囲を拡大する。

    Link: https://arxiv.org/abs/2403.15048

  • 予測符号化ネットワークと推論学習:チュートリアルとサーベイ [cs.DL, cs.CL, cs.LG, cond-mat.dis-nn, cs.AI, cs.NE, stat.ML]目的:予測符号化ネットワーク(PCN)に関する包括的なレビューと詳細な形式仕様
    • 近年,人工知能研究において神経科学に着想を得たアプローチが注目されており,脳の仕組みを模倣することで高性能なAIの実現が期待されている。
    • 従来のニューラルネットワークは生物学的な妥当性に課題があり,脳の活動パターンを十分に説明できない場合がある。
    • PCNは,より生物学的な学習アルゴリズムを用いて高い効率と表現力を実現し,AIの新たな可能性を拓くことを目指す。
    • 予測符号化ネットワーク(PCN)は,脳の予測符号化の枠組みに基づき,誤差を最小化する階層型ベイズ推論モデルとして捉えることができる。
    • PCNは,バックプロパゲーション(BP)とは異なり,推論学習(IL)を用いることで,BPでは説明できないニューラル活動パターンを説明可能である。
    • PCNは従来のフィードフォワードニューラルネットワーク(FNN)を包含する汎用的なモデルであり,教師あり学習と教師なし学習の両方を可能にする。

    Link: https://arxiv.org/abs/2407.04117

  • エージェンシーの変容:大規模言語モデルの存在様式について [cs.AI, cs.CL, cs.CY, cs.LG]目的:大規模言語モデルの存在論的特徴付け
    • AI技術の発展は,人間の認知や行動に大きな影響を与える可能性を秘めている。
    • 大規模言語モデルは,その高度な能力ゆえに,エージェントとしての地位が議論されている。
    • 本研究は,大規模言語モデルが自律的なエージェントとしての条件を満たすか検証する。
    • 本研究の結果,大規模言語モデルは,身体化された心の理論に基づき,自律的エージェントとしての必要十分条件を満たさない。
    • 具体的には,自己生成性,規範性,相互作用の非対称性の条件において課題が残る。
    • 大規模言語モデルは,自律的なエージェントではなく,「対話者」または「言語自動機械」として捉えるべきである。

    Link: https://arxiv.org/abs/2407.10735

  • PACE:パラメータ効率的なファインチューニングにおける汎化性能と一貫性正則化の融合 [cs.LG, cs.CV]目的:パラメータ効率的なファインチューニングにおける汎化性能の向上
    • 事前学習済みTransformerの活用は重要だが,汎化性能の低下が課題となる。
    • ファインチューニングによるタスク性能向上と汎化性能維持はトレードオフの関係にある。
    • 勾配の正則化と事前学習モデルとの整合性により汎化性能を改善する。
    • 提案手法PACEは,アダプター層にノイズを加え,同一サンプルの異なる摂動に対するモデルの一貫性を維持する。
    • 理論分析により,PACEが勾配を暗黙的に正則化し,汎化性能を向上させることが示された。
    • 実験結果から,PACEがVTAB-1k,FGVCなどの画像適応タスクや,GLUE,GSM-8Kなどのテキストタスクで既存手法を上回ることが確認された。

    Link: https://arxiv.org/abs/2409.17137

  • FALCON:文脈に基づいたオブジェクト中心事前学習によるUAVアクション認識のための未来予測学習 [cs.CV, cs.AI, cs.LG, cs.RO]目的:UAVアクション認識のための自己教師あり型ビデオ事前学習手法
    • UAV(無人航空機)の利用拡大に伴い,映像からの行動認識の重要性が高まっている。
    • UAV映像は背景が大きく,行動に関係ない領域の学習にリソースが費やされやすい。
    • 背景の影響を抑制し,行動に関連する物体や人物への学習を促進することを目指す。
    • FALCONは,NEC-Droneベンチマークでトップ1精度を2.9%,UAV-Humanで5.8%向上させた。
    • 事前学習時にオブジェクト検出のみを使用し,マスキングと再構成のバランスを調整することで,背景の影響を軽減する。
    • 短期的・長期的な未来予測を行うオブジェクト中心の監視領域を設定し,時間的ダイナミクスの学習を促進する。

    Link: https://arxiv.org/abs/2409.18300

  • SpecFuse:次段落予測による大規模言語モデルのアンサンブル [cs.RO, cs.CL, cs.CL, cs.AI]目的:大規模言語モデルのアンサンブル手法
    • 多様な言語モデルの長所を統合し,性能向上を目指す上で重要。
    • 既存手法は,初期トークンの遅延やモデル間の連携の難しさがある。
    • タスクに応じたモデルの性能差を考慮した動的な重み調整で改善する。
    • 提案手法SpecEMは,訓練不要でプラグアンドプレイ可能なアンサンブルフレームワークである。
    • SpecEMは,推測デコーディングに着想を得て,セグメントレベルでの協調を可能にする。
    • オンラインフィードバック機構により,検証段階での性能に応じて重みを調整し,高性能なモデルの影響力を高める。

    Link: https://arxiv.org/abs/2412.07380

  • L0正則化二次表面サポートベクターマシン [cs.LG, stat.ML]目的:二次表面サポートベクターマシンの疎な変種
    • 非線形な決定境界のモデリングにおいて,カーネル関数に依存しないQSVMの重要性が高まっている。
    • モデルパラメータ数がデータ次元の二乗で増加し,過学習や解釈の困難さを招くという課題が存在する。
    • モデルパラメータにカーディナリティ制約を課すことで,汎化性能の向上と疎性の促進を目指す。
    • L0ノルム正則化されたQSVMの解法として,Lu-Zhang最適性条件を満たすペナルティ分解アルゴリズムを提案した。
    • 提案手法は,部分問題に対して閉形式解を持つか,双対形式で効率的に解けるため,高い有効性を示す。
    • 公開ベンチマークデータセットやクレジットデータセットを用いた実験により,提案モデルの競争性と疎な解の生成を確認した。

    Link: https://arxiv.org/abs/2501.11268

  • 大規模言語モデルによる科学の変革:AI支援科学的発見,実験,コンテンツ生成,評価に関する調査 [cs.CL, cs.AI, cs.CV, cs.LG]目的:AI支援科学的発見の技術,評価手法,および新たな動向の概観
    • 科学研究の効率化と新たな知見の創出が期待されるため,AI技術の応用は重要である。
    • 生成モデルの誤用による研究の信頼性低下や倫理的な懸念が存在する。
    • AI技術を科学研究の全段階に統合し,研究の加速と質の向上を目指す。
    • 本調査は,科学研究ライフサイクルにおけるAI支援の現状を,文献調査に基づき整理した。
    • 文献検索,実験計画,コンテンツ生成,図表作成,査読など,科学研究の主要なタスクにおけるAIの役割を網羅的に議論した。
    • データセット,手法,評価戦略,限界,倫理的課題についても考察し,今後のAI4Scienceシステムの開発に貢献する。

    Link: https://arxiv.org/abs/2502.05151

  • コード混合テキスト生成のためのLLMの条件付け [cs.DC, cs.CL, cs.AI]目的:コード混合テキスト生成の枠組みにおけるLLMの利用可能性
    • 自然言語処理において,多様な言語が混在するコード混合の処理は重要な課題である。
    • 大規模で多様なコード混合データセットが不足しており,ロバストな学習と評価が困難である。
    • LLMを用いたコード混合テキスト生成手法を確立し,生成されるテキストの品質向上を目指す。
    • ファインチューニングが,LLMによる一貫性のある流暢なコード混合テキスト生成に不可欠であることが示された。
    • 提案手法により高品質なコード混合テキストが生成され,関連研究の機会が拡大すると期待される。
    • 従来の評価指標は人間の判断と相関せず,LLMに基づく評価が人間の選好により近いことが判明した。

    Link: https://arxiv.org/abs/2502.12924

  • 生成予測制御:動的かつ模倣困難なタスクのためのフローマッチングポリシー [cs.CY, cs.RO, cs.AI, cs.SY, eess.SY]目的:動的かつ模倣困難なタスクに対するフローマッチングポリシーの生成
    • ロボティクス分野では,複雑な制御を実現するために,効率的な学習手法が求められている。
    • 既存手法は,専門家のデモンストレーションに依存し,高速な動的タスクへの適用が困難である。
    • シミュレーションは容易だが,デモンストレーションが難しいタスクに対する制御を目指す。
    • 生成予測制御は,サンプリングに基づく予測制御と生成モデルの密接な関係を利用することで,上記の課題を解決する。
    • 学習済みのフローマッチングポリシーは,推論時にウォームスタートすることで,時間的一貫性を維持し,高頻度なフィードバックを可能にする。
    • 本手法は,既存の行動クローニング手法を補完し,準静的タスクを超えた汎用的なポリシー実現に貢献すると期待される。

    Link: https://arxiv.org/abs/2502.13406

  • FragFM:フラグメントレベル離散フローマッチングによる効率的な分子生成のための階層的フレームワーク [cs.LG, cs.AI, physics.chem-ph]目的:効率的な分子グラフ生成
    • 創薬において,新たな化合物を効率的に探索することは重要である。
    • 既存の分子生成手法は,計算コストが高く,大規模な探索が困難である。
    • フラグメントレベルでの生成により,効率性とスケーラビリティの向上を目指す。
    • FragFMは,フラグメントレベルでの離散フローマッチングにより,効率的な分子生成を可能にする。
    • 従来の原子ベースの手法と比較して,より優れた物性制御と柔軟性を示す。
    • 天然物生成ベンチマークNPGenを用いて,自然物類似分子の生成能力を評価し,高い性能を実証した。

    Link: https://arxiv.org/abs/2502.15805

  • システムレベルDPOによる複合AIシステムの整合化 [cs.LG, cs.AI, cs.MA]目的:複合AIシステムの人間選好との整合
    • 複合AIシステムは単一モデルより性能が高い。実用化には人間との整合が不可欠。
    • システム内の非微分可能な相互作用と,システムレベルの選好をコンポーネントレベルに変換する難しさ。
    • 複合AIシステムをDAGとしてモデル化し,システムレベルの整合化フレームワークSysDPOを提案。
    • 提案手法SysDPOは,直接法とサンプリング法を,データセットの有無に応じて使い分ける。
    • 言語モデルと拡散モデルの整合化,LLM協調システムの整合化という2つの応用例で有効性が確認された。
    • システムレベルの選好最適化を可能にし,複合AIシステムの性能向上に貢献する。

    Link: https://arxiv.org/abs/2502.17721

  • 分割型量子分類器の敵対的頑健性 [cs.ET, cs.AI, cs.CR, cs.LG, quant-ph]目的:分割型量子分類器に対する敵対的摂動の頑健性
    • 量子機械学習は古典モデルと比較して潜在的な利点を示唆しており,その性能評価は重要である。
    • 量子デバイスの量子ビット数の制限により,大規模回路のシミュレーションが困難である。
    • 分割型量子分類器に対する攻撃を分析し,頑健性を向上させる。
    • ワイヤ切断や量子状態テレポーテーションを標的とした敵対的摂動と,量子分類器の中間層への敵対的ゲートの実装との関連性を示した。
    • 理論的および実験的な観点から,中間層への敵対的ゲートの実装に関する問題を調査した。

    Link: https://arxiv.org/abs/2502.20403