arXiv雑要約

AI - 2026/02/05 公開

  • BrainVista:多変量次トークン予測による自然な脳活動ダイナミクスのモデル化 [q-bio.NC, cs.AI]目的:自然な脳活動ダイナミクスのモデル化
    • 脳機能解明には,外部刺激と脳活動の関連性を理解することが不可欠である。
    • マルチモーダル入力と複雑な脳ネットワーク構造の時間スケール不整合が課題である。
    • 高頻度刺激と血流反応の同期化により,因果的推論を可能にするモデルを構築する。
    • BrainVistaは,システム特有のダイナミクスを解きほぐすNetwork-wise Tokenizerと,ネットワーク間情報フローを捉えるSpatial Mixer Headを備えている。
    • Stimulus-to-Brain (S2B) マスク機構により,高頻度感覚刺激と血流反応信号を同期させ,厳密な因果的条件付けを実現した。
    • Algonauts 2025,CineBrain,HADデータセットで最先端のfMRIエンコーディング性能を達成し,長期ロールアウト設定でベースラインを大幅に上回った。

    Link: https://arxiv.org/abs/2602.04512

  • TabPFNにおける不確実性の分解に関する原理的フレームワーク [quant-ph, cs.DC, stat.ML, cs.LG, stat.ME]目的:TabPFNにおける不確実性分解の確立
    • 表形式データの予測精度向上は,様々な応用分野で重要な課題である。
    • TabPFNは高性能だが,不確実性の分解方法が存在しないという課題がある。
    • TabPFNのベイズ的解釈に基づき,不確実性分解の理論的枠組みを構築する。
    • 予測更新のボラティリティに基づいた分散推定量を導出することに成功した。
    • 計算が高速であり,認識的確実性を対象とし,公称頻度主義的カバレッジに近い結果が得られた。
    • 分類問題に対しては,エントロピーに基づく不確実性分解も可能となった。

    Link: https://arxiv.org/abs/2602.04596

  • 標的合成統制法 [stat.ML, cs.LG]目的:因果効果の推定
    • 政策評価や介入効果の検証において,客観的な効果測定は重要である。
    • 従来の合成統制法では,重みの推定に不安定性や解釈性の問題があった。
    • 重みのバイアスを低減し,より安定した推定と解釈を可能にすること。
    • 本研究で提案する標的合成統制法(TSC)は,重み更新を通じてバイアスを低減する。
    • TSCは,最終的な反実仮想推定が観測された統制結果の凸結合となるようにする。
    • シミュレーション実験および実証分析の結果,TSCは既存の合成統制法よりも高い精度を示した。

    Link: https://arxiv.org/abs/2602.04611

  • 不確実性下におけるRF信号分離の学習:検出後分離 vs. 統合結合モデル [eess.SP, cs.LG]目的:不確実性下RF信号分離における検出後分離と統合結合モデルの性能比較
    • 無線周波数帯の混雑が進み,多様な干渉信号が存在する環境下での通信品質確保が重要である。
    • 既存手法は干渉信号の種類を事前に知る必要があり,干渉信号の種類が増えるにつれて対応が困難になる。
    • 本研究は,単一のモデルで干渉検出と分離を同時に行う統合結合モデルを提案し,スケーラビリティの向上を目指す。
    • 検出後分離(DTS)戦略は,ガウス混合モデルにおいて漸近的な最小二乗誤差最適性を達成する理論的根拠を持つことが示された。
    • 提案する統合結合モデル(UJM)は,多様な信号対干渉雑音比,干渉の種類,変調方式において,DTSと同等の性能を示すことが確認された。
    • UJMは,DTSのスケーラビリティの制限を克服し,より実用的なRF信号分離手法となりうる可能性を示唆する。

    Link: https://arxiv.org/abs/2602.04650

  • 遅延時間依存性を持つシステムにおける外れ値の原因説明 [stat.ML, cs.LG]目的:システムにおける外れ値の原因分析
    • 制御された時間依存システムにおける根本原因分析は,エネルギーシステムなど多くの応用分野で重要である。
    • エネルギーシステムは,即時的および遅延的な影響を伴い,蓄電機能を備えることで記憶を持つため,分析が困難である。
    • 本研究は,時間依存システムにおける根本原因を特定するための手法を改良し,複雑な依存関係を扱うことを目指す。
    • 提案手法は,工場エネルギー管理における電力消費ピーク回避という課題を参考に生成されたデータを用いて検証された。
    • 十分な遅延時間を用いることで,特徴量と時間領域の両方で根本原因の特定が可能であることが示された。
    • メカニズム近似が結果に与える影響についても議論された。

    Link: https://arxiv.org/abs/2602.04667

  • 分子に対する学習を,分子に関する弱教師あり学習によって拡張する [stat.CO, cs.CY, physics.chem-ph, cs.LG]目的:分子表現のタスク依存性
    • 創薬や材料科学において,分子構造と物性の関係性を理解することが重要である。
    • 既存の分子エンコーダーはタスクに依存せず,特定のタスクに適した表現を獲得しにくい。
    • 安価な弱教師あり学習を用いて,タスクに応じた分子表現を効率的に獲得すること。
    • ACE-Molは,プログラム的に生成された分子モチーフと自然言語記述子を用いた弱教師あり学習により,タスクに即した分子表現を学習する。
    • 従来のエンコーダーと比較して,ACE-Molはタスクに関連する構造を迅速に捉え,分子物性予測において最先端の性能を達成した。
    • ACE-Molによって得られた分子表現は解釈可能性が高く,化学的に意味のある構造を反映している。

    Link: https://arxiv.org/abs/2602.04696

  • Sub-6 GHzチャネルを用いたmmWaveビーム予測のための知識蒸留 [quant-ph, cs.CC, eess.SP, cs.LG]目的:mmWaveビーム予測の効率化
    • mmWave通信は高速大容量だが,チャネル変化への対応が課題である。
    • 従来の深層学習モデルは計算量が多く,リソース制約がある。
    • 知識蒸留により,小型モデルで高性能を実現する。
    • 提案手法は,大規模モデルの性能を維持しつつ,学習パラメータと計算量を99%削減した。
    • 個別の蒸留戦略と関係性蒸留戦略に基づくコンパクトな学生モデルを開発した。
    • シミュレーションにより,提案モデルが教師モデルと同等のビーム予測精度とスペクトル効率を達成することが示された。

    Link: https://arxiv.org/abs/2602.04703

  • 複数受信機結合アップリンクニューラル復号のためのクロスアテンションTransformer [math.AG, cs.SC, math.DS, cs.SY, eess.SY, eess.SP, cs.IT, cs.LG, math.IT]目的:複数アクセスポイントで受信したアップリンクOFDM信号の結合復号
    • 無線通信において,より多くのデータを効率的に伝送するため,受信側の性能向上が不可欠である。
    • 従来の復号手法では,各受信機チャネルの推定が必要であり,計算量が増加し,誤差の影響を受ける。
    • 受信機間の情報を活用し,チャネル推定なしで効率的な復号を実現することで,システム全体の信頼性を高める。
    • 提案手法は,複数のアクセスポイントからの受信信号を結合し,高い復号性能を発揮する。
    • 特に,チャネル状態が未知の場合や,一部のリンクが劣化している場合でも,従来の方式を上回る結果が得られた。
    • モデルは軽量であり,低遅延で動作するため,次世代Wi-Fi受信機の実用的な構成要素となり得る。

    Link: https://arxiv.org/abs/2602.04728

  • 条件付き反実仮想平均埋め込み:二重に頑健な推定と学習率 [stat.ML, cs.LG]目的:異質治療効果の完全な理解
    • 治療効果の個別化が重要視される中で,潜在的な結果の分布を把握する必要がある。
    • 条件付き反実仮想分布の推定には,高い次元と複雑さが伴う。
    • 反実仮想分布を効率的に推定し,頑健な推定を可能とする手法の開発。
    • 本研究では,反実仮想結果の条件付き分布を再生核ヒルベルト空間に埋め込むCCMEというフレームワークを提案した。
    • CCMEの推定には,リッジ回帰,深層特徴,ニューラルカーネルの3つの実用的な推定器を開発した。
    • 提案手法は,条件付き反実仮想分布の多峰性を含む分布特徴を正確に捉えることが実験的に示された。

    Link: https://arxiv.org/abs/2602.04736

  • ランダム特徴モデルにおける最適な学習率スケジュールとスケーリング則の理論 [cond-mat.dis-nn, cs.LG, stat.ML]目的:ランダム特徴モデルの最適な学習率スケジュールの理論的解明
    • 深層学習の性能向上には学習率の調整が不可欠であり,その重要性は高い。
    • 最適な学習率の決定は経験則に頼る部分が多く,理論的根拠が不足している。
    • 学習率スケジュールの最適化を通じて,深層学習モデルの効率的な学習を実現すること。
    • 最適な学習率スケジュールは,容易な段階では多項式減衰,困難な段階ではウォームアップ・安定・減衰という形を示すことが明らかになった。
    • 学習率とバッチサイズの同時最適化において,退化的な最適条件が確認された。
    • 理論から,モデル構造やタスクに応じて学習率の転移特性が変化することが示唆された。

    Link: https://arxiv.org/abs/2602.04774

  • 構造的エージェント:人工知能分子エディター [physics.soc-ph, cs.SI, quant-ph, cs.SY, eess.SY, physics.chem-ph, cs.AI, cs.MA]目的:自律化学および分子モデリングのための,マルチモーダル自然言語駆動の幾何構造生成・操作エージェント
    • 分子設計は,新薬開発や材料科学において不可欠であり,効率的な手法が求められている。
    • 従来の生成モデルでは,精密な分子構造の編集や,特定の官能基の置換が困難であった。
    • 人間の専門家のように,分子構造を直接操作し,正確な制御を実現することを目指している。
    • 構造的エージェントは,幅広い現実世界のシナリオにおいて,化学的に意味のある幾何学的操作を可能にした。
    • 特に,部位選択的官能基化,配位子結合・交換,立体制御構造構築などのタスクにおいて有効性が示された。
    • このエージェントと量子化学プラットフォームQunturの統合により,三次元構造の生成・編集能力が向上した。

    Link: https://arxiv.org/abs/2602.04849

  • 量子化学のための研究協力エージェントQuntur [physics.chem-ph, cs.AI, cs.MA]目的:量子化学計算における研究協力
    • 化学,材料科学,計算生物学等の分野において,量子化学は基盤技術として不可欠である。
    • 専門知識,ソフトウェアの多様性,結果の解釈の難しさから,量子化学計算の実用的な応用は専門家に限られる。
    • 幅広い知識を持つ化学者へのアクセスを改善し,量子化学計算の応用範囲を広げることを目指す。
    • エージェントQunturは,ハードコードされた手順ではなく,推論に基づく意思決定を行うことで,量子化学計算の研究を支援する。
    • 汎用性と効率性を高めるため,一般的な操作を組み合わせ,抽象的な量子化学的推論とソフトウェアの内部ロジックを統合した。
    • ORCA 6.0の全範囲の計算をサポートし,文献やドキュメントを参照して最適な実験計画,実行,適応,解析を行う。

    Link: https://arxiv.org/abs/2602.04850

  • 多層クロスアテンションは,マルチモーダルインコンテキスト学習において証明的に最適である [stat.ML, cs.AI, cs.LG]目的:マルチモーダルインコンテキスト学習における最適性
    • 近年,アテンション機構を用いたニューラルネットワークの学習メカニズムの理解が進んでいる。
    • 既存研究は単一のデータ形式に限定されており,マルチモーダルデータの理論的基盤は未解明である。
    • マルチモーダルデータに対するインコンテキスト学習の理論的限界と最適アーキテクチャを明らかにすること。
    • 単層の自己アテンションは,タスク分布全体でベイジアン最適予測子を再現できないことが証明された。
    • 提案された線形化クロスアテンション機構は,層数とコンテキスト長が大きい場合,ベイジアン最適であることが証明された。
    • 深層構造がインコンテキスト学習に有利であり,クロスアテンションがマルチモーダル分布に有効であることが示された。

    Link: https://arxiv.org/abs/2602.04872

  • 攻撃的な発言の分類における二次的攻撃とノイズ監査:攻撃的であることについての人間と機械の不一致の統合 [cs.CL, cs.CY, cs.LG]目的:攻撃的な発言の分類における人間と機械の不一致
    • コンテンツモデレーションにおいて,攻撃的な発言の検出は重要な課題である。
    • 攻撃的な発言の判断は主観的であり,人間と機械の間で意見の不一致が生じやすい。
    • 政治的議論における人間と機械の不一致の原因とパターンを明らかにすること。
    • 人間および機械モデレーター間には広範な意見の不一致が存在することが示された。
    • 政治的傾向が,一次的および二次的攻撃の両方に影響を与えることが示唆された。
    • 機械モデレーターの判断は大きく異なり,一貫性がないことが明らかになった。

    Link: https://arxiv.org/abs/2301.12534

  • ZipLoRA:効果的なLoRAの融合によるあらゆる被写体とスタイルの生成 [cs.CV, cs.GR, cs.LG]目的:生成モデルの被写体・スタイル制御のためのLoRA融合手法
    • 生成モデルのパーソナライズは,多様なコンテンツ生成を可能にするため重要である。
    • 既存のLoRA融合技術では,被写体とスタイルの両方の品質を維持することが困難である。
    • ZipLoRAは,被写体とスタイルの忠実性を損なわずに,任意の組み合わせを実現することを目指す。
    • ZipLoRAは,独立に学習されたスタイルと被写体のLoRAを効果的に融合する手法である。
    • 多様な被写体とスタイルの組み合わせで実験を行い,ベースラインと比較して,被写体とスタイルの忠実度が向上することを示した。
    • ZipLoRAは,文脈の再設定能力を維持しながら,魅力的な結果を生成できる。

    Link: https://arxiv.org/abs/2311.13600

  • 多重励起射影シミュレーション:多体物理学に着想を得た帰納的バイアス [cs.LG, cs.AI, cs.DM, quant-ph]目的:説明可能なAIのための,多概念同時処理を可能にする射影シミュレーションの一般化
    • 深層学習の応用拡大に伴い,意思決定の根拠説明が不可欠となっている。
    • 既存の射影シミュレーションは,複数の概念を同時に扱うことが困難である。
    • 多重励起射影シミュレーションは,概念間の複雑な相互作用を効率的にモデル化することを目指す。
    • 多重励起射影シミュレーション(mePS)は,ハイパーグラフ上の複数粒子のランダムウォークとして思考の連鎖を表現する。
    • 多体物理学にヒントを得た帰納的バイアスを導入することで,計算複雑性を指数関数から多項式関数に削減することを示した。
    • 玩具環境とコンピュータ診断のシナリオにおいて,提案手法の計算資源効率と解釈可能性が確認された。

    Link: https://arxiv.org/abs/2402.10192

  • 言語ボトルネックを用いた方策学習 [cs.LG, cs.AI, cs.CL]目的:人間らしい汎化能力,解釈可能性,人間との協調性を持つAIエージェントの実現
    • 高性能なAIは,人間のような汎用性や解釈可能性に課題があり,実用化には限界がある。
    • AIの方策がブラックボックス化しており,人間が理解・修正することが困難である。
    • 言語によるルール生成を通じて,AIの方策の解釈性と汎化能力を高めることを目指す。
    • 言語ボトルネックを用いた方策学習(PLLB)は,AIエージェントが報酬の高い行動の背後にある高レベルな戦略を言語ルールとして生成することを可能にする。
    • PLLBエージェントは,言語ルールに基づいて方策を学習・更新することで,解釈可能かつ汎化性能の高い行動を獲得する。
    • 学習されたルールは人間と共有可能であり,人間とAIのより効果的な協調を促進する。

    Link: https://arxiv.org/abs/2405.04118

  • データ駆動型誤り推定:クラス複雑度を必要としない過剰リスク境界 [cs.LG, stat.ML]目的:複数の推定値に対する同時有効な信頼区間構築
    • 平均推定,一般化保証,適応実験計画など,様々な分野で重要な課題である
    • 既存手法はクラスの複雑度を必要とし,適用範囲が限定されていた
    • クラス複雑度を必要としない,データ駆動型の誤り推定手法を提案する
    • 提案手法は,有限および無限のクラス設定の両方において,ランダム誤差の相関構造に適応する。
    • 既存手法の主要な制限を克服し,同時信頼区間の構築や過剰リスク制御に貢献する。
    • 文脈バンディットアルゴリズムにおける探索の最適化にも応用可能である。

    Link: https://arxiv.org/abs/2405.04636

  • ハイパーネットワークを用いたスケーラブルな物理源から場への推論 [cs.LG, cs.CE, physics.comp-ph]目的:物理源から場への推論の計算効率化
    • 物理シミュレーションの高速化は,科学技術の発展に不可欠である。
    • 従来の計算手法は計算量が膨大であり,大規模シミュレーションのボトルネックとなる。
    • ハイパーネットワークを用いて計算量を削減し,大規模シミュレーションを可能にすること。
    • 提案手法は,従来の計算手法と比較して計算量を大幅に削減できることが示された。
    • 相対誤差は4〜6%程度であり,精度も維持されている。
    • 任意の場所での評価が可能であり,複雑な形状のソースにも適用できる。

    Link: https://arxiv.org/abs/2405.05981

  • オンライン議論における公平性考慮型マルチグループ標的検出 [cs.LG]目的:オンライン議論における標的グループの検出
    • 社会における多様なグループ間の相互理解を深め,より公正なコミュニケーションを促進する上で重要である。
    • 標的グループごとの検出精度にばらつきが生じやすく,公平性の確保が課題となっている。
    • 特定のグループに対する有害な表現の検出精度を高め,公平性を向上させることを目指す。
    • 提案手法は,既存の公平性考慮型ベースラインを上回り,高い予測性能を示すことが確認された。
    • グループ間のバイアスを低減し,標的グループ検出における公平性を向上させる効果が示された。
    • 再現性を確保するため,コードを公開し,今後の研究を促進する。

    Link: https://arxiv.org/abs/2407.11933

  • インタラクティブタスク学習のための自己認識型事前条件誘導:STAND [cs.LG]目的:インタラクティブタスク学習における効率的なルール事前条件誘導
    • 人間との協調学習は,AIの汎用性と適応性を高める上で重要である。
    • 限られた指示量で効果的に学習するため,事前条件の正確な推定が課題である。
    • 学習進捗の自己認識による,より安定した人間支援型学習の実現を目指す。
    • STANDは,少ないデータでの事前条件誘導において,既存手法(XGBoost等)を上回る性能を示す。
    • STANDは,性能向上を正確に推定でき,エラーの再発率が低いという特徴を持つ。
    • これらの特徴により,学習状況の把握と,追加学習が必要な箇所を特定することが可能となる。

    Link: https://arxiv.org/abs/2409.07653

  • 欠損モダリティを持つ深層多Modal学習:サーベイ [cs.CV, cs.AI, cs.LG]目的:欠損モダリティ下における深層多Modal学習手法の現状と課題
    • 現実世界のデータは,センサの制約やプライバシー保護により不完全になりがちである。
    • モダリティ欠損は,多Modalモデルの性能低下を招く大きな要因となっている。
    • 欠損モダリティにロバストなモデルを構築し,性能劣化を抑制すること。
    • 本サーベイは,欠損モダリティ下での多Modal学習(MLMM)の動機と標準的な多Modal学習との違いを明確にした。
    • 現在のMLMM手法,応用事例,データセットについて詳細な分析を行った。
    • MLMMの課題と将来の展望について議論し,今後の研究方向性を示唆した。

    Link: https://arxiv.org/abs/2409.07825

  • 暗黙的ネットワーク族に対する一般化限界 [cs.CL, cs.LG, stat.ML]目的:暗黙的ネットワークの一般化に関する限界
    • 近年,自然言語処理や画像処理など幅広い分野で暗黙的ネットワークが活用されている。
    • 暗黙的ネットワークの経験的な成功は豊富であるものの,理論的な一般化の議論は未だ発展途上である。
    • パラメータ化された収縮写像に基づく暗黙的ネットワーク族に対する一般化限界を導出すること。
    • 提案手法では,Rademacher 複雑性に対する被覆数を用いた議論により,暗黙的ネットワーク族に対する一般化限界を導出した。
    • これにより,暗黙的ネットワークの理論的理解が深まることが期待される。

    Link: https://arxiv.org/abs/2410.07427

  • 低資源言語における文法誤り訂正:ザルマ語の場合 [cs.CL, cs.LG]目的:低資源言語における文法誤り訂正の性能評価
    • 自然言語処理技術の発展は,多言語でのコミュニケーションを円滑にする上で不可欠である。
    • 文法誤り訂正は高資源言語で研究が進む一方,低資源言語では十分なツールが不足している。
    • ザルマ語のような低資源言語における文法誤り訂正の有効な手法を確立すること。
    • 機械翻訳モデルM2M100が自動評価で95.82%の検出率,78.90%の提案精度を達成した。
    • M2M100は,母語話者による手動評価で5点満点中3.0点の平均スコアを獲得し,文法・論理誤りの訂正に優れていた。
    • 本研究は,低資源言語における文法誤り訂正に機械翻訳モデルが有効であることを示唆し,バンバラ語でも同様の結果を検証した。

    Link: https://arxiv.org/abs/2410.15539

  • 制約条件下のバンディット問題におけるラグランジュ関数を用いた探索学習 [cs.LG, cs.AI, stat.ME, stat.ML]目的:制約条件下の多腕バンディット問題における,最適かつ実行可能な方策の迅速な特定
    • ハイパーパラメータ調整やユーザ調査など,現実世界の多くの問題に応用可能。探索の効率化が重要。
    • 線形制約が未知である場合,効率的な探索が困難であり,既存手法では性能が制限される。
    • ラグランジュ緩和を用いることで,制約条件下の探索問題のサンプル複雑度を改善し,効率的なアルゴリズムを開発する。
    • ラグランジュ緩和の下限を基に,Track-and-StopとGamified Explorerの効率的な拡張版であるLATSとLAGEXを提案。
    • LAGEXは漸近的に最適なサンプル複雑度上限を達成し,LATSは制約に依存する定数までの漸近的最適性を示す。
    • 数値実験により,LATSとLAGEXの効率的な性能が様々な報酬分布と制約条件において検証された。

    Link: https://arxiv.org/abs/2410.18844

  • LLM-ABBA:記号近似による時系列データの理解 [cs.LG, cs.AI]目的:時系列データに対する記号近似を用いた理解
    • 時系列データ解析は,金融,医療,環境など,多様な分野で不可欠である。
    • 既存手法では,時系列データに内在する意味情報を十分に活用できていない。
    • LLMと時系列データの埋め込み空間を整合させ,意味情報を抽出すること。
    • LLM-ABBAは,UCRや医療時系列分類タスクにおいて,最先端技術を上回る性能を示した。
    • ABBAにおける固定多角形鎖トリックにより,予測タスクにおけるドリフトを抑制し,累積誤差を軽減した。
    • 時系列外挿回帰タスクでは,TSERベンチマークで新たな最高性能を達成した。

    Link: https://arxiv.org/abs/2411.18506

  • 深層演算ネットワークによる隠れた物理法則とシステムパラメータの学習 [cs.LG]目的:隠れた物理法則の発見とシステムパラメータの同定
    • 計算科学や工学において,少ない観測データからの物理法則抽出は重要である。
    • 既存手法は,再学習の必要性,ノイズへの脆弱性,PDE族間の汎化性の欠如といった課題がある。
    • 深層演算ネットワークを用いて,これらの課題を克服し,効率的な物理法則発見とパラメータ同定を目指す。
    • 提案手法は,反応拡散系,Burgers方程式,2D熱方程式,2D Helmholtz方程式などのベンチマーク問題で高い精度を達成した。
    • 解の相対誤差はO(10^-2)程度,パラメータ推定誤差はO(10^-3)程度であり,限られたノイズの多い観測データ下でも良好な結果を示した。
    • 演算子学習と物理情報に基づくモデリングを組み合わせることで,複雑な動的システムにおけるロバストな逆問題解決の道を開く。

    Link: https://arxiv.org/abs/2412.05133

  • 離散時間ポリシーから連続時間拡散サンプラーへ:漸近的同値性と高速学習 [cs.LG, stat.ML]目的:ニューラル確率微分方程式,または拡散モデルの学習
    • 生成モデルは,複雑な分布からのサンプリングにおいて重要な役割を担う。
    • 効率的な学習には,ターゲットサンプルへのアクセスが不要な手法が求められる。
    • 時間離散化の選択によって学習効率を向上させることを目指す。
    • 時間離散化の微小化に関する漸近的同値性が証明され,GFlowNetsと連続時間オブジェクトが結び付けられた。
    • 適切な時間離散化により,サンプル効率が大幅に向上し,計算コストが削減された。
    • 標準的なサンプリングベンチマークにおいて,競争力のある性能が達成された。

    Link: https://arxiv.org/abs/2501.06148

  • AI駆動型CPS対応脆弱性ユーザー配慮型都市交通デジタルツイン:手法と応用 [eess.SY, cs.AI, cs.CY, cs.NI, cs.SY]目的:都市交通管理のためのデジタルツイン開発
    • 都市交通の効率化や安全性の向上は,現代社会において不可欠な課題である。
    • 既存のデジタルツイン研究は,センシング・知覚技術に偏重し,予測・意思決定機能が十分でない。
    • AIとサイバーフィジカルシステムを活用し,高度な予測・意思決定機能をデジタルツインに実装すること。
    • 本研究は,デジタルツインの「脳」である予測・意思決定機能の重要性を指摘し,その実現に向けた方向性を示す。
    • AIとサイバーフィジカルシステムの連携により,都市交通管理におけるデジタルツインの潜在能力を最大限に引き出すことが可能となる。
    • 本研究は,研究者や実務家がデジタルツイン開発の課題と機会を特定し,学際的な対話を促進するための指針を提供する。

    Link: https://arxiv.org/abs/2501.10396

  • OverThink:推論LLMに対する減速攻撃 [cs.LG, cs.CR]目的:推論言語モデルの計算コスト増加
    • LLMの性能向上に伴い,推論コストが重要視されている。
    • 推論過程で使用されるトークン数が増加し,遅延やコストが増大する。
    • 公開コンテンツに偽の推論問題を埋め込み,LLMに過剰な計算をさせる。
    • OverThink攻撃は,様々な推論モデルで減速効果が確認された。
    • 画像を用いたマルチモーダル環境でも,同様の効果が得られた。
    • LLMベースやシステムレベルでの防御策の検討が重要である。

    Link: https://arxiv.org/abs/2502.02542

  • 疑似物理情報ニューラル演算子:限られたデータからの演算子学習の強化 [cs.LG, physics.comp-ph]目的:限られたデータからの演算子学習の精度向上
    • 複雑な現象のモデリングにおいて,ニューラル演算子は重要な役割を果たす。
    • ニューラル演算子の学習には大量のデータが必要であり,それが課題となる場合が多い。
    • 少ないデータでも高精度な演算子学習を可能にする手法の開発。
    • 提案手法PPI-NOは,単純な物理原理に基づく代替物理システムを構築する。
    • このシステムとニューラル演算子モデルを交互に更新することで,予測精度を向上させる。
    • ベンチマークタスクと疲労モデリングへの適用により,その有効性が確認された。

    Link: https://arxiv.org/abs/2502.02682

  • 活性化に基づく伝播:スパイクニューラルネットワークのためのワンステップ戦略 [cs.CV, cs.LG]目的:スパイクニューラルネットワークにおける隠れ状態更新メカニズム
    • リアルタイム多感覚知覚において,イベント駆動型かつパラメータ効率の良い特性から,その応用が期待されている。
    • ニューロンの隠れ状態をステップごとに反復更新する必要があり,精度と遅延のトレードオフが課題となっている。
    • より少ない時間ステップで高い性能を実現し,汎用性と拡張性を向上させることを目指す。
    • 活性化膜電位伝播(AMP2)は,隣接ニューロン間での膜電位の動的な伝播を可能にし,隠れ状態の効率と精度を向上させる。
    • AMP2は,MLPやCNN,TransformerベースのSNNなど,様々なアーキテクチャで性能を向上させ,汎用的なソリューションとなる可能性を示した。
    • 本手法は,時間ステップの延長に依存しない効率的なスパイクニューラルネットワークの実現に貢献する。

    Link: https://arxiv.org/abs/2502.12791

  • DISCOVER:スマートホームデータからの人間の日常生活パターンの特定 [cs.HC, cs.AI, cs.CV]目的:人間の日常生活パターンの発見と注釈付け
    • 高齢化社会において,継続的な健康モニタリングと支援生活の重要性が増している。
    • 既存の活動認識は,あらかじめ定義された活動ラベルに依存するため,個々のニュアンスを捉えられない。
    • 居住者の独自のルーチンから出現する,きめ細かい反復的なセンサーイベントシーケンスを特定する。
    • DISCOVERは,高い評価者間一致率で一貫性のある行動クラスターを識別することに成功した。
    • DISCOVERは,ラベル全体のわずか0.01%を使用しながら,完全に教師ありベースラインと同等の分類性能を達成した。
    • 本研究は,居住者の特定の環境に行動を基づかせることで,長期的な分析の基盤を確立した。

    Link: https://arxiv.org/abs/2503.01733

  • 説得できるなら試してみろ:大規模言語モデルにおける説得効果と感受性評価のためのフレームワーク [cs.CL, cs.AI, cs.LG, cs.MA]目的:大規模言語モデルにおける説得能力と説得への感受性の評価
    • 大規模言語モデルの発展は社会に貢献する一方,悪用のリスクも伴うため,その影響を評価する必要がある。
    • 大規模言語モデルがどのように人を説得し,また自身が説得されるのかという点は,安全性と倫理的観点から重要な課題である。
    • 大規模言語モデルの説得力と感受性を自動的に評価し,より安全なAIシステムの開発に貢献すること。
    • PMIYCフレームワークは,大規模言語モデルの説得効果と感受性を,人間による注釈作業の代替としてスケーラブルに評価できる。
    • Llama-3.3-70BとGPT-4oは,Claude 3 Haikuと比較して30%高い説得効果を示すことが分かった。
    • GPT-4oは,誤情報に対する説得への抵抗力がLlama-3.3-70Bよりも50%以上高いことが示された。

    Link: https://arxiv.org/abs/2503.01829

  • 経路選択モデルへのグラフニューラルネットワークの組み込み [cs.LG]目的:経路選択モデルの予測性能と解釈性の向上
    • 交通研究の基礎であり,都市計画や交通政策に不可欠な分野である。
    • 従来のモデルは解釈性に優れるが,予測精度に限界がある。
    • グラフニューラルネットワークを用いて,予測精度と解釈性の両立を目指す。
    • 提案モデルは,既存モデルと比較して,東京における旅行軌跡データを用いた検証で,より高い予測精度を示した。
    • グラフニューラルネットワークの活用により,ネットワークの特徴を効果的に捉えることが可能となった。
    • 独立性の無関係性代替仮説の緩和を実現し,より現実的な経路選択モデルの構築に貢献する。

    Link: https://arxiv.org/abs/2503.02315

  • データ駆動型多タスク最適化のためのメタサロゲートとしての大規模言語モデル:原理実証研究 [cs.CY, cs.LG, cs.AI, cs.NE]目的:多タスク最適化における計算負荷軽減のためのメタサロゲートフレームワーク
    • 多タスク最適化は,多様な問題を効率的に解決するために重要であり,その計算コストが課題となる。
    • 従来のサロゲートモデルは,タスク間の知識共有が限定的であり,新たなタスクへの適応が困難である。
    • 大規模言語モデルの知識転移能力を活用し,タスク間の知識共有と汎化性能を向上させることを目指す。
    • 本研究では,タスクメタデータと決定変数を入力として,大規模言語モデルによるフィットネス予測を行うメタサロゲートフレームワークを提案した。
    • 提案手法は,タスク間の知識共有を促進し,未知の次元を持つ問題に対しても優れた汎化能力を示すことが実験的に確認された。
    • 進化型転送最適化(ETO)に統合することで,サロゲートモデルレベルと個体レベルの両方で知識転移を可能にし,最適化効率とロバスト性を向上させた。

    Link: https://arxiv.org/abs/2503.08301

  • 遅延を伴う多エージェント非同期オンライン最適化の再検討:強凸の場合 [cs.LG, math.OC]目的:多エージェント非同期オンライン最適化における後悔の緩和
    • 分散システムにおける意思決定の効率化が求められているため。
    • 実用的な環境では,最大遅延の事前知識やフィードバックの特殊な到着順序が困難。
    • 強凸関数の特性を利用し,既存手法の仮定を緩和し,後悔の上限を改善する。
    • 強凸関数の場合,最大遅延の事前知識やフィードバックの到着順序に関する仮定が不要となることが示された。
    • 提案手法FTDLおよびその近似版は,既存アルゴリズムと比較して,より優れた後悔性能を示す。
    • 後悔の上限が$O(d\log T)$に改善され,理論的・実験的に有効であることが確認された。

    Link: https://arxiv.org/abs/2503.10013

  • DeepSeek-R1による説明可能な感情分析:性能,効率性,および少量学習 [cs.CL, cs.AI]目的:感情分析におけるDeepSeek-R1の性能,効率性,および少量学習能力の評価
    • 感情分析は,顧客の意見把握や市場調査など,様々な分野で不可欠な技術である。
    • 大規模言語モデルは高性能だが,説明可能性が低く,効率性も課題となっていた。
    • 高性能かつ説明可能なオープンソースの感情分析モデルの確立を目指す。
    • DeepSeek-R1は,5クラス感情分析で91.39%のF1スコア,2値タスクで99.31%の精度を,わずか5ショットで達成した。
    • GPT-4oと比較して,少量学習の効率性は8倍向上し,優れた性能を示した。
    • DeepSeek-R1の推論プロセスは透明性が高く,段階的な追跡により,高い説明可能性を実現する。

    Link: https://arxiv.org/abs/2503.11655

  • 教育におけるLLMエージェント:進歩と応用 [cs.CY, cs.AI, cs.CL, cs.HC]目的:教育におけるLLMエージェントの進歩と応用の体系的レビュー
    • 教育現場では,個別最適化された学習支援の必要性が高まっており,その実現にAI技術が期待される。
    • LLMエージェントの幻覚や過度な依存,倫理的な課題などが,教育への実用化を妨げる要因となっている。
    • 教育現場におけるLLMエージェントの課題を明らかにし,効果的かつ安全な導入のための指針を示す。
    • LLMエージェントは,フィードバック生成やカリキュラム設計など,複雑な教育タスクの自動化に貢献し,教育の質向上に寄与する可能性が示された。
    • 本調査では,LLMエージェントを支える技術,データセット,評価指標,アルゴリズムフレームワークを分析し,その現状を整理した。
    • 倫理的課題,幻覚,過度な依存といった問題点に加え,既存の教育システムとの統合の難しさについても議論された。

    Link: https://arxiv.org/abs/2503.11733

  • ニューラルネットワーク検証における証明駆動節学習 [cs.LO, cs.LG]目的:ニューラルネットワークの検証における証明生成と効率化
    • 深層学習の安全性確保は重要であり,検証技術の信頼性が不可欠である。
    • 既存の検証器はスケーラビリティ重視で,証明の信頼性が課題であった。
    • 標準的な証明形式を用いて,信頼性の高い検証器を開発し,効率的な証明生成を目指す。
    • PICIDは,標準的なAlethe形式で証明を生成し,複数のチェックツールで検証可能である。
    • 並列CDCL(T)アーキテクチャと最新のSATソルバーを統合し,証明生成を効率化している。
    • 評価実験により,PICIDが有効な証明を生成し,既存ツールを大幅に上回る性能を示すことが確認された。

    Link: https://arxiv.org/abs/2503.12083

  • 事故Sim:現実世界の事故報告から物理的に現実的な衝突軌跡を持つ車両衝突ビデオの生成 [cs.CV, cs.AI]目的:車両衝突ビデオ生成のための物理的リアリズムの実現
    • 自動運転技術開発において,多様な事故状況の再現は不可欠である。
    • 現実の事故ビデオは入手困難であり,既存の生成手法では物理的なリアリティが不足する。
    • 事故報告書の情報を用いて,物理的に妥当な衝突後の車両軌跡を生成すること。
    • AccidentSimは,事故報告書から物理的情報を抽出し,正確な衝突後の軌跡を再現する。
    • 言語モデルを微調整し,様々な状況下で物理的に整合性の取れた軌跡を予測する能力を獲得した。
    • NeRFを活用し,高画質な背景と物理的に現実的な車両の動きを融合させ,本物らしい衝突ビデオを生成する。

    Link: https://arxiv.org/abs/2503.20654

  • 大規模言語モデル生成テキストの多言語デマ拡散における存在感の測定:憶測を超えて [cs.CL, cs.AI]目的:大規模言語モデル生成テキストの多言語デマ拡散における存在感の測定
    • 言語モデルの進化は情報環境に大きな影響を与え,その影響評価は喫緊の課題である。
    • デマ拡散における言語モデルの利用は懸念されるものの,その実態は明確にされていなかった。
    • 実際のデマデータに基づき,言語モデルの利用状況を定量的に明らかにすることを目的とする。
    • ChatGPTリリース以降,最新のデマデータセットにおける機械生成コンテンツの増加が確認された。
    • 言語,プラットフォーム,時期によって,機械生成コンテンツのパターンが異なることが示された。
    • 本研究は,言語モデルがデマ拡散に及ぼす影響に関する初めての経験的証拠を提供する。

    Link: https://arxiv.org/abs/2503.23242

  • 学生の手書き数学の解答から認知スキルを診断するための大規模言語モデルのベンチマーク [cs.AI, cs.HC]目的:学生の手書き数学の解答からの認知スキル診断における大規模言語モデルの性能評価
    • 教育現場における個別最適化された学習支援の実現には,生徒の認知スキルを正確に把握することが不可欠である。
    • 生徒の解答は省略や曖昧な記述を含むことが多く,大規模言語モデルによる正確な認知スキル診断が困難である。
    • 手書き数学の解答から認知スキルを正確に診断できる大規模言語モデルの開発を目指す。
    • 18種類の大規模言語モデルを評価した結果,いずれのモデルも認知スキル診断において十分な性能を示さなかった (F1値 < 0.5)。
    • 曖昧な根拠に基づく解答に対しては,性能が著しく低下する傾向が確認された。
    • 誤りの分析から,モデルが曖昧な根拠を過大評価したり,些細な手がかりを過剰に解釈したり,存在しない根拠を捏造したりするパターンが明らかになった。

    Link: https://arxiv.org/abs/2504.00843

  • OmniCellTOSG:グラフ言語基盤モデルのための初の細胞テキストオミクスシグナルグラフデータセット [eess.SY, cs.SY, cs.AI, cs.LG]目的:細胞テキストオミクスシグナルグラフデータセット
    • 単一細胞オミクスデータの急増に伴い,生命科学研究と精密医療の進展が期待される。
    • 既存のオミクス基盤モデルは数値的なトランスクリプトームデータに偏り,生物医学的知識の統合が不十分である。
    • テキスト,オミクスデータ,シグナルネットワーク情報を統合し,科学的発見を促進すること。
    • OmniCellTOSGは,約8000万の単一細胞RNA-seqプロファイルから構築された,約50万のメタ細胞TOSGを含む大規模リソースである。
    • CellTOSG-FMは,テキスト,オミクス,シグナルネットワーク情報を統合的に解析するマルチモーダルグラフ言語基盤モデルである。
    • 多様なタスクにおいて,CellTOSG-FMは既存のオミクス基盤モデルを上回り,疾患関連ターゲットやシグナル経路に関する解釈可能な知見を提供する。

    Link: https://arxiv.org/abs/2504.02148

  • Reveal-or-Obscureによる差分プライバシーに基づくサンプリング [cs.IT, cs.CR, cs.DS, cs.LG, math.IT]目的:データセットからの単一の代表的なサンプル生成
    • 個人情報保護が重要視される中,データ分析におけるプライバシー保護技術の確立が求められている。
    • 既存手法では,ノイズ付加によりデータ利用可能性が低下する,または計算コストが高いという課題がある。
    • Reveal-or-Obscureメカニズムの改良により,高いプライバシー保護とデータユーティリティの両立を目指す。
    • 提案手法Reveal-or-Obscureは,既存手法よりもサンプリング複雑性に関する厳密な上限を確立した。
    • データ分布に応じて隠蔽確率を調整するData-Specific ROOは,同じプライバシー予算下で,既存手法よりも高いユーティリティを実現する。
    • Data-Specific ROOのTotal Variation Distanceは,データセットサイズnに対して指数関数的に減衰し,優れた性能を示す。

    Link: https://arxiv.org/abs/2504.14696

  • Event2Vec:ベクトル空間における表現によるニューロモルフィックイベントの直接処理 [cs.CV, cs.NE]目的:ニューロモルフィックイベントの直接処理を可能にする表現手法
    • ニューロモルフィックカメラは,従来のカメラに比べて高解像度,低消費電力,広ダイナミックレンジを持つため重要である。
    • 非同期かつ疎なイベントデータ形式が,従来の深層学習手法への適用を困難にしている。
    • イベントデータの疎性を維持しつつGPU効率を最大化し,リアルタイム処理を実現することを目指す。
    • Event2Vecは,イベントデータを直接処理可能なベクトル表現を提案することで,Transformerアーキテクチャとの互換性を実現した。
    • DVS Gesture,ASL-DVS,DVS-Lipのベンチマークにおいて,パラメータ効率,スループット,低遅延,高精度を実証した。
    • イベントデータの疎性を維持しながらGPU効率を最大化する新しいパラダイムを提示し,リアルタイムなニューロモルフィックビジョンタスクへの応用が期待される。

    Link: https://arxiv.org/abs/2504.15371

  • 嗜好ベクトルによる適応的な有益性・無害性調整 [cs.LG, cs.AI]目的:大規模言語モデルの有益性と無害性のバランス調整
    • 大規模言語モデルの社会実装において,安全性と有用性の両立は不可欠である。
    • 既存手法では,性能の衝突や制御性の低さ,拡張性の問題が存在する。
    • ユーザー制御可能な柔軟な嗜好調整と,新たな嗜好の容易な統合を目指す。
    • 提案手法は,有益性を損なうことなく過度な保守性を抑制する効果が確認された。
    • 嗜好のトレードオフを滑らかに制御することが可能となり,ユーザーの意図に沿った出力を実現する。
    • 複数嗜好の効率的な調整と,モデルの拡張性を両立するスケーラブルな枠組みを提供する。

    Link: https://arxiv.org/abs/2504.20106

  • 拡散モデルの疎な訓練 [cs.LG, cs.CV]目的:拡散モデルにおける疎性訓練の効率化
    • 画像生成をはじめ多様な分野で高性能を示す拡散モデルは,その応用範囲の広さから重要性が増している。
    • 拡散モデルは高品質なサンプル生成能力を持つ一方,訓練・推論に膨大な計算資源を要するという課題がある。
    • 本研究は,訓練と推論の両面で効率的な疎な訓練パラダイムを拡散モデルに導入し,計算コストを削減することを目指す。
    • 疎な拡散モデルは,パラメータ数やFLOPsを大幅に削減しつつ,密なモデルと同等かそれ以上の性能を示すことが確認された。
    • Latent DiffusionとChiroDiffの訓練実験から,疎性訓練における安全かつ効果的な設定値が特定された。
    • 本研究は,拡散モデルの実用化に向けた計算資源の制約を緩和する可能性を示唆する。

    Link: https://arxiv.org/abs/2504.21380

  • マルチ目的Q学習に基づくIoTネットワークにおける動的・分散ルーティング [cs.DC, cs.AI, cs.LG, cs.NI]目的:IoTネットワークにおける動的・分散ルーティング手法
    • IoTは社会インフラや生活を支える重要技術であり,その性能向上は不可欠である。
    • 従来のルーティング手法は,目的が固定されており,動的に変化する状況への対応が困難である。
    • 動的な状況変化に対応し,複数目的を同時に最適化するルーティング手法を開発する。
    • 本研究では,マルチ目的Q学習を用いた分散ルーティングアルゴリズムを提案した。
    • 提案手法は,未学習の優先度に対しても,再学習や中央集権的な制御なしに,ほぼ最適な性能を発揮する。
    • シミュレーション結果から,提案手法はエネルギー消費量を削減し,報酬とパケット配信率を向上させることが示された。

    Link: https://arxiv.org/abs/2505.00918

  • 連続時間確率微分方程式のパラメータ推定における統計的手法と深層学習技術の比較 [cs.LG, math.PR]目的:連続時間確率微分方程式のパラメータ推定精度に関する比較
    • 金融市場や気象変動など,現実世界の確率的現象を記述する上で重要である
    • 伝統的な統計手法では,パラメータ推定精度に限界がある場合がある
    • 深層学習モデルが統計手法を上回るパラメータ推定精度を達成できるか検証する
    • 最尤推定法とRNNを用いて,Ornstein-Uhlenbeck過程のパラメータ推定実験を実施した
    • 実験結果から,RNNは最尤推定法と同程度の精度でパラメータ推定が可能であることが示された
    • RNNは計算コストが高いという課題があることが明らかになった

    Link: https://arxiv.org/abs/2505.03980