arXiv雑要約

AI - 2026/03/26 公開

  • 統計システム力学の予測のためのWasserstein平行輸送 [stat.ML, cs.LG, math.PR, math.ST, stat.TH]目的:統計システムの力学的変化の予測
    • 確率分布の変化を扱うことは,因果推論やドメイン適応など,様々な科学分野で重要である。
    • 分布の空間はベクトル空間構造を持たないため,古典的な手法の適用が困難である。
    • Wasserstein多様体上での平行輸送を用いて,分布レベルでの力学的変化を予測する。
    • 提案手法「Wasserstein平行トレンド」は,古典的な手法におけるベクトル減算を,測地線に沿った平行輸送に置き換える。
    • これにより,因果推論やドメイン適応における分布力学の反事実比較が可能となる。
    • Wasserstein多様体上での効率的な平行輸送近似と,理論的保証を初めて提供する。

    Link: https://arxiv.org/abs/2603.23736

  • 一貫性を超えて:深層非パラメトリックCoxモデルにおける相対リスク関数の推論 [stat.ML, cs.LG, math.ST, stat.TH]目的:深層非パラメトリックCoxモデルにおける相対リスク関数の推論
    • 生存時間分析は,医療,経済学など様々な分野で重要な役割を担う。
    • 深層学習を用いたCoxモデルでは,理論的な解明が不十分な点が多い。
    • 深層Cox推定量の漸近分布理論を確立し,信頼性のある推論を可能にすること。
    • 本研究では,深層Cox推定量の最適化誤差と母集団リスクの関係を明確にした。
    • 構造化されたニューラルパラメータ化により,点ごとのバイアスを制御し,漸近正規性を証明した。
    • アンサンブル推定量のサブサンプリングサイズに関する範囲を導出し,より現実的な分散減衰条件に対応した。

    Link: https://arxiv.org/abs/2603.23835

  • SM-Net:複数の恒星スペクトルライブラリからの連続スペクトル多様体学習 [quant-ph, cs.DM, math.CO, astro-ph.IM, cs.AI]目的:複数の高分解能恒星スペクトルライブラリから連続的なスペクトル多様体の学習
    • 恒星物理学研究において,恒星のスペクトルは基本的な観測データであり,恒星の物理的性質を理解する鍵となる。
    • 既存の恒星スペクトルライブラリはパラメータ空間の範囲が限られており,連続的なパラメータ変化に対応できない場合がある。
    • 異なるライブラリを統合し,より広範囲なパラメータ空間で滑らかなスペクトルを予測するモデルを開発すること。
    • SM-Netは,有効温度,表面重力,金属量という基本的な恒星パラメータから直接スペクトルを生成できる。
    • 学習およびテストデータセットにおいて,それぞれ1.47 x 10^-5 および 2.34 x 10^-5 の平均二乗誤差を達成した。
    • 単一のGPU上で毎秒14,000以上のスペクトルを生成できる高速な推論能力を持つ。

    Link: https://arxiv.org/abs/2603.23899

  • 電荷フロー:電荷条件付き電子密度のフローマッチングによる改良 [cond-mat.mtrl-sci, cs.LG]目的:電荷条件付き原子密度を,対応するDFT電子密度へと変換するモデル
    • 電子構造理論において,正確な電荷密度は不可欠であり,材料設計や物性予測の基礎となる。
    • DFT計算による電荷状態依存性の高い電荷密度の算出は計算コストが高く,大規模スクリーニングの妨げとなる。
    • フローマッチングを用いて電荷密度の精度を向上させ,効率的な材料探索を実現することを目的とする。
    • ChargeFlowは,ペロブスカイト,欠陥,MOF,有機結晶を含むベンチマークデータセット上で高い性能を示した。
    • 特に,非局所的な電荷再分布や電荷状態の補外が重要な問題において,ResNetベースラインと比較して改善が見られた。
    • ChargeFlowで予測された密度は,Bader分割や静電ポテンシャル計算など,下流の解析においても良好な結果をもたらした。

    Link: https://arxiv.org/abs/2603.23943

  • ごくわずかな検出光子数での機械視 [physics.optics, cs.CV, cs.ET, cs.LG, physics.data-an]目的:極めて低照度環境下における機械視システムの最適化
    • 機械視は,様々な消費機器や科学機器に不可欠な技術であり,その重要性はますます高まっている。
    • 従来の機械視は,十分な光量下では高い性能を発揮するが,極めて低照度下では課題が多い。
    • 本研究は,光子数の制約と光検出の確率的性質を考慮した最適化手法により,低照度環境での機械視性能向上を目指す。
    • 提案手法PANSは,FashionMNISTにおいて,1回の推論あたり平均4.9光子(最大17光子)の検出で73%(82%)の認識精度を達成した。
    • MNISTにおいては,平均8.6光子(最大29光子)の検出で86%(97%)の認識精度を示し,従来の技術と比較して桁違いに高い光効率を実現した。
    • シミュレーション結果から,PANSは他の分類,イベント検出,画像再構成タスクへの応用も可能であることが示唆された。

    Link: https://arxiv.org/abs/2603.23974

  • 自己解釈型深層ニューラルネットワークのための最小十分表現 [stat.ME, cs.LG]目的:深層ニューラルネットワークの解釈可能性を向上させるための最小限の表現の特定と学習
    • 深層学習は高い予測性能を持つが,その解釈は困難であり,透明性の向上が求められている。
    • 過剰なパラメータが解釈を妨げ,モデルの構造を理解することを難しくしている。
    • 最小限の十分な構造を復元することで,汎化誤差を改善し,統計的推論を可能にする。
    • 提案手法DeepInは,予測性能を維持しつつ,最小限の表現次元を正確に特定できる。
    • DeepInは,関連変数の選択と最小限の十分なネットワークアーキテクチャの復元を可能にする。
    • 実験結果から,DeepInは予測精度と解釈可能性を向上させ,実世界のデータセットで最大30%の誤差削減を実現した。

    Link: https://arxiv.org/abs/2603.24041

  • マルチモーダル衛星画像時系列を用いたリアルタイムな土地モニタリングのためのデュアルフォームネットワークの比較分析 [eess.IV, cs.AI, cs.CV]目的:マルチモーダル衛星画像時系列分析における効率的なデュアルフォームアテンションメカニズムの比較
    • 土地利用変化の監視は,環境保全や防災など,社会における重要な課題である。
    • Transformerは高性能だが,計算コストが高く,広範囲の土地を継続的に監視するには限界がある。
    • デュアルフォームメカニズムにより,効率的な並列学習と逐次推論を可能にし,リアルタイム監視を実現する。
    • デュアルフォームメカニズムは,標準的なTransformerと同等の性能を達成しつつ,効率的な逐次推論を実現した。
    • マルチモーダルフレームワークは,単一モ−ダルアプローチよりも一貫して優れた性能を示し,センサーフュージョンの有効性を実証した。
    • 本研究は,広範囲な地理的領域における定期的な更新を必要とする運用上の土地モニタリングシステムの新たな可能性を開く。

    Link: https://arxiv.org/abs/2603.24109

  • CECシングルオブジェクト最適化コンペティション(2010-2024)の長期分析と変分量子最適化への示唆 [quant-ph, cs.NE]目的:CECシングルオブジェクト最適化コンペティションの結果の歴史的分析
    • 最適化は科学技術の根幹であり,様々な問題解決に不可欠である。
    • 従来の最適化手法は,複雑な問題に対して性能限界を示すことがある。
    • 現代の最適化手法が量子最適化問題にも適用可能か検証する。
    • 2014年の密回転行列の導入が,アルゴリズムの性能を大きく左右したことが明らかになった。
    • L-SHADEなどの差分進化変種が,回転不変性を維持することで優位性を示した。
    • 現代のベンチマーク問題と変分量子アルゴリズムの構造的類似性が示され,CECソルバーの適応能力が量子制御に役立つ可能性が示唆された。

    Link: https://arxiv.org/abs/2603.24140

  • 量子ニューラル物理学:量子畳み込みニューラルネットワークを用いた量子シミュレータによる偏微分方程式の解法 [quant-ph, cs.LG, physics.comp-ph]目的:偏微分方程式の解法
    • 科学技術計算において,偏微分方程式の数値解法は重要であり,様々な分野で利用されている。
    • 古典的なグリッドベースの手法では,自由度が数十億にも及ぶ問題に対して計算ボトルネックが生じる。
    • 量子ニューラル物理学フレームワークにより,量子回路を用いた偏微分方程式の効率的な解法を目指す。
    • 本研究では,解析的に決定された微分演算子のステンシルを,パラメータ不要の量子畳み込みカーネルにマッピングするハイブリッド量子古典CNNマルチグリッドソルバー(HQC-CNNMG)を提案した。
    • HQC-CNNMGは,振幅符号化,ユニタリー演算の線形結合,量子フーリエ変換を活用し,回路深さがO(log K)でスケーリングする量子回路で実装される。
    • 量子シミュレータによる検証の結果,ポアソン方程式,拡散方程式,対流拡散方程式,非圧縮性ナビエ-ストークス方程式に対する解が,従来の解法と高い一致性を示した。

    Link: https://arxiv.org/abs/2603.24196

  • 因果誘導表現学習によるグラフ外分布汎化 [quant-ph, cs.ET, quant-ph, cs.CL, stat.ML, cs.LG]目的:グラフ外分布における汎化性能向上
    • グラフ構造データ分析の重要性が増す中,汎化性能が課題となっている。
    • GNNはデータの分布が変わると性能が低下し,頑健性に欠けるという問題がある。
    • 因果関係に着目し,GNNの汎化性能を理論的に保証し,改善を目指す。
    • 因果グラフの導入とバックドア調整により,非因果経路を遮断する手法を提案した。
    • ノードレベルの因果不変性を捉え,グラフの事後分布を再構成する表現学習を行った。
    • 実験により,提案手法が外分布の汎化性能を向上させ,不安定な相互情報学習を軽減することを示した。

    Link: https://arxiv.org/abs/2603.24304

  • 隕石スペクトルと月面組成の関連性:ハイパースペクトルイメージングと機械学習の活用 [astro-ph.EP, astro-ph.IM, cs.LG]目的:月面組成の鉱物学的マッピング
    • 月探査は,太陽系の起源と進化を理解する上で重要である。
    • 月面組成の正確な特定には,高分解能なデータと高度な解析技術が求められる。
    • 隕石と月面のスペクトルデータを統合し,より正確な鉱物マッピングを可能にすること。
    • 実験室での隕石ハイパースペクトルイメージングと地上からの月面観測データを組み合わせることで,高精度な鉱物マップを作成した。
    • サポートベクターマシン (SVM) を用いた分類により,オリーブ石と輝石の識別精度がそれぞれ92%と88%を達成した。
    • 地上からの望遠鏡を用いたハイパースペクトルイメージングにより,0.8角秒という高解像度な月面スペクトル観測が可能となった。

    Link: https://arxiv.org/abs/2603.24323

  • 確率的サービスネットワーク設計における適応的意思決定 [eess.SP, cs.AR, math.OC, cs.LG]目的:確率的なサービスネットワーク設計のための適応的意思決定手法
    • サプライチェーンの効率化は,企業の競争力強化に不可欠であるため,輸送ネットワーク設計の重要性は高い。
    • 輸送時間の不確実性や車両の制約は,最適なネットワーク設計を困難にする要因となっている。
    • 不確実性を考慮した効率的なネットワーク設計手法を開発し,輸送計画の課題解決を目指す。
    • 提案手法は,ベンチマーク問題において既存手法を上回る解品質と計算時間短縮を実現した。
    • 機械学習を活用した適応的サロゲートモデルにより,計算コストを大幅に削減しつつ,高精度な解を得ることができた。
    • 多様なモデリングと最適化技術の統合が,複雑な輸送計画問題への有効性を示す結果が得られた。

    Link: https://arxiv.org/abs/2603.24369

  • 差分プライバシー下における連合学習での公平性認識分類 [physics.soc-ph, cs.SY, eess.SY, stat.ML, cs.LG, stat.ME]目的:差分プライバシーと公平性を考慮した連合学習による分類手法の開発
    • 機械学習におけるプライバシー保護と公平性の確保は重要な課題であり,社会実装を阻害する要因となっている。
    • プライバシー保護と公平性の両立は未だ研究が十分ではなく,トレードオフの関係が明確になっていない。
    • 分散環境下でプライバシーと公平性を同時に実現するアルゴリズムを提案し,その性能を理論的・実験的に評価する。
    • 提案手法FDP-FairおよびCDP-Fairは,プライバシー,公平性,および過剰リスクの制御に関して理論的な保証を持つ。
    • 過剰リスクの要因を分類コスト,プライバシーコスト,公平性コスト,およびプライバシーを考慮した公平性コストに分解することで,詳細な分析を可能にした。
    • 合成データおよび実データを用いた実験により,提案手法の実用性が確認された。

    Link: https://arxiv.org/abs/2603.24392

  • 文脈回帰のためのニューラルネットワークモデル [stat.ML, cs.LG]目的:文脈回帰モデル
    • 機械学習の応用範囲拡大のため,複雑なデータ構造への対応が求められている。
    • 従来のニューラルネットワークは,パラメータ数が多く,解釈性が低いという課題がある。
    • 文脈構造を組み込むことで,モデル効率を向上させ,解釈性を維持することを目指す。
    • 提案モデル(SCtxtNN)は,文脈の識別と文脈特有の回帰を分離し,解釈可能な構造を実現した。
    • 理論的結果と数値実験により,提案モデルが従来のニューラルネットワークより低い誤差と安定した性能を示すことが確認された。
    • パラメータ数を増やしても,提案モデルほど効率的に精度向上できないことが示唆された。

    Link: https://arxiv.org/abs/2603.24400

  • 確率分布の継続時間学習:1型糖尿病の小児におけるデジタル試験における事例研究 [stat.ML, cs.LG]目的:確率分布の時間的進化のモデリング
    • デジタルヘルス分野において,バイオマーカー分布の時間変化の理解は重要である
    • 従来の要約指標では捉えきれない,病状進行や治療反応のパターンが存在する
    • 微細な時間的分布変化を捉え,治療効果の評価を向上させることを目指す
    • 提案手法は,時間変化する混合ガウス分布をニューラル常微分方程式で記述する
    • 最大平均不一致に基づく分布一致基準を用いてモデルパラメータを推定する
    • 臨床試験データへの適用により,従来の分析手法では捉えにくいグルコース変動の改善が検出された

    Link: https://arxiv.org/abs/2603.24427

  • 制約領域制約付きベイズ最適化:ペナルティ付き制約処理 [stat.ML, cs.LG]目的:高次元ブラックボックス設定における制約付き最適化手法
    • 複雑な問題に対して,効率的な最適化手法の確立が求められている。
    • 高次元空間や評価コストが高い場合,従来の最適化手法では困難が生じる。
    • 制約条件を満たしつつ,少ない評価回数で高性能な解を探索すること。
    • 提案手法は,ペナルティ関数,代理モデル,信頼領域戦略を組み合わせることで,高次元制約付き最適化問題を効率的に解決する。
    • 実験結果から,本手法は,既存手法と比較して,少ない評価回数で高品質な実行可能解を特定し,安定した性能を示すことが明らかになった。
    • 信頼領域を用いることで,探索範囲を局所的に制限し,高次元空間における安定性と効率性を向上させている。

    Link: https://arxiv.org/abs/2603.24567

  • パラメータ化されたゲームにおける人間の戦略的意思決定 [cs.GT, cs.AI, cs.LG, econ.TH]目的:人間の戦略的意思決定プロセス
    • 現実世界のゲームはパラメータに依存するため,その影響を理解することが重要である。
    • パラメータ値が事前に不明な状況下での人間の意思決定は,困難を伴う。
    • リアルタイムソルバーに頼らず,迅速な意思決定を可能にする枠組みを提示すること。
    • 本研究では,リアルタイムソルバーなしで迅速な意思決定を可能にする新しい枠組みを提案した。
    • この枠組みは,複数プレイヤーや不完全情報といった様々な状況に適用可能であることが示された。
    • 人間の意思決定を支援する新しいアプローチとして,パラメータ化されたゲームへの応用が期待される。

    Link: https://arxiv.org/abs/2104.14744

  • 信頼性のあるコンテンツ推薦のための全空間反事実的学習 [cs.LG, cs.AI, stat.ML]目的:コンテンツ推薦システムの信頼性向上
    • 推薦システムは,ユーザーに有用な情報を提示する上で不可欠である。その精度が利用者の満足度に直結する。
    • 推薦システムの性能は,データ不足や選択バイアスにより制約を受ける。特に,クリック後のコンバージョン率予測が課題となる。
    • 反事実的リスク最小化により,クリックとコンバージョン間の因果関係を考慮し,予測バイアスを軽減することを目的とする。
    • 提案手法ESCM$^2$は,既存手法が抱える推定バイアス(IEB)と誤った独立性事前分布(FIP)を効果的に軽減する。
    • 大規模な産業用推薦データセットとオンラインサービスでの実験により,ESCM$^2$が推薦性能を大幅に向上させることが示された。
    • ESCM$^2$は,全空間マルチタスクモデル(ESMM)フレームワークに反事実的リスク最小化を組み込むことで,CVR推定の精度を高める。

    Link: https://arxiv.org/abs/2210.11039

  • ムーンウォーク:逆向き・順向き微分 [cs.LG, cs.AI]目的:活性化関数の保存を回避する深層学習手法の開発
    • 深層学習の発展は,より複雑な問題を解決するために不可欠であり,モデルの深さ拡大が求められている。
    • バックプロパゲーションは中間活性化関数を保存する必要があり,深層ネットワークの学習に制約が生じている。
    • 活性化関数の保存を不要とし,より深いネットワークを効率的に学習できるようにすること。
    • 本研究では,層のヤコビ行列の余核が自明な「浸水型ネットワーク」を定義し,活性化関数を保存せずに勾配を再構成できることを示した。
    • 浸水型でない層に対しては,「断片的な勾配チェックポイント」を導入し,必要な部分的な活性化関数のみを記録することでメモリ効率を高めている。
    • ムーンウォークの実装により,メモリ消費量を抑えつつ,バックプロパゲーションと同等の速度で,より深いネットワークの学習が可能になった。

    Link: https://arxiv.org/abs/2402.14212

  • 視覚言語モデルによる人間の意思決定支援学習 [cs.AI]目的:人間の意思決定を支援するための視覚言語モデルの学習
    • 医療診断など,高度な意思決定が求められる分野で,AIによる支援の重要性が高まっている。
    • 既存手法では,AIへの過信や,AIが支援しない困難なケースでの専門家の孤立といった問題が生じやすい。
    • AIが人間の意思決定を制御するのではなく,意思決定に役立つガイダンスを提供する枠組みを構築すること。
    • 本研究では,AIが人間の専門家を導く「学習によるガイダンス(LTG)」という新しい枠組みを提案した。
    • 視覚言語モデルを,少量の人間からのフィードバックを活用して,解釈可能でタスク固有のテキストガイダンスを生成する「SLOG」という手法を開発した。
    • 合成データセットと実際の医療診断タスクにおいて,SLOGの有効性を実証した。

    Link: https://arxiv.org/abs/2403.16501

  • 高速推薦のための動的プルーニングによる行列分解の高速化 [cs.IR, cs.LG]目的:行列分解による推薦システムの高速化
    • 推薦システムは,現代の情報社会において重要な役割を担う技術である。
    • ユーザー数やアイテム数の増加に伴い,行列分解の計算コストが増大している。
    • 計算資源の追加コストなしに,行列分解の学習速度を向上させることを目指す。
    • 提案手法は,従来の行列分解学習プロセスと比較して,1.2~1.65倍の高速化を達成した。
    • 高速化に伴い,最大で20.08%の誤差増加が発生する可能性がある。
    • 提案手法は,オプティマイザや初期化方法など,様々なハイパーパラメータ設定で適用可能であることが示された。

    Link: https://arxiv.org/abs/2404.04265

  • 困難な条件下におけるSLAM用データセット:赤外線,深度カメラ,LiDAR,4Dレーダーなど [eess.SY, cs.SY, cs.RO, cs.AI]目的:困難な環境下でのSLAM性能評価のための多感覚データセット
    • ロボットナビゲーションや自動運転において,環境変化への対応は不可欠である。
    • 悪天候,低照度,悪路といった条件下でのSLAMデータセットが不足している。
    • 多様なセンサーデータを活用し,過酷な環境下でのSLAM研究を促進すること。
    • 本データセットは,雪,雨,夜間,悪路など,様々な困難なシナリオを網羅している。
    • 4Dレーダー,赤外線カメラ,深度カメラなど,既存研究では利用頻度の低いセンサーも収録している。
    • RGB画像,赤外線画像,深度画像,LiDAR,4Dレーダーを用いたSLAMアルゴリズムの評価を実施した。

    Link: https://arxiv.org/abs/2404.09622

  • レジリエント分散コンピューティングのための符号化コンピューティング:学習理論的フレームワーク [cs.LG, cs.DC, cs.IT, math.IT]目的:レジリエント分散コンピューティングのための符号化コンピューティングの新たな基盤
    • 大規模分散コンピューティングは,現代のデータ処理において不可欠であり,その効率性と信頼性が求められている。
    • 従来の分散コンピューティングは,障害や遅延のあるサーバーの存在に脆弱であり,計算効率を低下させる可能性がある。
    • 機械学習ワークロードにおける効率と信頼性を向上させるための,符号化コンピューティングの理論的枠組みを構築すること。
    • 提案手法は,損失関数を汎化誤差と学習誤差の和で上界化することにより,最適なエンコーダーとデコーダーの探索を可能にする。
    • ノイズなしおよびノイズありの計算環境において,推定誤差がそれぞれ$\mathcal{O}(S^3 N^{-3})$および$\mathcal{O}(S^{\frac{8}{5}}N^{\frac{-3}{5}})$の割合で減衰することを示した。
    • 様々な機械学習モデルの推論タスクにおける評価により,提案フレームワークが最新技術を精度と収束速度の両面で上回ることが示された。

    Link: https://arxiv.org/abs/2406.00300

  • 多方向多スライスPHATE:学習中のRNNの隠れたダイナミクスを可視化 [cs.LG]目的:RNNの学習中の隠れ状態の進化の可視化
    • RNNは時系列データ解析で広く用いられるが,その内部構造はブラックボックスとなりがちである。
    • 従来の視覚化手法では,学習過程における表現の変化が捉えられていない。
    • RNNの学習過程における隠れ状態の構造変化を明らかにし,より良いモデル設計に貢献する。
    • MM-PHATEは,時間,学習エポック,ユニットといった多次元にわたるRNNの隠れ状態の進化を可視化する。
    • 制御された合成ベンチマークや実用的なRNNにおいて,隠れ状態のコミュニティ構造を維持し,表現の幾何学的な変化を明らかにした。
    • 学習中の情報処理と圧縮の段階を特定し,線形プローブやラベル-状態間の相互情報量と整合性のある結果を示した。

    Link: https://arxiv.org/abs/2406.01969

  • 近接度が重要:治療効果推定のための局所近接性に基づくバランス調整 [cs.LG, cs.AI, stat.ML]目的:治療効果推定における表現バランスの強化
    • 観察データからの治療効果推定は,因果推論の重要な課題であり,医療や政策決定に不可欠である。
    • 既存手法は,潜在空間での分布のずれを最小化するが,局所的な近接性という重要な要素が無視されている。
    • 局所近接性を考慮したバランス調整により,治療効果推定の精度向上を目指す。
    • 提案手法CFR-Proは,最適な輸送に基づいたペアワイズ近接性正則化を導入し,局所近接性を活用する。
    • 次元の呪いとデータ不足の問題に対処するため,情報的な部分空間射影器を開発した。
    • 実験結果から,CFR-Proは治療群間のマッチング精度が高く,既存手法を大きく上回ることが示された。

    Link: https://arxiv.org/abs/2407.01111

  • Set2Seq Transformer:時系列および位置情報を考慮した集合表現によるSequential Multiple-Instance Learning [cs.CV, cs.LG]目的:時系列データの集合構造と時間的関係性をモデル化するための手法
    • 現実世界の多くの応用において,集合の内部構造と時間的関係性のモデリングが重要である。
    • 既存手法では,時間的変化を無視した静的な集合表現に注力するか,集合を明示的に表現できない。
    • 時系列における集合の位置情報と絶対的な時間値を符号化し,時間的推移と文脈を捉える。
    • 提案手法Set2Seq Transformerは,多様なドメインとタスクにおいて,既存手法よりも優れた性能を示した。
    • 本手法は,集合,時間,位置情報を考慮した表現を効果的に学習することで,予測精度を向上させる。
    • 芸術作品分析および短期的森林火災危険予報という,異なるドメインで有効性が確認された。

    Link: https://arxiv.org/abs/2408.03404

  • マルチスケール問題に対する効率的なウェーブレットベースの物理情報ニューラルネットワーク [cs.LG]目的:マルチスケール問題に対する物理情報ニューラルネットワークの効率化
    • 複雑な物理現象のモデル化は,科学技術の発展に不可欠である。データが限られる場合でも重要。
    • 従来の物理情報ニューラルネットワークは,急速な振動や特異な挙動を持つ微分方程式の求解が困難である。
    • ウェーブレット変換を用いて,効率的かつ正確な解を求めることを目指す。
    • 提案手法は,ウェーブレット空間で解を学習することで,自由度を削減しつつ,複雑な物理現象を捉える。
    • 自動微分を用いないため,学習時間を大幅に短縮しつつ,高い精度を維持する。
    • 様々な問題(FHNモデル,ヘルムホルツ方程式等)において,提案手法の有効性と精度が実証された。

    Link: https://arxiv.org/abs/2409.11847

  • 動的ニューラルポテンシャル場:移動障害物下におけるオンライン軌道最適化 [cs.RO, cs.AI]目的:移動障害物存在下でのオンライン軌道最適化手法
    • 家庭やオフィスなど,人間が不規則に動く環境下でのロボットの安全かつ信頼性のある動作が求められている。
    • 従来のロボットの経路計画は,動的な環境変化への対応が難しく,安全性を担保することが課題であった。
    • 本研究は,動的な環境変化に対応し,より安全で効率的なロボットの軌道計画を可能にすることを目的とする。
    • 提案手法NPField-GPTは,BenchMR等の動的な屋内環境において,従来のStaticMLP/DynamicMLPよりも効率的かつ安全な軌道を生成した。
    • NPField-GPTは,TransformerとMPCの組み合わせにより,モデルベース計画の透明性と安定性を維持しつつ,データから学習可能な空間的・時間的な衝突リスクを改善した。
    • StaticMLP/DynamicMLPと比較して遅延は小さいものの,NPField-GPTはより安全で効率的な軌道最適化を可能にする。

    Link: https://arxiv.org/abs/2410.06819

  • 汎用参照セグメンテーションのためのフレーズ・インスタンスアラインメント [cs.CV, cs.CL, cs.LG]目的:汎用参照セグメンテーションにおけるフレーズとインスタンスの対応付け
    • 画像内の対象を言語で指示する技術は,ヒューマン・コンピュータ間のインタラクションにおいて重要である。
    • 既存手法では,指示表現に含まれる複数のフレーズと,画像内の個々のインスタンスとの対応関係が不明確である。
    • 言語フレーズと視覚インスタンス間の詳細な対応付けを確立し,より正確なセグメンテーションを実現することを目指す。
    • 本研究では,汎用参照セグメンテーションをインスタンスレベルの推論問題として再構築した。
    • 参照表現に応じて複数のインスタンス対応クエリを予測し,各クエリと最も関連性の高いフレーズをアラインメントする。
    • gRefCOCOとRef-ZOMのベンチマークにおいて,最先端の性能を大幅に向上させた(cIoUで3.22%,N-accで12.25%)。

    Link: https://arxiv.org/abs/2411.15087

  • 確率的straggler環境における汎用符号化計算 [eess.SY, cs.SY, cs.DC, cs.LG]目的:確率的straggler環境下における汎用符号化計算方式の近似誤差
    • 分散コンピューティングにおいて,計算時間の遅延を引き起こすstraggler問題の解決は重要である。
    • 従来の符号化計算方式は厳密計算を前提としており,汎用的な関数への適用が難しいという課題があった。
    • 本研究は,近似計算を許容する汎用符号化計算におけるstraggler環境下での誤差収束性を解析する。
    • BACC方式の平均近似誤差は,少なくとも$\mathcal{O}(\log^3_{\frac{1}{p}}(N)\cdot{N^{-3}})$の速度でゼロに収束することが示された。
    • LeTCC方式の平均近似誤差は,$\mathcal{O}(\log^4_{\frac{1}{p}}(N)\cdot{N^{-2}})$の速度でゼロに収束することが示された。
    • サーバーのstraggler化が独立である場合,straggler数が増加しても近似誤差がゼロに収束することが確認された。

    Link: https://arxiv.org/abs/2502.00645

  • 対称性に基づくメモリ拡張による効率的なロコモーション学習 [cs.LG, cs.AI, cs.RO]目的:効率的なロコモーション学習の実現
    • ロボットのロコモーションは,自動化や複雑な環境での活動に不可欠である。
    • 強化学習によるロコモーション学習は,膨大な試行錯誤を必要とする。
    • 対称性を活用し,データ効率を向上させることで学習コストを削減する。
    • 提案手法は,ロボットとタスクの対称性を活用し,追加の訓練データを生成する。
    • メモリ状態への変換を適用することで,タスクに関する文脈を保持し,適応的な行動を可能にする。
    • シミュレーションおよび実機環境において,様々なロコモーションタスクで効率的な学習と堅牢な性能を示す。

    Link: https://arxiv.org/abs/2502.01521

  • 結合トークン生成による大規模言語モデルの評価 [cs.CL, cs.AI, cs.LG]目的:大規模言語モデルの評価方法
    • 大規模言語モデルは自然言語処理の重要な技術であり,その性能評価は発展の鍵となる。
    • 従来の評価方法では,モデルの確率的な応答生成が考慮されておらず,評価の信頼性が損なわれる可能性があった。
    • 生成過程における確率的要素を制御することで,より公平かつ正確なモデル評価を目指す。
    • 結合自己回帰生成を用いることで,従来の自己回帰生成と同等の結論をより少ないサンプル数で導き出せることを示した。
    • モデル数が多い比較評価において,結合および従来の自己回帰生成では異なるランキングが生じることが判明した。
    • 既存の評価プロトコルにおけるモデル間の優位性は,生成過程の確率性に起因する見かけ上のものと考えられる。

    Link: https://arxiv.org/abs/2502.01754

  • エネルギー効率化されたUAV支援LoRaゲートウェイ:マルチエージェント最適化アプローチ [cs.NI, cs.LG]目的:システムエネルギー効率の最大化
    • 次世代IoTネットワークの成長に伴い,デバイス数と消費電力が増加しており,資源管理が重要である。
    • 電力制約のあるIoTデバイスにおけるエネルギー効率が課題となっている。
    • UAV支援LoRaネットワークにおいて,最適な資源配分によるエネルギー効率向上を目指す。
    • 提案手法は,従来のMARLアルゴリズムと比較して,有意に優れた性能を示すことがシミュレーションによって確認された。
    • 動的なチャネル状態やデバイスの移動性を考慮したPOSGモデルを構築した。
    • チャネルを考慮したマッチングアルゴリズムと,CTDEに基づくMAPPOフレームワークを組み合わせた二段階のソリューションを提案した。

    Link: https://arxiv.org/abs/2502.03377

  • 暗号鍵変数漏洩の局所化学習 [cs.LG, cs.CR]目的:暗号鍵などの機密変数漏洩の相対的な度合いの特定
    • 暗号アルゴリズムの実装における物理的な脆弱性対策は,情報セキュリティにおいて不可欠である。
    • 電力消費や電磁波放射を利用したサイドチャネル攻撃による情報漏洩が問題となっている。
    • 漏洩箇所を特定し,ハードウェア設計者が対策を講じるための指針を示すことを目指す。
    • 敵対的学習に基づき,測定点の時間的な重要度を定量的に評価するフレームワークを開発した。
    • AES,ECC,RSAの実装データセットを用いて,提案手法の有効性と既存手法の限界克服を実験的に示した。
    • この手法は,暗号ハードウェア設計者が漏洩の原因を理解し,対策を講じる上で役立つ情報を提供する。

    Link: https://arxiv.org/abs/2503.07464

  • ユニコーン:汎用的かつ協調的な強化学習アプローチによる汎化可能なネットワーク全体交通信号制御 [cs.LG, cs.AI, cs.RO]目的:交通信号制御の汎化性能向上
    • 都市の急速な成長に伴い,交通渋滞の緩和と効率的な交通流の確保が重要である。
    • 実際の交通ネットワークは多様であり,従来の強化学習では対応が困難である。
    • 異なる交通シナリオに対応可能な,汎用的な交通信号制御フレームワークを開発する。
    • 提案手法「ユニコーン」は,異なる交差点の構造や交通状況を共通の形式に変換する。
    • ユニバーサル交通表現(UTR)モジュールと交差点固有表現(ISR)モジュールを導入し,多様な交通状況への適応性を高めている。
    • 隣接するエージェント間の依存関係を考慮したポリシー最適化により,地域的な協調を促進し,効率的な制御を実現している。

    Link: https://arxiv.org/abs/2503.11488

  • KINESIS:人間の運動を模倣する筋骨格運動制御 [cs.RO, cs.AI, cs.CV, cs.LG, q-bio.NC]目的:人間の運動模倣のためのフレームワーク
    • 人間の運動のメカニズム解明は,ロボット工学やリハビリテーション分野において重要である。
    • 従来のロボット制御は,人間の複雑な筋骨格系の制約や筋肉の非線形性を十分に再現できていない。
    • 本研究は,より生理学的に妥当な人間の運動制御モデルを構築し,多様なタスクへの応用を目指す。
    • KINESISは,1.8時間の歩行データを学習し,未知の軌跡に対しても高い運動模倣性能を示した。
    • ネガティブマイニング手法により,ロバストな歩行の事前知識を獲得し,テキストからの制御や目標点到達などの下流タスクに活用された。
    • KINESISが生成する筋肉活動パターンは,人間の筋電図活動と高い相関性を示し,生理学的な妥当性が確認された。

    Link: https://arxiv.org/abs/2503.14637

  • Gen-C:生成型群衆による仮想世界の人口増加 [cs.GR, cs.LG]目的:生成型群衆のシミュレーション手法
    • 仮想環境における人間らしい群衆の再現は,没入感向上や行動分析に不可欠である。
    • 従来の群衆シミュレーションは,衝突回避等の低レベルな処理に偏り,高レベルな行動の再現が困難であった。
    • 大規模言語モデルを活用し,多様で一貫性のある群衆行動を生成することで,この課題を解決する。
    • Gen-Cは,時間展開グラフ構造を用いて,行動,相互作用,空間的文脈を表現する。
    • 二重変分グラフオートエンコーダ(VGAE)により,テキスト情報と構造情報を条件とした学習を行い,大規模な環境対応型群衆シミュレーションを可能にする。
    • 大学キャンパスや駅などのシナリオで,多様な群衆,一貫性のある相互作用,高レベルな意思決定パターンを生成することを示した。

    Link: https://arxiv.org/abs/2504.01924

  • インドにおける構造化された法的文書生成:VidhikDastaavejを用いたモデル非依存型ラッパーアプローチ [cs.CL, cs.AI, cs.IR, cs.LG]目的:インドにおける構造化された法的文書生成のためのモデル非依存型ラッパーフレームワークおよび大規模データセット
    • 法務作業の効率化が求められる中で,AIによる法的文書の自動化は重要な研究分野である。
    • インドにおける法的文書の構造化生成は,公的データセットの不足と複雑な長期文書への適応が課題であった。
    • 本研究は,インドの法的文書に特化したデータセットと汎用的な生成フレームワークを確立することで,この課題を解決する。
    • VidhikDastaavejは,133のカテゴリを網羅するインド初の私的な法的文書の大規模匿名データセットである。
    • 提案手法であるModel-Agnostic Wrapper (MAW) は,法的文書のセクション構造を計画し,検索ベースのプロンプトで各セクションを生成する。
    • MAWは,事実の正確性,一貫性,および完成度を微調整ベースラインと比較して大幅に向上させることが示された。

    Link: https://arxiv.org/abs/2504.03486

  • AIと人間がオンラインの精神衛生に関する質問に与える応答の言語学的比較 [cs.RO, cs.HC, cs.AI, cs.CL, cs.SI]目的:AIと人間によるオンライン精神衛生に関する質問への応答の言語的特徴の比較
    • デジタル技術の普及により,オンラインでの精神衛生サポートの重要性が増している。
    • 生成AIの応答は即時性やパーソナライズ性に優れるものの,人間らしい共感性や経験に基づいたサポートが課題である。
    • オンライン精神衛生コミュニティにおけるAI活用において,人間との対話の質を損なわないための指針を提示すること。
    • AIの応答は人間によるものと比較して,冗長で読みやすく,分析的な構造を持つことが明らかになった。
    • しかし,AIの応答は言語的多様性や個人的な語りの欠如が見られた。
    • AIは中立的な立場を取り,質問に対する追加の確認を求めない傾向があることが示唆された。

    Link: https://arxiv.org/abs/2504.09271

  • GraphOmni:グラフ理論タスクにおける大規模言語モデルの評価のための包括的かつ拡張可能なベンチマークフレームワーク [cs.DC, cs.LG, cs.DM]目的:大規模言語モデルのグラフ理論タスクにおける推論能力の評価
    • グラフ構造は現実世界の様々な情報を表現可能であり,知識グラフやソーシャルネットワーク等,幅広い分野で重要である。
    • 既存のベンチマークは限定的なグラフ構造や形式に偏っており,言語モデルの能力を十分に評価できていない。
    • 多様な条件での評価を通じて,言語モデルの弱点を明らかにし,より高度なグラフ推論能力の開発を促進する。
    • GraphOmniは,多様なグラフ形式,シリアライゼーション形式,プロンプティング手法を網羅する包括的なベンチマークである。
    • 実験の結果,Claude-3.5やo4-miniが優れた性能を示したが,改善の余地は大きいことが示された。
    • シリアライゼーションやプロンプティング戦略は,オープンソースモデルとクローズドソースモデルで異なる影響を与えることが確認された。

    Link: https://arxiv.org/abs/2504.12764

  • 距離説明器による説明可能な埋め込み表現 [cs.LG, cs.AI, cs.CL, cs.CV]目的:埋め込み空間における局所的な事後解釈
    • 機械学習の高度化に伴い,モデルの判断根拠の説明可能性が重要視されている。
    • 埋め込み空間は抽象的な次元で表現されるため,解釈が困難であるという課題がある。
    • 埋め込み空間における類似性や相違性の根拠を説明することで,透明性と信頼性を向上させる。
    • 距離説明器は,選択的なマスキングと距離ランクに基づいたマスクフィルタリングにより,埋め込み空間の距離を説明する。
    • ImageNetとCLIPモデルを用いた実験で,類似度または相違度に寄与する特徴を効果的に特定することが示された。
    • 本手法は,高いロバスト性と整合性を維持しながら,埋め込み空間の解釈可能性を高める。

    Link: https://arxiv.org/abs/2505.15516

  • ボトルネックトランスフォーマー:汎化推論のための周期的なKVキャッシュ統合 [cs.LG, cs.AI, cs.IT, math.IT]目的:汎化推論能力の向上のためのKVキャッシュ統合手法
    • 大規模言語モデルの推論能力は計算資源に依存し,複雑な推論には高い計算コストが必要となる。
    • 既存のKVキャッシュ圧縮手法では,推論性能とメモリ効率のバランスが課題となっている。
    • 情報ボトルネック理論に基づき,KVキャッシュの再統合によって推論性能と汎化能力を向上させる。
    • 提案手法であるBottlenecked Transformerは,KVキャッシュプロセッサを用いて周期的にキャッシュを再統合する。
    • 数学推論ベンチマークにおいて,Bottlenecked Transformerは標準的なトランスフォーマーやpause-token拡張ベースラインと比較して一貫した性能向上を示した。
    • 特定のタスクとバックボーンにおいて,最大で+6.6ppの性能向上が確認された。

    Link: https://arxiv.org/abs/2505.16950

  • RestoreVAR:オールインワン画像修復のための視覚自己回帰的生成 [cs.CV, cs.AI]目的:オールインワン画像修復のための視覚自己回帰的生成手法
    • 画像修復技術は,劣化した画像を鮮明にする上で不可欠であり,様々な応用分野で利用されている。
    • 既存の拡散モデルは高性能だが,反復処理により推論速度が遅いという課題があった。
    • 視覚自己回帰モデルの特性を活用し,高速かつ高性能な画像修復を実現することを目指す。
    • 提案手法RestoreVARは,拡散モデルベースの手法と比較して,修復性能が向上し,推論速度が10倍以上向上した。
    • 視覚自己回帰モデルにおいて,粗いスケールが劣化を捉え,細かいスケールがシーンの詳細をエンコードするという分析結果が得られた。
    • RestoreVARは,クロスアテンション機構や潜在空間の改良モジュールなどの工夫により,画像修復タスクに最適化されている。

    Link: https://arxiv.org/abs/2505.18047

  • 周波数埋め込み3Dガウススプラッティングによる広帯域RF放射場モデリング [cs.CL, cs.NI, cs.AI, cs.LG]目的:広帯域RF放射場モデリング手法
    • 屋内環境における多様な周波数帯のRF信号の共存は,異種RFシステムの統合に不可欠である。
    • 従来の3Dガウススプラッティングは単一周波数に限定され,広範囲な周波数でのRF放射場モデリングが困難である。
    • 本研究は,未観測周波数を含む広帯域におけるRF放射場を効率的に再構成することを目的とする。
    • 提案手法は,周波数と伝搬特性の関係を学習する周波数埋め込みEM特徴ネットワークを導入した。
    • 1〜94GHzのPASデータセットを用いた実験により,提案手法はSSIM 0.922を達成し,最先端の単一周波数モデル(SSIM 0.863)を上回った。
    • 疎な周波数サンプルから,任意の周波数におけるRF放射場を効率的に再構成できることが示された。

    Link: https://arxiv.org/abs/2505.20714

  • ニューラルモデルの潜在空間ダイナミクスの探求 [cs.LG]目的:ニューラルモデルの潜在多様体上のベクトル場の解明
    • 深層学習モデルの性能向上には,その内部表現の理解が不可欠である。
    • 潜在空間の挙動は複雑であり,モデルの汎化性能や記憶容量の分析が困難である。
    • ベクトル場を用いてモデルの特性とデータの性質を分析する新たな手法を提案する。
    • オートエンコーダモデルは,潜在多様体上にベクトル場を暗黙的に定義していることが示された。
    • 標準的な学習手続きは,このベクトル場内にアトラクタ点をもたらす誘導的バイアスを導入することが明らかになった。
    • 提案手法は,モデルの汎化性能,事前知識の抽出,外れ値検出に有効であることが実証された。

    Link: https://arxiv.org/abs/2505.22785

  • EHR2Path:多岐にわたる電子カルテデータからの患者経過の拡張性のあるモデリング [cs.NI, cs.LG, cs.CL]目的:電子カルテデータの患者経過モデリング
    • 患者の個別化医療や予防医療の実現には,病状の予測が不可欠である。
    • 既存手法は,予測タスクの限定やデータ利用の狭さに課題がある。
    • 本研究は,患者の包括的な経過を予測可能なモデルを開発する。
    • EHR2Pathは,多様な臨床データを統合し,患者の病状経過を予測するフレームワークである。
    • 長期的な病歴と広範な特徴量を考慮するため,Masked Summarization Bottleneckを導入した。
    • MIMIC-IVを用いた実験で,既存手法を上回る予測性能が確認された。

    Link: https://arxiv.org/abs/2506.04831

  • 報酬だけで十分:LLMは文脈内強化学習者である [cs.LG, cs.AI, cs.CL]目的:大規模言語モデルにおける文脈内強化学習の創発
    • 逐次的な意思決定問題解決において,強化学習は重要な枠組みを提供する。
    • LLMは推論時に自己改善が難しい場合があり,性能向上が課題である。
    • LLMが推論時に報酬信号を最適化し,強化学習のように振る舞うことを示す。
    • LLMは,推論時に自身の過去の応答と報酬を文脈として活用することで,応答の質を向上させる。
    • この手法(ICRLプロンプティング)は,ゲーム,文章作成,数学競技など,様々なタスクで既存手法を上回る性能を示す。
    • 報酬信号をLLM自身が生成した場合でも性能が向上し,テスト時スケーリングの新たな可能性を示す。

    Link: https://arxiv.org/abs/2506.06303

  • TimeRecipe:モジュールレベルの効果測定による時系列予測レシピ [cs.LG]目的:時系列予測手法におけるモジュールレベルの効果
    • 時系列予測は,幅広い分野で不可欠なタスクであり,実世界への応用が重要である。
    • 有効なアーキテクチャや構成要素の選択において,明確な指針が存在しない。
    • モジュールレベルでの効果測定により,最適な設計選択を支援する。
    • TimeRecipeは,10,000以上の実験を通じて,多様なデータセットと予測期間における各モジュールの効果を体系的に評価した。
    • その結果,既存の最先端手法を凌駕するモデルが設計可能であり,設計選択と予測シナリオの関連性が明らかになった。
    • 経験的知見に基づいた適切なモデルアーキテクチャを推奨するツールキットを公開している。

    Link: https://arxiv.org/abs/2506.06482

  • 領域特性を持つ再帰型ニューラルネットワークに基づくロバスト制御システムとMPC設計への応用 [eess.SY, cs.SY, eess.SY, cs.LG, cs.SY]目的:再帰型ニューラルネットワークで記述されるシステムの出力フィードバックスキーム設計
    • 制御システムは,現代社会の基盤技術であり,安全性や効率性の向上が求められている。
    • 従来の制御手法では,複雑な非線形システムに対するロバスト性の確保が課題となっていた。
    • 漸進的入力対状態安定性に基づき,摂動や状態推定誤差に対するロバスト性を実現する。
    • 線形行列不等式に基づく観測器と静的状態フィードバックコントローラ設計手順を提案した。
    • 領域漸進的入力対状態安定性を活用し,定常軌道追従とロバスト性を両立する手法を提示した。
    • 領域漸進的入力対状態安定性を利用したチューブベースの非線形モデル予測制御(NMPC)を導入し,吸引領域を拡大した。

    Link: https://arxiv.org/abs/2506.20334

  • COALA:文脈を考慮した低ランク近似のための,数値的に安定で効率的なフレームワーク [cs.LG, cs.CL, cs.NA, math.NA]目的:大規模ニューラルネットワークの圧縮とファインチューニングにおける,文脈を考慮した低ランク近似手法
    • 近年の深層学習モデルの規模拡大に伴い,計算効率とメモリ使用量の削減が重要課題となっている。
    • 既存の低ランク近似手法は,グラム行列の計算と逆行列の算出に依存しており,数値的不安定性を引き起こしやすい。
    • 本研究は,数値的不安定性を回避し,より安定した低ランク近似を可能とするフレームワークを提案する。
    • 提案手法は,グラム行列の計算や逆行列の算出を必要とせず,数値的に安定な分解のみに基づいている。
    • GPUメモリ容量の制限や,入力活性行列の特異性,データ不足といった課題に対しても,安定した近似を保証する。
    • 理論的な収束性証明と誤差限界の導出により,提案手法の有効性を裏付けている。

    Link: https://arxiv.org/abs/2507.07580