arXiv雑要約

AI - 2026/04/22 公開

  • 複雑なユーザインタラクションを通じた行動と感情のモデリングと分析 [cs.HC, cs.AI]目的:ユーザの投稿テキストから抽出した性格特性と感情に基づき,システムの状態を予測する概念的フレームワーク
    • ソーシャルメディアデータの急増は,広告・マーケティング業界に変革をもたらし,ユーザエクスペリエンス向上に貢献する。
    • 大量のソーシャルデータから有益な知見を得ることは,複雑かつ困難である。
    • デジタルプロファイリングとシステム状態の関係性を明らかにし,理解を深める。
    • オンライン奨学金システムにおける2000人の学生のデータを用いて,新規の概念的フレームワークを構築した。
    • 性格特性と感情の抽出に基づき,システムの状態を予測することに成功した。
    • 心理言語学,人工知能,人間-コンピュータインタラクション分野の文献レビューから,デジタルプロファイリングとシステム状態のマッピングに関するギャップを特定した。

    Link: https://arxiv.org/abs/1902.07683

  • バッチ適応型因果注釈 [stat.ML, cs.CY, cs.LG, econ.EM, stat.ME]目的:介入の効果推定における効率的なデータサンプリング方法
    • 政策決定や意思決定において,介入の因果効果を正確に評価することは重要である。
    • データが欠損していたり,測定誤差を含む場合が多く,正確な推定が困難である。
    • 限られた予算内で,因果効果推定の精度を向上させるためのデータ選択方法を提案する。
    • 提案手法は,平均処置効果推定における欠損値問題を解決するため,最適なバッチサンプリング確率を導出した。
    • シミュレーション実験と実際のデータセットにおいて,既存手法と比較して二乗平均誤差を大幅に低減した。
    • 実際には,361個のランダムサンプルと同等の信頼区間を,90個の最適化されたサンプルで達成し,ラベル付け予算を75%削減した。

    Link: https://arxiv.org/abs/2502.10605

  • エージェント型コーディングにおけるテスト時計算量のスケーリング [math.OC, cs.SY, eess.SY, math.OC, cs.SY, eess.SY, cs.SE, cs.AI, cs.CL, cs.LG]目的:エージェント型コーディングにおけるテスト時計算量スケーリングの枠組み
    • 大規模言語モデルの性能向上は重要であり,テスト時スケーリングはその有効な手法の一つである。
    • 既存手法は短い出力に最適化されており,長期間にわたるエージェントの行動系列には不向きである。
    • 過去の経験を効果的に表現し,選択・再利用することで,エージェント型コーディングの性能を向上させる。
    • 提案手法は,ロールアウト軌跡を要約することで,重要な仮説,進捗,失敗モードを効率的に表現する。
    • 並列スケーリングには再帰的トーナメント投票(RTV)を導入し,ロールアウト要約の集団を比較・絞り込む。
    • シーケンシャルスケーリングにはPDRを適用し,過去の試行から蒸留された要約に基づいて新たなロールアウトを条件付けする。

    Link: https://arxiv.org/abs/2604.16529

  • 二重三角形注意機構:位置埋め込みなしの効率的な双方向注意 [q-fin.TR, cs.CE, q-bio.QM, cs.LG]目的:位置埋め込みを用いない双方向注意機構の開発
    • 自然言語処理をはじめとするシーケンスモデリングにおいて,Transformerは基盤技術である。
    • Transformerは順列不変であり,位置情報を明示的に埋め込む必要があった。
    • 双方向Transformerにおける位置情報符号化の課題を解決する。
    • 二重三角形注意機構は,過去と未来の情報をそれぞれ三角マスクで処理することで,双方向の文脈を維持しつつ,位置情報を暗黙的に符号化する。
    • 合成的な位置プローブ実験では,二重三角形注意機構と因果注意機構は位置情報を学習できたが,標準的な双方向注意機構はできなかった。
    • マスク言語モデリング実験では,RoPEと組み合わせた二重三角形注意機構が,文脈拡張性能で優れた結果を示した。

    Link: https://arxiv.org/abs/2604.18603

  • 物理に基づいたニューロモルフィックネットワークを用いた熱異常検知:Sentinel-2 Level-0およびLevel-1Cデータの比較 [eess.SP, cs.AI]目的:熱異常の検知に関する研究
    • 森林火災や火山噴火による被害は,早期発見が遅れるほど拡大するため,迅速かつ信頼性の高い早期警戒システムの構築が不可欠である。
    • 生のセンサーデータは,ドメインシフト,センサーのドリフト,放射計量的な不整合,ラベル付き訓練データの不足などの課題を抱えている。
    • 本研究は,これらの課題を克服し,リアルタイムな熱異常検知を可能にする軽量なニューロモルフィックネットワークフレームワークを提案する。
    • 提案手法であるPANNは,生のSentinel-2データに対して0.809のMatthews相関係数(MCC)を達成した。
    • Level-1Cデータを用いた場合,MCCは0.875に向上し,前処理の有効性を示した。
    • Level-0データの処理遅延は平均2.44秒であり,Sentinel-2の取得時間(3.6秒)を下回るため,リアルタイム処理が可能であることが示された。

    Link: https://arxiv.org/abs/2604.18606

  • 癌診断バイオマーカー探索のための量子AI [q-bio.GN, cs.LG]目的:肺腺がんおよび肺扁平上皮がんのサブタイプ特異的なバイオマーカーの同定
    • 癌は依然として主要な死因であり,早期発見と正確な診断が重要である。
    • 従来のバイオマーカー探索手法では,複雑なデータから有用な情報を抽出することが困難である。
    • 量子機械学習を用いて,より効率的なバイオマーカー探索と癌のサブタイプ分類を目指す。
    • 量子機械学習モデルが,肺腺がんおよび肺扁平上皮がんの識別において高い予測性能を示した。
    • サンプル3(複合遺伝子セット)が,全ての評価指標において最高の予測性能を達成した。
    • GOエンリッチメント解析により,シナプスシグナル伝達,イオンチャネル調節,神経発生に関わる遺伝子の重要性が示唆された。

    Link: https://arxiv.org/abs/2604.18621

  • 神経AIとそれ以降:神経科学と人工知能の進歩の架け橋 [q-bio.NC, cs.AI, cs.CY]目的:神経科学と人工知能の進歩間の連携促進
    • 脳の仕組み理解は,高性能で効率的なAI開発に不可欠である。
    • 既存AIは,物理世界との相互作用や学習の脆弱性,非効率性に課題がある。
    • 神経科学の原理をAIに適用し,これらの課題を克服することを目指す。
    • 現在のAIが抱える物理世界とのインタラクション,学習の脆さ,エネルギー効率の悪さといった課題に対し,神経科学的な解決策が提示された。
    • 身体と制御系の共同設計,相互作用による予測,多階層学習など,神経科学の原理に基づくAI研究ロードマップが提示された。
    • 神経科学と工学を融合した研究者育成と,それらを支援する体制構築の必要性が強調された。

    Link: https://arxiv.org/abs/2604.18637

  • 熟練した全球海洋エミュレーションと相関を考慮した損失関数の役割 [physics.ao-ph, cs.AI, nlin.CD]目的:全球海洋力学の予測
    • 地球温暖化の影響予測には高精度な海洋モデルが不可欠である。
    • 既存の海洋モデルは計算コストが高く,リアルタイム予測が困難である。
    • 機械学習を用いた高速かつ高精度な海洋予測モデルの構築。
    • GraphCastアーキテクチャを海洋専用エミュレータに改良し,10~15日先の予測精度を達成した。
    • 平均二乗誤差損失関数よりも,マハラノビス距離を用いた損失関数が予測精度を向上させた。
    • 相関を考慮した損失関数が,全球海洋のゆっくりとした相関ダイナミクスを正則化する役割を担うことが示された。

    Link: https://arxiv.org/abs/2604.18727

  • 不完全検出下における疎なネットワーク推論とその生態ネットワークへの応用 [stat.ML, cs.LG, eess.SP, math.OC, stat.AP]目的:カウントデータからの潜在的構造の復元
    • 生態学研究では,双方向ネットワークにおいて群間相互作用と群内類似性の両方を捉えることが重要である。
    • 既存モデルは相互作用の復元に重点が置かれ,誘導される類似性グラフの研究は十分でない。
    • 本研究では,疎な構造を制御し,スケールの不均衡を解消することで,構造の復元精度向上を目指す。
    • 検出確率推定を用いた,構造化された疎な非負低ランク分解のフレームワークを提案した。
    • 潜在的な類似性および接続構造に対して,非凸なℓ₁/₂正則化を適用し,疎性を促進した。
    • 合成データおよび実際の生態データを用いた実験により,既存手法と比較して優れた復元性能が示された。

    Link: https://arxiv.org/abs/2604.18820

  • OmniMouse:1500億ニューラルトークンにおけるマルチモーダル・マルチタスク脳モデルのスケール特性 [q-bio.NC, cs.AI]目的:脳活動モデリングにおけるスケール特性の解明
    • AIの進歩はデータとニューラルネットワークのスケールによって推進されており,脳科学への応用が期待される。
    • 脳活動モデリングにおいては,データ量が十分でなく,モデルサイズの拡大が性能向上に繋がりにくい状況が存在する。
    • マウスの視覚皮質における大規模なニューロンデータを用いて,データ量とモデルサイズの相関関係を明らかにすることを目指す。
    • OmniMouseは,神経予測,行動デコード,神経予測の組み合わせを含む様々な評価において,最先端の性能を達成した。
    • 性能はデータ量の増加と共に安定的に向上するが,モデルサイズの拡大による効果は飽和する傾向が確認された。
    • 言語や画像認識とは異なり,脳モデリングではデータ量が依然としてボトルネックであり,より大規模なデータセットが必要である可能性が示唆された。

    Link: https://arxiv.org/abs/2604.18827

  • 量子カーネルサポートベクターマシンと古典的ベースラインの表形式データにおけるベンチマーク:ハードウェア検証を用いた厳密な実験的研究 [quant-ph, cs.LG]目的:量子カーネルサポートベクターマシン(QSVM)と古典的ベースラインの性能比較
    • 機械学習はデータ分析において重要であり,特に分類問題の解決に広く用いられる。
    • 量子コンピュータを用いた機械学習は有望視されているが,古典的手法との比較検証が不十分である。
    • 本研究は,量子カーネル法の性能を厳密に評価し,その限界と改善点を探ることを目的とする。
    • 統計的有意性検定の結果,量子カーネルと古典的カーネルのいずれの組み合わせにおいても有意差は認められなかった。
    • 学習曲線分析では,量子カーネルは一部データセットで古典的手法よりも学習速度が速かったものの,性能差を埋めるには至らなかった。
    • IBMの量子コンピュータ(ibm_fez)を用いた検証では,カーネルの忠実度が高いことが確認された。量子カーネル学習は特定のデータセットにおいて競争力のある結果を示したが,計算コストが非常に高かった。

    Link: https://arxiv.org/abs/2604.18837

  • 変分量子目的関数の線形性を超えた学習可能性 [quant-ph, cs.LG]目的:変分量子アルゴリズムのスケーラビリティに対する障壁である,勾配の指数関数的な抑制の限界
    • 変分量子アルゴリズムは量子計算の有望な手法であり,実用的な問題を解決する可能性を秘めている。
    • バレンプレート現象により,目的関数によっては指数関数的に勾配が抑制され,学習が困難になることが知られている。
    • 目的関数の構造に着目し,勾配抑制が起こる条件を明確化することで,スケーラブルなアルゴリズム設計の指針を得る。
    • 目的関数が測定統計量に対してアフィンである場合に限り,固定観測可能表現を持つことが示された。これは,標準的な集中型証明テンプレートの境界を特定する。
    • アフィンでない損失関数に対しては,勾配抑制を回避できる可能性がある。幅を多項式に設定することで,指数次元の障害が緩和され,損失関数の特性が重要になる。
    • 電荷保存量子系を用いた数値実験では,増幅可能な目的関数が,アフィン関数や抑制を受けるベースラインと比較して,数桁大きい勾配を示した。

    Link: https://arxiv.org/abs/2604.18846

  • ベルマン方程式を超えて:連続時間ポリシー評価のための高次生成回帰 [math.OC, cs.SY, eess.SY, math.CO, cs.CC, stat.ML, cs.LG, math.OC]目的:時間変化のあるダイナミクス下における離散閉ループ軌跡からの連続時間ポリシー評価
    • 強化学習や制御理論において,効率的なポリシー評価は最適な制御戦略を決定する上で不可欠である。
    • 従来のベルマン方程式に基づく手法は,計算精度に限界があり,特に連続時間問題では高精度な評価が困難である。
    • 本研究は,高次生成回帰を用いることで,ベルマン方程式の精度限界を克服し,より高精度なポリシー評価を可能にする。
    • 提案手法は,多段階遷移を用いた生成器の推定により,低次項の打ち消しを実現し,精度の向上に貢献する。
    • 理論的な解析により,生成器の誤り,射影誤差,プーリングバイアス,有限サンプル誤差,初期誤差への分解が示された。
    • 検証実験の結果,提案手法はベルマン方程式に基づく手法を安定して上回り,理論的に予測される領域で効果が確認された。

    Link: https://arxiv.org/abs/2604.18972

  • PM2.5汚染予測のための地上近リアルタイムモデリング [stat.AP, cs.LG]目的:PM2.5汚染の予測モデル
    • 大気汚染は世界的な健康問題であり,呼吸器疾患や心血管疾患など多くの病気の原因または悪化要因となる。
    • 従来のモデルは,更新頻度の低いデータや固定グリッドに依存しており,リアルタイムでの汚染評価が困難である。
    • 本研究は,疎な観測データから高精度かつリアルタイムなPM2.5予測を可能にすることを目指す。
    • 本研究では,深層学習を用いて,US EPAの観測地点間をグリッドを使用せずにPM2.5濃度を補間する手法を開発した。
    • 地形,気象,土地利用データ等の付加情報を取り込むことで,空間的・時間的な解像度が高い予測が可能となった。
    • 軽量なアーキテクチャにより,ストリーミングデータへの迅速な対応が可能であり,公衆衛生危機時の意思決定支援に貢献しうる。

    Link: https://arxiv.org/abs/2604.18973

  • 一貫性正則化による統合ASR変換器のオフライン・ストリーミング性能差の縮小 [eess.AS, cs.AI, cs.CL, cs.HC]目的:オフラインおよび低遅延ストリーミング環境下での良好な性能を両立する単一モデルの構築
    • 自動音声認識システムの統合は開発・保守コストを削減できるため重要である。
    • オフラインとストリーミング設定の両方で高い性能を発揮する単一モデルの学習が課題である。
    • オフライン性能を維持しつつ,ストリーミング精度を向上させることを目指す。
    • 提案手法により,低遅延環境下でのストリーミング精度が向上することが確認された。
    • オフライン性能は維持され,より大規模なモデルやデータセットへの拡張性も示された。
    • 統合ASRフレームワークと英語モデルのチェックポイントが公開されている。

    Link: https://arxiv.org/abs/2604.19079

  • 中心化と特異値閾値化によるガウス混合モデル成分の高速推定 [stat.ML, cs.LG]目的:ガウス混合モデル成分数の推定
    • 教師なし学習において,成分数推定は重要な課題である。高次元データや成分サイズが極端に不均衡な場合に特に重要となる。
    • 既存手法は,反復計算や尤度計算が必要であり,計算コストが高い。また,成分数の事前知識が必要となる場合がある。
    • 中心化と特異値閾値化により,高速かつ正確な成分数推定を実現し,計算コストと事前知識の課題を解決する。
    • 提案手法は,データ中心化,中心化行列の特異値計算,閾値以上の特異値数のカウントという単純な手順で成分数を推定する。
    • 分離条件が満たされれば,提案手法は成分数を一貫して正確に推定できることが証明された。高次元設定でも有効である。
    • 実験結果は,高次元,多数の成分,深刻なクラス不均衡といった困難な状況下でも,提案手法の精度を確認した。

    Link: https://arxiv.org/abs/2604.19091

  • 条件付きソボル指標の基底分解による解析的抽出 [physics.acc-ph, cs.SY, eess.SY, stat.ML, cs.LG, cs.NA, math.NA]目的:不確実性定量化における条件付きソボル指標の解析的抽出
    • システムの応答がパラメータに依存する場合,感度指標の評価は重要である。空間場や運転条件の変化に対応できる。
    • 従来のポイントごとのモデリングは計算コストが高く,パラメータ空間全体で一貫性を欠く場合がある。
    • 事前学習済みのPCEモデルから条件付きソボル指標を効率的に抽出すること。
    • 提案手法は,PCE基底のテンソル積の性質を利用し,条件変数を考慮した解析的な係数場を導出する。
    • 条件付き確率測度の直交性の保持により,条件付き分散とソボル指標の閉形式表現を導出した。
    • 本手法は,物理的な整合性を保証し,従来のポイントごとのアプローチよりもロバスト性と計算効率に優れる。

    Link: https://arxiv.org/abs/2604.19165

  • 光音響トモグラフィにおける深層画像事前知識は,限られた視野角によるアーチファクトを軽減できる [eess.IV, cs.LG, math.OC]目的:光音響トモグラフィにおける,限られた視野角によるアーチファクト軽減とノイズ抑制
    • 光音響トモグラフィは,生体組織の深部を非侵襲的に可視化する技術であり,医療診断への応用が期待される。
    • 実験環境では,視野角が制限されることが多く,画像再構成時にアーチファクトやノイズが発生しやすい。
    • 限られた視野角下における,ロバストな画像再構成手法の開発。
    • 深層画像事前知識(DIP)フレームワークが,限られた視野角下でも効果的な画像再構成を可能にする。
    • DIPは,全変動(TV)再構成と比較して,定量的な評価指標において改善が見られた。
    • シミュレーションデータと実験データの両方で,DIPの有効性が確認された。

    Link: https://arxiv.org/abs/2604.19176

  • 機械学習と特徴量選択を用いた天気予報のポスト処理改善 [physics.ao-ph, cs.LG]目的:天気予報のポスト処理モデルの改善
    • 気象予報の精度向上は,社会経済活動や防災に不可欠である。
    • 数値予報モデルの出力には,系統的な誤差が含まれる場合がある。
    • 機械学習によるポスト処理で,予報精度を向上させることを目指す。
    • 機械学習モデルLightGBMは,CNN等の既存モデルやMSM直接予報,MSMGと比較して,多くの地点とリードタイムで低いRMSEを達成した。
    • 降水量の予測において,Tweedie損失関数やイベント重み付けにより,特に高雨量域での性能が向上した。
    • ただし,降水量の性能向上は地点に依存し,全体的な性能はMSMGにわずかに劣る場合もあった。

    Link: https://arxiv.org/abs/2604.19340

  • 金属有機構造体の特性予測のためのサンプル認識型マルチモーダルTransformer [cond-mat.mtrl-sci, cs.AI]目的:金属有機構造体の特性予測におけるサンプル依存性の考慮
    • 材料探索の加速化に貢献する材料インフォマティクスの重要性が高まっている。
    • 既存の機械学習モデルは,構造と特性の一対一対応を仮定しており,サンプルごとのバラつきに対応できない。
    • 実験的なサンプルの特性変化を捉え,より高精度な特性予測を実現することを目指す。
    • MOFidとX線回折(XRD)を組み合わせたEXITモデルを開発し,サンプル状態を考慮した特性予測を可能にした。
    • EXITは,シミュレーションデータで事前学習することで,汎用性の高い表現を獲得し,予測性能を向上させた。
    • 実験データを用いたファインチューニングにより,XRD情報を加えることで予測精度が向上し,サンプルごとの特性変化を捉えられることが示された。

    Link: https://arxiv.org/abs/2604.19383

  • 物理システムの安定性と応答性のデータ駆動型発見のためのニューラル演算子フレームワーク [quant-ph, cs.ET, physics.flu-dyn, cs.AI]目的:物理システムの安定性と応答性のデータ駆動型発見
    • 科学技術における複雑系の挙動理解は重要であり,安定性や応答性は基本的な課題である。
    • 従来の解析手法は,方程式や線形化を必要とし,非線形システムやモデル化が困難なシステムへの適用が制限されていた。
    • 観測データのみから安定性や最適な強制応答を自動的に識別し,方程式を必要としない分析手法を確立すること。
    • ニューラルネットワークをダイナミクスエミュレータとして学習し,自動微分によってヤコビアンを抽出することで,固有モードやresolventモードを直接データから計算することに成功した。
    • カオスモデルと高次元流体流れの両方において,支配的な不安定モードと入出力構造を非線形領域でも正確に特定できた。
    • 本手法は,複雑な高次元データセットの解析のための汎用的なツールとなり,気候科学,神経科学,流体工学などへの応用が期待される。

    Link: https://arxiv.org/abs/2604.19465

  • ランダムニューラルネットワークの関数形のゆらぎにおける相転移 [math.PR, cs.LG, stat.ML]目的:ランダムニューラルネットワークの関数形の漸近的振る舞い
    • 深層学習の理論的基盤を確立し,汎化性能を理解する上で重要である。
    • ネットワークの深さが増すにつれて,関数形の挙動が複雑化し,数学的な解析が困難である。
    • 関数形の相転移を明らかにし,深層学習モデルの振る舞いを予測する。
    • ネットワークの深さが増加するにつれて,関数形の漸近的振る舞いが共分散関数の固定点に強く依存することが示された。
    • 3つの異なる極限領域が確認された。ガウス場への収束,ガウス分布への収束,Q次ウィーナーカオスへの収束である。
    • 共分散に関連付けられた反復演算子の固定点構造が,異なる極限領域を決定する上で重要であることが判明した。

    Link: https://arxiv.org/abs/2604.19738

  • 機械の中の囁き:エージェントシステムにおける機密性 [cs.HC, cs.CR, cs.LG]目的:LLMベースエージェントシステムの機密性に関するリスク評価
    • LLM技術の発展に伴い,自動化されたタスク処理の需要が高まっている。
    • エージェントシステムは,外部ツールとの連携により攻撃対象領域が拡大し,機密情報漏洩のリスクがある。
    • LLMエージェントにおける機密性リスクを定量的に評価し,脆弱性を明らかにすること。
    • 調査の結果,評価したすべてのエージェントが少なくとも一つの攻撃に対して脆弱であることが判明した。
    • 既存の防御策は,これらの脅威に対する信頼できる保護を提供できないことが示された。
    • 特に,使用するツール自体が情報漏洩のリスクを増大させる可能性があることが明らかになった。

    Link: https://arxiv.org/abs/2402.06922

  • ノルム制限された入力を持つ非線形システムの安定化のための統一的なコントローラ設計 [eess.SY, cs.AI, cs.SY, math.OC]目的:非線形システムの安定化コントローラ設計手法
    • 現代の制御システムは複雑化しており,ロバストな安定化手法の確立が重要である。
    • 入力制限がある非線形システムに対する一般的な安定化手法が不足している。
    • 様々な制御シナリオに対応可能な汎用的なコントローラ設計方法を確立すること。
    • リン・ソンタグの普遍公式を拡張し,状態依存のスケーリング項を導入することで,統一的な設計方法を提案した。
    • スケーリング項の最適化により,コスト関数を最適化し,漸近的な安定性を保証するコントローラが得られた。
    • シミュレーションにより,提案手法が非線形システムの安定化問題に有効であることが示された。

    Link: https://arxiv.org/abs/2403.03030

  • 生成モデルとコネクテッド・自動運転車:輸送とAIの交差点を探るサーベイ [cs.LG, cs.AI, cs.RO]目的:生成モデルとコネクテッド・自動運転車の統合
    • 輸送システムの効率化や安全性向上にAI技術の応用が不可欠である。
    • 自動運転車の開発におけるシミュレーションの精度向上が課題である。
    • 生成モデルによる予測モデルの精度向上を目指す。
    • 生成モデルの応用が,自動運転車の予測モデリング,シミュレーション精度,意思決定プロセスの改善に貢献する可能性が示された。
    • 生成モデルとコネクテッド・自動運転車の統合には,進歩と残された課題が存在することが確認された。
    • 安全性とイノベーションの向上に向けた,更なる研究開発の可能性が示唆された。

    Link: https://arxiv.org/abs/2403.10559

  • 局所解析関数空間におけるプッシュフォワードの有限次元近似 [math.NA, cs.LG, cs.NA, math.CV, math.DS, math.FA]目的:局所解析関数空間におけるプッシュフォワードの近似手法
    • 解析力学や最適輸送において,写像による空間の変形を理解することが重要である。
    • 有限個のサンプルからプッシュフォワードを直接計算することは困難である。
    • サンプルデータからプッシュフォワードを近似し,その誤差を評価すること。
    • 局所解析関数空間とフーリエ・ボレル変換を用いることで,プッシュフォワードを整関数上の作用素として表現した。
    • ハンケルモーメント行列の最小固有値を用いて,有限次元近似の誤差を明示的に評価することに成功した。
    • 離散的な軌跡データから解析ベクトル場を再構成するデータ駆動型手法の収束性を証明した。

    Link: https://arxiv.org/abs/2404.10769

  • DASB - 離散オーディオおよび音声ベンチマーク [cs.SD, cs.AI, eess.AS]目的:離散オーディオトークンのベンチマークフレームワーク
    • 音声と言語処理の融合が期待され,マルチモーダル言語モデルの発展に不可欠である。
    • 音韻内容,話者識別,パラ言語的特徴などの重要な情報を維持することが課題である。
    • 様々なタスクにおける離散オーディオトークンの性能を公平に評価する手段を提供する。
    • 離散表現は連続表現よりも頑健性が低く,モデル構造や学習率などの調整が重要である。
    • 意味的トークンは音響的トークンよりも優れているが,離散トークンと連続特徴の間には依然として差がある。
    • DASBのコード,評価設定,リーダーボードは公開されており,研究の再現性と発展に貢献する。

    Link: https://arxiv.org/abs/2406.14294

  • ロボット制御タスクのための潜在線形二次レギュレータ [cs.RO, cs.LG]目的:ロボット制御における効率的な制御手法
    • ロボットの自律性を向上させるためには,高度な制御技術が不可欠である。
    • モデル予測制御は計算コストが高く,特に非線形モデルでは実用上の課題がある。
    • 計算コストを削減しつつ,高性能な制御を実現すること。
    • 潜在空間へのマッピングにより,LQRを効率的に適用できる新しい手法を提案した。
    • 提案手法LaLQRは,元のMPCを模倣することで,代替システムを同時に学習する。
    • 実験結果から,LaLQRが他のベースラインと比較して,効率性と汎化性能に優れていることが示された。

    Link: https://arxiv.org/abs/2407.11107

  • アイドル状態が新たなスリープ:FPGAベースの深層学習アクセラレータにおける非活動時の構成最適化 [cs.AR, cs.AI]目的:FPGAベースの深層学習アクセラレータにおけるエネルギー効率の向上
    • IoT分野の急速な発展に伴い,持続可能なコンピューティングの原則に沿ったエネルギー効率が重要視されている。
    • FPGAの構成段階はエネルギー消費が大きく,そのオーバーヘッドが課題となっていた。
    • 構成パラメータの最適化により,FPGA構成段階のエネルギー消費を最小化することを目指す。
    • 構成パラメータの調整により,構成エネルギーを40.13倍削減することに成功した。
    • アイドル待ち戦略は,デューティサイクルモードにおいて,従来のオンオフ戦略を上回る性能を示した。
    • 40msのリクエスト周期と4147Jのエネルギー予算において,システム寿命をオンオフ戦略の約12.39倍に延長した。

    Link: https://arxiv.org/abs/2407.12027

  • 作物の種類マッピングにおける基盤モデルの汎化性能について [cs.CV, cs.LG]目的:作物種類のマッピングにおける基盤モデルの汎化性能
    • 精密農業や災害対応など,地球観測技術の重要性が高まっており,効率的な土地利用に貢献する。
    • データが豊富な先進国で学習したモデルが,データ不足の発展途上国で有効に機能するか不明確である。
    • 地理的な偏りを考慮し,汎化性能を評価することで,より公平で効果的なモデル構築を目指す。
    • Sentinel-2用に設計されたSSL4EO-S12は,汎用的なImageNetよりも高い性能を示した。
    • 高い全体精度を達成するには100枚のラベル付き画像で十分だが,クラスの不均衡を緩和し,平均精度を向上させるには900枚が必要である。

    Link: https://arxiv.org/abs/2409.09451

  • 時系列予測のためのTransformerを組み込み型FPGAに展開するためのリソースを考慮した混合精度量子化 [cs.LG]目的:組み込み型FPGAにおける時系列予測のためのTransformer展開の実現可能性向上
    • エッジデバイスでのAI活用が進む中,Transformerモデルの組み込みシステムへの応用が重要となる。
    • Transformerは計算資源を多く必要とし,リソース制約のあるFPGAへの展開が困難である。
    • リソース制約下でTransformer展開を可能にする,効率的な量子化手法を提案すること。
    • 本研究では,VHDLテンプレートに選択可能なリソースタイプを導入し,BRAMを効率的に活用することで,Transformer展開のボトルネックを解消した。
    • リソースを考慮した混合精度量子化手法により,ニューラルアーキテクチャ検索の専門知識がなくてもハードウェアレベルの量子化戦略を探索できるようになった。
    • 提案手法は,実際の展開指標と比較して精度誤差3%以内で正確なリソース利用量推定を可能にし,従来展開できなかった5つの設定を展開することに成功した。

    Link: https://arxiv.org/abs/2410.03294

  • 意味的類似性の喚起 [cs.AI]目的:文表現間の意味的類似性評価手法
    • 自然言語処理において,文の意味理解は重要な課題である。類似性の正確な評価が求められる。
    • 従来の類似性評価は,言い換え表現に依存し,本質的な意味の距離を捉えきれない場合がある。
    • テキストが喚起するイメージの分布間の距離により,意味的類似性を直接評価する手法を提案する。
    • 提案手法では,テキストが誘導する逆時間拡散確率微分方程式(SDE)間のJeffreysダイバージェンスを計算することで,意味的類似性を評価する。
    • モンテカルロサンプリングにより,効率的な計算が可能である。
    • 本手法は,人間による評価との一致性を示し,テキスト条件付き生成モデルの評価にも応用できる。

    Link: https://arxiv.org/abs/2410.16431

  • 検出Transformerにおける不確実性定量化:オブジェクトレベルのキャリブレーションと画像レベルの信頼性 [cs.MA, cs.SI, math.OC, cs.CV, cs.AI]目的:検出Transformerの予測に対する信頼性評価手法の開発
    • 物体検出は,自動運転などの安全性に重要な応用分野において不可欠な技術である。
    • DETRは多数の予測を出力するため,信頼できる予測を特定することが課題であった。
    • DETRが出力する予測の信頼性を評価し,安全な応用を可能にすることを目的とする。
    • DETRは,オブジェクトごとに1つのキャリブレーションされた予測を生成し,残りを抑制する戦略をとることが明らかになった。
    • 既存の評価指標では,モデルのキャリブレーション品質と後処理アルゴリズムの効果を同時に評価できないことが示された。
    • オブジェクトレベルのキャリブレーション誤差(OCE)を導入し,モデル評価と信頼性の高い予測サブセットの特定に役立つことを示した。

    Link: https://arxiv.org/abs/2412.01782

  • GNNを用いたソーシャルネットワークにおける意見の二極化緩和 [cs.SI, cs.LG]目的:ソーシャルネットワークにおける意見の二極化軽減策
    • 現代社会において,ソーシャルメディアは意見交換の場であり,その影響力は大きい。
    • ソーシャルメディア上では,意見の二極化が進み,エコーチェンバー現象が問題視されている。
    • 本研究は,ネットワーク上の少数のユーザーの意見を調整することで二極化を抑制することを目指す。
    • 提案手法では,グラフニューラルネットワークを用いて,意見調整による二極化最小化に貢献するユーザー群を効率的に特定する。
    • エコーチェンバー構造を持つネットワークにおいて,一部のユーザーが中立的な意見を持つことで,ネットワーク全体の二極化が軽減されることを確認した。
    • 大規模グラフに対しても有効に機能する,効率的なアルゴリズムを開発した。

    Link: https://arxiv.org/abs/2412.09404

  • 最適化知識の適応による学習進化 [cs.NE, cs.AI, cs.CV, cs.LG]目的:進化戦略における最適化知識の活用とオンライン適応
    • 最適化問題解決において,過去の知見を有効活用することで,効率的な探索が可能となる。
    • 既存手法では,過去の知識の不完全な利用や,特定の演算子への限定的な適応といった課題が存在する。
    • 最適化知識の統合と動的なパラメータ更新を同時に実現し,効率的な知識伝達と適応を目指す。
    • 提案手法OKAEMは,事前学習による知識転移と,リアルタイム知識に基づく適応的最適化を統合した学習可能な進化フレームワークである。
    • 実験結果から,OKAEMは知識転移シナリオにおいて既存手法を凌駕し,事前知識のない環境でも高度な自己調整能力を示すことが確認された。
    • ビジョン言語モデルのプロンプト調整への応用や,消去実験,可視化分析により,学習可能な要素の必要性およびモデルの解釈可能性が示された。

    Link: https://arxiv.org/abs/2501.02200

  • 生成AI時代におけるユーザシミュレーション:ユーザモデリング,合成データ生成,およびシステム評価 [cs.AI, cs.HC, cs.IR, cs.LG]目的:ユーザシミュレーションに関する基礎的な統合
    • AI技術の発展に伴い,人間とAIのインタラクションを理解し,改善する重要性が高まっている。
    • ユーザシミュレーションの研究は,AI,HCIなど多岐にわたる分野に分散しており,体系的な理解が困難である。
    • 本研究は,ユーザシミュレーションの倫理的課題に対処し,公平性と安全性を確保するためのツールを提供する。
    • 本研究は,従来の予測モデルから生成アプローチへのパラダイムシフトを強調している。
    • ユーザシミュレーションが,データ不足や評価の課題を克服し,パーソナライズを最適化するための触媒となり得ることを論じている。
    • 学術界と産業界を結びつける革新的なエコシステムを提案し,ユーザシミュレーション技術の発展を促進する。

    Link: https://arxiv.org/abs/2501.04410

  • ノイズのある部分集合選択のためのロバスト評価によるパレート最適化 [cs.NE]目的:ノイズのある部分集合選択問題におけるロバスト評価関数最大化と部分集合サイズ最小化
    • 組合せ最適化の基礎問題であり,影響力最大化や疎回帰など,幅広い応用分野が存在する。
    • 現実世界では目的関数の評価にノイズが含まれることが多く,既存手法はノイズに弱かったり,計算コストが高かったりする。
    • ノイズ環境下で効率的に高品質な解を探索し,計算資源の制約下でも有効に機能することを目指す。
    • 提案手法POREは,既存手法(貪欲法,POSS,PONSS)と比較して,影響力最大化と疎回帰のデータセットにおいて有意に高い性能を示す。
    • POREは,ロバスト評価関数に基づき,構造化された解を効率的に特定し,PONSSで見られた計算資源の制約を克服する。
    • アブレーションスタディにより,提案するロバスト評価関数の有効性が確認された。

    Link: https://arxiv.org/abs/2501.06813

  • 頭部CTにおける汎化可能な疾患検出のための3D基盤モデル [cs.CV, cs.AI]目的:頭部CT画像における汎化可能な疾患検出
    • 頭部CTは脳疾患診断に不可欠であり,迅速かつ安全な検査手段として広く用いられている。
    • 高品質なラベル付きデータの不足が,高性能な深層学習モデル開発の大きな課題となっている。
    • ラベルなしデータを用いた自己教師あり学習により,汎化性能の高い基盤モデルを構築すること。
    • 自己教師あり学習により,大量の頭部CTデータからロバストな特徴量を効率的に学習できた。
    • 開発した基盤モデルは,既存の3D CT基盤モデルやゼロから学習させたモデルと比較して,診断性能が大幅に向上した。
    • 本研究は,医療画像における自己教師あり学習の有効性を示し,頭部CT画像解析の新たなベンチマークを確立した。

    Link: https://arxiv.org/abs/2502.02779

  • フーリエ特徴を用いた高精度な単一トークン数値埋め込み FoNE [cs.CL, cs.LG]目的:数値の埋め込み表現の効率化と精度向上
    • 大規模言語モデルにおいて,数値処理能力は重要な課題である。効率的な数値表現は,性能向上に不可欠。
    • 従来の数値表現は複数トークンに分割されるため,計算コストが増大し,精度が低下することが課題。
    • フーリエ特徴を活用し,数値情報を単一トークンで効率的に表現することで,上記課題の解決を目指す。
    • 提案手法FoNEは,各桁を2次元の埋め込みで表現することで,従来の数値表現よりも大幅な計算量削減を実現。
    • 6桁の10進数加算において,FoNEは従来の埋め込み手法と比較して,99%の精度達成に必要なデータ量を64分の1に削減。
    • 加算,減算,乗算の全テスト例(10万件以上)において,FoNEは100%の精度を達成しており,高い有効性が確認された。

    Link: https://arxiv.org/abs/2502.09741

  • 量子非線形バンディット最適化 [cs.LG, quant-ph]目的:非線形バンディット最適化における探索戦略
    • 創薬や材料設計などに応用可能な,ブラックボックス関数の最適化手法である。
    • 既存手法は,カーネルヒルベルト空間への制限や次元の呪いにより,高次元問題に対応できない。
    • 入力次元に依存しないアルゴリズムを開発し,高次元問題への適用を目指す。
    • 提案手法Q-NLB-UCBは,入力次元に依存しない$O(\mathrm{poly}\log T)$の上界を達成する。
    • 量子モンテカルロ平均推定,パラメトリック関数近似,量子非線形回帰オラクルが鍵となる。
    • 合成データおよび実データを用いた実験により,提案手法の有効性が確認された。

    Link: https://arxiv.org/abs/2503.03023

  • COMODO:ビデオとIMUのクロスモーダル知識蒸留による効率的な一人称視点ヒューマンアクティビティ認識 [cs.CV, cs.AI, cs.LG, cs.MM]目的:一人称視点ヒューマンアクティビティ認識の効率化
    • ウェアラブルシステムにおける継続的な活動理解は重要だが,計算資源やプライバシーの問題が存在する。
    • IMUセンサは省電力だが,大規模なアノテーションデータが不足しており,汎化性能が低い。
    • ビデオの知識をIMUに蒸留することで,IMUの性能を向上させ,実用的なウェアラブルシステムを実現する。
    • COMODOは,ラベルを用いずにビデオからIMUへの知識蒸留を行うことで,IMUの性能を改善する。
    • 実験の結果,COMODOは既存の教師あり学習モデルと同等またはそれ以上の性能を達成し,高い汎化性能を示した。
    • COMODOは様々な事前学習済みモデルに対応しており,将来のユビキタスコンピューティング研究に貢献する可能性を秘めている。

    Link: https://arxiv.org/abs/2503.07259

  • AutoNFS:自動ニューラル特徴選択 [cs.LG]目的:機械学習における特徴選択の自動化
    • 高次元テーブルデータの分析において,解釈可能性と計算効率が重要である。
    • 既存手法は,必要な特徴量の数を自動的に検出できず,ユーザー介入や再学習が必要となる場合がある。
    • タスク解決に不可欠な最小限の特徴量セットを自動的に決定すること。
    • AutoNFSは,Gumbel-Sigmoidサンプリングに基づくFSモジュールと,選択された特徴量の関連性を評価する予測モデルを組み合わせる。
    • 従来のwrapper型手法と比較して,AutoNFSは低い予測可能な学習オーバーヘッドで,特徴量予算ごとのモデル再学習を回避する。
    • 分類および回帰ベンチマーク,メタゲノムデータセットを用いた評価の結果,AutoNFSは既存手法と同等またはそれ以上の性能を示す。

    Link: https://arxiv.org/abs/2503.13304

  • RESFL:プライバシー,公平性,ユーティリティのバランスによる責任ある連合学習のための不確実性認識フレームワーク [cs.LG, cs.CV, cs.DC, cs.ET]目的:プライバシー,公平性,ユーティリティのバランスによる責任ある連合学習フレームワーク
    • 連合学習は,データ集中化を伴わない機械学習を可能にし,医療や金融など様々な分野で重要性を増している。
    • プライバシー保護のために差分プライバシーを用いる場合,バイアス修正に必要な情報が失われ,公平性が損なわれる可能性がある。
    • プライバシーと公平性のトレードオフを解消し,高精度かつ公平な連合学習モデルを構築することを目指す。
    • RESFLは,敵対的プライバシー解 disentanglement と不確実性 guided 公平性 aware 集約を組み合わせることで,プライバシーと公平性を同時に改善する。
    • FACETとCARLAの実験では,RESFLがFedAvgベースラインと比較して,mAPの向上,メンバーシップ推論攻撃の成功率低下,機会均等の格差縮小を実現した。
    • RESFLは,自律運転環境で評価されたが,そのドメイン汎用性から,他の幅広いアプリケーション領域にも適用可能である。

    Link: https://arxiv.org/abs/2503.16251

  • GAIR:位置情報に基づいた自己教師ありコントラスト学習による地理的整合性を持つ暗黙的表現を用いた事前学習 [cs.CV, cs.AI]目的:地理空間タスクにおける汎用的な地理空間表現の学習
    • 地理空間データは,都市計画,環境モニタリング等に不可欠であり,その応用範囲は広い。
    • 既存のViTは,地理空間タスクに必要な詳細な位置情報を捉えきれていないという課題がある。
    • 地理空間データ間の関係性をモデル化するための,高解像度な位置情報に基づく表現を獲得することを目指す。
    • 提案手法GAIRは,空撮画像,ストリートビュー画像,位置情報メタデータを統合的に学習する。
    • 暗黙的ニューラル表現(INR)モジュールを用いることで,地理空間データを位置情報に基づいて整合させる。
    • 9つの地理空間タスクにおける評価で,最先端のgeo-foundationモデルや他の自己教師あり学習手法を上回る性能を示した。

    Link: https://arxiv.org/abs/2503.16683

  • 効率的な音声チャットボットアシスタントのための推測的ターン終了検出器 [cs.CL, cs.AI, cs.LG, cs.SD, eess.AS]目的:ターン終了検出の精度向上
    • 近年のLLMの発展により音声対話システムが進化している。自然な会話を実現する上で重要である。
    • ターン終了の判断が難しく,誤ったタイミングで応答が来て会話の流れを阻害する問題がある。
    • 効率性と精度を両立するリアルタイムなターン終了検出手法を開発し,会話の円滑化を目指す。
    • 初のターン終了検出用公開データセット「ETD Dataset」を構築した。
    • 軽量なGRUモデルと高性能なWav2vecモデルを組み合わせた「SpeculativeETD」を提案した。
    • 提案手法は,計算量を抑えつつターン終了検出の精度を大幅に向上させることを実験で示した。

    Link: https://arxiv.org/abs/2503.23439

  • 認識スキル:知識と忘却についての推論 [cs.AI, cs.CC, cs.LO]目的:知識の獲得と忘却のダイナミクスを捉える認識論理
    • 知識とその変化は,AIやマルチエージェントシステムにおける意思決定に不可欠である。
    • 既存の認識論理では,知識の獲得と忘却を統一的に扱う枠組みが不足している。
    • 知識獲得と忘却のプロセスを定量的にモデル化し,認識能力を評価する手法を提供する。
    • 本研究では,知識更新に伴う認識能力を「認識スキル」という指標で表現する重み付きモデルを提案する。
    • 知識獲得はスキルの向上,忘却はスキルの低下としてモデル化し,「知得可能性」「忘却可能性」の概念を導入した。
    • モデル検査や充足可能性問題の計算複雑性を分析し,理論的基盤と実用的な含意を明らかにした。

    Link: https://arxiv.org/abs/2504.01733

  • AgentDynEx:マルチエージェントシミュレーションのメカニズムとダイナミクスの誘導 [eess.SY, cs.SY, math.OC, cs.MA, cs.AI, cs.HC]目的:マルチエージェントシミュレーションにおけるメカニズムとダイナミクスの設定支援
    • 複雑な人間行動や相互作用をモデル化する上で,マルチエージェントシミュレーションの重要性が高まっている。
    • シミュレーションのメカニズムを維持しつつ,顕著で創発的なダイナミクスを生み出すことが困難である。
    • 意図した結果からの逸脱を抑制しつつ,複雑なメカニズムとダイナミクスを維持する手法の確立。
    • AgentDynExは,ユーザーが指定したメカニズムとダイナミクスに基づき,シミュレーションの設定を支援するAIシステムである。
    • 「nudging(誘導)」という手法を導入し,シミュレーションの進行状況を動的に監視し,必要に応じて穏やかに介入する。
    • 技術評価の結果,nudgingにより,メカニズムが複雑化し,顕著なダイナミクスが維持されることが示された。

    Link: https://arxiv.org/abs/2504.09662

  • 連合学習クライアントにおける敵対的観測を用いたリモートRowhammer攻撃 [cs.LG, cs.AI, cs.CR]目的:連合学習におけるサーバーメモリに対するリモートRowhammer攻撃の実現可能性
    • 連合学習は,大規模な分散データを用いたAIモデルの学習を可能にする重要な技術である。
    • 従来のFLセキュリティ研究はデータプライバシーに重点を置いており,サーバーへのクライアントからの攻撃は未解明である。
    • 本研究は,クライアントの観測を操作することでサーバーのメモリを遠隔から攻撃する手法を提示する。
    • 敵対的学習エージェントを用いて,サーバーモデルにおいて約70%の反復更新率を達成し,DRAM上のビット反転を誘発することに成功した。
    • サーバーへのバックドアアクセスなしに,リモートRowhammer攻撃が実現可能であることを実証した。
    • 本研究は,連合学習におけるセキュリティ対策とハードウェア設計の改善に向けたさらなる研究の道を拓く。

    Link: https://arxiv.org/abs/2505.06335

  • LLMに基づくマルチエージェント協調のための包括的最適化フレームワークOMAC [cs.SC, math.AG, math.CO, cs.MA, cs.AI, cs.LG]目的:LLMベースのマルチエージェントシステムの包括的最適化
    • 大規模言語モデルの進化により,複雑なタスクにおけるエージェントの能力が飛躍的に向上しているため。
    • LLMベースのマルチエージェントシステムの設計と最適化に関する体系的な研究が不足している。
    • マルチエージェントシステムの機能と協調構造を包括的に最適化する手法を確立すること。
    • OMACフレームワークは,エージェントの機能と協調構造の5つの最適化次元を特定した。
    • セマンティック初期化子とコントラスト比較器を用いるアルゴリズムにより,各次元の最適化を実現した。
    • コード生成,算術推論,汎用推論タスクにおいて,最先端の手法を上回る性能を示した。

    Link: https://arxiv.org/abs/2505.11765

  • 敵対的パトロールゲームにおける有限メモリ戦略のためのメモリ割り当て [cs.AI]目的:敵対的パトロールゲームにおける防御側の戦略最適化
    • セキュリティゲームは,資源配分やリスク管理など,様々な分野で応用が期待されている。
    • 有限メモリ戦略は有効だが,適切なメモリサイズの割り当てが手動で行われる必要があり,効率が悪い。
    • 自動的に最適なメモリ割り当てを行う手法を開発し,有限メモリ戦略の実用性を向上させる。
    • 提案手法は,既存の戦略最適化ツールと組み合わせて利用できる汎用性を持つ。
    • 様々なパトロールモデルの実験において,提案手法の堅牢性と有効性が確認された。
    • 本研究により,有限メモリ戦略の適用範囲が広がり,セキュリティゲームの解決に貢献する。

    Link: https://arxiv.org/abs/2505.14137