arXiv雑要約
AI - 2026/05/04 公開
非パラメトリック2D形状に対するHelmholtz方程式演算子のDeepONetによる学習 [cs.NI, cs.LG]目的:非パラメトリック2D形状におけるHelmholtz方程式の解法
- 工学・科学分野において,複雑な形状を持つ領域における波動現象のシミュレーションは重要である。
- 従来の数値解析手法は,形状変更のたびにメッシュ再生成が必要で,計算コストが高いという課題がある。
- DeepONetを用いて,形状と散乱場の関係を学習し,効率的な波動シミュレーションを実現すること。
- 本研究では,DeepONetを用いて形状情報を学習し,FEMに匹敵する精度で散乱場を予測できることを示した。
- 学習済みのネットワークは,未知の形状に対しても高い汎化性能を示し,再メッシュの必要性を回避できる。
- 提案手法は,FEMと比較して計算コストが低く,効率的な波動シミュレーションを可能にする代替モデルとなる。
予算制約下の組合せ多腕バンディットにおける Shapley 値による公正性の確保 [cs.LG, cs.AI, cs.MA]目的:予算制約下の組合せ多腕バンディット問題における公正性の評価基準とアルゴリズム
- 機械学習の応用範囲拡大に伴い,意思決定の公平性に対する要請が高まっている。
- 多腕バンディット問題では,報酬の偏りにより不公平な結果が生じる可能性がある。
- 個々の腕の貢献度を定量化し,公正な資源配分を実現することを目指す。
- 本研究では,組合せ多腕バンディット問題における公平性を評価する新たな指標として,$K$-Shapley 値を導入した。
- 提案アルゴリズム K-SVFair-FBF は,未知の評価関数下で $K$-Shapley 値を適応的に推定し,公平性を考慮した学習を実現する。
- 理論的解析により,K-SVFair-FBF が $O(T^{3/4})$ の公平性後悔限界を持つことを示した。実験結果からも,既存手法より優れた性能が確認された。
指向性ソーシャル・リガード:オンラインメディアにおける標的型支持,反対,支援,危害,および被害の顕在化 [cs.CL, eess.SY, cs.SY, cs.CL, cs.AI]目的:オンラインメディアにおける標的型感情の分析手法
- ソーシャルメディアは社会情勢に大きな影響を与えるため,その感情分析は重要である。
- 従来の感情分析はテキスト全体の感情しか評価できず,標的と感情の方向性を特定できない。
- テキスト内の感情の標的を特定し,その感情の方向性を多角的に評価することを目指す。
- 提案手法DSRは,テキスト内の感情の対象を特定し,道徳的距離感とフレーミングに基づいた3つの軸で感情を評価する。
- DSRデータセットの構築戦略と,スパンレベルの感情スコアリングのためのTransformerアーキテクチャを提示した。
- 既存のソーシャルサイエンスデータセットを用いた検証により,DSR出力と既存ラベル・トピックとの間に有意な相関が認められた。
観察可能なパフォーマンスはシステムの組織構造を完全に反映しない:咬合拘束下における歩行ダイナミクスの多層的分析 [cs.LG, q-bio.NC]目的:咬合拘束下における歩行ダイナミクスのシステムレベル応答
- 生体力学的システムにおいて,パフォーマンス評価はシステム理解の基礎となる。
- 出力指標と内部システム状態の対応関係が必ずしも明確ではない。
- システムの組織構造と観察可能なパフォーマンスの乖離を明らかにすること。
- 観察可能なパフォーマンスが同程度でも,状態空間および潜在空間における組織構造が異なる場合がある。
- 集約的な指標のみでは,システムの複雑な状態を捉えきれない可能性が示唆された。
- 本研究は,制約下にあるシステムの多層的な分析手法を提案する。
GeoContra: 流暢なGISコードから検証可能な空間分析へ – 地理に基づいた修正による実現 [cs.SE, cs.AI]目的:LLM駆動型Python GISワークフローの検証と修正
- GIScienceでは,座標の意味,トポロジー,単位,地理的な妥当性を維持することが重要である。
- 現在のLLMベースのGISシステムは流暢なスクリプトを生成するが,大規模な地理的規則の適用が課題である。
- 地理的規則に違反する結果を検出し,修正することで,空間分析の信頼性を高める。
- GeoContraは,空間分析タスクを「地理空間コントラクト」として表現し,検証と修正を行う。
- DeepSeek-V4では空間分析の正答率を47.6%から77.5%へ,Kimi-K2.5では57.7%から81.5%へ向上させた。
- 11のオープンモデル全体では,平均正答率が26.6%向上し,地理的に無効な結果を捕捉することに貢献した。
連続制御のためのコサイン類似度を用いた状態行動価値幾何形状学習:SAVGO [cs.LG]目的:状態行動価値の幾何構造の学習
- 強化学習のサンプル効率向上において,表現学習と類似度学習は重要である。
- 行動空間における直接的な方策更新への活用が限られている。
- 価値に基づく類似性を明示的に方策更新に組み込むことで改善を目指す。
- 提案手法SAVGOは,類似した行動価値を持つ状態行動ペアを高コサイン類似度で,異なるペアを異なる方向にマッピングする埋め込み空間を学習する。
- 学習された幾何構造を活用し,候補行動の類似度カーネルを生成し,勾配ベースの更新を超えた高価値領域への方策改善を誘導する。
- 表現学習,価値推定,方策最適化を単一の幾何学的整合性のある目的関数に統合し,オフポリシーアクタークリティック学習のスケーラビリティを維持する。
LVLMのKVキャッシュを軽量化する [cs.CV, cs.AI, cs.LG]目的:大規模ビジョン言語モデルにおけるKVキャッシュサイズの削減
- LVLMは画像とテキストを連携させるため,多様な応用が期待されている分野である。
- KVキャッシュはメモリ使用量が多く,LVLMの効率的な推論のボトルネックとなっている。
- テキストプロンプトを活用し,冗長な視覚トークンを圧縮することでKVキャッシュを軽量化する。
- LightKVは,元の視覚トークン数の55%でKVキャッシュサイズを半分に削減できる。
- 計算量を最大40%削減し,既存手法よりも優れた性能を維持する。
- MMEやSeedBenchを含む8つの公開ベンチマークデータセットで有効性が確認された。
RAGチャットボットがバックエンドを露呈する場合:患者向け医療AIにおけるプライバシーとセキュリティリスクの匿名化ケーススタディ [cs.CR, cs.AI, cs.CL]目的:患者向け医療RAGチャットボットのセキュリティ評価と,安全な展開のためのガバナンス教訓
- 医療分野におけるAI活用は,患者へのアクセス向上と情報提供の質改善に不可欠である。
- RAGチャットボット開発の容易さとは裏腹に,セキュリティ,プライバシー,ガバナンスの確保が課題となっている。
- 患者の機密情報を保護しつつ,安全な医療AIの導入・運用を実現するための対策を明らかにすること。
- LLM支援による脆弱性特定の結果,システム設定やRAG構成がクライアント・サーバー間の通信で露出していることが判明した。
- ブラウザの開発者ツールを用いることで,システムプロンプト,モデル設定,APIスキーマ,会話履歴など,機密情報が容易に収集可能であることが確認された。
- プライバシーポリシーに反し,認証なしで完全な会話記録(健康関連の質問を含む)が取得できるという重大な問題が明らかになった。
RunAgent:制約ガイド付き実行による自然言語計画の解釈 [cs.LG, cs.CL, cs.MA]目的:自然言語計画の解釈と制約に基づいた実行
- 複雑な問題解決において,人間は計画に基づき行動する。LLMの活用が期待される。
- LLMは構造化されたワークフローの実行において信頼性に欠けるという課題がある。
- 自然言語計画の解釈と実行を可能にし,LLMの信頼性を向上させる。
- RunAgentは,自然言語の表現力とプログラミングの決定論性を組み合わせた。
- タスクとインスタンスの説明から制約を自動的に導き,検証する機能を持つ。
- Natural-planとSciBenchデータセットにおいて,既存手法を上回る性能を示した。
検証駆動型LLMワークフローによる統計チャートの生成 [cs.LG]目的:統計チャート生成のためのLLMベースの構造化ワークフロー
- データ可視化は,データ分析や情報伝達において不可欠であり,その重要性は高まっている。
- LLMによる統計チャートの自動生成は困難であり,生成後の検証が不可欠である。
- 視覚的な検証を取り入れることで,可読性や意味のずれといった課題を解決する。
- 提案手法は,UCIデータセットを用いて,74データセットから1,500のチャートと30,003の質疑応答ペアを生成した。
- 16種類のマルチモーダルLLMに対する評価により,チャート構文に関する質問はほぼ飽和状態にあることが示された。
- 一方で,値の抽出,比較,推論は依然として課題であり,このワークフローがマルチモーダル推論の診断に役立つことが示された。
コーディングエージェントは計算材料科学の知見を再現できるか [cs.SE, cs.AI, cs.CL]目的:計算材料科学における主張の再現能力の評価
- 科学研究の再現性は,知見の信頼性を保証し,科学的進歩の基盤となる。
- 計算科学では,実験手順の詳細な記述が不足し,再現が困難な場合がある。
- LLMベースのエージェントの計算科学における再現能力の限界を明らかにすること。
- AutoMatベンチマークを用いてLLMベースのエージェントの性能を評価した結果,成功率は54.1%にとどまった。
- 特に,論文のテキストのみからワークフローを再構築する場合に性能が低下し,不完全な手順や方法論の逸脱が主な原因であった。
- AutoMatは,計算科学における再現性の評価基準として,またAIを活用した科学研究におけるエージェントシステムの課題特定ツールとして活用できる。
持続的な視覚記憶:LVLMにおける深層生成のための知覚維持 [cs.CV, cs.AI]目的:深層生成における持続的な視覚知覚の確保
- 大規模ビジョン言語モデルはマルチモーダルタスクで高い性能を示すが,生成長が長くなるほど視覚情報が希薄になる課題がある。
- 生成シーケンス長が長くなるにつれて,視覚への注意力が減衰し,モデルの性能が低下する。
- 視覚情報の減衰を抑制し,長文生成においても安定した視覚知覚を実現すること。
- 提案手法PVMは,LVLMに組み込むことで,わずかなパラメータ増加で視覚的精度を大幅に向上させる。
- PVMは,生成長による視覚信号の減衰に強く,内部予測の収束を加速させる。
- Qwen3-VLモデルを用いた実験で,4Bおよび8Bスケールにおいて一貫した精度向上が確認された。
HyCOP:解釈可能な偏微分方程式学習のためのハイブリッド合成演算子 [cs.CL, cs.CE, cs.LG, cs.NA, math.NA]目的:偏微分方程式の解演算子を学習するためのモジュール型フレームワーク
- 偏微分方程式は科学技術の根幹であり,高精度な解法が求められている。
- 従来のニューラル演算子はブラックボックス化しやすく,汎化性能に課題があった。
- 解釈性と汎化性能を両立する,新しい偏微分方程式解法を開発する。
- HyCOPは,アドベクション,拡散,学習されたクロージャなどの単純なモジュールを合成することで,解演算子を学習する。
- 実験の結果,HyCOPは既存のニューラル演算子と比較して,大幅に高い外挿性能を示した。
- HyCOPは解釈可能なプログラムを生成し,モジュール単位での知識転移を可能にする。
多岐にわたるLLM思考における制約遵守:モデルは違反内容を思い出す [cs.CL, cs.AI]目的:多岐にわたるLLMによる思考支援における制約遵守の評価
- 研究開発において,LLMを活用したアイデア創出の重要性が増している。
- LLMは,対話が進むにつれて当初の目的からの逸脱や制約違反を起こしやすい。
- 本研究は,LLMが制約を遵守しているかを定量的に評価し,その課題を明らかにする。
- 評価ベンチマークDriftBenchを用いて,複数のLLMの制約遵守率を分析した結果,反復的な対話により制約違反が増加することが示された。
- モデルは制約内容を正確に記述できるにもかかわらず,実際には制約に反するアイデアを生成することが多い(KBV率8%〜99%)。
- 中間チェックポイントの設定はKBV率の軽減に一部効果があるものの,制約違反と記述内容の乖離は解消されない。
平均場パス積分拡散:サンプルから相互作用エージェントへ [math.OC, cs.AI, stat.ML]目的:確率質量をより効率的に輸送するためのサンプル間の協調
- 近年のAI生成モデルにおいて,独立したサンプル生成が主流であるが,集団統計の共有による協調が効率向上に繋がる可能性。
- 既存手法では,エージェント間の相互作用を考慮した確率輸送の効率的な枠組みが存在しない。
- 相互作用するエージェントによる確率輸送を可能にする新しいフレームワークを提案し,エネルギーシステム制御への応用を目指す。
- 平均場パス積分拡散(MF-PID)は,サンプルを相互作用エージェントとして捉え,集団密度に基づいてドリフトを自己整合的に決定する。
- 特定の条件下では,無限次元の平均場システムが有限個のリッカート方程式と線形常微分方程式に簡約され,解析的な解が得られる。
- エネルギーシステムの需要応答制御において,MF-PIDは独立エージェントベースラインと比較して,累積制御エネルギーを19~24%削減し,正確な終端分布を実現した。
TimeRFT:強化学習による時系列予測モデルの汎化性能向上 [eess.SP, cs.AI, cs.CV, cs.LG]目的:時系列予測モデルの汎化性能向上
- 時系列データは経済,気象,医療など広範な分野で重要であり,正確な予測は不可欠である。
- 既存のモデルは,時系列データの非定常性により,学習データとテストデータ間の分布のずれに弱く,汎化性能が低下しやすい。
- 本研究は,強化学習による微調整で,分布のずれに対するロバスト性とデータ不足状況下での汎化性能を改善することを目指す。
- TimeRFTは,予測精度を向上させるための時系列データに対する報酬メカニズムと,汎化性能の高いデータ選択戦略を導入した。
- 実験の結果,TimeRFTは様々な実世界の予測タスクにおいて,従来の教師あり微調整法を上回る性能を示した。
- TimeRFTは,予期せぬ分布の変化に対して,予測精度と汎化性能を向上させることが確認された。
MoDAl:音声ニューロプロテーゼのためのデコレーションによる自己教師ありニューラルモダリティ検出 [q-bio.NC, cs.CL, cs.HC, cs.LG]目的:補完的なニューラルモダリティの検出
- 失語症患者のコミュニケーション回復に貢献する音声ニューロプロテーゼ研究は重要である。
- 従来のニューロプロテーゼは運動皮質に集中し,ブローカ野などの言語情報を活用できていない。
- デコレーション損失を導入し,多様なニューロ言語モダリティを検出することを目指す。
- MoDAlは,Brain-to-Text Benchmark '24において,これまでの最良手法と比較して単語誤り率を26.3%から21.6%に低減した。
- 特に,これまで利用されていなかったブローカ野44領域の信号の組み込みが,デコレーション機構によってWER改善に貢献した。
- 検出されたモダリティの解析から,44領域入力エンコーダは文構造や構文的特性を捉えることが示された。
その行で間違いないか?:読眼球運動データにおける信頼度に基づくリアルタイム行割り当て手法 [q-bio.NC, cs.AI, cs.HC, cs.LG, eess.IV]目的:読眼球運動データにおける行割り当ての信頼度評価
- 読眼球運動データは,認知プロセス理解に不可欠であり,教育やユーザビリティ評価に貢献する。
- リモート眼球追跡ではノイズが多く,行の割り当てが困難であり,リアルタイム支援の精度が課題である。
- 信頼度に基づき,不確実性の高い場合は行割り当てを遅延させることで,リアルタイム行割り当ての精度向上を目指す。
- 提案手法CONF-LAは,既存のデータセットで安定した性能を示し,オフライン分析との差を最小限に抑えた(1-2%)。
- 特に回帰運動に対して頑健性を示し,小児データにおいて既存手法を上回る高い精度(約95%)を達成した。
- 本研究は,信頼度に基づく行割り当ての有効性を示唆し,今後の発展の可能性を示唆する。
RETO:自動車空気力学の高精度予測のための回転強化Transformerオペレーター [eess.IV, cs.LG]目的:自動車空気力学の高精度予測手法
- 自動車設計において,迅速な空気力学的評価は不可欠であり,性能と効率に大きく影響する。
- 従来のニューラルオペレーターは,複雑な空間相関を捉える能力に限界があり,予測精度が課題となる。
- RETOは,空間認識メカニズムを強化し,高精度な自動車空気力学予測を実現する。
- RETOは,ShapeNetにおいて,相対$L_2$誤差0.063を達成し,既存手法を大きく上回った。
- DrivAerMLデータセットでは,表面圧力および速度の誤差がそれぞれ0.089と0.097であり,Transolverと比較して精度が向上した。
- 情報理論的分析により,RETOの注意メカニズムが局所的な勾配を維持し,拡散を抑制することが示された。
CRC-Screen:分類学的変化下におけるDNA合成ハザードの認定スクリーニング [q-bio.GN, cs.AI]目的:DNA合成注文のハザードスクリーニング手法の開発
- バイオセキュリティの観点から,危険なDNA配列の不正合成を防止することが重要である。
- 既存のスクリーニング手法は,参照データベースに存在しないハザードシーケンスに対しては誤検知率が非常に高いという問題がある。
- 分類学的変化に対応し,ハザードシーケンスの誤検知を抑制する高精度なスクリーニング手法を確立することを目指す。
- 本研究では,DNA合成注文の公開アノテーションから得られる3つの信号(k-mer類似度,LLM判定,埋め込みベクトル類似度)を組み合わせたスクリーナーを開発した。
- Conformal Risk Controlによる較正を行うことで,検知漏れ率をα以下に保証し,UniProt KW-0800毒物データセットにおいて,高い精度を実現した。
- 認定可能なDNA合成スクリーニングにおける制約は,アルゴリズムではなく,較正データ量であると結論付けられた。
量子学習のための証明可能かつスケーラブルな量子ガウス過程 [quant-ph, cs.LG, stat.ML]目的:量子システムの学習のためのベイズ的枠組み
- 量子機械学習は急速に進展しているが,シンプルさ,解釈可能性,スケーラビリティに課題がある。
- 既存のアプローチには限界があり,量子データに適した学習フレームワークが不足している。
- 量子データに対する回帰,分類,ベイズ最適化を可能にするフレームワークを提示する。
- 量子ガウス過程は,量子変換に対する事前分布を定義することで,量子システムの学習を可能にする。
- 特定の条件下では,ユニタリ量子確率過程がガウス過程を定義し,物理に基づいた誘導バイアスを注入する。
- matchgate進化は,証明可能かつスケーラブルな量子ガウス過程を生み出し,長距離外挿や量子センシングで高い性能を示す。
量子機械学習モデルの効率的なミューテーションテスト [quant-ph, cs.LG]目的:量子機械学習モデルのバグや欠陥の検出
- 量子機械学習は,古典モデルよりも少ないパラメータで複雑な特徴を学習可能であり,重要性が増している。
- 量子機械学習モデルの複雑化に伴い,実装が設計仕様を満たしているかの検証が課題となっている。
- ミューテーションテストを用いて,設計仕様を満たさない量子回路の欠陥を効率的に特定することを目指す。
- 本研究では,従来の技術と比較して効率的なフォールト挿入のための新しいミューテーション演算を定義した。
- また,冗長なミュータント回路を削減するための指向性ミューテーション生成技術を提案した。
- 実験評価の結果,提案手法はより多様で代表的なミュータント集合を生成し,従来の技術では検出できなかったフォールトを効果的に検出することが示された。
ニューラルネットワークに対する適応的ノルムベース正則化 [stat.ML, cs.LG, stat.AP]目的:ニューラルネットワークにおけるノルムベース正則化手法の改良
- 機械学習の性能向上には,過学習の抑制が不可欠であり,正則化は重要な役割を果たす。
- 従来のノルムベース正則化は,特徴量間の依存関係を考慮していない場合がある。
- 特徴量間の依存関係を考慮した正則化手法を開発し,予測性能とモデルの複雑さの制御を改善する。
- 提案手法は,シミュレーション実験と実際のデータセットにおいて,従来の正則化手法よりも優れた予測性能を示した。
- 特に,特徴量間に相関がある場合や高次元データに対して,効果的な複雑さの制御が可能となった。
- 建物冷却負荷予測と白血病細胞タイプ分類という二つの実データ応用において,その有効性が確認された。
SHIFT:重い裾を持つ汚染下における平均用量反応関数のためのロバストな二重機械学習 [physics.data-an, cond-mat.mtrl-sci, cs.MS, stat.ML, cs.LG]目的:平均用量反応関数のロバストな推定
- 因果推論において,用量反応関数の正確な推定は重要な課題である。
- 既存の二重機械学習は,外れ値の影響を受けやすく,推定の信頼性が損なわれる場合がある。
- 外れ値の影響を軽減し,よりロバストな推定を可能とする手法の開発が求められる。
- SHIFTは,外れ値を含むデータに対しても,既存手法に比べて大幅にRMSEを低減することを示した。
- 外れ値のマスクの再現性も高く,真の異常値を正確に識別することが可能である。
- 提案手法と他の手法の選択には,極値理論に基づく診断ツールが有効であることが示された。
鳥のさえずりからうなり声まで:異種埋め込みによるゾウの鳴き声の分類 [eess.AS, cs.LG, cs.SD, q-bio.QM]目的:ゾウの鳴き声の分類
- 生物音響学は,動物行動や生態系の理解に不可欠であり,その重要性は増している。
- 生物音響データのラベル付けは高コストであり,十分なデータが得られない場合が多い。
- ラベル付けされたデータが少ない状況下でも,精度の高い分類を可能にすること。
- 事前学習済みの音響埋め込みは,エンドツーエンドの教師ありニューラルネットワークに匹敵する分類精度を達成した。
- Perch 2.0は,アフリカゾウでAUC 0.849,アジアゾウでAUC 0.936という最も高い交差検証分類性能を示した。
- wav2vec2.0とHuBERTの2層目は,効果的なゾウの鳴き声の分類に必要な情報量をエンコードしていることが示された。
拡散モデルとフローモデルにおけるファインチューニングとサンプリングの一元的な視点 [stat.ML, cs.LG, math.OC]目的:拡散モデルとフローモデルを用いたターゲット分布からのサンプリング
- 生成モデルは,画像生成等の分野で急速に発展しており,その応用範囲は広い。
- 既存手法では,非正規化密度からのサンプリングや事前学習モデルの報酬によるファインチューニングが困難である。
- 本研究は,指数関数的傾きを用いたターゲット分布からの効率的なサンプリング手法を確立する。
- Adjoint Matching/SamplingとNovel Score Matchingは有限の勾配分散を持つことが示された。
- Lean Adjoint ODEのノルムに関する理論的な限界が導かれ,Adjointベース手法の有効性が支持された。
- CMCDおよびNETS損失関数の適応,並びにCrooksおよびJarzynskiの恒等式の拡張が,指数関数的傾き設定下で検証された。
グラフ拡散のための情報幾何学的適応サンプリング [stat.CO, cs.DC, cs.MM, stat.ML, cs.CV, cs.LG]目的:グラフ拡散モデルにおけるサンプリング戦略
- 複雑なグラフ構造の生成は,創薬やソーシャルネットワーク分析等,多岐にわたる分野で重要である。
- 従来の拡散モデルは均一な時間ステップを用いるため,分布の変化が非均一な多様体上では効率が低下する。
- 情報幾何学に基づき,分布の変化率を考慮した適応サンプリングにより,生成効率と構造の忠実性を向上させる。
- 本研究では,サンプリング軌跡をリーマン多様体上の曲線と捉え,Fisher-Rao計量に基づく Drift Variation Score (DVS) を導入した。
- DVS は,統計多様体上での情報速度を一定に保つことで,各離散化ステップが均等に情報速度に寄与するよう制御する。
- 分子やソーシャルネットワークの生成実験により,DVS が構造の忠実性とサンプリング効率を大幅に改善することが示された。
AI駆動による合成プロトコル・特性相関を通じた材料発見の革新 [cond-mat.mtrl-sci, cs.AI]目的:AI駆動による合成プロトコルと特性の関係に基づく材料発見のパラダイムシフト
- 材料開発は科学技術の進歩に不可欠であり,新しい機能性材料の創出が求められている。
- 既存の構造中心のアプローチでは,合成可能性という課題に直面し,発見された構造の実用化が遅れている。
- 合成プロトコルを主要な設計変数として扱うことで,材料発見の加速と再現性の向上を目指す。
- 本研究では,合成手順を機械可読なプロトコルとして表現し,実行可能な反応経路を提案する。
- 生成モデルと逆設計モデルを活用し,実験データと持続可能性の制約に基づいてプロトコルを最適化する。
- プロトコル(P)から構造(X)そして特性(y)への因果関係(P->X->y)に基づき,自己運転研究所(SDL)との連携戦略を提示する。
高速リサージュ共焦点レーザー内視鏡法におけるマルチフレーム復元 [eess.IV, cs.CV, cs.LG]目的:高速リサージュ共焦点レーザー内視鏡法における画像復元
- 生体組織の迅速な光学生検が求められており,携帯型内視鏡の重要性が高まっている。
- 高速スキャンに伴い,リサージュ走査で未訪問ピクセルが構造的な穴として残るという課題がある。
- リサージュ走査の欠点を克服し,高品質な画像再構成を実現することを目指している。
- 本研究で開発したMIRAは,軽量でありながら,時間的コンテキストを効果的に活用することで,既存手法よりも高い復元品質を達成した。
- MIRAは,特徴再利用と変位整合により,リサージュ共焦点レーザー内視鏡法における画像復元性能を向上させた。
- 計算効率も高く,臨床応用への展開が期待できる。
勾配正則化ニュートンブースティング木:大域的収束性について [stat.ML, cs.LG, math.OC]目的:勾配ブースティング決定木におけるニュートン法に基づく大域的収束性の解析
- 表形式データの機械学習において,勾配ブースティング決定木が主流であり,実用的な性能を示す。
- ニュートン法に基づくブースティングは経験的に成功するものの,その大域的収束性に関する理論的な理解が不足している。
- ニュートン法の弱学習器への適用可能性を検証し,大域的収束性を持つ第二階ブースティングアルゴリズムを確立する。
- 本研究では,制限付きニュートン降下法を導入し,滑らかで強凸な損失関数に対する線形収束率を証明した。
- Lipschitzヘッセ行列を持つ一般的な凸損失関数に対し,勾配正則化ニュートン法を拡張し,$\mathcal{O}(\frac{1}{k^2})$の収束率を確立した。
- 数値実験により,提案手法が収束する一方で,従来のニュートンブースティングが発散する場合があることを示した。
生まれつき適合性のある材料:高度なエネルギー・電子材料の展開のための自律的フレームワーク [cond-mat.mtrl-sci, cs.AI]目的:高度なエネルギー・電子材料展開のための自律的フレームワーク
- エネルギー技術の進歩には,新規材料の発見が不可欠である。材料開発の効率化が求められている。
- 有望な材料システムが,実用化に至らないケースが多い。実験室での性能と産業上の実現可能性の乖離が課題。
- 材料開発初期段階から,製造性,コスト,耐久性を考慮することで,実用化を促進する。
- 本研究では,「生まれつき適合性のある」自律的開発戦略を提案し,多目的評価指標,因果モデル,モジュール型インフラを構築した。
- 製造プロセスを探索ループに組み込むことで,実験室での最適化から産業的実現可能性への移行を支援する。
- このアプローチは,材料開発の効率化と実用化を同時に実現する可能性を示す。
AIペルソナ事前分布を用いた適応的質問 [stat.ML, cs.CL, cs.LG]目的:ユーザー依存的な関心事項の学習
- 個人の特性に合わせた情報収集は,マーケティングや心理測定において重要である。
- 従来の適応的質問法は,仮定の制約や計算コストの高さが課題であった。
- AIペルソナを活用し,高次元かつコールドスタート状況下での効率的な質問を可能にする。
- AIペルソナ事前分布は,正確な確率予測と解釈可能な適応的質問パイプラインを実現した。
- 大規模言語モデルによるペルソナの分布を用いることで,表現力豊かな事前分布を構築できた。
- 合成データとWorldValuesBenchを用いた実験で,提案手法の有効性が確認された。
知識パーソナライズによる医療連合学習における汎化と個別化への対処:FedKPer [eess.IV, cs.LG]目的:医療連合学習における汎化と個別化のトレードオフ改善
- 医療データの共有が困難なため,連合学習が有望な手法として注目されている。
- 医療機関間の統計的異質性が大きく,モデルの汎化性能と個別化性能を両立することが課題である。
- 知識パーソナライズにより,統計的異質性の影響を軽減し,汎化と個別化のバランスを取る。
- 提案手法FedKPerは,各ローカルデバイスでの知識パーソナライズと,信頼性の高いラベル多様なローカル更新を重視するグローバルモデル集約により,汎化と個別化のトレードオフを改善する。
- 従来の忘却の一般的な影響を示す指標を追加して評価した結果,FedKPerは保持率を損なうことなく,汎化・個別化性能を向上させることを実証した。
分散型近接確率的勾配ランジェバン動力学 [stat.ML, cs.LG, math.PR]目的:対数凹型確率分布からのサンプリング
- 統計的推論や機械学習において,確率分布からの効率的なサンプリングは重要な課題である。
- 大規模データや分散環境において,集中型MCMC法の計算コストが課題となっている。
- 制約付き凸領域における分散型サンプリング手法を確立し,計算効率を向上させる。
- 提案手法DE-PSGLDは,2-Wasserstein距離における非漸近収束性を持つことが示された。
- DE-PSGLDは,正則化されたギブス分布へ収束し,近接近似によるバイアスを定量化した。
- 合成データおよび実データを用いた評価により,DE-PSGLDが高速な事後集中と高い予測精度を示すことが確認された。
ランダムな部分空間ネステロフ加速勾配法 [math.OC, cs.LG, stat.ML]目的:滑らかな凸および滑らかな強凸最適化における計算量の理論的保証
- 機械学習等の最適化問題において,計算コスト削減が重要課題となっている。
- 低次元投影勾配情報のみを用いる部分空間法では,加速手法の理論的保証が難しかった。
- 行列滑らかさ条件下の部分空間ネステロフ加速勾配法を開発し,計算量改善を目指す。
- 本研究では,行列滑らかさとスケッチ分布が計算量に与える影響を明確にした。
- 提案手法は,従来のネステロフ加速法よりも計算量が改善する場合があることを示した。
- 部分空間法と全次元法を比較するための統一的な基盤を提供した。
量子ニューラルネットワークの確証的学習のための量子区間境界伝播 [quant-ph, cs.LG]目的:量子ニューラルネットワークの確証的学習手法
- 量子機械学習は,データセットの特徴を効率的に学習し,分類などのタスクを実行する有望な分野である。
- 古典機械学習における確証的学習は重要だが,量子領域における確証的学習の手法は限られている。
- 量子領域における確証的学習を確立し,敵対的摂動に対するモデルの精度を保証することを目的とする。
- 提案手法である量子区間境界伝播(QIBP)により,量子ニューラルネットワークを確証的に学習できることを示した。
- 区間演算とアフィン演算の2つの実装を比較し,精度と設計上の考慮事項のトレードオフを評価した。
- 確証的に学習されたモデルは,訓練された敵対的ロバスト性境界内のサンプルに対して正しいクラスを予測することが保証された。
知覚的注意ネットワークを用いたリアル臨床低線量肝CTの教師なしノイズ除去 [eess.IV, cs.AI, cs.CV]目的:低線量CT画像のノイズ除去
- 医療画像処理は臨床研究を支援する上で不可欠であり,深層学習の発展により精度向上が期待されている。
- 低線量CTは被ばく量を減らせる一方,ノイズが増加し,医師の診断を妨げる可能性がある。
- 教師なし学習により,臨床データの直接利用が困難な問題を解決し,ノイズ除去性能を向上させる。
- 提案手法は,U-Net構造,注意機構,残差ネットワークを組み合わせた,エンドツーエンドの教師なしフレームワークである。
- 知覚的損失を導入することで,医療画像の特徴を考慮したノイズ除去を実現している。
- 実験結果は,画像ベースの評価指標と医療評価基準の両方において,良好な性能を示し,臨床ニーズを満たすことが確認された。
テンソル化ニューラルネットワークおよびテンソルネットワークアルゴリズムに対する部分ノルムを用いた効率的な有限初期化 [cs.DM, math.CO, cs.LG, quant-ph]目的:テンソル化ニューラルネットワーク及びテンソルネットワークアルゴリズムの層初期化手法
- テンソルネットワークは,高次元データの効率的な表現を可能にし,機械学習等の分野で重要性が増している。
- テンソルネットワークの学習は,ノルムの発散やゼロノルムに起因する不安定性を抱える場合がある。
- 部分ノルムを利用し,発散やゼロノルムを引き起こしたノルム値で正規化することで安定性を向上させる。
- 本手法は,テンソルネットワークのサブネットワークのノルムを反復的に利用することで,計算効率を高めている。
- MPS/TTやMPO/TT-M層への適用実験から,ノード数,結合次元,物理次元に対するスケーリング特性が確認された。
- 中間計算の再利用により,計算コストの削減を実現している。
転移可能な表現学習のための値明示事前学習 [cs.LG, cs.RO]目的:転移強化学習のための汎用的な表現学習
- 視覚強化学習における環境変化への適応は重要課題である。汎用的な表現学習が求められている。
- 既存の事前学習手法では,必ずしもタスクを解決できる質の高いデータが必要となる。
- サブオプティマルな未ラベルデータを用いた,タスクの目標を捉えた表現学習を実現する。
- 提案手法VEPは,Ant locomotion,ナビゲーションシミュレーター,Atariベンチマークで既存の最先端事前学習手法を上回った。
- 報酬が最大で2倍,サンプル効率が最大で3倍向上した。
- モンテカルロ価値推定に基づき,タスクの進行を反映した時間的に滑らかな表現を獲得した。
クープマン作用素支援強化学習 [cs.AI, cs.LG, math.DS, math.OC]目的:非線形システムの強化学習における最適価値関数推定
- 強化学習は,複雑な制御問題に応用可能な強力な手法である。
- 高次元または非線形システムでは,ベルマン方程式が解けなくなる。
- クープマン作用素を用いて,非線形システムを線形化し,解法を可能にする。
- 提案手法は,従来のニューラルネットワークベースの手法と比較して,線形状態空間システムなどで最先端の性能を達成した。
- クープマン作用素を活用することで,非線形システムのダイナミクスを近似的に線形化し,価値関数の期待時間発展を捉えることが可能になった。
- 制御作用素をパラメータ化することで,最適価値関数の推定を促進する「制御クープマンテンソル」を構築した。
差別検証における比較対象の再検討 [cs.LG]目的:差別検証における比較対象の役割
- 差別検証は,公正な社会を実現するために不可欠であり,法的・倫理的な観点から重要である。
- 従来の比較対象の選択基準は理想化され過ぎており,現実の状況を反映していない場合がある。
- より現実的な比較対象を定義し,機械学習を用いて差別検証の精度向上を目指す。
- 本研究では,比較対象を「全てが等しいまま(ceteris paribus)」とする従来の基準に加え,「適切な調整を加えた(mutatis mutandis)」基準を導入する。
- 「適切な調整を加えた」比較対象を用いることで,保護属性以外の属性が異なる場合でも差別検証が可能になる。
- 機械学習を活用することで,「適切な調整を加えた」比較対象の算出が現実的となり,差別検証の新たな可能性が開かれる。
離散コサイン変換に基づく非相関注意機構:ViT向け [cs.CV, cs.LG, eess.SP]目的:Vision Transformerにおける効率性と性能の向上
- Transformerは画像認識で高い性能を示すが,計算コストが大きい。
- 自己注意機構の学習は,初期化が難しく,計算資源を消費する。
- 離散コサイン変換を用いて,初期化と圧縮による効率化を目指す。
- 離散コサイン変換に基づいた初期化により,CIFAR-10とImageNet-1Kで分類精度が向上した。
- 高周波成分の切り捨てによる圧縮により,計算コストを削減しつつ,同等の性能を維持した。
- 提案手法はSwin Transformerモデルにおいても有効であることが示された。
CollaFuse:協調拡散モデル [cs.LG, cs.AI, cs.CV]目的:分散型協調拡散モデルのトレーニング
- 生成AI分野において,拡散モデルは高品質な画像生成に有効である。
- データ不足,計算コスト,プライバシー保護が課題となっている。
- クライアントの負担を軽減し,効率的な分散学習を実現すること。
- 提案手法CollaFuseは,スプリットラーニングに着想を得た分散型協調学習アプローチである。
- CelebA,CIFAR-10,Animals-with-Attributes2データセットで性能向上と情報漏洩の抑制を実証した。
- エッジコンピューティング等の応用展開に貢献する。
独自のプロンプトを持ち込む:LLMにおけるユースケース固有のバイアスと公平性評価 [cs.CL, cs.AI]目的:LLMのバイアスと公平性評価のための意思決定フレームワーク
- LLMの社会実装が進む中,倫理的な問題への関心が高まっている。
- 既存の評価手法では,LLMの利用状況に応じた適切な評価指標の選定が困難である。
- LLMの利用状況に基づいた,バイアスと公平性評価の体系的な方法論を提示する。
- LLMのユースケースとプロンプトの特性を考慮した評価指標のマッピングフレームワークを提案した。
- 既存のベンチマークパフォーマンスのみでは,公平性リスクを正確に評価できないことが示された。
- このフレームワークの実践的な利用を支援するPythonライブラリ「langfair」を公開した。
制約付きマルコフ決定過程における汎用パラメータ化方策の最終反復収束 [cs.LG, cs.AI]目的:制約付きマルコフ決定過程における汎用パラメータ化方策の学習
- 強化学習は,ロボット制御や資源配分など,様々な分野で重要な役割を担っている。
- 制約付きマルコフ決定過程では,安全性の確保が課題であり,制約を満たしつつ最適な方策を見つけることが難しい。
- 汎用パラメータ化方策を用いることで,複雑な環境にも対応可能であり,効率的な学習を目指す。
- 提案手法であるPDR-ANPGは,エントロピーや二次正則化項を用いて,最終反復におけるε最適性と制約違反εを満たすことを保証する。
- 方策クラスの適合性近似誤差εbiasが存在する場合,サンプル複雑度は$\tilde{\mathcal{O}}(\epsilon^{-2}\min\{\epsilon^{-2},\epsilon_{\mathrm{bias}}^{-\frac{1}{3}}\})$となる。
- 完全な方策クラス(εbias=0)では,サンプル複雑度が$\tilde{\mathcal{O}}(\epsilon^{-4})$となり,既存手法よりも大幅に改善される。
ロバストなシステム同定とパラメータ推定のためのダイナミクス符号化深層学習 [cs.LG, cs.NA, math.DS, math.NA]目的:ロバストなシステム同定とパラメータ推定
- 物理法則の知識は機械学習の性能と解釈性を向上させる上で重要である。
- 動力学系の理論において,動力学の発見とパラメータ推定は未解決問題である。
- 観測データに基づき,システムダイナミクスを予測し,物理パラメータを推定すること。
- 提案手法は,振動およびカオス的ダイナミクスを示すテスト問題において,ノイズを含む観測データからのデータ駆動型モデリング予測において有効性が示された。
- ルンゲ・クッタ法や線形多段階法などの数値スキームの性能比較から,適切な離散化スキームと数値法の次数選択によって,システムダイナミクスの予測と物理パラメータ推定が可能であることが示された。
大規模言語モデルにおけるバイアス:起源,評価,および軽減策 [cs.CE, cs.CL, cs.LG]目的:大規模言語モデルにおけるバイアスの現状と対策
- 自然言語処理の発展に貢献するLLMだが,その公平性が重要視されている。
- LLMにはバイアスが内在しており,不公平な結果を生む可能性がある。
- LLMのバイアスを検出し,軽減するための包括的な知識を提供する。
- LLMのバイアスは,データやモデル自体に内在するものと,外部からの影響によるものに分類できる。
- バイアスの評価手法は,データレベル,モデルレベル,出力レベルの3つの段階で検討されている。
- バイアス軽減策は,モデルの学習前,学習中,学習後の3段階で実施可能であり,それぞれに効果と限界がある。
GNNにおける過剰圧縮と過剰平滑化の緩和に向けたグラフ再配線:サーベイ [cs.LG, cs.AI]目的:GNNにおける情報伝播を改善するためのグラフ再配線技術
- グラフ構造データからの学習に有効なGNNは,様々な分野で応用が拡大している。
- GNNは,遠方ノード情報の過剰圧縮と表現の均一化により,性能が制限される場合がある。
- 本調査は,グラフ再配線を通じて情報伝播を改善し,GNNの性能向上を目指す。
- グラフ再配線技術は,GNNにおける情報伝播を促進し,過剰圧縮や過剰平滑化を緩和する手法である。
- 本サーベイでは,最先端の再配線アプローチの理論的背景,実装,および性能トレードオフを包括的にレビューする。
ローカル学習,グローバル修正:ノイズラベルを持つ連合学習のためのグローバル修正器 [cs.LG, cs.CV]目的:連合学習におけるノイズラベル問題のロバスト性向上
- 連合学習はデータプライバシー保護に貢献するが,現実的なデータ品質が性能に影響する。
- 連合学習では,クライアント間でラベルノイズの種類や割合,データ分布が異なり,問題が悪化する。
- グローバルモデルのノイズラベルに対する緩やかな記憶特性を活用し,ラベルノイズの修正とローカル学習の正則化を行う。
- 提案手法FedGRは,3つのモジュールによりノイズラベルを修正し,ローカル学習を正則化する。
- FedGRは,既存の最先端手法と比較して,厳しいノイズラベル環境下やデータ異質性下でも優れた性能を示す。
- FedGRは,自己完結型のアプローチにより,連合学習のラベルノイズに対するロバスト性を向上させる。
嗜好目標調整:凍結されたポリシーの潜在的制御としての後学習 [cs.AI, cs.LG]目的:タスクの嗜好に合わせた行動分布の調整
- 目標条件付きポリシーは多様な行動を可能にするが,その性能は指示に左右される。
- 離散的なテキスト指示には限界があり,微調整が困難な場合がある。
- 潜在的な制御変数を用いて,凍結されたポリシーの行動を調整する。
- 後学習適応を潜在的制御問題として定式化し,嗜好目標調整(PGT)フレームワークを提案した。
- PGTは,わずかなデータでMinecraft SkillForgeベンチマークにおいて平均72.0%と81.6%の改善を達成した。
- タスクの嗜好と物理ダイナミクスを分離することで,分布外設定でフルファインチューニングを13.4%上回る汎化性能を示した。
