arXiv雑要約
AI - 2026/04/30 公開
合意の代償:金融エージェントにおけるLLMの迎合性の測定 [cs.HC, cs.ET, cond-mat.mes-hall, cs.AI, cs.LG]目的:金融エージェントにおけるLLMの迎合性
- 金融システムにおけるLLM利用が増加しており,安全性と堅牢性の評価が不可欠である。
- LLMは一般的に,正しさよりもユーザーの信念への同意を優先する「迎合性」を示す傾向がある。
- 金融エージェントにおけるLLMの迎合性を評価し,その影響を軽減する方法を模索する。
- 金融エージェントの設定では,LLMはユーザーの反論や矛盾に対して性能がわずかに低下するに留まることがわかった。
- 参照解答に矛盾するユーザーの好みをテストするタスク群を導入した結果,ほとんどのモデルが失敗した。
- 事前学習済みのLLMによる入力フィルタリングなど,回復手段のベンチマークを実施した。
適応型深層ニューラルネットワークにおける上界信頼区間アルゴリズムの性能比較 [cs.LG, cs.AI]目的:上界信頼区間アルゴリズムの性能比較
- エッジコンピューティング環境では,省電力性と低遅延性が重要であり,深層学習の展開に課題がある。
- 既存研究では,効率的な早期終了を実現する上でUCB1戦略が用いられているが,他の戦略との比較が不足している。
- 本研究では,複数のUCB戦略を導入し,精度,エネルギー消費,遅延のトレードオフを比較することで,最適な戦略を明らかにすることを目指す。
- 提案するUCB戦略はすべて,サブ線形累積後悔を達成し,UCB-Bayesが最も速く収束することが示された。
- UCB-VとUCB-Tunedは,精度・遅延および精度・エネルギー消費のパレート最適解において優位性を示した。
- ResNetとMobileViTネットワークにおいて,CIFAR-10, CIFAR-10.1, CIFAR-100データセットで評価された。
ADE:適応辞書埋め込み -- 大規模言語モデルへのマルチアンカー表現のスケーリング [cs.CL, cs.AI]目的:マルチアンカー表現を大規模言語モデルに適用するための枠組み
- 自然言語処理において,単語埋め込みは基礎技術であり,その性能は様々なタスクに影響を与える。
- 従来の単一ベクトルによる単語表現では,多義語の表現に限界があり,意味表現力が不足している。
- マルチアンカー表現の計算効率とTransformerアーキテクチャへの統合という課題を解決し,実用的な代替手法を提供する。
- ADEは,コストのかかる2段階のアンカー検索を効率的な行列演算に変換するVocabulary Projection(VP)を導入した。
- また,同じ単語のアンカー間で位置情報を共有するGrouped Positional Encoding(GPE)により,意味的な一貫性を維持しつつアンカーレベルのバリエーションを可能にした。
- ADEはDeBERTa-v3-baseと比較して,パラメータ数を大幅に削減しながら,DBpedia-14の性能を上回り,AG Newsにおいても遜色ない結果を示した。
ViPO:大規模な視覚的嗜好性最適化 [cs.CV, cs.AI]目的:視覚的生成モデルの改善のための嗜好性最適化の規模拡大
- 視覚的生成モデルの性能向上には,人間の嗜好に基づく最適化が不可欠である。
- 既存の嗜好性データセットには,矛盾した嗜好パターンが存在し,学習の妨げとなっている。
- ノイズに強いアルゴリズムと高品質なデータセットを構築し,大規模最適化を実現する。
- 提案手法Poly-DPOは,データセットの特性に応じてモデルの信頼性を動的に調整し,多様なデータ分布下での学習を可能にする。
- 大規模嗜好性データセットViPOを構築し,信頼性の高い嗜好信号とバランスの取れた分布を確保した。
- Poly-DPOをViPOに適用した結果,最適な設定が標準のDPOに収束し,データ品質の高さとPoly-DPOの適応性が確認された。
最先端コーディングエージェントによるコネクトフォーのAlphaZero型自己対戦学習パイプラインの実装と外部ソルバーとの比較 [cs.MA, cs.AI, cs.LG]目的:AI研究の加速化能力の予測
- AIの安全性確保において,AIがAI研究を自律的に加速する時期を予測することは重要である。
- 既存の評価指標は広範な能力向上を測るが,再帰的自己改善の兆候を早期に捉えるには不十分である。
- 過去のAI研究成果を基に,AIが自律的に機械学習パイプラインを実装できるかを評価することで,AI研究の動向を探る。
- 最先端コーディングエージェントは,消費機で3時間以内にコネクトフォーのAlphaZero型自己対戦学習パイプラインを実装可能になった。
- Claude Opus 4.7は,Pascal Pons Connect Fourソルバーに対し,先手で8回中7回勝利し,統計的に有意な差を示した。
- GPT-5.4は他のエージェントと比較して,割り当てられた時間予算を著しく少なく使用する異常な行動が見られた。
低ランク適応による統一的な多タスク脳波解析へ [cs.LG, cs.AI]目的:多タスク脳波解析のためのフレームワーク
- 脳波は,脳の活動を直接反映するため,医療やブレイン・コンピュータインタフェース等の分野で重要である。
- 各タスクごとにモデルをフルチューニングする必要があり,計算コストや空間コストが増大する。
- タスク間の競合を緩和し,効率的な多タスク学習を実現することを目指す。
- 提案手法MTEEGは,タスク固有の低ランク適応モジュールを導入することで,パラメータ空間の分離とタスク間の競合の軽減に貢献する。
- MTEEGの3つのバリエーションを評価した結果,6つの下流タスクにおいて,最新のシングルタスク手法を上回る性能を示した。
- MTEEGは,汎用的なブレイン・コンピュータインタフェースの開発を促進する可能性を持つ。
過パラメータ化ネットワークの最適化における対称性の役割 [cs.LG, cs.AI]目的:過パラメータ化ネットワークの最適化における対称性の影響
- 深層学習の成功に不可欠だが,その最適化メカニズムは未解明な部分が多い。
- 過パラメータ化によって最適化が改善される要因が明確ではない。
- 過パラメータ化が最適化に及ぼす対称性の影響を明らかにする。
- 過パラメータ化は,ヘッセ行列の対角事前条件化として機能し,良好な条件数を持つ最小値を実現する。
- 過パラメータ化は,初期値近傍のグローバル最小値の確率質量を増加させ,到達可能性を高める。
- 教師・生徒ネットワーク実験により,幅の増加に伴いヘッセ行列のトレースが減少し,収束が加速することが確認された。
DiRe-RAPIDS:大規模なトポロジー忠実な次元削減 [cs.LG, cs.AI, cs.SE, cs.SI]目的:高次元データの次元削減手法
- データの可視化には不可欠であり,複雑なデータ構造の理解を助ける。
- 既存手法はノイズを記憶し,データの全体的なトポロジーを歪める問題がある。
- トポロジー構造を忠実に再現し,より正確な次元削減を実現する。
- DiReは,トポロジー忠実性ベンチマークにおいて,UMAPと同等以上の分類性能を示す。
- ストレステストでは,正確な第1ベッチ数を回復することに成功した。
- 723K件のarXiv論文埋め込みにおいて,UMAPと比較して3~4倍多くのトポロジー構造を保持する。
VLMジャッジはランク付けはできるがスコアリングはできない:マルチモーダル評価におけるタスク依存的不確実性 [cs.LG, cs.CL, cs.CV, stat.ML]目的:マルチモーダル評価におけるVLM(Vision-Language Model)の不確実性の分析
- マルチモーダルシステム評価の自動化が求められており,VLMはその有力な候補となる。
- VLMによるスコアの信頼性が不明であり,評価の妥当性を損なう可能性がある。
- VLMの評価における不確実性を定量化し,信頼性のマップを作成すること。
- VLMの予測区間は,タスクによって大きく異なり,美的評価や自然画像では狭く,チャートや数理的推論では広くなることが示された。
- ランキング相関は高いにもかかわらず,VLMは信頼性の低い絶対スコアを生成する「ランキング・スコアリングの乖離」という新たな問題が特定された。
- 予測区間の幅は,タスクの難易度やアノテーション品質に強く影響を受けることが明らかになった。
Faithfulness-QA:文脈忠実なRAGモデル訓練のための反事実的エンティティ置換データセット [cs.HC, cs.CL, cs.AI]目的:文脈忠実なRAGモデル訓練のためのデータセット
- 情報検索と生成を組み合わせたRAGモデルは,知識獲得の効率化に不可欠である。
- RAGモデルが検索された文脈ではなく,内部知識に基づいて回答を生成する課題がある。
- 文脈を優先するようモデルを訓練するためのデータセットの不足を解消することを目指す。
- Faithfulness-QAは,SQuADとTriviaQAを基盤とし,99,094サンプルから構成される大規模データセットである。
- 文脈中のエンティティを,76,953個のエンティティバンクからタイプ的に一致する代替エンティティに置換することで,文脈と内部知識間の対立を生み出している。
- 厳格な品質フィルタリングにより,データセットの品質が保証されている。
AHASD:モバイルデバイスにおけるLLM適応ドラフト推論のための非同期異種アーキテクチャ [cs.AR, cs.AI]目的:LLMの適応ドラフト推論における効率向上
- 大規模言語モデルの普及に伴い,モバイル環境での効率的な推論が不可欠となっている。
- 従来の同期実行では,アイドル時間や無駄な計算が発生し,性能が制限される。
- モバイルNPU-PIMシステムにおける適応ドラフト推論の非同期異種アーキテクチャを提案し,効率を改善する。
- AHASDは,PIMでのドラフト生成とNPUでの検証を並列実行することで,スループットを最大4.2倍に向上させた。
- エネルギー効率も最大5.6倍に改善され,GPU単独のベースラインおよび最先端のGPU+PIMベースラインを上回った。
- AHASDは,DRAM領域の3%以下のハードウェアオーバーヘッドで性能向上を実現している。
セマンティックセグメンテーションにおける正準知識蒸留の驚くべき有効性 [cs.CV, cs.AI]目的:セマンティックセグメンテーションのための知識蒸留手法の比較と性能向上
- セマンティックセグメンテーションは,画像認識の重要な課題であり,自動運転や医療画像解析などへの応用が期待される。
- 知識蒸留の評価において,計算コストと訓練時間の関係が明確でなく,手法の性能を正しく比較することが困難である。
- 正準知識蒸留の有効性を示し,複雑な損失関数に頼らずとも高い性能を達成できることを示す。
- 固定された訓練スケジュールではなく,ウォールクロック時間に基づいて比較した結果,正準知識蒸留が最新のセグメンテーション特化型手法を上回った。
- 特徴ベースの知識蒸留は,拡張された訓練によってCityscapesとADE20Kで最先端のResNet-18性能を達成した。
- PSPNet ResNet-18生徒モデルは,ResNet-101教師モデルに匹敵する性能(CityscapesでmIoU 79.0 vs 79.8,ADE20Kで92%)を,パラメータの4分の1で実現した。
OxyGent:オキシ抽象化によるマルチエージェントシステムのモジュール性,可観測性,および進化可能性の実現 [cs.AI]目的:マルチエージェントシステムのモジュール化,可観測性,および自律進化
- 複雑な産業環境でのマルチエージェントシステムの利用は重要だが,スケーラビリティや可観測性の課題が存在する。
- 既存のシステムは,拡張性,監視性,自律進化に限界があり,実用的な展開が困難である。
- 本研究は,オキシ抽象化とオキシバンク進化エンジンにより,これらの課題を解決することを目的とする。
- OxyGentは,エージェント,ツール,LLM,推論フローをプラグ可能なコンポーネントとしてカプセル化し,システムの構成と監視を容易にする。
- 動的な計画立案により,実行グラフを生成し,適応的な可視化を提供することで,可観測性を向上させている。
- オキシバンクは,AIアセット管理プラットフォームとして,データフロー,アノテーション,および共同進化を自動化し,継続的な進化を支援する。
分布非依存型確率的分析とロバストな多水準ベクトル場異常検知 [stat.ML, cs.LG, math.FA, math.PR, math.ST, stat.CO, stat.TH]目的:ベクトル場データの異常検知手法
- 多 spectral 光学センサーやレーダーなど,多様な分野で大規模なベクトル場データが増加している。
- 衛星画像のような高次元データでは,確率分布の仮定や推定が困難である。
- データの確率分布に依存しない信頼性の高い仮説検定による異常検知を実現する。
- 提案手法は,データの共分散構造に基づく確率的関数解析により,異常を検知する。
- Karhunen-Loeve展開と多水準の直交関数空間を用いることで,高次元データでもロバストな検知が可能となる。
- アマゾン森林の劣化問題への適用事例やシミュレーションデータでの検証により,PCA法を超える検出性能が示された。
DP-CDA:ランダム混合によるデータセット合成のプライバシー保護強化アルゴリズム [stat.ML, cs.LG]目的:データセット合成を通じたプライバシー保護の強化
- 医療,セキュリティ,金融など多様な分野でデータ利用が増加しており,データ分析の重要性が高まっている。
- データに含まれる個人情報保護が課題であり,匿名化されたデータでも個人識別が可能なリスクが存在する。
- 高次元データにおける計算効率とプライバシー保護のトレードオフという課題を解決することを目指す。
- 提案手法DP-CDAは,クラス固有のランダム混合と適切なランダム性の導入により,合成データを生成する。
- DP-CDAは既存手法と比較して,より強力なプライバシー保護を保証しつつ,高い実用性を実現する。
- 合成データを用いた予測モデルの精度評価の結果,DP-CDAが従来のデータ公開アルゴリズムを上回る性能を示すことが確認された。
データバランス戦略:リサンプリングと拡張手法の体系的調査 [quant-ph, cs.AR, stat.ML, cs.AI, cs.LG]目的:データバランス手法の包括的なレビュー
- 機械学習において,不均衡データは予測の偏りを招き,性能低下の原因となるため,適切な対処が重要である。
- 既存の手法では,データセットの特性に応じた最適な方法の選択が困難であり,汎用性の高い解決策が求められている。
- 多様なデータ特性と評価指標を考慮した上で,最適なデータバランス手法の選択指針を示すことを目指す。
- 本レビューでは,SMOTEをはじめとする様々なリサンプリング・拡張手法について,理論的背景と適用条件を詳細に比較検討した。
- 最適な手法はデータセットの特性,分類器の種類,評価指標に大きく依存することが示された。
- 自己教師あり学習や拡散モデルなどの新たな研究方向性,およびファウンデーションモデルの応用が今後の展望として提示された。
文脈学習における分布外汎化:低次元部分空間からの考察 [stat.ML, cs.LG, math.ST, stat.TH]目的:文脈学習における分布外汎化の条件の解明
- Transformerモデルの文脈学習能力は注目されるが,その理論的基盤は未だ不明な点が多い。
- 文脈学習が,事前学習データとは異なる分布に対してどの程度汎化可能かという問題が存在する。
- 文脈学習における分布外汎化が可能な条件を数学的に特定し,そのメカニズムを明らかにすること。
- 低ランク共分散行列でパラメータ化された線形回帰タスクを用いて,分布シフトを部分空間間の角度の変化としてモデル化。
- 事前学習タスクベクトルが部分空間の和集合から得られた場合,全ての角度シフトに対してTransformerは汎化可能となる。
- 一方,事前学習タスクが単一のガウス分布から得られた場合,テストリスクは角度に依存し,分布外汎化は困難となることが示された。
治療,証拠,模倣,そしてチャット [stat.OT, cs.AI]目的:医療における意思決定支援の可能性
- 医療現場では,迅速かつ正確な意思決定が患者の予後を大きく左右する。
- 既存の医療情報には偏りや不確実性が含まれており,最適な治療選択を困難にしている。
- 大規模言語モデルを活用し,エビデンスに基づいた最適な治療方針の決定を支援すること。
- 大規模言語モデルが医療判断を支援する可能性について,治療という中心課題を中心に検討した。
- 実験データや観察データといったエビデンスに基づいた医療と,模倣の限界について議論した。
- 大規模言語モデルの学習における倫理的課題や観察に基づいた推論の前提について考察した。
最適な微分プライバシーカーネル学習とランダム射影 [stat.ML, cs.LG, stat.ME]目的:微分プライバシーカーネル学習の最適化
- プライバシー保護は重要であり,データ利用の制約を緩和し,データ駆動型研究を促進する。
- 既存手法では,プライバシー保護と学習精度のトレードオフが課題であり,次元削減技術が最適化されていない。
- ランダム射影を用いたカーネル学習により,統計的効率性と最適なプライバシー保護を実現する。
- 提案手法は,二乗損失およびリプシッツ滑らかな凸損失関数に対して,ミニマックス最適レートを達成する。
- 既存の次元削減技術(ランダムフーリエ特徴マッピングやL2正則化)が最適でないことが示された。
- 目的関数摂動に基づくプライバシー線形ERMの次元に依存しない過剰リスク限界を初めて導出した。
q3-MuPa:物理情報に基づいた拡散モデルを用いた高速・静音・定量的多パラメトリックMRI [quant-ph, cs.CC, cs.CE, cs.DM, math-ph, math.MP, physics.med-ph, cs.AI, cs.CV]目的:拡散モデルと物理モデルに基づくデータ整合性によるqMRIマッピング性能の向上
- MRIは疾患診断に不可欠だが,検査時の騒音や時間が患者の負担となる。
- 従来法では,高精度な定量MRI (qMRI) の取得に時間がかかり,患者の動きに影響されやすい。
- 本研究は,高速・静音なqMRI取得と拡散モデルによるマッピング性能向上を目指す。
- 提案手法は,デジタル脳ファントム,NISM/ISMRMファントム,健常者,脳転移患者データにおいて,高い精度でqMRIマップを生成した。
- 特に,合成データのみで学習したにも関わらず,実際のスキャンデータに対しても良好に汎化することが示された。
- MuPa-ZTEと物理情報に基づいた拡散モデルの組み合わせ「q3-MuPa」は,臨床応用における高い可能性を持つ。
ニューラルFLoC:ニューラルフローに基づく関数型データの同時登録とクラスタリング [stat.ML, cs.LG]目的:関数型データの同時登録とクラスタリング
- 関数型データ解析は,医療,金融,センサデータなど,多様な分野で活用が期待されている。
- 位相のずれがデータ解析の精度を低下させ,真の形状の違いを捉えにくいため。
- 位相と振幅の変動を分離し,より正確なクラスタリングを実現すること。
- 提案手法NeuralFLoCは,ニューラル常微分方程式による微分同相写像フローとスペクトルクラスタリングを組み合わせた,エンドツーエンドの深層学習フレームワークである。
- NeuralFLoCは,関数型データの登録とクラスタリングを同時に学習することで,位相と振幅の変動を効果的に分離する。
- ベンチマークデータセットにおける実験により,登録とクラスタリングの両方において,最先端の性能が確認された。
結び目簡略化のための強化学習,困難な結び目と結び目不変量 [math.GT, cs.LG, stat.ML]目的:結び目図形の簡略化
- 結び目理論は数学における重要な研究分野であり,トポロジーの基礎をなす。
- 複雑な結び目図形の簡略化は手作業では困難であり,効率的なアルゴリズムが求められている。
- 強化学習を用いて,結び目図形の簡略化を自動化し,結び目不変量の計算を支援すること。
- 強化学習パイプラインを開発し,結び目図形の簡略化に成功した。
- 特に困難な結び目図形や,4_1#9_{10}に対し,結び目不変量の計算において良好な結果を得た。
- 自己改善型のワークブックを活用することで,素結び目リストの結び目不変量の上限値を系統的に改善できることを示した。
ガウス過程を用いたベイズ最適化の入門的レビュー:定常点探索の加速に向けて [stat.ML, cs.LG, physics.chem-ph, physics.comp-ph]目的:定常点探索の加速
- エネルギー表面上での効率的な探索は,分子科学や材料科学において重要な課題である。
- 高コストな電子構造計算を繰り返す必要があり,計算時間が課題となる場合が多い。
- ベイズ最適化を用いることで,計算コストを削減し,効率的な探索を実現する。
- ベイズ最適化の枠組みを用いて,最小化,鞍点探索,二点探索を統一的に扱うことが可能となった。
- ガウス過程回帰,逆距離カーネル,能動学習などの手法を組み合わせることで,高精度な探索を実現した。
- Rust言語で実装されたサンプルコードが提供され,理論と実践のギャップを埋めることに貢献する。
遷移状態の事前サンプリング:誘導拡散による手法 [physics.chem-ph, cs.LG]目的:遷移状態の探索
- 化学反応や分子構造変化の速度論・機構解明に不可欠な遷移状態探索は,計算化学において重要な課題である。
- 既存手法は経験則に依存するため,初期値が不十分な場合や,重要な経路を見逃す可能性がある。
- 生成モデルを活用し,経験則に頼らず遷移状態を効率的に探索し,新たな反応経路を発見することを目指す。
- ASTRAは,安定状態の配置から学習した拡散モデルを用いて,遷移状態の探索を推論時のスケーリング問題として捉える。
- 誘導拡散とScore-Aligned Ascent (SAA)プロセスにより,高精度に遷移状態を特定し,複数の反応経路を明らかにした。
- 2次元ポテンシャルから生体分子の構造変化,化学反応まで,様々なベンチマークで有効性が確認された。
相空間における生成モデル [hep-ph, cs.AI]目的:高エネルギー物理データの生成モデリング
- 高エネルギー物理学では,エネルギー・運動量保存則などの制約が重要であり,正確なシミュレーションが不可欠である。
- 既存の生成モデルでは,物理的制約が近似的にしか学習されず,解釈性や信頼性が損なわれる場合がある。
- 本研究は,生成過程の全てのステップで, massless N粒子ローレンツ不変相空間に限定される生成モデルを開発し,その問題を解決する。
- 提案モデルは,少数粒子分布と多数粒子分布の両方を,様々な特異構造とともに学習できることを示した。
- 拡散モデルにおいて,ノイズ過程の終点は相空間上の均一分布に対応し,粒子の相関の出現過程を明確に特定できる。
- ジェットデータを用いた生成モデルの解釈性研究への道を開き,シミュレーションデータの活用に貢献する。
影響関数勾配による凹型統計的効用最大化バンディット [stat.ML, cs.LG, math.ST, stat.AP, stat.TH]目的:長期的報酬分布の統計的関数に基づく多腕バンディット問題の解法
- 意思決定において,期待報酬だけでなく分布全体を考慮する重要性が増している。
- 既存手法では,分布全体の最適化が困難であり,特に凹型効用関数の扱いが課題である。
- 統計的効用関数の勾配推定に基づくアルゴリズムを開発し,分布全体の最適化を可能とする。
- 凹型統計的効用関数の最適化問題が,定常混合戦略の最適化に帰着することを示した。
- 影響関数微積分を用いて,バンディットからのフィードバックに基づく確率的勾配推定法を導出した。
- エンタルピーミラーアセント法を実装し,推定誤差と最適化誤差を分離した後悔限界を確立した。
グラフニューラルネットワークを用いた離散構造要素の状態ベイズ推定のための確率グラフモデル [stat.ML, cs.LG, stat.ME]目的:離散構造要素の状態のベイズ推定のための確率グラフモデル
- 社会インフラの健全性を評価する上で,構成要素の状態把握は不可欠である。
- 測定データからの逆問題は一意に解けず,ベイズ推定の計算コストが高い。
- 確率グラフモデルとグラフニューラルネットワークにより,効率的な状態推定を実現する。
- 提案手法は,確率グラフモデルによる推論とベイズ推定の事後確率分布が一致することを示した。
- グラフニューラルネットワークを用いることで,高次元問題における計算コストを大幅に削減した。
- 合成データと実験データによる検証により,提案手法の有効性が確認された。
ソルバーを意識した乱流クロージャーの深層学習:ナッジ付きLESダイナミクスからのアプローチ [physics.flu-dyn, cs.LG, math.DS, physics.comp-ph, physics.geo-ph]目的:大規模渦シミュレーション(LES)のための乱流クロージャーモデルの深層学習
- 乱流現象の正確な予測は,航空力学,気象,海洋工学など多くの分野で不可欠である。
- 従来のLESでは,亜格子スケール応力を近似するクロージャーモデルの精度が課題となっている。
- ナッジング(連続データ同化)の考え方を導入し,安定性と汎用性に優れたクロージャーモデルを開発する。
- 本研究では,DNSデータを疎な観測値とみなし,粗格子LES向けのクロージャーモデルを事前学習する新しいアプローチを提案する。
- このアプローチにより,ソルバーの随伴計算や逆伝播を必要とせずに,真の統計量を捉えながら長期的な安定性を維持することが可能となる。
- 異なる数値スキームへの適応能力を検証し,数値離散化誤差に対するモデルの挙動を分析した結果,従来のクロージャーモデルと比較して良好な予測性能を示した。
