arXiv雑要約
AI - 2026/05/01 公開
AblateCell: バーチャルセルリポジトリのための再現と除去を行うエージェント [cs.AI, cs.MA]目的:AIバーチャルセルにおける性能向上要因の特定
- AI技術を生物学に応用する上で,バーチャルセルは重要な役割を担う。
- 生物学的リポジトリは標準化が不十分で,データ形式が複雑なため,体系的な性能評価が困難。
- リポジトリの検証と性能要因の特定を自動化し,生物学的コードベースの改良を促進。
- AblateCellは,環境設定,依存関係の解決,評価の再実行により,報告されたベースラインを88.9%の成功率で再現。
- リポジトリの変異グラフを生成し,性能向上と実行コストのバランスに基づき実験を適応的に選択する閉ループ除去を実現。
- シングルセル摂動予測リポジトリにおいて,真の重要な要素を93.3%の精度で復元し,専門家やヒューリスティックを上回る性能を示した。
構造と来歴分析のためのテキスト属性グラフとしての保証事例の評価 [cs.SE, cs.LG]目的:保証事例の構造と来歴分析
- 安全性やコンプライアンスが重要となる分野において,システムの信頼性を保証する上で不可欠である。
- 保証事例の構造的欠陥や,AI生成による偏りの検出が課題となっている。
- グラフ診断フレームワークを用いて,保証事例の構造と来歴を分析し,その課題解決を目指す。
- グラフニューラルネットワーク(GNN)は,実際の保証事例において高いリンク予測性能(ROC-AUC 0.760)を示した。
- GNNは,人間が作成した事例とLLMが生成した事例を効果的に識別した(F1 0.94)。
- LLM生成の保証事例は,人間が作成した事例とは異なる階層的なリンクパターンを持つことが示された。
文脈多様性の仮定なしで$\tilde{O}(\sqrt{dT})$後悔のロジスティックバンディット [cs.CL, cs.RO, cs.HC, cs.DC, cs.LG]目的:ロジスティックバンディット問題における後悔の低減
- バンディット問題は,オンライン学習の基本的な枠組みであり,様々な応用が存在する。
- 既存手法は文脈多様性の仮定に依存し,低次元部分空間への集中を許容しない。
- 文脈多様性の仮定なしに,最適な後悔率$\tilde{\mathcal{O}}(\sqrt{dT})$を達成すること。
- 提案手法SupSplitLogは,文脈多様性の仮定なしで$\tilde{\mathcal{O}}(\sqrt{dT})$後悔を達成する初のアルゴリズムである。
- サンプルを分割し,初期推定器とニュートン型補正手順を組み合わせることで,精度と効率を両立している。
- 実験結果は,提案手法が理論的結果を裏付け,既存アルゴリズムよりも優れていることを示している。
偶発表の結合度・ピークネス指標 [cs.RO, cs.LG]目的:偶発表を比較するための単一の性能指標
- クラスタリングアルゴリズムの性能比較には,客観的な評価基準が不可欠である。
- 既存の指標では,偶発表に現れる詳細な特徴を捉えきれない場合がある。
- クラスタリングアルゴリズムの性能を予測するための指標を開発すること。
- 提案する結合度・ピークネス(AP)指標は,既存指標よりも広い動的範囲で偶発表の性能を評価できる。
- AP指標は,計算効率においても既存の指標を上回る。
- AP指標は,教師あり学習における混同行列の品質評価指標に類似している。
スマートグリッド運用におけるLLMの脱獄脆弱性評価:NERC基準に対するベンチマーク [cs.CR, cs.AI]目的:LLMをスマートグリッド運用支援に展開した場合の脱獄脆弱性
- 電力系統の複雑化に伴い,LLMによる効率的な運用支援が期待されている。
- LLMはプロンプト操作により安全対策を回避され,不正な指示を出力するリスクがある。
- 本研究では,NERC基準に違反するLLMの出力を引き出す攻撃を評価し,脆弱性を明らかにすることを目指す。
- 3つのLLMを対象とした攻撃成功率は平均33.1%であり,DeepInceptionが最も効果的であった。
- Claude 3.5 Haikuは完全に耐性を示したが,Gemini 2.0 Flash-Liteは最も脆弱で,GPT-4o miniは中程度の脆弱性を示した。
- BaselineとBitBypass攻撃の文言を調整することで,より高い攻撃成功率が得られ,シンプルな手法でも効果的であることが確認された。
未解決問題に対する数学的証明を生成するためのオープンソースマルチエージェントシステムQED [cs.DC, cs.AI, math.AP]目的:数学的証明の生成
- 数学におけるAI応用の可能性を広げ,数学研究の加速に貢献する重要性がある。
- 大規模言語モデル(LLM)はベンチマークでは高い性能を示すものの,真に新しい証明を生成することが困難である。
- LLMの弱点を克服し,未解決問題に対する数学的証明を信頼性高く生成することを目指す。
- 本研究で開発したQEDは,LLMの失敗要因に対処するシステム設計を採用している。
- 応用解析と偏微分方程式の未解決問題5つに対し,QEDは3つの問題に対して専門家がオリジナルかつ重要と認める証明を生成した。
- QEDはオープンソースソフトウェアとして公開されており,数学研究への貢献が期待される。
スキルテキストからスキル構造へ:エージェントスキルに対するスケジュール-構造-論理表現 [cs.CL, cs.AI]目的:エージェントスキルに関するスケジュール,実行構造,論理レベルの情報を分離した構造化表現の開発
- LLMエージェントの能力向上のためには,再利用可能なスキルの重要性が増している。
- 既存のスキル表現はテキストベースであり,機械可読な情報の抽出が困難である。
- スキル管理と利用における推論能力を向上させるため,明示的なスキル知識表現を提案する。
- 提案手法(SSL表現)は,スキル発見タスクにおいてMRRを0.573から0.707に向上させた。
- リスク評価タスクにおいては,SSL表現がマクロF1スコアを0.744から0.787に改善した。
- 明示的な構造化表現は,スキル検索とレビューを容易にし,再利用性と操作可能性を高める。
皮質に着想を得た継続学習:機能的タスクネットワークの教師なしインスタンス化と回復 [cs.LG, cs.AI, q-bio.NC]目的:機能的タスクネットワークのインスタンス化と回復
- 脳の構造と機能に着想を得た機械学習は,より効率的な学習モデルの開発に貢献しうる。
- 継続学習において,過去の知識を忘却することなく新しいタスクを学習することが課題である。
- 本研究は,過去のタスクを効率的に再利用し,タスク間の干渉を軽減することを目指す。
- 提案手法である機能的タスクネットワーク(FTN)は,脳皮質の構造にヒントを得て,既存の知識の忘却をほぼゼロに抑える。
- FTNは,空間的な組織化メカニズムにより,マスク探索の計算量を削減し,高速な学習を実現する。
- MNIST等のベンチマークテストにおいて,FTNは高い性能を示すとともに,タスク間の分離を保証する。
最終の人手による論文:エージェントネイティブな研究成果 [cs.LG]目的:エージェントが理解,再現,拡張可能な研究成果の提供
- 科学的進歩には,研究プロセスの透明性と再現性が不可欠である。
- 従来の論文は,詳細な過程を省略し,AIエージェントによる理解を困難にする。
- 研究過程全体を記録し,AIエージェントが利用可能な形式で成果を提示すること。
- Agent-Native Research Artifact (ARA) を導入し,研究を機械実行可能なパッケージとして構造化した。
- PaperBenchとRE-Benchにおいて,ARAは質問応答の精度を72.4%から93.7%に向上させた。
- RE-Benchの拡張タスクでは,失敗記録が進行を加速する一方で,エージェントの能力によっては制約となる場合がある。
minAction.net:エネルギー優先型ニューラルアーキテクチャ設計 ― 生物学的原理から体系的検証へ [cs.LG, q-bio.QM]目的:エネルギーを考慮したニューラルアーキテクチャ設計の検証
- 機械学習の発展において,計算コストは無視されがちである。エネルギー制約下で動作する物理・生物システムとの整合性が重要。
- 汎用的な最適なアーキテクチャは存在せず,タスクの種類によって最適なアーキテクチャが大きく異なる点が課題である。
- アクション原理に基づくエネルギー優先型アーキテクチャによる学習効率の改善を目指す。
- アーキテクチャ自体は精度にほとんど影響を与えない一方,アーキテクチャとデータセットの相互作用は大きく,タスクに依存することが示された。
- エネルギー正則化項を導入することで,内部活性化エネルギーを大幅に削減でき,精度への影響は軽微であった。
- アクション原理に基づいたアーキテクチャは,従来のアーキテクチャと比較して,学習効率を5~33%向上させた。
AHASD:モバイルデバイスにおけるLLM適応ドラフト推論のための非同期ヘテロ構造 [eess.SY, cs.SY, cs.AR, cs.AI]目的:LLMの適応ドラフト推論における効率向上
- LLMは高性能だが,モバイルデバイスでの推論には計算資源の制約がある。
- 従来の同期実行ではアイドル時間が発生し,非同期実行では無駄な計算が生じる。
- モバイルNPU-PIMシステムにおける,効率的な適応ドラフト推論の実現。
- AHASDは,PIMでのドラフト生成とNPUでの検証を並列化する非同期ヘテロ構造である。
- エントロピー履歴に基づくドラフト制御と時間認識事前検証制御により,無効なドラフトを抑制する。
- 実験結果から,AHASDはGPUのみの場合と比較して,スループットが最大4.2倍,エネルギー効率が5.6倍向上する。
ソフトウェア脆弱性検出のための汎化可能なマルチモーダル表現学習 [cs.SE, cs.AI]目的:ソフトウェア脆弱性検出における汎化性能向上
- ソフトウェアの安全性確保は重要であり,脆弱性検出技術の発展が不可欠である。
- 既存手法はコードのみに着目し,コメントに含まれる意図を無視している。
- コードとコメントの情報を統合し,よりロバストな脆弱性検出を目指す。
- MultiVulはコードとコメントの表現を対照学習と整合性正則化により整合させる。
- 多様なコードとテキストのペアを用いることで,モデルの頑健性を高めている。
- 実験の結果,MultiVulは既存手法を最大27.07% F1スコアで上回る性能を示した。
AMMA:低遅延100万コンテキストAttentionサービングのためのマルチチップレットメモリ中心アーキテクチャ [cs.AR, cs.AI, cs.DC, cs.LG]目的:低遅延長文脈Attentionのためのマルチチップレットメモリ中心アーキテクチャ
- 大規模言語モデルの利用拡大に伴い,推論時の低遅延化が重要課題となっている。
- 従来のGPU中心設計では,Attention処理におけるメモリボトルネックが顕著になっている。
- メモリ帯域幅を向上させ,Attention処理の効率化を図ることで,低遅延化を実現する。
- AMMAは,HBM-PNMキューブを用いてGPUの計算ダイを置き換えることで,メモリ帯域幅をほぼ2倍に増加させた。
- キューブ内並列化や階層型並列化,リオーダーされた集団通信フローの導入により,帯域幅の向上を最大限に活用した。
- 評価の結果,AMMAはNVIDIA H100と比較して,Attentionレイテンシを15.5倍,エネルギー消費量を6.9倍低減した。
CheXthought:胸部X線写真解釈のための臨床的な思考連鎖と視線注視点のグローバルなマルチモーダルデータセット [cs.CV, cs.AI]目的:胸部X線写真解釈における臨床的な思考連鎖と視線注視点のデータセット
- 医療現場で頻繁に行われる診断であり,AI開発の主要なターゲットである。
- 既存の画像とレポートのペアデータに偏っており,臨床推論の認知プロセスや視線注視点が考慮されていない。
- 臨床的な思考プロセスや視線注視点を学習させ,より透明性の高いAIモデルの開発を目指す。
- CheXthoughtは,71カ国501人の放射線科医による103,592件の思考連鎖と6,609,082件の視線注視点データを含む。
- CheXthoughtを用いた学習は,最先端のビジョン言語モデルの精度向上,誤検出の抑制,不確実性の伝達に貢献する。
- 画像から人間同士,または人間とAI間の意見の相違を予測し,ケースの難易度やモデルの信頼性を示すことが可能である。
降水量の空間的極端依存性のモデリング:分布ニューラルネットワークの利用 [stat.ML, cs.LG]目的:降水量最大値の依存性およびその時間空間的不確実性の推定
- 極端現象の理解は,防災・減災対策において不可欠であり,気候変動への適応策の基盤となる。
- 極値過程のパラメータ推定は,閉じた形の尤度関数が得られない場合に困難となることが多い。
- 時間空間依存性を考慮した降水極値のモデリング手法を開発し,不確実性を定量化すること。
- 生成ニューラルネットワークを用いたシミュレーションベース推定により,空間依存性の非パラメータ的推定が可能となった。
- 複雑な条件下でも良好な性能が得られ,閉じた形の尤度推定が困難な場合にも適用可能であることが示された。
- 2021年7月のドイツ西部における豪雨災害を事例に,本手法の有効性と頑健性が確認された。
股関節X線写真におけるSingh Indexクラスタリングを用いた骨粗鬆症の教師なし機械学習 [quant-ph, cs.ET, physics.pop-ph, eess.IV, cs.CV, cs.LG]目的:骨粗鬆症診断のための機械学習によるSingh Indexの自動識別
- 世界的な高齢化に伴い,骨粗鬆症は有病率が高く,骨折リスクが増大する重要な健康問題である。
- 骨密度測定は一般的だが,集団スクリーニングには限界があり,手動でのSingh Index評価は時間と専門知識を要する。
- 機械学習を用いて,簡便かつ迅速な骨粗鬆症診断を可能にするSingh Indexの自動化を目指す。
- 開発した畳み込みニューラルネットワークは,既存モデルと比較してクラスタの均質性と異質性において優れた性能を示した。
- クラスタリングの結果,Silhouette Scoreが高い有望な2つのクラスターが認められた。
- データセットの不均衡や画像品質が課題であり,臨床データとの組み合わせや画像前処理の重要性が示唆された。
モーメント収束の評価のための多項式シュタイン不一致 [stat.ML, cs.LG, stat.CO]目的:ベイズ推論におけるサンプル集合と目的の事後分布間の不一致の測定
- ベイズ推論は不確実性を定量化する上で重要であり,高品質なサンプリングが不可欠である。
- 既存のサンプル品質評価指標は,漸近的バイアスを持つスケーラブルなベイズサンプリングアルゴリズムには不向きである。
- 計算コストと次元の呪いの問題を軽減し,より効率的なハイパーパラメータ選択を支援すること。
- 提案手法である多項式シュタイン不一致(PSD)は,既存手法よりも高い検出力を持つことが実験的に示された。
- PSDは,ガウス分布を対象とする場合,最初のr個のモーメントの違いを検出することが証明された。
- PSDを用いることで,ベイズサンプリングアルゴリズムのハイパーパラメータをより効率的に選択できる可能性が示された。
時間データにおける人間の意思決定に関する新たな機械学習の視点:Foreclassing [stat.ML, cs.LG]目的:時間データに基づく人間の意思決定プロセスを自動化するための機械学習問題
- 時系列データは意思決定に広く利用されており,その重要性は高い。
- 既存研究では,予測不確実性を考慮した包括的な手法や明確な問題定義が不足している。
- 人間の意思決定を模倣し,時系列データから直接分類決定を行うモデルを開発する。
- 本研究では,時間データと予測不確実性に基づいて分類を行う「Foreclassing」という新たな機械学習問題と,その解決策である深層ベイズニューラルネットワーク「ForeClassNet」を提案した。
- ForeClassNetは,畳み込み層におけるカーネルサイズを確率的に学習するボルツマン畳み込みという新しい層構造を採用している。
- 気象,エネルギー,金融分野の現実データを用いた評価により,ForeClassNetが既存の時系列分類手法を上回る性能を示すことが確認された。
量子力学における不確実性への意思決定理論的アプローチ [quant-ph, cs.AI, math.PR]目的:量子力学における不確実性の扱い
- 量子力学は現代物理学の基礎であり,その解釈は科学技術の発展に不可欠である。
- 量子力学における不確実性は確率論と密接に関連するが,その関係性は未だ完全には解明されていない。
- 本研究は,不確実性を意思決定理論の枠組みで捉え,量子力学の基礎を再構築することを試みる。
- 本研究は,測定を不確実な結果をもつ行為として捉える意思決定理論的枠組みを提示した。
- この枠組みにより,ボルンの規則はこれらの行為に関連する効用関数に組み込まれることが保証される。
- また,本研究は精密な確率論と量子力学を分離し,より一般的な不確実確率アプローチの余地を残す。
文脈的オンライン不確実性認識型嗜好学習:人間からのフィードバックに向けて [stat.ML, cs.LG, stat.ME]目的:人間からのフィードバックに基づく,最適なモデルのオンライン意思決定と統計的推論
- 大規模モデルと人間の嗜好を一致させる上で,人間のフィードバックを用いた強化学習が重要である。
- オンラインで得られる人間の嗜好データは,動的な文脈に依存しており,その扱いが課題である。
- 動的な文脈下における人間の嗜好データを効率的に処理し,最適な意思決定と推定を実現する。
- 提案手法は,最適な後悔限界と推定量の漸近分布を両立する効率的な意思決定戦略を提供する。
- シミュレーション実験の結果,提案手法は最先端の手法よりも優れた性能を示すことが確認された。
- 大規模多言語理解データセットを用いて分析した結果,医学解剖学知識における大規模言語モデルの性能に関する知見が得られた。
ヒト灰白質微細構造の定量のための簡略化NEXIプロトコル [physics.med-ph, cs.AI, cs.CV, cs.LG, eess.IV]目的:ヒト灰白質微細構造定量のためのNEXIプロトコルの効率化
- 脳の微細構造解析は,神経疾患の理解や診断に不可欠であり,その重要性は高い。
- 従来のNEXI法は,スキャン時間が長く,臨床応用には課題があった。
- Explainable AIを用いて,スキャン時間を短縮しつつ,高い精度を維持するプロトコルを確立する。
- Explainable AIフレームワークにより,特徴量の数を8個に削減し,スキャン時間を27分から14分に短縮した。
- 生体内での検証において,簡略化プロトコルは従来のフルプロトコルや理論的最適解と同等のパラメータ推定性能を示した。
- 本研究は,Explainable AIが,複雑な解析手法なしに最適化を達成できることを示し,臨床応用への道を開く。
最悪条件数を超える最適対角事前条件付け:オメガスケーリングの理論と実践 [quant-ph, cs.CC, math.OC, cs.LG, cs.NA, math.NA]目的:最適対角事前条件付け
- 線形方程式の求解において,計算効率と精度が重要であり,事前条件付けはそのための有力な手法である。
- 従来の事前条件付け手法では,最悪条件数に基づく最適化に偏りがちで,実用上十分な性能が得られない場合がある。
- 最悪条件数と平均に基づく条件数(オメガ条件数)の両方を考慮し,より効率的な事前条件付け手法を確立することを目指す。
- 最悪条件数最適化問題に対し,効率的な解法を提案し,既存のSDPに基づく手法よりも高速かつ高精度な計算が可能となった。
- オメガ条件数最適化問題において,ヤコビ法や行/列正規化などの古典的な事前条件付けが最適であることが理論的に示された。
- 実験結果から,オメガ最適事前条件付けは,最悪条件数最適事前条件付けよりも計算コストが低く,反復解法の性能向上に貢献することが示唆された。
署名カーネル・スコアリングルール:確率的気象予測のための時空間診断 [stat.ML, cs.LG, stat.AP]目的:確率的気象予測の評価とモデル訓練のための厳密なスコアリング指標
- 近年の機械学習の発展により,気象予測は数値予報からデータ駆動型手法へと移行している。
- 従来のMSEなどのスコアリングルールは,気象データの時間的・空間的な相関を考慮していない。
- 気象変数を連続パスとして捉え,時間的・空間的な依存性を符号化する新しいスコアリングルールを提案する。
- 署名カーネル・スコアリングルールは,厳密な正当性を数学的に保証されており,理論的に堅牢な指標である。
- WeatherBench 2モデルを用いた評価により,高い識別力と経路依存性の相互作用の捕捉能力が示された。
- ERA5データを用いた訓練実験では,気候統計よりも優れた予測性能が確認された。
高次元単層ネットワークにおける確率的勾配降下の極限定理 [stat.ML, cs.LG, math.PR, math.ST, stat.TH]目的:高次元におけるオンライン確率的勾配降下のスケーリング限界
- 機械学習の規模拡大に伴い,高次元データに対する効率的な学習手法が求められている。
- 確率的勾配降下法の高次元における挙動は複雑であり,理論的な理解が十分ではない。
- 確率的勾配降下法のステップサイズの適切なスケーリングを解析し,学習の限界を明らかにすること。
- ステップサイズが臨界値以下では,決定論的な挙動を示す。臨界値付近では,新たな補正項が現れる。
- 固定点の近傍において,有効力学の拡散限界は特定の条件下でオーンシュタイン・ウーレンベック過程に収束する。
- 情報指数がサンプル複雑性を制御し,決定論的スケーリング限界では高次元学習の確率的変動を捉えきれないことが示唆される。
不確実性定量化を用いたAIベースの気象モデルにおける極端現象予測能力について [physics.ao-ph, cs.LG]目的:AIベースの気象モデルにおける極端現象予測のスキル向上
- 気象災害の軽減のため,高精度な極端現象予測が不可欠である。
- AI気象モデルは予測精度向上を示す一方,不確実性の表現に課題がある。
- 初期値摂動によるアンサンブル予測を通して,AIモデルの極端現象予測能力を評価する。
- ガウシアンノイズ等の単純な摂動でも,高度な手法と同程度のアンサンブルスプレッドが得られた。
- モデル選択が摂動手法よりもアンサンブル性能に大きく影響することが示された。
- AIモデルは気温の極端現象を降水よりも効果的に捉える傾向がある。
量子マスク自動符号化器:ビジョン学習への応用 [quant-ph, cs.AI, cs.LG]目的:画像データの隠れた特徴の学習
- 画像認識技術は,AIの発展に不可欠であり,その性能向上は重要な課題である。
- 従来の自動符号化器では,データの欠損部分に対するロバスト性が課題となっていた。
- 量子計算の利点を活用し,欠損データを含む画像の特徴学習を改善すること。
- 本研究で提案する量子マスク自動符号化器(QMAE)は,量子状態を用いて欠損特徴を効果的に学習可能である。
- MNISTデータセットを用いた実験で,QMAEは従来の量子自動符号化器と比較して,分類精度で平均12.86%の向上が確認された。
- QMAEは,マスクされた入力画像の再構成においても,より高い視覚的忠実度を実現することが示された。
LUNA:高速かつ低コストな量子ビット読み出しのためのLUTベースニューラルアーキテクチャ [quant-ph, cs.LG]目的:量子ビット読み出しの高速化と低コスト化
- 量子コンピュータの性能向上には,高精度かつ高速な量子ビット読み出しが不可欠である。
- 従来のDNNベース読み出しは,ハードウェア資源を多く必要とし,推論速度が遅いという課題があった。
- ハードウェア効率と低遅延性を両立した量子ビット読み出しアーキテクチャを開発し,実用化を目指す。
- LUNAは,シンプルなインテグレータとLUTベースのニューラルネットワークを組み合わせることで,高速かつ効率的な量子ビット読み出しを実現した。
- 最先端技術と比較して,面積を最大10.95倍削減し,遅延を30%低減,かつ忠実度を維持した。
- LUNAは,スケーラブルで低フットプリント,かつ高速な量子ビット読み出しを可能にし,より信頼性の高い量子コンピュータ開発を支援する。
オーバーラップフリープティコグラフィーによるシングルショットコヒーレントイメージング [physics.optics, cs.AI, cs.CV, cs.LG, physics.comp-ph]目的:オーバーラップフリープティコグラフィーによるシングルショットコヒーレントイメージングの実現
- シンクロトロンやXFEL光源でのプティコグラフィーは高分解能イメージングに不可欠だが,スキャン密度が課題となる。
- 従来のプティコグラフィーは,スキャンのオーバーラップが必須であり,スループット低下や被曝量の増加を招く。
- 本研究は,オーバーラップなしで拡張サンプルをシングルショットで高精度に再構成する手法を確立することを目指す。
- 提案手法PtychoPINNは,低光量下(約10^4光子/フレーム)でも高い再構成精度を維持できることが示された。
- 実験的プローブを用いたシングルショット再構成では,SSIM 0.904を達成し,オーバーラップ制約下での再構成(SSIM 0.968)に匹敵する性能を示した。
- PtychoPINNは,既存のモデルと比較して,少ない学習データ(1,024枚)で高いSSIMを達成し,未知の照明プロファイルにも汎化可能であることが確認された。
トランスフォーマーによる原子間遷移の予測 [cond-mat.mtrl-sci, cs.LG]目的:材料および材料表面における原子間遷移経路の予測
- 材料科学の様々な問題解決に,原子レベルでの遷移経路の理解が不可欠である。
- 従来のシミュレーション手法は計算コストが高く,適用範囲が限られていた。
- 機械学習を用いて計算コストを削減し,より広範な範囲での遷移予測を可能にすること。
- トランスフォーマーモデルが,ナノクラスターの原子間遷移予測に有効であることが示された。
- 予測の物理的妥当性を評価する方法が確立された。
- モデルへの入力データをわずかに変更することで,多様な微視的状態を生成できることが確認された。
ベイズ階層モデルと最大エントロピー原理 [stat.ML, cs.LG, physics.data-an, stat.ME]目的:ベイズ階層モデルにおける事前分布の制約
- 実データ解析において広く利用されており,統計的推論の基礎である。
- 階層モデルの事前分布はパラメータ間で依存性があり,解釈が難しい場合がある。
- 事前分布が最大エントロピー分布となる条件を明らかにし,モデルの解釈を深める。
- 階層モデルの事前分布が正準分布である場合,周辺事前分布もまた最大エントロピー性を持つ。
- この周辺事前分布は,未知量のある関数に関する異なる制約を持つ。
- 本研究は,階層モデルを適用する際に暗黙的に仮定されている情報を明確にする。
不正検知のための表形式データ生成における埋め込み拡散Transformer [stat.ML, cs.LG]目的:不正取引の合成データ生成
- 不正検知は金融セキュリティにおいて重要であり,欺瞞行為の早期発見が不可欠である。
- 不正データは稀少であり,既存の分類器は多数派クラスに偏りがちで,不正検知性能が低い。
- EmDTは,少数派クラスである不正データの合成により,分類性能の向上を目指す。
- EmDTは,UMAPクラスタリングとTransformerを用いて,特徴量間の関係性を捉えた拡散モデルである。
- 実験の結果,EmDTは既存のオーバーサンプリング手法や生成モデルと比較して,不正検知の分類性能を大幅に向上させた。
- プライバシー保護と元のデータの特徴量相関の維持においても,EmDTは良好な結果を示した。
ゼロショットLLMエージェントの集約学習による企業開示分類 [math.CO, cs.DM, q-fin.TR, cs.AI, cs.MA, q-fin.CP, q-fin.ST]目的:企業開示分類のための,多様なゼロショット大規模言語モデルの出力を統合する軽量な教師あり集約器
- 企業開示は投資判断の重要な要素であり,その分類の精度向上は市場の効率化に貢献する。
- ゼロショットLLMは柔軟だが,プロンプトやモデルによって予測にばらつきが生じるという課題がある。
- 複数のゼロショットLLM出力を集約することで,よりロバストで精度の高い分類を実現することを目指す。
- 教師あり集約器は,単一の分類器,多数決,信頼度加重投票,ゼロショットLLM判断,FinBERTのベースラインを上回る性能を示した。
- バランスの取れた精度は,最良の単一分類器の0.566から,訓練された集約器では0.606へと向上した。
- 特に,分類器間で意見が分かれる混合信号の開示において,集約器による改善効果が大きかった。
DDO-RM:報酬学習後の分布レベルの方策改善 [stat.ML, cs.LG]目的:報酬モデルを用いた効率的な方策改善手法
- 複雑な方策を直接学習するより,単純な報酬関数から学習する方が効率的な場合がある。
- 既存手法では,報酬の改善を方策に効果的に反映させることが課題となっていた。
- 報酬の改善を分布レベルで捉え,鏡降下法により方策を改善する。
- DDO-RMは,Pythia-410Mを用いた実験で,ペアの精度と平均マージンにおいてDPOを上回る性能を示した。
- 報酬学習と鏡降下法による方策改善の間の理論的な繋がりを明確化した。
スライス正則化オプティマル輸送 [stat.ML, cs.LG]目的:オプティマル輸送の新しい正則化手法
- オプティマル輸送は,確率分布間の距離を測る強力なツールであり,機械学習や画像処理など幅広い分野で活用されている。
- 既存手法では,計算コストが高く,大規模データへの適用が困難であるという課題があった。
- 計算効率を維持しつつ,より高精度なオプティマル輸送計画の近似を可能にすること。
- 提案手法であるSROTは,従来のEOTよりも精度の高いオプティマル輸送計画の近似を実現する。
- SROTは,参照となるSOT計画自体も改善する。
- 実験結果から,SROTはEOTおよびSOTよりもオプティマル輸送の近似において優れていることが示された。
事後後悔に基づくマーケティング予算配分監査 [econ.EM, cs.AI, cs.LG, q-fin.PM]目的:マーケティング予算配分の最適性評価方法
- マーケティング予算は企業の戦略的核心であり,効率的な配分が重要である。
- 予算配分後の効果測定が難しく,最適な配分であったか判断が困難である。
- 過去のデータに基づき,後悔最小化による予算配分の監査手法を確立する。
- 本研究では,過去のマーケティングログから効果関数を推定し,制約条件付き最適化により事後配分を算出する。
- モンテカルロ評価を通じて不確実性を考慮し,後悔分布,期待リフト,改善確率を提示する。
- 実データ実験により,解釈可能な事後診断が可能であり,配分柔軟性と検出可能性のトレードオフが明らかになった。
