arXiv雑要約

AI - 2026/04/22 公開

  • SCATR:単純キャリブレーションによるテスト時ランキング [cs.LG, cs.AI]目的:テスト時ランキングの精度向上
    • 大規模言語モデルの性能向上が重要視されており,推論時の計算資源配分が課題となっている。
    • 従来のランキング手法では,高性能なスコアラーの学習コストが高いことが問題となっている。
    • 軽量なスコアラーで,学習コストを抑えつつランキング精度を向上させることを目指す。
    • SCATRは,少ないキャリブレーションデータを用いて軽量なスコアラーを学習し,BoNランキングの精度を向上させる。
    • コーディングや数学的推論のベンチマークにおいて,従来の信頼度ベースの手法と比較して最大9%の改善が見られた。
    • LoRAファインチューニングと比較して,同等の精度をより少ないパラメータと計算量で達成し,学習・推論の遅延を大幅に削減する。

    Link: https://arxiv.org/abs/2604.16535

  • 機械の個性:大規模言語モデルにおける真の特異性と回答バイアスの分離 [cs.CL, cs.AI]目的:大規模言語モデルにおける個性
    • 日常生活への統合が進む中で,言語モデルの行動特性を理解することは重要である。
    • 行動の違いが,安定した個性によるものか,バイアスやノイズによるものかの区別が困難である。
    • 言語モデルの行動特性を分析し,バイアスやノイズに起因しない個性を明らかにすること。
    • 大規模言語モデル10種類,10万語以上の分析から,刺激特異的な個性による分散が全体の16.9%を占めることが分かった。
    • この個性は,各モデルに固有の一貫した指紋として現れ,予測分析によって確認された。
    • 回答バイアスやノイズに起因しない,言語モデル間の個性(機械の個性)が確認された。

    Link: https://arxiv.org/abs/2604.16755

  • LLM抽出された共変量:臨床因果推論における統合戦略の再考 [cs.LG]目的:臨床因果推論のためのLLM抽出共変量の統合戦略
    • 電子カルテからの因果推論は,医療の質向上に不可欠である。
    • 未測定の交絡因子が,正確な因果推論の大きな障壁となっている。
    • LLMを活用し,テキスト情報から潜在的な交絡因子を抽出し,因果推論の精度向上を目指す。
    • LLMで抽出した共変量を傾向スコアモデルに直接統合することが,最も効果的な統合戦略であることがわかった。
    • LLMで拡張された傾向スコアは,従来のテーブルデータのみの方法と比較して,推定バイアスを大幅に減少させた。
    • LLM抽出共変量を組み込むことで,血管作動薬早期投与の効果推定値は,ランダム化試験の結果と整合性があった。

    Link: https://arxiv.org/abs/2604.16763

  • ドメイン適応型テキスト埋め込み事前微調整のための表現正則化REZE [cs.MA, cs.CL, cs.CL, cs.AI]目的:ドメイン適応型テキスト埋め込みの事前微調整における表現シフトの制御
    • テキスト埋め込みモデルは多様な分野に応用可能であり,自然言語処理技術の発展に不可欠である。
    • 従来の事前微調整ではタスク固有のバイアスが混入し,埋め込み空間が歪むという課題があった。
    • REZEは表現シフトを明示的に制御し,安定した事前微調整を実現することでこの問題を解決する。
    • REZEは,主要な埋め込みバックボーンと専門的なベンチマークにおいて,標準的な事前微調整や事後正則化手法を上回る性能を示した。
    • 既存の事前微調整手法で生じる崩壊を防ぎ,安定性を維持することが確認された。
    • 埋め込み空間の分析から,REZEが元の埋め込み多様体に沿った制御されたシフトを誘起することが示された。

    Link: https://arxiv.org/abs/2604.17257

  • カテゴリ適応型安全アライメント [cs.CL, cs.AI]目的:大規模言語モデルの安全アライメント
    • 言語モデルの安全性確保は,社会実装において不可欠であり,その重要性は増している。
    • 従来の安全アライメント手法では,安全性評価が一律であり,特定の有害カテゴリへの対応が不十分な場合がある。
    • カテゴリごとの安全マージンを適応的に調整することで,よりきめ細やかな安全アライメントを実現する。
    • Cat-DPOは,既存の直接選好最適化アルゴリズムを改良し,カテゴリごとの安全性を向上させる。
    • 2つのLLMバックボーンと6つのベースラインと比較して,Cat-DPOは全体的な有用性と無害性を改善する。
    • カテゴリごとの安全性のばらつきを抑え,最良と最悪のケースの差を縮小することに貢献する。

    Link: https://arxiv.org/abs/2604.17299

  • 古代碑文テクスチャ復元のための学習不要マルチ事例深層フレームワークMESA [cs.CV, cs.AI, cs.GR]目的:古代碑文の損傷箇所の復元
    • 歴史的資料の保存・解読において,碑文は重要な一次情報源である。
    • 碑文は破損や風化により情報が失われ,読解や分析を困難にする場合がある。
    • MESAは,類似した碑文を利用し,損傷部分のテクスチャを効果的に復元することを試みる。
    • MESAは,既存の画像復元手法の限界を克服し,高い復元精度を実現した。
    • VGG19の畳み込み特徴をグラム行列としてエンコードすることで,碑文のスタイルや筆致を捉えている。
    • 文字幅推定に基づいた層ごとの重み付けにより,文字形状に合わせたフィルタリングが可能となった。

    Link: https://arxiv.org/abs/2604.17390

  • EvoMaster:大規模な自律的科学研究のための基盤となる進化エージェントフレームワーク [cs.CL, cs.AI]目的:大規模な自律的科学研究のための進化エージェントフレームワーク
    • 近年のLLMとエージェントの融合により科学研究の新たな時代が到来。従来のフレームワークの限界を克服する必要がある。
    • 既存のエージェントフレームワークは静的で範囲が狭く,試行錯誤からの学習能力に乏しいという課題があった。
    • 自己進化を通じて仮説を洗練し,知識を蓄積する能力を備えたフレームワークを提供することで,科学的探求を支援する。
    • EvoMasterは,Humanity's Last Exam, MLE-Bench Lite, BrowseComp, FrontierScienceの4つのベンチマークで最先端のスコアを達成した。
    • OpenClawと比較して,最大で+316%の相対的な改善が見られ,EvoMasterの有効性と汎用性が実証された。
    • EvoMasterは,約100行のコードで記述でき,様々な分野に容易に適用可能なドメインに依存しない基盤を提供する。

    Link: https://arxiv.org/abs/2604.17406

  • EHRAG:ハイブリッドハイパーグラフ構築と検索による軽量グラフRAGにおけるセマンティックギャップの架橋 [cs.AI]目的:軽量グラフRAGにおけるセマンティックギャップの架橋
    • LLMの性能向上が求められており,知識獲得の効率化が重要である。
    • 既存の軽量RAGは構造的共起に依存し,潜在的なセマンティックな繋がりを捉えきれていない。
    • 構造とセマンティックレベルの関係性を捉えたハイパーグラフ構築による情報検索の精度向上を目指す。
    • EHRAGは,構造的共起とエンティティ埋め込みクラスタリングに基づくセマンティックな関係性を捉えたハイパーグラフを構築する。
    • EHRAGは,トピックを考慮したスコアリングとパーソナライズされたPageRankを用いた構造・セマンティックハイブリッド拡散検索を行う。
    • 4つのデータセットでの実験により,EHRAGが最先端のベースラインを上回り,線形インデックス複雑度とゼロトークン消費を維持することが示された。

    Link: https://arxiv.org/abs/2604.17458

  • DuQuant++:微細回転がFP4量子化のマイクロスケール化を向上 [cs.CV, cs.AI, cs.CL]目的:LLM推論効率化のためのMXFP4マイクロスケール化における量子化誤差の低減
    • 大規模言語モデルの推論コスト削減は,実用化において重要な課題である。
    • MXFP4形式では,外れ値がブロックスケールを増大させ,量子化誤差を引き起こす。
    • 外れ値に特化した微細回転によって,MXFP4形式における量子化誤差を軽減すること。
    • DuQuant++は,MXFP4形式にDuQuantの外れ値対応微細回転を適用することで,回転コストを半減させた。
    • LLaMA-3ファミリーを用いた実験で,DuQuant++は最先端の性能を達成した。
    • ブロックスケール間の分散の問題が解消され,単一の外れ値対応回転で処理が可能となった。

    Link: https://arxiv.org/abs/2604.17789

  • WebUncertainty:自律型ウェブエージェントのための二段階不確実性駆動型計画と推論 [cs.AI]目的:ウェブエージェントにおける計画と推論の不確実性軽減
    • ウェブ上のタスク自動化は,情報収集やサービス利用の効率化に不可欠である。
    • 既存エージェントは,動的な環境変化や長期間のタスク実行において,計画の柔軟性や推論の信頼性に課題がある。
    • 計画と推論における二段階の不確実性を考慮し,よりロバストな意思決定を可能とする。
    • 提案手法WebUncertaintyは,タスク不確実性に応じた計画モードの適応的な選択機構を導入した。
    • 行動不確実性駆動型モンテカルロ木探索(MCTS)推論機構により,不確実性の定量化と探索プロセスの最適化を実現した。
    • WebArenaとWebVoyagerの評価において,最先端の手法と比較して優れた性能を示した。

    Link: https://arxiv.org/abs/2604.17821

  • 局所的相互作用による文法の創発について [cs.CL, cs.AI, cs.LG]目的:算術式文法のメンバーシップ問題を学習する二次元ニューラル細胞オートマトンにおける文法処理の創発
    • 言語処理において,人間の文法能力のメカニズム解明は重要な課題である。
    • 従来の言語モデルは複雑であり,生物的な神経システムにおける文法獲得の過程を説明できない。
    • 局所的相互作用のみから文法構造が自発的に創発される可能性を示す。
    • 18,658パラメータのニューラル細胞オートマトンが,境界信号のみの教師あり学習によりProto-CKYと呼ばれる秩序だった内部表現を自発的に形成した。
    • Proto-CKYは,正則言語を超える表現力,学習分布を超えた構造的汎化,文法構造との量的整合性(ピアソンのr≈0.71)という文法処理の3つの基準を満たしている。
    • この表現は4つの文脈自由文法で独立して創発し,摂動後も自発的に再生する。CKYアルゴリズムと機能的には一致するが,形式的には異なる。

    Link: https://arxiv.org/abs/2604.17857

  • 大規模言語モデルのための潜在的推論方策最適化:LEPO [cs.IR, cs.LG, cs.AI]目的:大規模言語モデルにおける潜在的推論能力の向上
    • 言語モデルの高度化に伴い,より複雑な推論能力が求められている。
    • 潜在的推論手法は決定論的になりやすく,多様な推論経路を発見できない場合がある。
    • 潜在的表現への確率的サンプリングを導入し,探索能力を回復させる。
    • 提案手法LEPOは,連続的な潜在表現に対して直接強化学習を適用する新しいフレームワークである。
    • ロールアウト段階で確率性を維持し,多様な軌跡サンプリングを可能にする。
    • 既存の強化学習手法と比較して,顕著な性能向上を実験的に示した。

    Link: https://arxiv.org/abs/2604.17892

  • マルチエージェントLLMシステムにおける多様性崩壊:構造的結合とオープンエンドなアイデア創出における集団的失敗 [cs.MA, cs.MA, cs.AI, cs.CL]目的:マルチエージェントLLMシステムにおける多様性の崩壊メカニズムの解明
    • 創造的な問題解決において,多様なアイデアが重要である。LLMエージェント間の協調によるアイデア創出が期待されている。
    • 協調が必ずしも探索の多様性を広げるとは限らず,多様性が低下する原因が不明である。
    • エージェント間の構造的結合が多様性崩壊を引き起こすメカニズムを特定し,改善策を提示する。
    • 高性能でアライメントされたモデルは,個々のサンプル品質は高いものの,多様性の向上に限界があることが示された。
    • 権威的なエージェントが主導するグループでは,より若手主導のグループと比較して,意味的な多様性が抑制される傾向がある。
    • グループ規模の拡大や,密なコミュニケーション構造は,早期の収束を加速させ,多様性の低下を招く可能性がある。

    Link: https://arxiv.org/abs/2604.18005

  • μNPUにおけるリアルタイム心電図・筋電図モデリングに向けて [cs.HC, cs.LG]目的:心電図および筋電図信号解析のための軽量かつNPU対応モデルアーキテクチャとトレーニングフレームワーク
    • ウェアラブルデバイスの普及に伴い,リアルタイムな生理信号解析の需要が高まっている。
    • Transformerモデルは高性能だが,リソース制約のある小型ハードウェアとの互換性が低い。
    • 小型NPUでも生理信号解析が可能となる,低消費電力なモデルの実現を目指す。
    • PhysioLiteは,最新のTransformerモデルと同等の性能を,10%以下のサイズで実現した。
    • 学習可能なウェーブレットフィルタバンクやハードウェアに配慮した設計により,μNPU上での実行可能性を示した。
    • MAX78000およびHX6538 WE2 μNPU上での遅延とリソース消費のプロファイリングを行った。

    Link: https://arxiv.org/abs/2604.18067

  • モジュール表現圧縮:効率的かつ効果的な推薦のためのLLMの適応 [cs.IR, cs.AI, cs.CL]目的:LLM表現の圧縮
    • 推薦システムは重要な情報提供手段であり,その精度向上はユーザー体験に直結する。
    • LLMの活用には計算コストやストレージの問題があり,効率的な表現圧縮が課題となる。
    • LLMの中間層の優位性を活かし,モジュール構造を制御することで表現圧縮を最適化する。
    • 本研究では,LLM表現圧縮における中間層表現の優位性(MRA)を明らかにした。
    • 提案手法MARCは,LLMのモジュール構造を明示的に制御し,効率的な表現を生成する。
    • 大規模なオンラインA/Bテストにおいて,MARCはeCPMを2.82%向上させる結果を得た。

    Link: https://arxiv.org/abs/2604.18146

  • MM-JudgeBias:MLLM-as-a-Judgeにおける構成的バイアスの評価ベンチマーク [cs.CL, cs.AI, cs.CV]目的:MLLM-as-a-Judgeにおける構成的バイアスの評価
    • 近年,MLLMを自動評価者として活用する研究が進む。
    • MLLMの信頼性やバイアスに対する脆弱性は未解明な点が多い。
    • 視覚・テキスト情報の統合の不備による評価の不安定性を解消する。
    • 多くのMLLMは重要な視覚・テキスト情報を適切に統合できず,信頼性の低い評価を示す。
    • MM-JudgeBiasは,クエリ,画像,応答に対する制御された摂動を通じて,バイアスを評価する。
    • 26個の最先端MLLM実験により,モダリティの無視や評価傾向の非対称性が明らかになった。

    Link: https://arxiv.org/abs/2604.18164

  • STaD:LLMにおける構成的スキルギャップを特定するための段階的タスク設計 [cs.CL, cs.AI]目的:LLMの構成的スキルギャップの特定
    • LLMの能力評価は重要であり,多様な分野への応用が期待されている。
    • 従来のベンチマークでは,LLMの弱点や改善点が明確にならない場合がある。
    • 段階的な支援を通して,LLMの弱点を可視化し,改善に繋げる。
    • STaDフレームワークは,ベンチマークタスクに段階的なサポートを導入することで,LLMの行動を体系的に分析する。
    • 6種類のLLMを用いた実験により,3つの推論ベンチマークにおいて複数の失敗点が明らかになった。
    • 各モデルの固有のスキルギャップを特定することができた。

    Link: https://arxiv.org/abs/2604.18177

  • 創造性評価のための進化木構造に基づく心理測定的文脈生成器:AlphaContext [cs.CL, cs.AI]目的:創造性評価のための心理測定的文脈生成
    • LLMと人間AI協調の時代において,創造性はイノベーションの基盤であり,重要な能力である。
    • 質の高い専門家による文脈が不足しており,既存のLLM生成器は多様性や思考支援に課題がある。
    • 創造性評価に適した多様で高品質な文脈を自動生成し,評価の改善を目指す。
    • AlphaContextは,専門家の設計をルール化するHyperTree Outline PlannerとMCTSによる文脈生成器を組み合わせる。
    • MAP-Elitesを用いた進化型文脈最適化により,多様性と品質を両立した文脈を生成する。
    • 実験の結果,6つの品質指標において既存手法と比較して平均8%の改善が確認された。

    Link: https://arxiv.org/abs/2604.18398

  • UDM-GRPO:一様離散拡散モデルのための安定かつ効率的なグループ相対方策最適化 [cs.ET, cs.CL, cs.CV, cs.LG]目的:一様離散拡散モデルと強化学習の統合
    • 離散生成モデリングの新たな手法として,一様離散拡散モデルが注目されている。
    • 既存の強化学習アルゴリズムを単純に適用すると,学習が不安定になり,性能向上が限定的になる。
    • 拡散モデルと強化学習を安定的に統合し,生成性能を向上させることを目指す。
    • 提案手法UDM-GRPOは,画像生成タスクにおいてベースラインモデルの性能を大幅に向上させる。
    • GenEvalの精度は69%から96%に,PickScoreは20.46から23.81に向上し,最先端の性能を達成した。
    • OCRベンチマークでは精度が8%から57%に向上し,汎化能力を実証した。

    Link: https://arxiv.org/abs/2604.18518

  • システムダイナミクスAIアシスタントのベンチマーク:クラウド対ローカルLLMによるCLD抽出と議論 [cs.AI, cs.HC, cs.LG]目的:システムダイナミクスAI支援のためのクラウドAPIとローカルホスト型オープンソースモデルの評価
    • 複雑なシステムの理解とモデリングは,政策決定や問題解決において重要である。
    • システムダイナミクスのモデル構築支援AIは発展途上であり,性能評価が不十分である。
    • クラウドとローカルLLMの性能を比較し,実用的なガイドラインを提供すること。
    • CLD抽出において,クラウドモデルは77~89%の合格率を達成し,最良のローカルモデルは77%と同等の性能を示した。
    • 議論においては,ローカルモデルはモデル構築段階で50~100%,フィードバック説明で47~75%の性能を達成する一方,エラー修正は不得意であった。
    • バックエンドの選択が量子化レベルよりも実用的な影響が大きく,mlx_lmはJSON制約を強制しないため,llama.cppがより信頼性が高い。

    Link: https://arxiv.org/abs/2604.18566

  • 言語的信念の逐次ベイズ更新によるエージェント的予測 [cs.AI]目的:二値予測のためのエージェントシステム
    • 予測は意思決定やリスク管理において不可欠であり,その精度向上は重要である。
    • 大規模言語モデルによる予測は,文脈の長さや情報の過剰な追加に課題がある。
    • 言語的信念の更新と集約手法により,予測精度と安定性を高める。
    • 提案手法BLFは,ForecastBenchベンチマークにおいて,既存の最先端手法を凌駕する性能を示した。
    • 構造化された信念状態が,ウェブ検索へのアクセスとほぼ同等の効果を持つことが示された。
    • 縮小集約と階層的較正がそれぞれ有意な性能向上に貢献している。

    Link: https://arxiv.org/abs/2604.18576

  • Sessa:選択的状態空間注意 [cs.LG, cs.AI, cs.CL]目的:長文脈における情報保持と選択的検索のメカニズム
    • 近年の系列モデリングにおいて,Transformerと状態空間モデルが主流である。
    • 長文脈において,Transformerは注意機構の拡散,状態空間モデルは長期依存性の喪失が課題となる。
    • 再帰的フィードバックパスに注意機構を組み込み,情報保持と選択的検索を改善する。
    • Sessaは,TransformerやMambaと比較して,長文脈ベンチマークで優れた性能を示した。
    • 理論的に,Sessaは特定の条件下で,より緩やかな減衰率を持つべき乗則メモリ特性を示すことが証明された。
    • Sessaは,距離に関わらず影響が減衰しないプロファイルを含む,柔軟な選択的検索を実現する唯一のモデルクラスである。

    Link: https://arxiv.org/abs/2604.18580

  • 下水流量推定のための組み込みFPGAベースソフトセンサの自動構築に向けて [eess.SP, cs.AI]目的:下水流量推定のための自動化されたエンドツーエンドソリューション
    • IoTデバイスにおける深層学習ベースのソフトセンサは,信頼性と省エネルギー性に優れる。
    • 下水流量推定への応用は,データセット不足,開発・展開ツール,ハードウェアの最適化不足により遅れている。
    • 本研究は,これらの課題を解決し,組み込みFPGAを用いた自動化されたソリューションを提案する。
    • プロトタイプIoTデバイスを用いて,下水流量推定のための自動化されたエンドツーエンドソリューションが実現された。
    • 既存のツールチェーンの問題点を克服し,デバイス上でのAIモデル開発・展開を容易にした。
    • エネルギー効率に最適化されたソフトセンサアプリケーションに向けたハードウェア基盤を提供した。

    Link: https://arxiv.org/abs/2407.05102

  • 有限混合モデルのビザンチン耐性分散学習 [stat.ME, cs.LG, stat.ML]目的:有限混合モデルのビザンチン耐性分散学習手法
    • 現代の分散データストレージに対応するため,統計手法の更新が不可欠である。
    • 局所的なサブ集団のインデックスが置換される「ラベルスイッチング問題」が存在する。
    • ビザンチン故障に対する脆弱性を解消し,ロバストな集約を可能にすること。
    • 提案手法DFMRは,局所的な推定値の密度を利用したフィルタリング機構により,ビザンチン故障に強い。
    • DFMRは,局所的な推定値間のL2距離を分析することで,破損した推定値を特定し除去する。
    • 理論的根拠に基づき,最適な収束速度と最尤推定値との漸近的な同等性を示す。

    Link: https://arxiv.org/abs/2407.13980

  • 材料および分子特性予測のための大規模言語モデルによる回帰 [cond-mat.mtrl-sci, cs.LG]目的:材料および分子特性の回帰タスクにおける大規模言語モデルの能力
    • 材料科学や創薬において,特性予測は重要な課題であり,効率的な材料設計に不可欠である。
    • 既存の特性予測モデルは,詳細な分子構造情報に依存しており,簡便な入力からの予測は困難である。
    • 本研究は,組成情報のみを入力として,大規模言語モデルによる特性予測の可能性を探求する。
    • LLaMA 3をSMILES形式で微調整することで,QM9データセットにおいて,ランダムフォレストや全結合ニューラルネットワークに匹敵する回帰結果が得られた。
    • 材料特性の予測においても,化合物記述のみを用いた場合,ランダムフォレストや元素記述子と同程度の精度を示した。
    • LLaMA 3は,GPT-3.5やGPT-4oよりも優れた予測性能を示し,大規模言語モデルの多様性を示唆している。

    Link: https://arxiv.org/abs/2409.06080

  • AIから恩恵を受けるのは誰か:自己選択,スキルギャップ,そしてAIフィードバックの隠れたコスト [econ.GN, cs.AI, cs.HC, q-fin.EC]目的:AIフィードバックの自己選択が,個人学習と集団的成果に及ぼす影響
    • AI技術の発展は,学習や意思決定のあり方を変革する可能性を秘めている。
    • AIフィードバックの効果は,利用者の特性によって左右される可能性が指摘されている。
    • AIフィードバックの利用における自己選択が,スキルギャップの拡大や知的多様性の低下を招くのかを検証する。
    • オンラインチェスプラットフォームのデータ分析から,意欲的で熟練したプレイヤーがAIフィードバックを積極的に利用することが明らかになった。
    • AIフィードバックによる学習効果は,個人の意欲を考慮に入れることで消失し,AIの有効性に対する幻想が生じることが示された。
    • AIフィードバックへの自己選択は,スキルギャップの拡大と知的多様性の低下を引き起こし,組織学習や人材育成に影響を与える可能性がある。

    Link: https://arxiv.org/abs/2409.18660

  • 区分線形カーネル近似を用いたガウス過程獲得関数の大域的最適化 [math.OC, cs.LG]目的:ガウス過程獲得関数の大域的最適化手法
    • ベイズ最適化は効率的な探索手法として重要であり,その性能は獲得関数の最適化に大きく依存する。
    • 獲得関数の最適化は非凸問題であり,既存手法では大域的最適解への収束が保証されない。
    • 区分線形カーネル近似と混合整数計画法を用いることで,獲得関数の大域的最適化を可能とする。
    • 提案手法は,ガウス過程カーネルの区分線形近似を通じて混合整数二次計画問題(MIQP)として獲得関数を定式化する。
    • 理論的な後悔境界を解析し,合成関数,制約付きベンチマーク,ハイパーパラメータ調整タスクにおける有効性を示す。
    • 定式化された手法は,任意の定常または内積カーネルを用いる不確実性に基づく獲得関数に適用可能である。

    Link: https://arxiv.org/abs/2410.16893

  • データ駆動型検閲ニュースベンダー問題 [math.OC, cs.LG, stat.ML]目的:検閲されたオフライン販売データに基づく過剰在庫と在庫不足の期待コスト最小化
    • 需要予測はサプライチェーン管理において不可欠であり,効率的な在庫管理を可能にする。
    • 実際の販売データは,需要情報が完全に観測できない検閲されている場合がある。
    • 検閲されたデータから最適な発注量を決定するための理論的限界とロバストなアルゴリズムを確立する。
    • 需要の検閲度合いが,学習アルゴリズムの性能に与える影響を分布ロバスト最適化の枠組みで分析した。
    • 検閲下での達成可能なリグレットのスペクトルを明らかにし,検閲による情報損失を正確に特徴づけた。
    • 検閲レベルに適応するロバストなアルゴリズムを提案し,有限サンプル保証と近最適性を示した。

    Link: https://arxiv.org/abs/2412.01763

  • DADA:距離適応型二重平均法 [math.OC, cs.LG]目的:凸最適化問題に対する汎用的な勾配法
    • 機械学習や信号処理など,様々な分野で最適化問題は不可欠である。
    • 既存手法は問題固有のパラメータ調整が必要で,汎用性に欠ける場合がある。
    • 問題に依存しない汎用的な最適化アルゴリズムを開発し,パラメータ調整の負担を軽減する。
    • 提案手法DADAは,二重平均法を基盤とし,観測された勾配と開始点からの距離に基づいて係数を動的に調整する。
    • DADAは,リプシッツ関数,ホルダー滑らかな関数など,幅広い問題クラスに対して適用可能である。
    • 制約付き問題や非有界領域の問題にも適用でき,反復回数や目標精度に関する事前知識を必要としない点が特徴である。

    Link: https://arxiv.org/abs/2501.10258

  • 格子視覚:非定常空間データのモデル化のための画像間ネットワーク [stat.ML, cs.LG]目的:非定常空間データのパラメータ推定
    • 空間分布する確率変数のモデル化は,多様な分野で重要である。
    • 大規模かつ非定常な空間データに対する最尤推定は計算コストが高い。
    • 画像間ネットワークを用いて,複雑な空間自己回帰モデルのパラメータ推定を効率化する。
    • 空間自己回帰モデルのパラメータを画像として捉え,画像間ネットワークを適用することで高速な推定が可能となった。
    • 従来の最尤推定を回避し,より複雑な非定常空間データモデルを扱えるようになった。
    • 提案手法は,パラメータ推定の精度と速度の両面で優れた結果を示した。

    Link: https://arxiv.org/abs/2505.09803

  • 多値ブールアーキテクチャによる高効率かつ効果的なLLM [stat.ML, cs.LG]目的:大規模言語モデルの効率化
    • LLMは自然言語処理の基盤技術であり,その発展は様々な応用を可能とする。
    • LLMの巨大化は計算コストの増大を招き,実用上の制約となっている。
    • ブール演算によるモデル表現で,計算効率と性能の両立を目指す。
    • 本研究では,多値ブールパラメータによるLLM表現を提案し,ブール領域での直接的なファインチューニングを実現した。
    • 潜在変数に依存する従来法と異なり,表現能力を維持しつつ複雑さを大幅に削減する。
    • 多様なLLMにおける実験により,最新の低ビット量子化手法や二値化手法を上回る性能を示す。

    Link: https://arxiv.org/abs/2505.22811

  • 量子近似最適化アルゴリズムにおけるパラメータ初期化のための群知能最適化アルゴリズムのベンチマーク [quant-ph, cs.NE]目的:量子近似最適化アルゴリズムのパラメータ初期化における群知能最適化手法の有効性評価
    • 組み合わせ最適化問題解決への応用が期待される量子計算の重要な手法の一つで,その性能向上が求められている。
    • 量子近似最適化アルゴリズムの性能はパラメータに大きく依存するが,最適なパラメータ探索は困難である。
    • ノイズ環境下を含む様々な条件下で,よりロバストなパラメータ探索手法を確立し,アルゴリズムの性能を向上させる。
    • 粒子群最適化,完全情報粒子群最適化,量子粒子群最適化などの群知能最適化手法が,Adamなどの標準最適化手法と比較して低い近似ギャップと安定した収束を示した。
    • 特に,ノイズやショットノイズが存在する条件下において,群知能最適化手法は優れた性能を維持することが確認された。
    • これらの結果は,群知能最適化が量子近似最適化アルゴリズムの複雑なパラメータ空間を効率的に探索するための有望なアプローチであることを示唆している。

    Link: https://arxiv.org/abs/2506.06790

  • ニューラルネットワークによる共分散行列のクリーニングを用いた,分散最小化のための大規模ポートフォリオ最適化 [q-fin.PM, cs.AI, math.OC, physics.data-an, stat.ML]目的:分散最小化ポートフォリオの最適化
    • 投資ポートフォリオの分散を最小化することは,リスク管理において非常に重要である。
    • 大規模な株式共分散行列の推定は計算コストが高く,精度が課題となる。
    • ニューラルネットワークを用いて,共分散行列を効率的にクリーニングし,最適化精度を向上させる。
    • 本研究では,回転不変なニューラルネットワークを開発し,過去の収益率と周辺ボラティリティを学習することで,グローバル最小分散ポートフォリオを導出した。
    • このモデルは,次元に依存せず,数百銘柄で学習後,1000銘柄への適用が可能であり,高い汎化能力を示した。
    • アウトオブサンプルテストの結果,本手法は,既存の競合手法と比較して,実現ボラティリティが低く,最大ドローダウンが小さく,シャープレシオが高いことが確認された。

    Link: https://arxiv.org/abs/2507.01918

  • 多指標ガイド強化学習に基づく定量取引意思決定エージェントQTMRL [q-fin.PM, cs.LG, q-fin.CP]目的:多次元技術指標と強化学習を組み合わせた適応的かつ安定的なポートフォリオ管理
    • グローバル金融市場は変動が激しく,変化への適応が重要である
    • 既存の定量取引モデルは,市場の変化や想定外の事態に対応できない
    • 市場のダイナミクスを捉え,安定的な取引を実現するエージェントの開発
    • QTMRLは,S&P500の23年間のデータを用いた実験で,9つのベースラインと比較して収益性,リスク調整後のリターン,下落リスクの抑制において優れていることが確認された。
    • QTMRLは,トレンド,ボラティリティ,モメンタム指標を含む多次元技術指標データセットを活用し,市場の全体的な動きを捉える。
    • 軽量な強化学習フレームワーク(A2Cアルゴリズム)を設計し,政策学習と具体的な取引決定をサポートする。

    Link: https://arxiv.org/abs/2508.20467

  • エネルギー重み付きフローマッチング:効率的でスケーラブルなボルツマンサンプリングのための連続正規化フローの解放 [stat.ML, cs.LG]目的:ボルツマン分布からのサンプリング手法
    • 科学計算において,ボルツマン分布からのサンプリングは不可欠だが,計算コストが高い。
    • 既存手法は,大量のサンプルデータが必要か,高度なアーキテクチャの活用が困難である。
    • エネルギー関数評価のみを用いて,連続正規化フローをボルツマン分布に適用する。
    • 提案手法であるエネルギー重み付きフローマッチング(EWFM)は,任意の提案分布からのサンプルで学習可能である。
    • iEWFMとaEWFMの2つのアルゴリズムを開発し,反復的な提案の改善と温度アニーリングを導入した。
    • 55粒子Lennard-Jonesクラスターを含むベンチマークにおいて,既存手法と同等のサンプル品質を,エネルギー評価回数を大幅に削減して実現した。

    Link: https://arxiv.org/abs/2509.03726

  • 量子ウォークによる空間的最適腕識別 [quant-ph, cs.AI, cs.LG, math-ph, math.MP]目的:グラフ構造上の最適腕識別問題に対する量子アルゴリズムフレームワーク
    • 強化学習と量子計算の融合は,複雑な意思決定問題の解決に貢献し,新たな可能性を開く。
    • グラフ構造上の多腕バンディット問題に対する量子アプローチは未だ限られており,効率的なアルゴリズムが求められる。
    • グラフ構造上の制約を考慮した量子探索アルゴリズムを開発し,最適腕識別の効率化を目指す。
    • 本研究で提案するQSBAIフレームワークは,Szegedyのウォークフレームワークを用いて,グラフ制約のある行動の重ね合わせを量子ウォークで表現する。
    • 完全グラフおよび二部グラフにおける解析により,最適腕を識別できる確率と達成に必要なステップ数が理論的に示された。
    • 量子ウォークを用いた探索が,構造的な制約のある意思決定問題に適用可能であることが示唆された。

    Link: https://arxiv.org/abs/2509.05890

  • ランジュバンモンテカルロ法とランダム化:対数凹性および勾配リプシッツ性以上の非漸近誤差限界 [math.AT, cs.CG, stat.ML, cs.LG, cs.NA, math.NA]目的:複雑かつ高次元の目標分布からの効率的なサンプリング
    • 科学計算,統計,機械学習など,多様な分野における基盤技術である。
    • 高次元分布における効率的なサンプリング手法の誤差評価が課題である。
    • 対数凹性や勾配リプシッツ性を満たさない場合でも誤差限界を導出する。
    • ランダム化ランジュバンモンテカルロ法(RLMC)の誤差限界を,対数ソボレフ不等式下で$O(\sqrt{d}h)$と導出した。
    • 勾配が非大域的にリプシッツ連続で超線形成長する場合に,改良されたRLMCアルゴリズムを提案した。
    • 改良されたRLMCアルゴリズムと非漸近誤差限界は,非大域的リプシッツ設定では新規である。

    Link: https://arxiv.org/abs/2509.25630

  • Transformer確率モデルの効率的な自己回帰推論 [stat.ML, cs.LG]目的:Transformer確率モデルにおける効率的な自己回帰推論手法
    • 確率的推論は,不確実性を含む問題解決に不可欠であり,機械学習の重要な分野である。
    • 従来のセットベースモデルは,複数回の予測を行う際に計算コストが増大するという課題があった。
    • セットベースモデルと自己回帰モデルの利点を組み合わせ,効率的な複数予測を実現すること。
    • 提案手法は,文脈の再エンコードなしに,高速な共同予測サンプリングと密度評価を可能にする。
    • 実験結果から,提案手法は既存手法と同等の性能を維持しつつ,最大20倍の速度向上を実現した。
    • また,メモリ使用量も最大7分の1に削減されたことが示された。

    Link: https://arxiv.org/abs/2510.09477

  • クロスラーニングによるデータ類似性の定量化 [stat.ML, cs.LG]目的:データセット間の類似性の定量化
    • 機械学習において,データセットの類似性評価は,転移学習やドメイン適応の基礎となる。
    • 既存手法は入力特徴量の分布に焦点を当て,ラベル情報や特徴量と応答の関係性を無視している。
    • ラベル情報も考慮した,より正確なデータセット類似性評価手法を確立すること。
    • 提案手法であるクロスラーニングスコア(CLS)は,双方向の汎化性能に基づきデータセットの類似性を測定する。
    • CLSは,線形モデルにおける決定境界のコサイン類似性と理論的に関連付けられ,幾何学的な解釈を提供する。
    • 「転移可能領域」フレームワークは,ソースデータセットを正,曖昧,負の転移領域に分類し,転移学習に役立つ。

    Link: https://arxiv.org/abs/2510.10866

  • PriorGuide:シミュレーションに基づく推論におけるテスト時事前分布適応 [stat.ML, cs.LG]目的:シミュレーションに基づく推論におけるテスト時の事前分布適応手法
    • 工学や神経科学など,計算分野におけるベイズ推論の効率的な手法が求められている。
    • 既存手法は,学習時に用いた事前分布に依存し,柔軟性に課題がある。
    • テスト時に事前分布を適応させることで,事前分布の制約を克服し,汎用性を向上させる。
    • PriorGuideは,拡散モデルを用いた推論において,再学習なしで事前分布を柔軟に変化させる。
    • 新たな情報や専門知識を学習後に容易に取り込み,推論モデルの汎用性を高める。
    • PriorGuideは,新しい事前分布への適応を可能にする新しいガイダンス近似を用いる。

    Link: https://arxiv.org/abs/2510.13763

  • 局所下降補題に基づく非単調勾配法 [math.OC, cs.LG]目的:非単調直線探索勾配法
    • 最適化問題において,滑らかな関数ではない場合でも効率的な解法が求められている。
    • 従来の勾配法では,非凸関数に対して収束が保証されない場合がある。
    • 上界$\mathcal{C}^2$関数に対する,収束性保証のある新しい勾配法を提案する。
    • 提案手法は最適化問題の停留点への部分列収束が証明された。
    • 自己適応非単調勾配法(SNSM)を設計し,直線探索のパラメータを自動更新する仕組みを導入した。
    • 最小二乗和クラスタリング問題への適用例を示し,既存アルゴリズムとの比較実験で優位性を示した。

    Link: https://arxiv.org/abs/2510.19341

  • StrikeWatch:低消費電力FPGAを用いたコンパクトな時系列モデルによる手首装着型歩行認識 [eess.SP, cs.LG]目的:手首装着型デバイスにおけるリアルタイム歩行認識の実現
    • ランニングは健康に良いが,不適切な歩行パターンは怪我の原因となりうる。
    • 既存の歩行分析システムは,サイズが大きく,リアルタイム処理が困難である。
    • 手首装着型デバイスでリアルタイム歩行認識を実現し,怪我予防に貢献する。
    • 6ビット量子化された1D-SepCNNが,iCE40UP5K上でF1スコア0.847を達成した。
    • 推論当たりの消費電力を0.350マイクロジュール,遅延を0.140ミリ秒に抑えた。
    • この構成では,320mAhバッテリーで最大13.6日間の連続推論が可能である。

    Link: https://arxiv.org/abs/2510.24738

  • MR画像再構成のための事前条件付き非調整ランジェバンアルゴリズムによる高速堅牢な拡散事後サンプリング [physics.med-ph, cs.CV, cs.LG, math.PR]目的:MR画像再構成における高速収束を可能にするロバストなサンプリングアルゴリズムの開発
    • MRIは,病気の診断や治療において不可欠な画像診断技術であるため,その高速化・高画質化は重要課題である。
    • 高度にアンダーサンプリングされたk空間データからの再構成は,計算時間が長く,パラメータ調整が難しいという課題がある。
    • 拡散事後サンプリングの収束速度を改善し,パラメータ調整の必要性をなくすことを目指す。
    • 提案手法は,カルテシアンおよび非カルテシアン加速MRIにおいて,焼きなましサンプリングやDPSよりも高速な再構成速度とサンプル品質を実現した。
    • 事前条件付き正確尤度を用いることで,様々なMRI再構成タスクにおいて,高速かつ信頼性の高い事後サンプリングが可能となった。
    • 提案手法は,パラメータ調整を必要とせずに,安定した結果が得られる。

    Link: https://arxiv.org/abs/2512.05791

  • フローマッチングによるリアルタイムストリーミング生成音声復元 [eess.SP, cs.LG, cs.SD]目的:リアルタイム通信における生成音声処理の実現
    • 近年の音声処理分野において,拡散モデルに基づく生成モデルが注目されており,自然な音声合成が可能となっている。
    • 拡散モデルは計算コストが高く,リアルタイム通信への応用が遅れている。
    • 低遅延かつ高品質なストリーミング生成音声処理システムの構築を目指す。
    • Stream$.$FMは,アルゴリズム遅延32ミリ秒,総遅延48ミリ秒を実現し,リアルタイム通信における生成音声処理への道を開いた。
    • 提案手法は,バッファリングストリーミング推論スキームと最適化されたDNNアーキテクチャを採用し,計算資源と品質のトレードオフを考慮したモデル圧縮を検討した。
    • Stream$.$FMは,様々な音声処理タスク(ノイズ除去,残響除去など)において,最先端の性能を示し,非ストリーミングモデルと比較して品質の低下を抑えた。

    Link: https://arxiv.org/abs/2512.19442

  • 定常重み付けによるベルマン完全性のない Fitted Q 評価 [stat.ML, cs.LG]目的:オフポリシー評価における Fitted Q 評価の安定化
    • 強化学習において,オフポリシー評価は重要な課題であり,安全な方策改善に不可欠である。
    • 既存のFitted Q 評価理論はベルマン完全性に依存しており,実用的な関数クラスでは要件を満たさない場合が多い。
    • 定常分布の密度比推定に基づく重み付けにより,ベルマン完全性を必要とせず,Fitted Q 評価を安定化させる。
    • 提案手法は,標的方策の定常分布下での更新を可能にし,収縮性を回復させる。
    • 実験結果は,定常重み付けがオフポリシーサンプリング下でのFitted Q 評価の安定化に貢献することを示す。
    • 古典的なベアードの反例に対しても有効であることが確認された。

    Link: https://arxiv.org/abs/2512.23805

  • MR-Linac画像における時間的変化のAIベース検出 [math.GR, cs.CC, math.GT, eess.IV, cs.AI, cs.LG]目的:MR-Linac画像における微小な時間的変化の検出可能性
    • 放射線治療の精度向上には,腫瘍と正常組織の時間的変化の正確な把握が不可欠である。
    • 従来の画像診断では,微小な時間的変化の検出は困難であり,治療計画の最適化が制限される場合がある。
    • 本研究は,AIモデルを用いてMR-Linac画像から時間的変化を検出し,その臨床応用を目指す。
    • F1-FLモデルは高い性能(AUC=0.99,精度=0.95)を示し,時間的順序付けタスクにおいて放射線科医の性能を上回った。
    • All-pairsモデルも高い性能(AUC=0.97,精度=0.91)を示した。変化に寄与する領域は,前立腺,膀胱,恥骨結合であった。
    • 性能は分割間隔と相関があり,放射線照射されていない期間(SimとF1)では低下した。これは,観察された変化が時間的変動と放射線照射の両方を反映している可能性を示唆する。

    Link: https://arxiv.org/abs/2602.04983

  • 地震波伝播のための演算子学習における相反性の強制 [physics.geo-ph, cs.LG]目的:地震波伝播モデリングのための相反性強制ニューラル演算子
    • 地震構造や震源解析には正確かつ効率的な波場モデリングが不可欠である。
    • データ駆動型手法は発展の可能性を秘めるが,厳密な物理整合性が課題であった。
    • 相反性の原理を組み込むことで,物理整合性を向上させ,高速化を実現する。
    • 相反性強制ニューラル演算子(RENO)は,クロスアテンション機構と可換演算により,送信機と受信機の位置を入れ替えても不変性を保証する。
    • RENOは複数の震源に対する同時実行を可能にし,従来のニューラル演算子と比較して,推論速度を10倍に向上させた。
    • 粒子速度場,圧力場,トラベルタイム場など,様々な物理量に適用可能であり,より複雑な相反関係のエンコーディングへの道を開く。

    Link: https://arxiv.org/abs/2602.11631

  • 組み合わせ構造の強化された生成:ラムジー数 [math.CO, cs.AI, cs.CC]目的:ラムジー数の下界の改善
    • 組合せ数学における基本的な問題であり,グラフ理論などに応用がある。
    • ラムジー数の決定は計算困難であり,下界の算出も手間がかかる。
    • LLMを活用し,効率的にラムジー数の下界を算出すること。
    • 9つの古典的なラムジー数の下界を改善した。
    • 既存の正確な値と一致,および最良の下界を達成した。
    • AlphaEvolveというメタアルゴリズムが,多様な結果を生み出した。

    Link: https://arxiv.org/abs/2603.09172

  • 次世代シーケンシングの品質管理研究のための,不均衡データセットと複数特徴量表現 [q-bio.GN, cs.LG, cs.NE]目的:次世代シーケンシングデータの品質問題検出のためのデータセット
    • 次世代シーケンシングは生物のDNA/RNA研究に不可欠だが,品質管理は実験設定により困難である。
    • 既存のNGSリポジトリは品質関連の特徴量が限られており,自動品質管理ツール開発の障害となっている。
    • 本研究は,品質問題の特徴を捉えた特徴量表現を持つデータセットを構築し,品質管理研究を支援する。
    • 37,491のNGSサンプルから,QCツール由来の34特徴量と,ENCODE blocklist由来の8~1,183の特徴量を構築した。
    • データセットにはバイナリ品質ラベルが含まれており,低品質サンプルは全体の3.2%を占める。
    • 教師あり機械学習アルゴリズムにより,特徴量から品質ラベルを正確に予測することができ,特徴量表現の有用性が確認された。

    Link: https://arxiv.org/abs/2604.04981

  • ExoNet:TESSの系外惑星候補識別を目的とした多Modal深層学習 [astro-ph.EP, astro-ph.IM, cs.LG]目的:TESS系外惑星候補の識別
    • 系外惑星探査は,宇宙における生命の存在可能性を探る上で重要な研究分野である。
    • TESSによって検出された候補の目視検証には限界があり,効率的な検証手法が求められている。
    • 自動化された検証手法を用いて,TESSの未確認候補の中から信頼性の高い惑星候補を特定すること。
    • ExoNetは,Keplerデータで訓練され,高い分類性能とTESSデータへの効果的な一般化能力を示した。
    • 200個の未確認TESS候補に適用した結果,ハビタブルゾーン内に存在する複数の高確度候補を特定した。
    • 多Modal融合とAttention機構が,系外惑星候補の自動検証に有効であることが示された。

    Link: https://arxiv.org/abs/2604.15560