arXiv雑要約
AI - 2026/04/06 公開
分布シフトと異質特徴空間下における貸倒回収予測のための転移学習 [math.OC, cs.SY, eess.SY, quant-ph, cs.CC, math.CO, cs.DM, q-fin.RM, cs.LG]目的:貸倒回収率予測における転移学習の有効性検証
- 信用リスク管理において,正確な貸倒回収率予測は不可欠であり,規制資本の決定にも影響する。
- 貸倒イベントの発生頻度が低い場合,データ不足が予測モデルの構築を困難にする場合がある。
- 転移学習を活用し,分布シフトや特徴空間の異質性に対処することで,データ不足問題を解決する。
- 提案モデルFT-MDN-Transformerは,ターゲットドメインのデータが限られている状況下で,ベースラインモデルよりも優れた性能を発揮した。
- 特に,共変量シフトと条件付きシフトの場合に顕著な改善が見られたが,ラベルシフトは依然として課題である。
- 確率的予測は,経験的な回収分布を正確に追跡し,従来の点予測指標だけでは得られない豊富な情報を提供した。
疎な表面観測からの三次元領域海洋力学の高分解能確率的推定 [physics.ao-ph, cs.AI, math.DS, nlin.CD]目的:三次元海洋状態の再構成
- 地球の気候は海洋内部によって調節されるが,観測は限られている。
- 海洋内部の観測は限られており,衛星観測は表面に限られる。
- データが限られた状況下での海洋再構成手法の確立を目指す。
- 本研究では,99.9%まで疎な表面データから高分解能な三次元海洋状態を再構成する深さ認識型生成フレームワークを提示した。
- 条件付きノイズ除去拡散確率モデル(DDPM)を用い,背景力学モデルに依存せず,水温と海面高度の観測データから学習した。
- メキシコ湾への適用により,地下の温度,塩分,速度場を正確に再構成し,大規模循環と多重階層の変動を復元できることを示した。
積分カーネルに対するリプシッツ界 [stat.ML, cs.LG]目的:積分カーネルに関連する特徴マップのリプシッツ連続性
- カーネル法は機械学習において重要な役割を担い,その安定性には特徴マップの正則性が不可欠である。
- カーネル特徴マップのリプシッツ定数に関する明示的な表現は,限られた場合にしか知られていない。
- 微分可能性の仮定の下で,積分カーネルの特徴マップのリプシッツ連続性を明らかにし,定数を導出する。
- 十分条件のもとで,特徴マップのリプシッツ連続性を保証し,対応するリプシッツ定数の公式を導出した。
- 有限幅の二層ニューラルネットワークにおいて,関連するカーネルのリプシッツ定数を二次元積分で表現することに成功した。
- ガウス,ラプラス,マターンカーネルなど,連続かつシフト不変なカーネルに対するリプシッツ連続性の条件を証明した。
高次元におけるスコアベースデータ同化のための前方過程の再考 [stat.ML, cs.AI, cs.LG]目的:高次元データ同化における前方過程の再考
- 気候モデリングなど,複雑なシステムの状態推定は重要である。データ同化は,その精度向上に不可欠な技術である。
- 高次元空間では,従来のベイズフィルタは精度や計算コストの問題を抱える場合が多い。
- 測定情報に基づいた前方過程を定義することで,尤度スコアの近似誤差を減らし,データ同化の精度と安定性を向上させる。
- 提案手法(MASF)では,測定方程式から直接測定を考慮した前方過程を定義し,尤度スコアを解析的に扱うことを可能にした。
- 線形測定においては,尤度スコアを厳密に導出し,学習された事前スコアと組み合わせることで,事後スコアを得る。
- 数値実験により,提案手法が既存のスコアベースフィルタよりも高い精度と安定性を示すことが確認された。
サブスペース埋め込みとGPUフレンドリーなネステロフ加速投影勾配法によるスケーラブルな平均分散ポートフォリオ最適化 [math.OC, cs.CE, cs.DC, cs.LG, cs.NA, math.NA]目的:大規模制約付き平均分散ポートフォリオ最適化
- ポートフォリオ最適化は,金融工学における重要な課題であり,投資家の意思決定を支援する。
- 資産数の増加に伴い,計算コストが課題となり,実用的な解法が求められている。
- GPUを活用した高速化により,大規模ポートフォリオ最適化を実用的な時間で解決すること。
- 提案手法は,ランダムなサブスペース埋め込み,スペクトル切断,リッジ安定化を組み合わせ,効率的な要素を構築する。
- GPUフレンドリーな行列ベクトル積を利用したネステロフ加速投影勾配法(NPGA)により,計算時間を大幅に短縮した。
- 実データを用いた実験により,提案手法が精度を維持しつつ,Gurobiと比較して大幅な高速化を実現することが示された。
リーマン多様体上の反転不要自然勾配降下法 [stat.ML, cs.LG, stat.CO, stat.ME]目的:リーマン多様体上の確率分布パラメータに対する反転不要確率的自然勾配降下法の開発
- 統計的最適化において自然勾配法は広く用いられるが,従来の定式化はユークリッド空間を仮定する。
- パラメータ空間がユークリッド空間でない場合,正定値性や直交性などの制約を課すことが困難である。
- 多様体上のFisher情報行列を用いた効率的な更新手法により,制約付き最適化問題を解決する。
- 提案手法は,Fisher情報行列の逆行列をオンラインで近似し,スコアベクトルを用いて効率的に更新する。
- ステップサイズ指数α>2/3において,最適解への二乗距離に関してほぼ確実にO(log{s}/s^α)の収束率を示す。
- 変分ベイズ法や正規化フローを用いた実験で,ユークリッド空間上の手法と比較して有効性が確認された。
サイトの自由性判定法の半連続的緩和と,角度最小化としての自由性 [math.AG, cs.LG, math.CO]目的:線配置における自由性の判定
- 線配置の理論は,代数幾何学や組合せ論において重要な役割を果たす。
- 線配置の自由性判定は,一般に計算が困難であるという課題がある。
- サイトの自由性判定法を緩和することで,より効率的な自由性判定を目指す。
- 線配置の自由性判定に用いる関数を定義し,その幾何学的解釈を明らかにした。
- この関数は,線配置が自由な基底を持つか否かを測る指標として機能する。
- 強化学習を用いて線を追加する手順を開発し,自由性への角度距離を最小化することに成功した。
高次元経験的リスク最小化におけるガウス普遍性の崩壊に関する特性評価 [stat.ML, cs.LG]目的:高次元凸型経験的リスク最小化における主要統計量の漸近的min-max特性評価
- 機械学習において,高次元データに対する汎化性能の理論的保証は重要である。
- ガウス分布を仮定した理論では説明できないデータ分布が存在する。
- ガウス普遍性の適用範囲と限界を明らかにし,非ガウス分布下での理論的枠組みを構築する。
- データ行列に対する集中仮定と損失関数・正則化項に関する標準的な正則性条件の下で,経験的リスク最小化推定量$\hat{\theta}$の射影$\hat{\theta}^\top x$が,$\mu_{\hat{\theta}}^\top x$の分布と独立な中心化ガウス変数の畳み込みで近似されることが示された。
- この結果は,経験的リスク最小化におけるガウス普遍性の範囲と限界を明確にする。
- $\mathcal{C}^2$正則化項は,原点におけるヘッセ行列と$\mu_{\hat{\theta}}$における勾配によって決定される二次形式と同等であることが漸近的に証明された。
ResidualPlanner+: マージナルおよびそれ以上のためのスケーラブルな行列メカニズム [cs.DB, cs.CR, cs.LG]目的:マージナルとそれ以上のクエリに対するスケーラブルな行列メカニズム
- プライバシー保護されたデータ公開は重要であり,様々な下流タスクに役立つ。
- 既存のメカニズムは,大規模なデータセットに対してメモリ不足になる場合がある。
- 大規模データセットにおけるマージナルの精度向上と計算効率化を目指す。
- ResidualPlannerおよびResidualPlanner+は,既存手法よりも高速かつ正確にマージナルクエリに答えられる。
- ResidualPlannerは,マージナル分散の凸関数として表現できる多くの損失関数に対して最適化可能である。
- ResidualPlanner+は,マージナルと範囲/プレフィックス合計クエリを組み合わせた複雑なワークロードにも対応する。
大規模言語モデルを用いた効率的な因果グラフ探索 [cs.NI, cs.DC, cs.PF, cs.SY, eess.SY, cs.LG, cs.AI, stat.ME]目的:大規模言語モデルを利用した因果グラフの完全探索手法
- 因果推論は,科学的発見や意思決定において重要な役割を担う。
- 従来の因果グラフ探索は計算コストが高く,大規模グラフへの適用が困難であった。
- 本研究は,大規模グラフへの効率的な因果関係探索を目指す。
- 提案手法は,既存手法に比べてクエリ数を大幅に削減し,計算効率を向上させた。
- 観測データと組み合わせることで,探索性能をさらに向上させることが示された。
- 様々な規模の実世界データセットにおいて,最先端の結果を達成した。
出力制約付き決定木 [cs.LG]目的:出力制約付き回帰木(OCRT)の学習手法
- 機械学習モデルへの専門知識の組み込みは,実用的な予測精度と実現可能性の両立に不可欠である。
- 従来の決定木では,制約付き多ターゲット回帰タスクにおいて,制約を満たすことが困難である。
- 制約付き回帰タスクにおいて,精度と実現可能性を両立する決定木学習手法を開発すること。
- 提案手法(M-OCRT, E-OCRT, EP-OCRT)は,制約を考慮した決定木学習を可能にし,合成データと産業データで有効性が確認された。
- 特に,分割時に混合整数計画法を用いるM-OCRTは,制約を満たしつつ高精度な予測を実現する。
- さらに,凸集合に基づくランダムフォレストフレームワークを導入し,アンサンブル学習における可能性を示唆した。
グラフ畳み込み法による分枝限定法への補足資料 [cs.LG, math.OC]目的:組み合わせ最適化における深層学習モデルの統合
- NP困難問題の効率的な解法は,現実世界の様々な問題解決に不可欠である。
- 既存の厳密解法は,探索の指針となるヒューリスティックに依存し,性能が限界される。
- 深層学習で学習したヒューリスティックを用いて,探索効率の向上を目指す。
- 提案手法は,グラフ畳み込みニューラルネットワークを用いて最適性スコアを学習する。
- このスコアを分枝限定法のノード評価に利用することで,探索空間の効率的な探索を実現した。
- 実験結果は,提案手法が探索ノード数と計算時間を大幅に削減できることを示している。
表現的なプロンプティング:ゼロショットTTSにおける感情強度と話者一貫性の向上 [cs.SD, cs.AI, cs.CL, eess.AS]目的:感情強度と話者一貫性を高めたゼロショットTTSの実現
- 近年の音声合成技術の進展により,多様な音声表現が可能になった。
- 既存のプロンプト選択手法では,話者特性や感情強度の安定性が課題である。
- プロンプト選択戦略を改良し,表現豊かで安定した音声合成を目指す。
- 提案手法では,ピッチに基づくプロソディ特徴やLLMによる評価を用いてプロンプト候補を評価する。
- さらに,TTSモデルによる文字誤り率,話者類似度,感情類似度も評価に組み込む。
- 実験結果から,提案手法が感情強度と話者一貫性を向上させ,ゼロショットTTSの性能を高めることが示された。
条件付き固定点反復による因果モデルの償却推論 [cs.LG, stat.ML]目的:因果モデルの因果メカニズムの予測
- 科学的発見において,介入や分布外汎化は重要な目標である。
- 観測データからのSCM学習は困難であり,データセットごとにモデルを訓練する必要がある。
- データセットに依存しない単一モデルによる因果メカニズムの推論を目指す。
- 提案手法は,データセットごとに訓練されたベースラインと同程度の性能を示す。
- 分布内および分布外の問題において,高い汎化性能を発揮する。
- 少ないデータでも,ベースラインを上回る性能を示す。
ForgeryGPT:解釈可能な画像フォレンジック検出と局在化のためのマルチモーダルLLM [eess.SY, cs.SY, cs.CV, cs.AI]目的:画像フォレンジック検出と局在化における高度なフォレンジック知識の相関関係の捕捉
- 画像フォレンジックは,デジタルコンテンツの信頼性確保に不可欠であり,悪意ある改ざんを検出する上で重要である。
- 既存手法は低レベルな特徴に依存しやすく,改ざんの理由や詳細な局在化の説明が不十分である。
- 高次のフォレンジック知識を活用し,改ざん箇所の詳細な説明と対話的な分析を可能にすることを目指す。
- ForgeryGPTは,Mask-Aware Forgery Extractorを組み込むことで,画像中の精密なフォレンジックマスク情報を抽出する。
- FL-ExpertとMask Encoderにより,オブジェクトに依存しないフォレンジックプロンプトと強化されたVision Encoderを活用し,多規模な微細な改ざんの詳細を捉える。
- Mask-Text AlignmentとIFDLタスク固有のInstruction Tuningデータセットを用いた3段階の学習戦略により,性能が向上した。
S⁴ST:転移可能な標的攻撃のための強力で自己転移可能,高速かつシンプルなスケール変換 [cs.CR, cs.AI]目的:転移可能な標的攻撃における過学習問題の緩和と,データ依存性の排除
- 標的攻撃は,機械学習モデルの脆弱性を評価する上で重要であり,セキュリティ対策の向上に貢献する。
- 既存の転移可能な標的攻撃は,代理モデルへの過学習や,大量の学習データへの依存といった課題を抱えている。
- 本研究では,厳格なブラックボックス環境下で有効な,シンプルかつ効率的なスケール変換手法を開発し,その有効性を検証する。
- シンプルなスケール変換が,他の基本的な変換手法や複雑な手法と同等以上の転移可能な標的攻撃性能を示すことが明らかになった。
- S⁴STは,様々なアーキテクチャ,学習分布,タスクにおいて,最先端の有効性と効率性を両立し,データ依存性を排除している。
- スケールの有効性は,視覚データの多規模性と,学習中のスケール拡張に起因することが示唆され,スケール拡張は両刃の剣となる可能性がある。
分布統計は,ワンステップ蒸留拡散モデルにおける訓練データ監査可能性を回復する [cs.LG]目的:拡散モデルの訓練データ監査可能性の回復
- 拡散モデルの利用拡大に伴い,著作権侵害の有無などデータの出所確認が重要になっている。
- 蒸留処理によってモデルが訓練データを個別に記憶しなくなるため,データの出所を特定することが困難である。
- 蒸留後のモデルが出力分布を通じて訓練データとの関連性を維持していることを利用し,データの出所を追跡する。
- 蒸留されたモデルの出力分布は,訓練データ分布に非訓練データ分布よりも近いことが示された。
- 提案手法は,カーネルに基づく分布の不一致を利用して,未知のデータセットが訓練データ分布と統計的に整合しているかどうかを判定する。
- 実験の結果,提案手法は少数派の不正データであっても高い精度で検出可能であり,モデルの透明性向上に貢献することが確認された。
ゼロショット概念ボトルネックモデル [cs.LG, cs.AI, cs.CV]目的:概念ボトルネックモデルのゼロショット化
- AIの解釈可能性と制御可能性が重要視される中で,モデルの判断根拠を明確にすることが求められている。
- 従来の概念ボトルネックモデルは,特定のタスクでの学習が必須であり,データ収集や学習コストが高いという課題がある。
- 追加学習なしに,入力から概念,そしてラベルを予測する,解釈可能で制御可能なモデルを構築すること。
- 提案手法Z-CBMは,大規模な概念バンクを利用し,クロスモーダル検索により入力に関連する概念を動的に取得する。
- 取得された概念から,疎な線形回帰を用いて重要な概念を選択し,概念からラベルへの推論を行う。
- 実験により,Z-CBMが追加学習なしに解釈可能かつ制御可能な概念を提供することが確認された。
WiseMind:知識誘導型マルチエージェントフレームワークによる正確かつ共感的な精神疾患診断 [cs.AI, cs.CL]目的:精神疾患の正確かつ共感的な診断
- 精神医療の現場では,LLMの活用が期待される一方,信頼性や患者との信頼関係構築が課題である。
- LLMは構造化された臨床的推論に乏しく,患者の感情に寄り添ったコミュニケーションが難しい。
- 根拠に基づいた論理的思考と共感的なコミュニケーションを両立させ,診断の精度と信頼性を高める。
- WiseMindは,DSM-5に基づいた構造化知識グラフを活用し,幻覚を大幅に削減することに成功した。
- 仮想患者および実際のユーザーデータを用いた評価で,診断精度85.6%を達成し,精神科医の診断能力に匹敵する水準を示した。
- 精神科医による評価においても,WiseMindの応答は臨床的に妥当かつ心理的に支援的であると検証された。
ノイズ除去マルコフモデルの解析と設計に対する統一的アプローチ [cs.LG, cs.NA, math.NA, stat.ML]目的:ノイズ除去マルコフモデルの数学的基礎
- 生成モデルは,画像生成やデータ分析など,多様な分野で重要な役割を担っている。
- 従来の生成モデルは,モデルの設計や理論的解析がプロセスに依存するため,汎用性に欠ける。
- 任意のマルコフプロセスで利用可能な統一的な理論的枠組みを構築し,モデル設計を支援する。
- 測度輸送に基づいた生成モデルの数学的基礎を確立し,前方・後方プロセスの設計に関する統一的な変分目的関数を導出した。
- 連続・離散拡散モデルを包含する最も一般的なノイズ除去マルコフモデルの形を特定し,任意のレヴィー型プロセスによるモデル設計のレシピを提示した。
- 幾何ブラウン運動やジャンププロセスを用いた新しいノイズ除去マルコフモデルを構築し,複雑な分布のモデリングへの応用可能性を示した。
テキストから動画生成におけるニューロシンボリックフィードバックによる改善 [cs.CV, cs.AI]目的:テキストから動画生成の品質向上
- 動画生成技術はコンテンツ制作の効率化に貢献する重要な分野である。
- 複雑なプロンプトに対し,意味・時間的一貫性のある動画生成が課題である。
- ニューロシンボリックフィードバックによる動画の自動改善を目指す。
- 提案手法NeuS-Eは,追加学習なしに動画の品質を向上させる。
- ニューロシンボリックフィードバックにより,動画内の意味的な不整合を特定し,修正する。
- 様々なT2Vモデルで実験を行い,時間的・論理的整合性が約40%向上することを確認した。
gen2seg: 生成モデルによる汎用インスタンスセグメンテーション [cs.IR, cs.DM, math.CO, math.OC, cs.NI, cs.CV, cs.LG]目的:汎用的なインスタンスセグメンテーションの実現
- 画像認識分野において,物体検出とセグメンテーションは重要なタスクである。
- 既存手法では,学習データに依存した汎化性能の低さが課題となっていた。
- 生成モデルの持つ物体境界とシーン構成の理解を活用し,汎化性能を高める。
- Stable DiffusionとMAEをファインチューニングすることで,カテゴリーに依存しないインスタンスセグメンテーションが可能となった。
- ファインチューニングに使用していない未知のオブジェクトタイプやスタイルに対しても,高いゼロショット汎化性能を示した。
- 特に,微細構造や曖昧な境界のセグメンテーションにおいて,SAMを超える性能を発揮した。
StructEval:構造化出力生成能力のLLMベンチマーク [cs.CL, cs.CL, cs.ET, cond-mat.mtrl-sci, physics.app-ph, cs.SE, cs.AI, cs.CL]目的:大規模言語モデルの構造化出力生成能力の評価
- ソフトウェア開発におけるLLMの重要性が増しており,構造化出力能力が不可欠である。
- 既存のベンチマークは,多様な形式における構造的忠実性を体系的に評価していない。
- 多様な形式とタスクを通じて,LLMの構造化出力生成能力の課題を明確化する。
- StructEvalは,非表示形式(JSON, YAML, CSV)と表示形式(HTML, React, SVG)の両方を評価する包括的なベンチマークである。
- 生成タスクと変換タスクという2つのパラダイムで構造的忠実性を評価し,18の形式と44種類のタスクを網羅している。
- 最新モデルでも平均スコアは75.58であり,生成タスクは変換タスクよりも難しく,視覚コンテンツの生成はテキスト構造の生成よりも難しいことが示された。
微分可能シミュレーションを用いた線形時間論理による加速学習 [cs.IR, cs.LG, cs.RO]目的:強化学習における安全性と信頼性制約の充足
- 現実世界におけるロボット制御において,安全性確保は不可欠であり,その重要性は増している。
- 従来の安全性確保手法は,軌道レベルの要件を満たせず,過度に保守的な行動を招く場合がある。
- 線形時間論理(LTL)を用いて,深層強化学習における安全性と効率性を両立させることを目指す。
- 本研究では,LTLと微分可能シミュレータを統合した初のend-to-endフレームワークを提案した。
- 提案手法は,LTLに固有の疎な報酬問題を緩和しつつ,目的の健全性を維持する微分可能な報酬と状態表現を実現する。
- 複雑な連続制御タスクにおいて,従来の離散ベースラインと比較して,学習が大幅に加速され,報酬が最大で2倍となった。
FLEX:フィットネス動作品質評価のための構造化表現学習用大規模マルチモーダル・マルチビューデータセット [cs.CV, cs.AI]目的:フィットネス動作品質評価のためのデータセット及び評価基準
- ジムでのトレーニングにおける怪我の防止と効果の最大化には,正確なフィードバックが不可欠である。
- 既存の動作品質評価データセットは,単一視点での競技スポーツに限定されており,フィットネス動作のマルチモーダル信号や専門家による評価が不足している。
- フィットネス動作のマルチモーダルデータセットを構築し,より詳細な評価とAIによるコーチングを可能にすること。
- FLEXは,RGB動画,3Dポーズ,筋電図(sEMG),生理学的信号を含む7,500件以上のマルチビュー記録を提供し,多様なスキルレベルの被験者による20種類のウエイトトレーニング運動を網羅する。
- 専門家による注釈は,動作,主要ステップ,エラータイプ,フィードバックをリンクするフィットネス知識グラフ(FKG)として整理され,解釈可能な品質評価を可能にする。
- マルチモーダル入力,マルチビュー動画,詳細な注釈がAQAパフォーマンスを大幅に向上させることを実験により示した。
特異摂動境界層問題に対するマルチスケールニューラル演算子法:PVD-ONet [cs.CL, cs.LG]目的:特異摂動境界層問題の解法
- 流体や熱伝導など,自然科学・工学の様々な現象を記述する上で重要な境界層問題。
- 従来の物理情報ニューラルネットワークでは,特異摂動問題に対して収束しない場合がある。
- 安定性重視と高精度化の2つのアプローチで境界層問題を効率的に解く。
- 提案手法PVD-NetとPVD-ONetは,既存手法と比較して一貫して高い性能を示す。
- PVD-ONetは,再学習なしで一連の境界層問題に対して即座に予測可能である。
- 本フレームワークは,境界層厚さを支配するスケーリング指数を推定する逆問題にも応用可能である。
SmartCLIP:識別保証付きモジュール型視覚-言語アライメント [cs.CV, cs.AI]目的:視覚とテキスト表現のアライメント手法
- 画像とテキストの理解は,AIの発展に不可欠であり,様々な応用を可能とする。
- 既存のCLIPモデルは,画像とテキストのデータセットにおける情報不整合に弱く,表現が複雑に絡み合っている。
- 本研究は,画像とテキストの表現を適切にアライメントし,細粒度の概念を捉えることを目指す。
- 理論的な条件に基づき,テキストと視覚表現の様々な粒度での柔軟なアライメントを実現した。
- 提案手法SmartCLIPは,関連性の高い視覚およびテキスト表現をモジュール的に識別・アライメントする。
- 様々なタスクにおいて優れた性能を示し,情報不整合への対応と識別理論を裏付けた。
150年以上にわたるドイツ議会における移民に関する議論のLLM分析:戦後復興期の連帯から,直近10年での反連帯への移行 [cs.CY, cs.CL, cs.CY, cs.LG]目的:ドイツ議会における移民に関する議論における連帯と反連帯のサブタイプをLLMがどの程度注釈できるかの検証
- 移民問題は,戦後の追放者から労働移民,近年の難民移動まで,ドイツ政治において常に重要な議題である。
- 広範囲にわたる政治的言説を深く研究するには,膨大な手動注釈が必要であり,分析可能なデータセットが制限されていた。
- LLMを用いた大規模分析によって,連帯と反連帯の長期的なトレンドをより正確に把握することを目指す。
- GPT-5やgpt-oss-120Bなどの高性能LLMは,このタスクにおいて人間レベルの合意を示すが,エラーには系統的な偏りが存在する。
- LLMのソフトラベル出力とDesign-based Supervised Learning(DSL)を組み合わせることで,長期的なトレンド推定におけるバイアスを軽減できる。
- 戦後復興期には高いレベルの連帯が見られ,特に集団的および慈悲的な形態が顕著だが,2015年以降,排除,不当性,資源負担といった枠組みによる反連帯が著しく増加している。
ReDef:コード言語モデルは,ジャストインタイムソフトウェア欠陥予測のためのコード変更を真に理解しているか? [cs.CL, cs.CL, cs.DL, cs.IR, cs.SE, cs.AI]目的:ジャストインタイムソフトウェア欠陥予測のためのコード変更理解度評価
- ソフトウェア開発において,迅速な欠陥検出は品質向上に不可欠であり,開発効率を大きく左右する。
- 既存の欠陥予測データセットは,ノイズが多く,バグを引き起こすコミットの特定精度が低いという課題がある。
- 高精度なデータセットを用いて,コード言語モデルのコード変更理解の真偽を検証し,改善点を見出す。
- ReDefデータセットは,22のC/C++プロジェクトから収集された3,164件の欠陥のある変更と10,268件のクリーンな変更を含む信頼性の高いベンチマークである。
- コンパクトなdiff形式の入力表現が,コード言語モデルにおいて,変更情報を効果的に伝えることが示された。
- カウンターファクチュアルなテストの結果,コード言語モデルが表面的な手がかりに依存しており,真のセマンティックな理解に欠けることが明らかになった。
人間用心理尺度質問紙はLLMの心理を誤って特徴づける:生成行動からの証拠 [cs.CL, cs.AI]目的:LLMの心理的プロファイリングにおける人間用心理尺度質問紙の妥当性評価
- LLMの能力向上に伴い,その行動原理や特性の理解が重要になっている。
- 人間用質問紙がLLMの心理を正確に反映しているか不明確であり,誤った解釈のリスクがある。
- 人間用質問紙による評価と生成行動分析を比較し,LLMの心理的特性の信頼性ある評価方法を探る。
- 人間用質問紙による評価と,実際の生成行動から得られる心理的プロファイルの間には大きな乖離が見られた。
- LLMは質問紙に対して望ましい行動を示す傾向があり,安定した心理的特性を反映しているとは限らないことが示唆された。
- 人間用質問紙はLLMの潜在的なバイアスを誇張する可能性があり,慎重な解釈が必要である。
大規模言語モデルを用いたリラックス戦略:双方向共進化による制約最適化問題の解決 [cs.AI]目的:制約最適化問題に対する自動化手法
- 制約最適化問題は,現実世界の様々な分野で頻出する難題であり,効率的な解決が求められている。
- 既存手法では,大規模言語モデルを制約の検証に留め,戦略設計への積極的な活用が課題となっていた。
- 大規模言語モデルによる,原理に基づいた実行可能なリラックス戦略の自動合成と最適化を目指す。
- AutoCOは,制約緩和の原則と大規模言語モデルの推論を統合した,エンドツーエンドの自動制約最適化手法である。
- AutoCOは,モンテカルロ木探索と進化アルゴリズムを組み合わせた双方向共進化メカニズムにより,多様性と集約性をバランスよく実現する。
- 3つのベンチマーク問題に対する実験により,AutoCOは既存手法と比較して優れた性能と有効性が確認された。
AutiHero:自閉症児向け個別化されたマルチパスのソーシャルストーリー作成における保護者の参加促進 [cs.HC, cs.AI, cs.CL]目的:自閉症児を対象とした個別化されたマルチパスのソーシャルストーリー作成支援
- 自閉症児の社会適応を支援する上で,ソーシャルストーリーは重要な役割を果たす。
- ソーシャルストーリーの作成には,保護者の時間と労力がかかり,継続的な指導が求められる。
- AIを活用し,保護者が容易に個別化されたストーリーを作成・活用できる環境を構築すること。
- AutiHeroは,保護者による個別化されたマルチパスのソーシャルストーリーの作成を支援し,子供と行動選択や結果について共に探求することを可能にした。
- 2週間の実証実験の結果,保護者は積極的にストーリーを作成・調整し,子供と読み進め,日常的な行動指導に対する自信を高めた。
- 本研究は,自閉症児とその保護者に関わる繊細な状況において,AIを活用したユーザー中心のテキスト+画像コンテンツ生成手法を提示する。
ROPA:RGB-D両手操作データ拡張のための合成ロボットポーズ生成 [cs.RO, cs.AI, cs.CV, cs.LG]目的:RGB-D両手操作におけるデータ拡張のための合成ロボットポーズ生成
- ロボットの模倣学習において,多様なデータは性能向上に不可欠である。特に両手操作では,複雑な動作を学習するため,より多くのデータが必要となる。
- 実世界の多様なデータを収集するには,コストと時間がかかるため,大規模な学習を阻害する要因となっている。
- 本研究は,Stable Diffusionを微調整することで,新しいロボットポーズのRGB-D画像を生成し,データ拡張による学習効率化を目指す。
- ROPAは,シミュレーションおよび実世界の5つのタスクにおいて,既存手法や比較実験を上回る性能を示した。
- 本手法は,物理的な整合性を保ちつつ,両手操作におけるグリッパーと物体の接触制約を考慮した合成データ生成を可能にする。
- これにより,RGB-Dデータ拡張による,目視位置からの両手操作の学習のスケーラビリティが期待される。
線形動的システムによる逐次モデルの並列化のための統一的フレームワーク [cs.RO, cs.CL, cs.LG]目的:逐次モデルの並列化
- 機械学習において,逐次処理の効率化は重要な課題である。
- 逐次モデルの並列化は困難であり,計算コストが高いという問題がある。
- 線形動的システムに基づく共通フレームワークでこの問題を解決する。
- ニュートン法,ピカール法,ヤコビ法などの反復固定点法が,線形動的システムとして統一的に理解できる。
- これらの手法の収束速度に関する理論的解析を行い,その予測をケーススタディで検証した。
- このフレームワークは,並列化手法の理論的基盤を明確にし,効率的な計算の新たな可能性を示唆する。
LLMの事前・事後学習データにおける政治的コンテンツの内容 [cs.CL, cs.AI, cs.CY]目的:LLMの事前・事後学習データに含まれる政治的コンテンツの分析
- LLMは社会に広く普及しており,その出力が社会に与える影響は大きい。
- LLMが政治的な偏りを生成することが知られているが,その原因が不明である。
- 学習データの構成が偏りに関与している可能性を検証し,軽減策の検討に貢献する。
- 学習データは左寄りのコンテンツに偏っていることが明らかになった。
- 事前学習コーパスは事後学習データよりも政治的なコンテンツを多く含む。
- 学習データの政治的な立場とモデルの行動の間には強い相関関係が認められた。
ノイズテレビを超える:学習進捗モニタリングによるノイズに強い探索 [eess.SY, cs.SY, cs.LG, cs.AI]目的:ノイズ環境下におけるロバストな探索手法の開発
- 強化学習において,効率的な探索は未解決の課題であり,複雑な環境での学習成功に不可欠である。
- 従来の内在的報酬に基づく探索は,学習不能なノイズ源に囚われやすく,サンプル効率が低いという問題がある。
- 学習進捗をモニタリングすることで,学習可能な遷移に焦点を当て,ノイズの影響を受けにくい探索を実現することを目指す。
- 提案手法である学習進捗モニタリング(LPM)は,モデルの改善を報酬化することで,効率的な探索を可能にする。
- LPMは,MNIST,3D迷路,Atari環境において,既存手法と比較して,より高速な報酬収束,探索状態数の増加,高い外部報酬を獲得した。
- LPMは,内在的報酬がゼロ等変であり,情報利得の単調増加指標となることを理論的に示した。
アトリビューション勾配:帰属AI回答の批判的検討のための引用の段階的展開 [cs.HC, cs.AI]目的:帰属AI回答の批判的検討を支援するための引用情報提示手法
- AI回答エンジンは新しい情報探索手段であり,その信頼性評価が重要である。
- 引用情報は,証拠の内容や根拠を示すガイダンスが不足しているという課題がある。
- 引用情報の有用性を高め,読者の深い理解を促進することを目的とする。
- アトリビューション勾配は,証拠量,支持/反駁箇所,出典,文脈説明をまとめて提示する。
- 2次引用をその場で展開し,情報の追跡を容易にする。
- 実験の結果,標準的な引用提示と比較して,読者の情報理解度向上が確認された。
混沌の裏にあるパターン:効率的な大規模MoE LLM推論のためのデータ移動予測 [eess.SY, cs.SY, cs.MA, cs.DC, cs.AI, cs.AR, cs.LG]目的:大規模MoE LLMのデータ移動パターンの解明
- 大規模言語モデルの性能向上は目覚ましいが,計算資源の効率的な利用が課題となっている。
- MoEモデルは専門家選択のランダム性から,データ移動のオーバーヘッドがボトルネックとなっている。
- データ移動パターンを把握し,効率的な推論システム設計のための指針を示す。
- 大規模MoEモデル(200B-1000B)におけるデータ移動を詳細にプロファイリングし,6つの重要な知見を得た。
- 次世代ウェハー規模GPUでは,これらの知見に基づく軽量なアーキテクチャ変更により,平均6.6倍の高速化を達成した。
- 既存のGPUシステムでは,プリフィルを考慮した専門家配置アルゴリズムにより,MoE計算の速度が最大1.25倍向上した。
適応的行列分解による高性能な半構造化プルーニング:ARMOR [cs.LG]目的:大規模言語モデルの効率的な展開
- 大規模言語モデルの利用拡大には,計算資源とメモリ消費量の削減が不可欠である。
- 従来の半構造化プルーニングでは,性能劣化が課題となっていた。
- モデル性能を維持しつつ,高い圧縮率を実現することが求められている。
- ARMORは,既存の2:4スパースプルーニング手法と比較して,様々なタスクにおいて一貫して高い性能を示す。
- 本手法は,推論速度の向上とメモリ使用量の削減を両立し,モデル圧縮とタスク精度の間のより効果的なトレードオフを実現する。
- 理論的な解析により,ARMORの最適化が最先端のプルーニングアルゴリズムと同等以上の性能に収束することが保証される。
分散型SGDの確率的収束保証 [cs.LG, cs.MA, math.OC]目的:分散型SGDの確率的高確率収束条件の緩和と解析
- 機械学習において分散学習は,大規模データに対する計算効率向上が期待される重要な手法である。
- 分散型SGDの確率的高確率収束保証は,既存研究では制約的な仮定を必要とし,理論と実践の乖離が生じていた。
- 本研究では,分散型SGDの確率的高確率収束条件を緩和し,より現実的な設定での収束性を保証することを目的とする。
- 分散型SGDが,平均二乗誤差収束と同等の条件で確率的高確率収束することを示した。
- 非凸関数および強凸関数に対する最適な収束レートを導出し,既存研究の仮定の制限を克服した。
- ユーザ数の増加に伴う線形的な高速化を示し,確率的高確率収束における分散学習の利点を明確にした。
行動条件付き二乗平均Q関数を用いた局所強化学習 [cs.LG, cs.AI]目的:行動条件付き二乗平均Q関数(ARQ)という新たな価値推定手法
- 強化学習は,報酬を通じて学習を進めるため,教師あり学習とは異なるアプローチが必要とされている。
- 従来の強化学習は,勾配降下法に依存しており,生物学的な妥当性に課題が残る。
- 勾配降下法に頼らない,生物学的に着想を得た局所的な強化学習手法を開発すること。
- 提案手法ARQは,層の活動統計量に基づいた善さ関数と行動条件付けを用いることで,局所強化学習を実現している。
- MinAtarやDeepMind Control Suiteといったベンチマークにおいて,最先端の局所バックプロパゲーションフリー強化学習手法を上回る性能を示した。
- また,バックプロパゲーションで学習したアルゴリズムと比較しても,ほとんどのタスクで優れた性能を発揮した。
CQA-Eval:リソース制約下における複数段落の臨床QAの信頼性評価の設計 [cs.CL, cs.AI]目的:複数段落の臨床QAシステムの信頼性評価のためのフレームワークと評価方法
- 臨床QAは医療の質向上に不可欠であり,その評価は重要な課題である。
- 医療専門知識が必要であり,複数段落のテキストに対する人間による評価の一貫性を確保することが困難である。
- リソースが限られた状況下でも信頼性の高い評価を可能にする方法を模索する。
- 医師による注釈に基づき,正答性,関連性,リスク開示の観点から,粗粒度と細粒度の評価を比較した。
- 正答性の評価には細粒度,関連性の評価には粗粒度が有効であり,リスク開示の判断は一貫性に欠けることが示された。
- 一部の文のみを注釈することで,粗粒度評価と同等の信頼性を確保でき,コストと労力を削減できることが分かった。
f-INE:学習のランダム性を考慮した影響度推定の仮説検定フレームワーク [cs.LG, cs.AI]目的:機械学習モデルにおける個々のサンプルが最終モデルに与える影響度の推定
- 機械学習モデルの説明可能性とデバッグが重要視されており,影響度推定はそのための有望な手法である。
- 既存の影響度推定方法は学習のランダム性に弱く,同じサンプルでも実行ごとに重要度が変動する問題がある。
- 学習のランダム性を考慮した影響度推定フレームワークを開発し,安定した影響度推定を実現すること。
- 提案手法f-INEは,仮説検定に基づき学習のランダム性を明示的に考慮することで,影響度推定の信頼性を向上させる。
- f-INEは単一の学習実行で影響度を計算する効率的なアルゴリズムであり,大規模データセットへの適用が可能である。
- Llama-3.1-8Bへの適用により,f-INEがモデルの意見を誘導する悪意のあるサンプルを検出し,データクリーンアップに役立つことが示された。
拡散モデルをデータセット蒸留の事前分布として [eess.SY, cs.SY, cs.LG]目的:大規模データセットからのコンパクトかつ情報量の多いデータセットの合成
- データセットの規模縮小は,計算資源の制約下での機械学習モデルの効率化に不可欠である。
- 多様性,汎化性能,代表性のバランスを保った蒸留データセットの作成が困難である。
- 拡散モデルに内在する代表性に関する事前知識を活用し,蒸留データセットの品質向上を目指す。
- 提案手法DAPは,特徴空間における合成データと実データの類似度をMercerカーネルを用いて定量化する。
- DAPは,この代表性に関する事前分布を逆拡散過程の指針として導入することで,追加学習なしに蒸留サンプルにおける代表性を向上させる。
- ImageNet-1K等の大規模データセットにおける実験により,DAPが最先端手法を上回り,高品質なデータセットを生成し,優れたアーキテクチャ間汎化性能を発揮することが示された。
抗菌ペプチド設計のための低次元半教師あり潜在ベイズ最適化における最良事例の探求 [cs.LG, physics.comp-ph]目的:抗菌ペプチド設計のための潜在ベイズ最適化における最適化効率と解釈性の向上
- 創薬において,特に抗菌ペプチドのような新規治療法の開発は重要な課題である。
- ペプチド配列空間は広大であり,実験データが限られているため,効率的な探索が困難である。
- 潜在空間の次元削減や整理によって,最適化を促進し,解釈性を高めることを目指す。
- 潜在空間の次元削減は,解釈性の向上に繋がり,最適化に有利に働く場合がある。
- 関連性の低い物理化学的性質を利用した潜在空間の整理は,特定の状況下で最適化効率を高める。
- ベイズ最適化の目的関数に関連する疎な性質の活用も,潜在空間の整理において有効である。
再帰的特徴量機械を用いた自己回帰型音楽生成の操縦 [cs.DB, cs.LG, cs.AI, cs.SD, eess.AS]目的:音楽生成の操縦手法
- 音楽生成技術は,創造性支援やコンテンツ制作において重要であり,その発展が期待される。
- 既存手法では,モデルの再学習や音質の劣化が生じやすく,詳細な制御が困難である。
- 事前学習済みの音楽モデルの内部活性化を直接操ることで,高品質な音楽生成と制御性を両立することを目指す。
- MusicRFMは,モデルの内部勾配を分析し,音楽的な属性に対応する「概念方向」を特定する。
- この概念方向を注入することで,リアルタイムで生成プロセスを制御し,特定の音符の生成精度を0.23から0.82に向上させた。
- テキストプロンプトへの追従性はほぼ維持され,制御性と生成品質のバランスが取れていることが示された。
グリア:自動システム設計と最適化のための人間着想型AI [cs.DB, cs.IR, cs.AI, cs.CL, cs.DC]目的:自動システム設計と最適化のためのAIアーキテクチャ
- システム設計は計算資源の効率的な利用に不可欠であり,高度な専門知識が求められる分野である。
- 従来の機械学習はブラックボックス化しやすく,設計根拠の解釈が困難な場合が多い。
- 人間のような創造性と推論能力を持つAIによるシステム設計の自動化を目指す。
- グリアは,大規模言語モデルを活用した人間着想型のマルチエージェントワークフローを用いることで,システム設計の自動化を実現した。
- 分散型GPUクラスタにおけるLLM推論において,リクエストルーティング,スケジューリング,オートスケーリングのための新しいアルゴリズムを生成し,人間レベルの性能を達成した。
- この研究は,推論能力を持つLLMと構造化された実験を組み合わせることで,複雑なシステム問題に対する創造的で理解可能な設計が可能になることを示唆している。
CostBench:動的な環境におけるLLMツール利用エージェントの費用最適計画と適応の評価 [cs.RO, cs.AI, cs.CL]目的:LLMツール利用エージェントにおける費用最適計画と適応能力の評価
- LLMエージェントの応用範囲拡大に伴い,タスク達成に加え資源効率の重要性が増している。
- 既存評価はタスク完了に偏重し,費用対効果や環境変化への適応能力が十分に検証されていない。
- 費用を考慮した計画立案と動的環境への適応能力を評価するベンチマークの開発を目的とする。
- CostBenchは,旅行計画ドメインにおいて,費用と複雑さの異なるツール群を用いた費用最適化を評価する。
- 評価の結果,既存のオープンソースおよびプロプライエタリモデルは,静的環境下でも費用最適解を特定できず,動的環境下では性能が大幅に低下した。
- このベンチマークは,経済的合理性とロバスト性を備えた次世代エージェント開発の基盤となる。
オイラー特性関数のテンソル計算と変換 [cs.CG, cs.LG, math.AT]目的:オイラー特性変換とオイラー特性関数の計算
- 多様な応用において有用なツールであり,データ解析の基礎となるトポロジー記述子の重要性が高まっている。
- 既存手法はGPU計算に最適化されておらず,高次元設定への拡張が困難であるという課題があった。
- GPUアーキテクチャに最適化された汎用的な計算フレームワークを提供し,計算効率の向上を目指す。
- 提案手法は,既存手法と比較して,2次元および3次元データセットにおけるオイラー特性変換とオイラー特性関数の計算において大幅な高速化を実現した。
- 本フレームワークは,単体複合体および立方体複合体に対して,任意の次元で有効に機能する。
- 実装は,公開されているPythonパッケージpyECTとして提供されている。
SAGA: 生成AI動画の出所特定 [cs.CV, cs.AI]目的:生成AI動画の出所特定手法の開発
- 生成AI技術の発展は,現実と区別のつかない動画を容易に作成可能にし,悪用リスクが高まっている。
- 既存の偽判定技術では,動画が生成AIによって作られたかどうかの判断しかできず,具体的な生成モデルの特定が困難である。
- 本研究は,生成AI動画の具体的な生成モデルを特定し,その出所を明らかにすることを目的とする。
- SAGAは,5つのレベル(信頼性,生成タスク,モデルバージョン,開発チーム,ジェネレーター)で詳細な出所特定を可能にする。
- 新しい動画Transformerアーキテクチャと,データ効率的な事前学習戦略により,少量(0.5%)の教師データで最先端の性能を達成した。
- Temporal Attention Signatures(T-Sigs)という解釈可能性手法を提案し,異なる動画生成モデルの識別根拠を可視化することに成功した。
