arXiv雑要約
AI - 2026/03/12 公開
なぜそこにそれがあるのか:画像分類のための構造化された説明 [cs.RO, cs.CL, cs.CV, cs.LG]目的:画像分類モデルの意思決定過程の構造化された説明
- 深層学習の性能向上に伴い,モデルの透明性と信頼性の確保が重要視されている。
- 既存の説明手法は,多くの場合,構造化されていない情報しか提供しない。
- モデルの挙動を忠実に説明し,モデルの最適化を支援する手法を開発する。
- I2Xフレームワークは,学習過程におけるチェックポイントでのプロトタイプ抽出を通じて,構造化された説明を構築する。
- I2Xは,MNISTとCIFAR10での実験により,様々な画像分類モデルの推論過程を明らかにする有効性を示す。
- I2Xによって特定された不確実なプロトタイプを利用した標本摂動により,モデルの精度を向上させることが可能。
段階的非均衡クラス増分学習における統一的な表現に向けて:一つのアダプターですべてを [cs.CV, cs.LG]目的:段階的非均衡クラス増分学習における課題克服
- 継続的な学習は,人間の学習能力を模倣する上で重要であり,AIの応用範囲を広げる。
- 従来のクラス増分学習手法は,タスク間のクラス数が均衡していることを前提としており,現実世界の状況に対応できない。
- タスクの規模に応じた適応的な学習を実現し,非均衡なタスクストリーム下での性能低下を抑制すること。
- 提案手法One-Aは,タスク更新を単一のアダプターに統合することで,推論コストを一定に保ちながら,不均衡な更新に対処する。
- One-Aは,主要なタスクから学習された支配的な部分空間を維持しつつ,情報量の少ない更新を抑制する非対称な部分空間アライメントを用いる。
- 複数のベンチマークにおいて,One-Aは競合する精度を達成し,推論オーバーヘッドを大幅に削減することを示した。
科学計算のためのニューロモルフィックアルゴリズムにおける内在的な数値的頑健性と耐障害性 [eess.SY, cs.SY, cs.NE, cs.AI, cs.LG, cs.NA, math.NA]目的:ニューロモルフィックアルゴリズムの数値的頑健性および耐障害性の評価
- 科学計算の高速化と低消費電力化が求められており,ニューロモルフィックコンピューティングは有望な手法の一つである。
- 従来のニューロモルフィックシステムは,ノイズやデバイスの故障に弱く,実用化が課題となっていた。
- 本研究は,ニューロモルフィックアルゴリズムが持つ潜在的な耐障害性を実証し,ロバスト性を高める方法を探る。
- 偏微分方程式を解くためのニューロモルフィックアルゴリズムが,構造的摂動(ニューロンの除去やスパイクの欠落)に対して内在的な耐性を持つことが示された。
- ニューロンの最大32%またはスパイクの最大90%を完全に削除しても,精度の著しい低下は見られなかった。
- このロバスト性は,構造的ハイパーパラメータを調整することで制御可能であり,脳の特性に触発されたアルゴリズム設計がその要因となっている。
製品開発におけるエージェントによる工学解析のオーケストレーション:DUCTILE [cs.RO, cs.SE, cs.AI, cs.HC]目的:製品開発における工学解析の自動化支援
- 製品開発の効率化と品質向上には,工学解析の自動化が不可欠である。
- 既存の自動化システムは,ツールやデータ形式の変更に弱く,柔軟性に欠ける。
- 変化に強いLLMを活用し,工学解析のプロセスを適応的にオーケストレーションする。
- DUCTILEは,LLMエージェントによる適応的なオーケストレーションと,検証済みの工学ツールによる決定論的な実行を分離する。
- エージェントは設計慣習を解釈し,入力データを確認し,処理経路を適応的に変更する。
- 航空宇宙メーカーにおける実務での評価により,DUCTILEは正確かつ標準に準拠した結果を繰り返し生成することが確認された。
拡散強化学習におけるオンライン拡散のための尺度一致法SiMPO [cs.LG]目的:拡散ポリシーにおけるオンライン拡散のための尺度一致法の提案
- 強化学習は,複雑な環境下での最適な行動戦略の学習を可能にする重要な技術である。
- 既存の拡散ポリシーを用いた強化学習アルゴリズムは,過度に貪欲なポリシーになりやすく,負のサンプルからのフィードバックを活用できていない。
- SiMPOは,柔軟な重み付けスキームを用いて,報酬地形に合わせた最適な重み付け方法を提供し,パフォーマンスを向上させる。
- SiMPOは,拡散強化学習における再重み付けスキームを一般化する,シンプルかつ統一的なフレームワークである。
- SiMPOは,$f$-divergence正則化されたポリシー最適化を用いて仮想的なターゲットポリシーを構築し,負の重み付けを可能にする。
- 実験結果は,SiMPOが柔軟な重み付けスキームを活用することで,優れたパフォーマンスを達成することを示している。
脳障害分類のためのクロスビュー対照的アラインメントによる画像・ROI表現の共同学習 [cs.CG, math.CO, cs.CV, cs.AI]目的:脳画像とROIに基づくグラフ表現の共同学習
- 脳画像解析は,精神疾患の診断や病態理解に不可欠であり,近年その重要性が増している。
- 画像全体とROIに着目した解析はそれぞれ有効だが,両者の関係性や相補性は十分に解明されていない。
- 画像とROI表現を統合的に学習し,脳障害分類の性能向上を目指す。
- 提案手法は,画像とROI表現を共通の潜在空間にアラインメントすることで,分類性能を向上させた。
- 画像のみ,ROIのみ,および両者を組み合わせた構成で評価した結果,共同学習が常に最良の結果を示した。
- 解釈可能性分析から,画像とROI表現が異なる特徴を捉え,互いに補完し合うことが示唆された。
因果構造の統合によるTabPFNの合成データ生成の改善 [cs.LG]目的:表形式データの合成データ生成における品質向上
- データ不足やプライバシー保護の課題解決に,合成データ生成が不可欠である。
- TabPFNは特徴量の順序に依存し,因果構造と矛盾すると誤った相関を生む。
- 因果構造を統合することで,TabPFNの合成データ生成の信頼性を高める。
- DAGを考慮した条件付けにより,従来のTabPFNと比較して合成データの品質と安定性が向上した。
- CPDAGに基づく戦略は,エッジの向きの数に応じて効果が変動するものの,ある程度の改善が見られた。
- 因果構造の注入は,自己回帰的生成における合成データの信頼性向上に寄与する。
scGPTにおける造血マニホールドの発見と,生物学的基盤モデル内部からの高性能アルゴリズム抽出法の開発 [cs.SI, cs.LG, q-bio.CB, q-bio.GN]目的:単細胞基盤モデルscGPTからのコンパクトな造血アルゴリズムの発見と抽出
- 単細胞データ解析は,疾患理解や個別化医療に不可欠であり,その高度化が求められている。
- 既存の解析手法は計算コストが高く,解釈性に乏しい場合がある。
- 基盤モデルの内部構造を解釈することで,効率的かつ解釈可能なアルゴリズムを抽出することを目指す。
- scGPTは内部的に有意な発生分岐構造を持つ造血マニホールドをエンコードしていることが示された。
- 抽出されたアルゴリズムは,既存手法と比較して,より高い擬似時間順序付け精度とサブタイプ分類性能を示した。
- 抽出された演算子は,統計的に有意な性能損失なしに圧縮可能であり,解釈可能な4つの主要因子で構成されていることが明らかになった。
事前学習からプロレベルへ:分布収縮型強化学習による効率的なスキル習得 [eess.SY, cs.SY, cs.RO, cs.LG]目的:事前学習済み生成ロボットポリシーの洗練
- ロボットの自律的な動作を実現するためには,複雑なスキルを効率的に習得することが重要である。
- 従来の強化学習は,サンプル効率が悪く,複雑なタスクへの適用が困難であるという課題がある。
- 事前学習済みポリシーを強化学習で効率的に洗練し,プロレベルの性能を実現することを目指す。
- DICE-RLは,強化学習を分布収縮演算子として利用し,事前学習済みポリシーを洗練するフレームワークである。
- オンラインフィードバックから高成功率の行動を増幅することで,高性能なポリシーへと改善される。
- シミュレーションと実機ロボットの両方で,高次元のピクセル入力から複雑な操作スキルを習得できることを示した。
グラフニューラルネットワークによる条件数の推定 [eess.SY, cs.SY, math.OC, cs.LG, cs.NA, math.NA]目的:疎行列の条件数推定
- 機械学習の応用範囲拡大に貢献し,大規模データ処理の効率化が期待される。
- 既存手法では,大規模疎行列の条件数計算に膨大な時間がかかるという課題がある。
- グラフニューラルネットワークを用いて,高速かつ高精度な条件数推定手法を開発する。
- 提案手法は,既存のHager-Higham法やLanczos法と比較して,大幅な高速化を達成した。
- グラフニューラルネットワークの効率的な学習・推論のために,特徴量エンジニアリングを工夫した。
- 1-ノルムおよび2-ノルム条件数推定に関する実験により,提案手法の有効性が確認された。
生成レコメンダの堅牢なポストトレーニング:指数報酬重み付きSFTがRLHFを上回る理由 [cs.LG]目的:生成レコメンダのユーザー選好への適合
- レコメンダシステムの品質向上は,次項予測から実際の推奨へと移行する上で不可欠である。
- 既存のポストトレーニング手法は,ノイズの多いフィードバックや信頼性の低い報酬モデルに起因する問題がある。
- 報酬ハッキングを防ぎ,大規模カタログでも有効な堅牢なポストトレーニング手法を開発すること。
- 指数報酬重み付きSFTは,学習された報酬モデルへのクエリなしに直接報酬に基づいて最適化され,報酬ハッキングの影響を受けない。
- カタログサイズのスケーリングに関して,この手法はロガリズム的なギャップのみを示すことが証明され,大規模なアイテムカタログでも有効である。
- 温度パラメータλは,堅牢性と改善のトレードオフを制御する解釈可能な正則化ハイパーパラメータとして機能する。
ADMMにおけるスコアベースノイズ除去器の制御:収束するプラグアンドプレイフレームワーク [cs.LG, cs.AI, cs.CV]目的:スコアベース生成モデルを用いた逆問題解決におけるADMM統合の収束性確保
- 逆問題解決において,スコアベース生成モデルは強力な事前分布として注目されている。
- ADMM反復における双対変数の影響により,スコア関数の訓練データ多様体とADMM反復の幾何学的不一致が生じる。
- この研究は,不一致問題と収束性問題を解決し,ADMMとスコアベースノイズ除去器を効果的に統合する。
- 本研究では,ADMMに組み込むためのAC-DCデノイザーを提案し,自動修正,方向性修正,スコアベースノイズ除去の3段階で構成される。
- 適切なデノイザーパラメータ下では,各ADMM反復が弱非拡大写像となり,一定ステップサイズで固定点への収束が保証される。
- AC-DCデノイザーは有界デノイザーであり,適応的ステップサイズスケジュール下で収束が示される。様々な逆問題で性能向上が確認された。
幾何学的根拠に基づくデータセット比較のためのGSVD:アラインメント角度のみで十分 [cs.RO, cs.LG]目的:データセット間の比較
- 問題領域の構造を尊重する幾何学的根拠に基づく学習の重要性が高まっている。
- 既存の手法では,データセット間の構造的な類似性を定量化することが困難である。
- GSVDを用いてデータセット間の幾何学的関係を分析し,解釈可能な比較指標を開発する。
- GSVDを用いて2つの部分空間の共通座標系を構築し,共有方向とデータセット固有の方向を分離した。
- サンプルzに対する角度スコアθ(z)を導出し,AとBのどちらによりzが説明されるかを定量化した。
- θ(z)に基づく二値分類器を提示し,幾何学的診断ツールとしての有効性を示した。
コプラ・ResLogit:観測されない交絡効果のための深層コプラフレームワーク [cs.LG]目的:観測されない交絡効果の検出と軽減
- 交通需要分析において,因果関係を正しく把握するためには,観測されない要因の影響を考慮する必要がある。
- 既存手法では,観測されない交絡要因による疑似相関を特定・除去することが困難である。
- 深層学習とコプラモデルを組み合わせ,隠れた交絡効果を検出し,その影響を軽減する。
- Copula-ResLogitは,コプラ関数とResNetを統合することで,交絡を検出する。
- 残差層は隠れた交絡効果を吸収し,因果関係の推定精度を向上させる。
- VR環境下での歩行者のストレスと待ち時間,ロンドンの交通行動データにおいて有効性が確認された。
自然史博物館における大規模デジタルコレクションの対話型AI探索システム [cs.HC, cs.AI, cs.CY, cs.DL, cs.ET]目的:自然史博物館の大規模デジタルコレクションへのアクセスと理解の促進
- 自然史博物館のコレクションは科学研究や教育にとって不可欠である。
- コレクションデータが膨大かつ複雑であり,一般公開や利用が困難である。
- 自然言語を用いたクエリによるコレクションデータの探索を可能にすること。
- 本システムは,約170万件の標本記録を対話型AIで検索可能にした。
- インタラクティブな地図と自然言語処理エージェントにより,標本データの詳細な情報を迅速に取得できる。
- 大規模言語モデルの機能呼び出しを活用し,リアルタイムでのデータ更新に対応している。
GUIエージェントのためのハイブリッド自己進化型構造化メモリ [cs.AI, cs.LG]目的:GUIエージェントの構造化メモリ
- GUI自動化は,コンピュータ利用の効率化に不可欠であり,複雑なタスクを支援する。
- 既存のメモリ構造は,人間のように構造化され自己進化する特性に欠け,複雑なタスクで課題がある。
- 本研究は,人間のような構造化と自己進化機能を備えたメモリを開発し,GUIエージェントの性能向上を目指す。
- 提案手法HyMEMは,離散的な記号ノードと連続的な軌跡埋め込みを組み合わせたグラフベースのメモリである。
- HyMEMは,マルチホップ検索,ノード更新による自己進化,推論中のワーキングメモリの動的更新を可能にする。
- 実験により,HyMEMはオープンソースGUIエージェントの性能を向上させ,一部のケースでは商用モデルを凌駕することが示された。
推論内シミュレーション (SiR): 自律輸送における経験的基盤を持つAIのための概念的フレームワーク [eess.SY, cs.SY, eess.SY, cs.AI, cs.SY]目的:自律輸送における経験的根拠に基づいたAIのための概念的フレームワーク
- 輸送システムは社会インフラの中核であり,効率化と安全性向上は重要な課題である。
- 大規模言語モデルの推論はテキストベースであり,複雑な現実世界との連携が課題となっていた。
- LLMの推論過程にシミュレーションを組み込み,検証可能な仮説検証サイクルを実現すること。
- 本研究では,LLMの推論ループにドメイン固有のシミュレーターを組み込む「推論内シミュレーション (SiR)」という新しい概念的フレームワークを提案した。
- SiRは,LLMがITS戦略の仮説を立て,トラフィックシミュレーターを用いて評価し,需要パターンに応じて戦略を改良することを可能にする。
- SiRは,信頼できる検証されたAIを自律輸送システムに導入するための重要なステップとなる。
GaLoRA:ノード分類のためのパラメータ効率の良いグラフ認識LLM [cs.LG]目的:テキスト属性グラフにおけるノード分類性能向上
- グラフ構造とテキスト情報を統合することで,多様な応用分野における意思決定の精度向上が期待される。
- 大規模言語モデルのフルファインチューニングは計算コストが高く,リソース制約がある環境下では困難である。
- グラフ構造情報を効率的に言語モデルに組み込み,少ないパラメータで高性能なノード分類を実現する。
- GaLoRAは,フルファインチューニングに必要なパラメータ数のわずか0.24%で,最先端モデルと同等の性能を達成した。
- テキスト属性グラフにおいて,構造情報と意味情報を効果的に組み合わせることで,ノード分類の精度が向上することが示された。
- 3つの実世界データセットを用いた実験により,GaLoRAの有効性が確認された。
文脈学習による状態認識型金融ボラティリティ予測 [cs.LG]目的:金融ボラティリティ予測のための状態認識型文脈学習フレームワーク
- 金融市場の予測はリスク管理や投資戦略において不可欠であり,精度の高い予測手法が求められている。
- 市場の状態は常に変化するため,従来の予測モデルは非定常な市場環境への適応が困難である。
- 大規模言語モデルを活用し,パラメータ調整なしで市場状態に応じた予測を可能にすること。
- 提案手法は,過去のボラティリティパターンを大規模言語モデルに学習させ,市場の状態を考慮した予測を行う。
- 状態認識型デモンストレーションを構築する oracle 指導型リファインメント手順を開発した。
- 複数の金融データセットを用いた実験の結果,提案手法は従来の予測手法や直接的なワンショット学習よりも優れた性能を示した。
最適な学習率スケジュールの形状とは [cs.LG]目的:ニューラルネットワーク学習における最適な学習率スケジュール形状の探索
- 深層学習の性能は学習率に大きく依存するため,適切な設定が重要である。
- 学習率スケジュールの形状に関する明確な指針がなく,試行錯誤に頼る状況である。
- 様々なタスクにおいて,近似的に最適な学習率スケジュール形状を自動的に発見すること。
- 学習率のウォームアップと減衰は,良好なスケジュール形状の堅牢な特徴であることが示された。
- 一般的な学習率スケジュール族は,これらのワークロードにおいて最適ではないことが判明した。
- 重み減衰が最適なスケジュール形状に強い影響を与えることがわかった。
タンパク質工学のためのマスク言語モデルの活用法 [cs.LG, q-bio.QM]目的:タンパク質工学における所望の生物学的特性を最適化するためのマスク言語モデルからのサンプリング方法
- 近年,タンパク質に関する研究が盛んになり,その設計・改良には計算手法が不可欠となっている。
- 既存のタンパク質言語モデルを最大限に活用するためのサンプリング方法が確立されていない。
- 抗体医薬品の設計・開発において,最適なサンプリング方法を確立し,性能向上を目指す。
- 確率的ビームサーチという新しいサンプリング方法を提案し,モデル全体の疑似パープレキシティ評価を活用した。
- 複数の最適化目標を設定し,柔軟な誘導を可能にする全配列評価に基づく生成方法を確立した。
- 抗体工学における実験評価の結果,サンプリング方法の選択がモデルの選択と同程度に重要であることが示された。
このアイデアは新規か? 研究アイデアの新規性判断のための自動ベンチマーク [cs.CL, cs.AI]目的:研究アイデアの新規性判断
- 科学の発展には,未開拓の研究方向の特定と,既存知識の単純な反復ではない貢献が不可欠である。
- 科学文献の爆発的な増加により,文献調査による手動での新規性判断は,労力と主観に依存し,大規模な評価が困難である。
- 本研究は,研究アイデアの新規性判断を大規模に評価するための標準化されたベンチマークを提供することを目指す。
- RINoBenchという,研究アイデアの新規性判断を大規模に評価するための包括的なベンチマークを新たに導入した。
- 最新の大規模言語モデル (LLM) を評価した結果,LLMによる推論は人間の根拠と類似しているものの,正確な新規性判断にはつながらないことが明らかになった。
- LLMの判断は,人間のゴールドスタンダードな判断とは大きく異なり,高度な推論能力を持つモデルでも同様の傾向が見られた。
解釈可能な非局所演算子学習のためのデータ駆動型積分カーネル [cs.LG, physics.ao-ph]目的:非局所演算子学習における解釈可能性と過学習の抑制
- 気候変動予測において,空間・高度・時間的に非局所的なプロセスを捉えることは重要である。
- 非局所的な情報の利用範囲が広がるほど,学習モデルの解釈が困難になり,過学習のリスクが高まる。
- データ駆動型積分カーネルにより,非局所的な情報集約と局所的な非線形予測を分離し,解釈性と予測精度を両立する。
- データ駆動型積分カーネルは,学習可能なカーネルを用いて空間・高度・時間情報を集約する。
- カーネルベースのモデルは,少ない学習パラメータでベースラインに近い性能を達成した。
- カーネルは,予測に最も寄与する空間位置,高度レベル,過去のタイムステップを明示的に示す重み付けパターンとして解釈できる。
鼻装着型低音量音声インターフェース NasoVoce:常時利用可能な音声対話のために [cs.HC, cs.AI, cs.LG, cs.SD]目的:常時利用可能な音声対話のための鼻装着型インターフェース
- 音声インターフェースは,ハンズフリーでの操作を可能にし,多様な分野での利便性向上に貢献する。
- 既存の手法では,語彙サイズ,装着性,静寂性,ノイズ耐性のバランスが課題となっていた。
- 本研究は,低音量音声(囁き声など)を確実に捉え,ノイズに強い音声インターフェースの実現を目指す。
- NasoVoceは,鼻梁にマイクと振動センサーを搭載し,音声と振動の両方の信号を統合することで,高品質かつノイズに強い音声認識を可能にする。
- 評価実験の結果,Whisper Large-v2を用いた音声認識精度が向上し,PESQ,STOI,MUSHRAの評価においても良好な結果が得られた。
- NasoVoceは,常時利用可能で,連続的かつ目立たないAI音声対話のための実用的なインターフェースであることを実証した。
PC-Diffuser:拡散ベースの軌道計画におけるパス整合型カプセルCBF安全フィルタ [cs.RO, cs.AI]目的:複雑な交通状況下における自律運転のための安全な軌道計画手法
- 複雑な交通環境下での安全な自動運転実現には,高度な軌道計画が不可欠である。
- 拡散ベースの軌道計画は性能が高いが,安全性確保が難しく,未知の状況で失敗する可能性がある。
- 拡散計画のノイズ除去ループに安全性を組み込み,信頼性の高い軌道生成を目指す。
- PC-Diffuserは,軌道生成の過程で,カプセル距離を用いたバリア関数による衝突リスク評価を行う。
- 運動学的な自転車モデルに基づき,ノイズ除去されたウェイポイントをダイナミクス的に実行可能な軌道に変換する。
- パス整合性のある安全フィルタにより,残存する制約違反を除去し,学習された分布に近い軌道を得る。
推論は検索をより公平にするか? 推論型と非推論型再ランク付け器の公平性の比較 [cs.IR, cs.AI]目的:推論型と非推論型再ランク付け器における公平性の比較
- 検索システムの重要性は増しており,関連度だけでなく,公平性も重要な評価基準となっている。
- 既存の検索システムは,特定の属性に基づいて差別的な結果を生み出す可能性があり,公平性の問題が指摘されている。
- 推論型再ランク付け器が公平性に与える影響を検証し,公平性を考慮した検索システムの開発に貢献する。
- 推論型再ランク付け器は,非推論型アプローチと比較して公平性を向上させも悪化もさせなかった。
- Attention-Weighted Rank Fairness (AWRF)指標は,モデル全体で安定しており(0.33-0.35),関連度は大きく変動した(nDCG 0.247-1.000)。
- 地理的属性において公平性の差が明らかになったが,モデルアーキテクチャに関わらず同様の傾向が見られた。
コンセプトゲートによる視覚的蒸留を用いた,視覚言語行動モデルにおける視覚的混乱の克服 [cs.CV, cs.AI, cs.RO, cs.SY, eess.SY]目的:視覚的混乱環境下における,視覚言語行動モデルの精度と推論能力のギャップ解消
- ロボットによる複雑な操作を実現するためには,視覚情報と言語指示を統合するVLAモデルの性能向上が不可欠である。
- VLAモデルは,背景のノイズによって操作対象が曖昧になり,視覚的混乱環境下では性能が著しく低下するという課題がある。
- 本研究は,ノイズを除去し,操作対象を明確化することで,VLAモデルのロバスト性を向上させることを目指す。
- 提案手法であるCGVDは,言語指示を安全セットと注意散漫セットに分割し,誤検出を抑制することで,VLAポリシーを安定化させる。
- CGVDは,フーリエ変換に基づくインペインティングにより,背景ノイズを除去しつつ,重要な空間幾何学情報を保持することで,よりクリーンな視覚情報を生成する。
- 高密度な視覚的混乱環境下において,CGVDは既存手法を大幅に上回り,77.5%の成功率を達成した(ベースラインは43.0%)。
極端な非IIDおよびグローバルなクラス不均衡下での連合アクティブラーニング [cs.LG, cs.AI]目的:プライバシー制約下でのアノテーションコスト削減
- データプライバシー保護の重要性が増す中,分散データを用いた機械学習が注目されている。
- 連合学習では,クライアント間のデータ分布の不均一性やクラス不均衡が性能低下の原因となる。
- 少数クラスへの配慮を促し,グローバルとローカルのモデル選択を最適化することで性能改善を目指す。
- 提案手法FairFALは,軽量な予測不一致からグローバルな不均衡とローカル・グローバルの乖離を推測し,適応的にクエリモデルを選択する。
- グローバル特徴を用いたプロトタイプガイド付き擬似ラベリングにより,クラスを考慮したクエリを促進する。
- k-center refinementを用いた二段階の不確実性・多様性バランスサンプリング戦略を適用し,性能を向上させる。
多言語LLMジャッジにおける翻訳調バイアス軽減:情報ボトルネックの分離による手法 [cs.CL, cs.AI]目的:多言語LLMによる評価における翻訳調バイアスの軽減
- 多言語対応の機械翻訳の品質評価は,グローバルなコミュニケーションにおいて不可欠である。
- LLMは翻訳調バイアスを持ち,機械翻訳文を人間が書いた文よりも高く評価してしまう。
- バイアスを分離し,判断に重要な情報を圧縮することで,より公平な評価を目指す。
- 提案手法DIBJudgeは,既存の強化学習ベースラインと比較して,翻訳調バイアスを大幅に軽減することを示した。
- DIBJudgeは,判断に不可欠な表現を学習しつつ,バイアス要因を分離することで,頑健な評価を実現する。
- 情報圧縮と交差共分散ペナルティにより,表現の分離を促進し,公平性を高める。
ユーティリティ関数が全て:LLMベースの輻輳制御 [cs.NI, cs.AI]目的:LLMを用いた輻輳制御ユーティリティ関数の設計
- 通信ネットワークにおける輻輳は重要な課題であり,性能とネットワーク利用率を最適化する輻輳制御が不可欠である。
- 従来のユーティリティ関数設計は,数学的分析と実世界実験を必要とし,改善が小幅に留まる傾向があった。
- LLMを活用し,多様な最適化目標に対応した輻輳制御ユーティリティ関数を効率的に設計することを目指す。
- LLMは,生成的なコード進化戦略または数学的な思考連鎖(CoT)により,最適な結果に近い輻輳制御プロトコルを生成できる。
- 生成されたプロトコルは,シナリオによって37%~142%の改善を示し,既存の輻輳制御プロトコルを上回る性能を達成した。
- LLMを活用することで,アプリケーション固有の要件やネットワーク容量を考慮した輻輳制御の設計が実現可能となった。
HEAL:事後エントロピー支援学習による推論蒸留 [cs.AI, cs.LG]目的:大規模推論モデルからの推論能力の蒸留
- 推論能力はAIの高度化に不可欠であり,その効率的な伝達が求められている。
- 従来の蒸留手法は教師モデルの限界により,十分な推論能力を学生モデルに移行できない場合がある。
- 教師モデルの失敗事例から学び,学生モデルの推論能力向上を目指す。
- HEALは,教師モデルの推論過程における重要なポイントを特定し,事後的なヒント注入によって学生モデルの学習を支援する。
- 真の認知的な進歩と見かけ上の近道を見分ける厳格なフィルタリングメカニズムを導入することで,より効果的な学習を実現する。
- 複数のベンチマークにおいて,HEALは従来の蒸留手法を大きく上回り,優れた性能を示す。
マルチドメイン対話状態追跡のための動的知識融合 [cs.CL, cs.AI]目的:マルチドメイン対話状態追跡における性能向上
- 対話システムにおいて,ユーザ情報正確な追跡は,タスク達成に不可欠である。
- 対話履歴のモデル化困難性や,アノテーションデータの不足が,課題となっている。
- 対話履歴とドメイン知識を統合し,追跡精度と汎化性能の向上を目指す。
- コントラスト学習を用いたエンコーダにより対話履歴と候補スロットを符号化し,関連性の高いスロットを選択する。
- 選択されたスロットの構造化された情報を文脈プロンプトとして活用し,対話状態追跡の精度と一貫性を向上させる。
- マルチドメイン対話ベンチマークにおいて,提案手法が追跡精度と汎化性能を顕著に向上させることを確認した。
生成推薦システムにおける因果的注意再構成:インターリーブを超えて [cs.IR, cs.AI]目的:生成推薦システムの因果関係に基づいた注意機構の再構築
- 推薦システムの精度向上は,ユーザー体験とビジネス成果に直結するため重要である。
- 既存のインターリーブ方式は,系列長が倍増し計算コストが増大するという課題がある。
- インターリーブ方式の非効率性を解消し,スケーラブルかつ効率的なランキングモデルを開発する。
- 提案手法AttnLFAとAttnMVPは,既存のインターリーブ方式と比較して損失関数を改善した。
- AttnLFAとAttnMVPは,Normalized Entropyにおいても有意な改善を示した。
- AttnLFAとAttnMVPは,学習時間をそれぞれ23%と12%削減することに成功した。
潜在トレンド埋め込みによる非定常環境へのFew-Shot適応 [cs.RO, cs.AI]目的:ロボティクスにおける非定常環境へのFew-Shot適応
- ロボットは実環境で動作する際に,観測できない潜在的要因による概念ドリフトに直面する。
- 従来の適応手法はモデルパラメータを更新するため,破滅的忘却や高コストの問題がある。
- 本研究は,モデルパラメータを変更せずにFew-Shot適応を可能にする手法を提案する。
- 提案手法では,環境状態である「トレンドID」を推定し,潜在空間の滑らかな進化を促す。
- 実験結果から,学習されたトレンドIDは潜在空間の異なる領域に分布し,時間的に一貫した軌跡を示すことが確認された。
- 本手法は,パラメータ更新なしに,未知の環境へのFew-Shot適応を実現し,スケーラブルかつ解釈可能なソリューションを提供する。
リアクティブ・ライティング:AIとの共執筆がアイデアとの関わり方を変える方法 [cs.HC, cs.AI]目的:AIとの共執筆における手続き的・行動的変化
- 文章作成は思考のプロセスと密接に関わるため,その変化を理解することは重要である。
- AIライティングツールの意見形成力は示唆されているが,そのメカニズムは未解明である。
- AIライティングツールが引き起こすバイアスや意見の変化に脆弱な「リアクティブ・ライティング」の解明。
- AIの提案に目を通し,採用するかどうか判断することが執筆活動の中心となる。
- 自身のアイデアを十分に練り上げる前にAIの提案に関わることで,提案が意見の方向性を決定する。
- 書き手はAIの影響に気づかず,最終的なテキストを編集できるという原則により,完全な制御下にあると感じる。
LLM潜在空間における因果概念グラフ:段階的推論への応用 [cs.LG, cs.AI, stat.ME]目的:大規模言語モデルにおける段階的推論時の概念間の相互作用の理解
- 言語モデルの推論能力向上は,AI研究における重要な課題である。
- 既存手法では,概念の所在は特定できるが,推論過程における概念間の関係性は不明確である。
- 概念間の因果関係をグラフ構造として捉え,推論のメカニズムを解明することを目的とする。
- 因果概念グラフ(CCG)は,概念間の因果関係を捉えた疎なグラフ構造として表現された。
- CCGは,ARC-Challenge,StrategyQA,LogiQAにおいて,既存手法(ROME,SAE)やランダムベースラインを上回る因果的忠実度スコア(CFS)を示した。
- 学習されたグラフは疎で,ドメイン特化性と安定性も確認された。
混合エキスパートにおける最適な専門家-注意配分:動的モデル設計のスケーラブルな法則 [cs.LG, cs.AI]目的:混合エキスパートモデルにおける,エキスパート層と注意層間の計算資源配分の最適化
- モデルの能力向上には計算資源の効率的な利用が不可欠であり,その最適化は重要な課題である。
- 混合エキスパートモデルでは,エキスパート層と注意層の計算資源配分が性能に大きく影響するが,その最適な比率が不明確である。
- 計算量とモデルの疎性を考慮し,最適なエキスパート-注意計算資源配分比率を導出することを目指す。
- 実験の結果,最適な配分比率は総計算量と疎性に応じてべき乗則に従うことが示された。
- この分析により,エキスパート-注意計算資源配分を正確に制御するための明示的な公式が得られた。
- Chinchillaのスケーリング則を一般化し,モデルサイズやデータ量に加え,この構造パラメータの調整が可能になった。
スカラーを超えて:幾何学的進行と安定性によるLLMの推論の評価と理解 [cs.AI]目的:LLMの推論の質評価
- 大規模言語モデルの性能向上は,その信頼性確保と解釈可能性の追求が不可欠である。
- スカラー確率による評価では,推論の構造的ダイナミクスを捉えきれないという課題がある。
- 推論過程を幾何学的に分析し,信頼性の高い推論パターンを特定し理解すること。
- TRACEDフレームワークは,推論の「進行」と「安定性」を幾何学的に分解し,正確な推論とハルシネーションを区別する。
- 正確な推論は高い進行と安定性を示す一方,ハルシネーションは低い進行と不安定性を示すことが明らかになった。
- TRACEDは,多様なベンチマークにおいて競争力のある性能と優れた頑健性を実現し,高い曲率を「躊躇ループ」,変位を「確信の蓄積」と関連付けた。
拡散モデル学習のための分散を考慮した適応的重み付け [cs.RO, cs.LG, cs.CV]目的:拡散モデル学習における損失分散の不均衡の是正
- 生成モデリングの分野で近年注目されており,高品質な画像生成が可能である。
- ノイズレベル間の学習ダイナミクスに不均衡があり,最適化の効率低下や学習の不安定化を招く。
- 損失分散に基づいて重みを動的に調整し,ノイズレベル間の最適化バランスを改善する。
- 提案手法は,CIFAR-10およびCIFAR-100における生成性能を向上させ,FIDスコアを低減した。
- ランダムシード間の性能ばらつきも抑制され,学習の安定化に貢献することが示された。
- 損失-log-SNRの可視化や分散ヒートマップ等の分析により,適応的重み付けの有効性が確認された。
人間とロボットのインタラクションにおける共形リスク制御を用いた安全な確率的計画 [cs.RO, cs.AI]目的:人間とロボットのインタラクションにおける安全な制御手法
- ロボットの社会実装が進む中で,人間との安全な協調は不可欠である。
- 人間の行動予測には不確実性が伴い,安全性を保証することが困難である。
- 行動予測の誤差を考慮し,安全性の確率的保証を確立すること。
- 提案手法は,制御バリア関数と共形リスク制御を組み合わせることで,形式的な安全性を保証する。
- 実験結果から,提案手法は従来の基盤手法と比較して,衝突率と安全違反を大幅に低減できることが示された。
- 目標達成率と制御効率を維持しつつ,インタラクションの文脈に応じて安全マージンを動的に調整する。
グラフGRPO:強化学習を用いたグラフフローモデルの学習 [cs.HC, cs.LG]目的:グラフフローモデルの学習のための強化学習フレームワーク
- グラフ生成は創薬など幅広い応用を持つ基盤技術であり,その重要性は高い。
- 複雑な人間の嗜好やタスク固有の目的に合わせてグラフフローモデルを調整することが困難である。
- 検証可能な報酬に基づき,グラフフローモデルの学習を可能にするフレームワークを提案する。
- 提案手法であるGraph-GRPOは,GFMの遷移確率の解析表現を導出することで,強化学習のための完全微分可能なロールアウトを可能にした。
- グラフの一部のノードやエッジをランダムに摂動し,再生成することで,局所的な探索と生成品質の自己改善を実現する。
- 合成データおよび実データを用いた実験により,Graph-GRPOの有効性が確認され,分子最適化タスクで最先端の性能を示した。
LLMの高次不確実性を曖昧確率で表現 [cs.AI]目的:大規模言語モデルにおける高次不確実性の抽出
- LLMの応用範囲拡大に伴い,その出力の信頼性評価が不可欠である。
- 従来の確率的枠組みでは,LLMの複雑な不確実性を十分に捉えきれない。
- 曖昧確率に基づき,LLMの高次不確実性をより正確に定量化する。
- 提案手法は,LLMから直接,一次および二次的不確実性を抽出できる。
- 曖昧確率を用いることで,曖昧な質問応答や文脈学習におけるLLMの不確実性をより忠実に表現可能である。
- このアプローチにより,LLMの信頼性が向上し,意思決定のサポートに貢献する。
ラベルノイズを用いた確率的勾配降下法による2層線形ニューラルネットワークの学習ダイナミクス [cs.LG, cs.AI]目的:ラベルノイズを用いた確率的勾配降下法の学習ダイナミクス
- 深層学習の成功要因の一つは,勾配ベースの学習アルゴリズムに内在するノイズによる暗黙的なバイアスである。
- ノイズの多いラベルでの学習がモデルの汎化性能を向上させるという経験的観察があるが,そのメカニズムは未解明である。
- ラベルノイズを用いた確率的勾配降下法の学習ダイナミクスを解析し,その背後にあるメカニズムを明らかにすること。
- 2層の過剰パラメータ化された線形ネットワークにおいて,ラベルノイズSGDの学習行動は2つの段階に分けられることが示された。
- 第1段階ではモデルの重みの大きさが徐々に減少し,モデルはlazy regimeからrich regimeへ移行する。
- 第2段階では,モデルの重みと真の補間器との整合性が高まり,最終的に収束する。ラベルノイズがlazy regimeからrich regimeへの移行を促進する役割が示唆された。
テキスト証拠に基づくサービスシステム設計 [cs.LG, cs.AI, math.OC, stat.ML]目的:サービスシステム構成の最適な選択
- サービスシステムの効率化は,顧客満足度向上やコスト削減に不可欠である。
- 従来の最適化手法は,テキストデータのような非数値データへの対応が困難である。
- LLMのバイアスを考慮しつつ,人間による監査コストを最小化する手法が求められる。
- LLMのみでの選択は,構成要素に依存したバイアスにより失敗する可能性がある。
- 提案手法PP-LUCBは,LLMの信頼性が低い場合に人間による監査を集中させる。
- 顧客サポートチケット分類タスクで,40回の試行中40回正しく最適なモデルを特定し,監査コストを90%削減した。
時空間予測のための双次元圧縮による効果的なデータセット蒸留 [cs.IR, cs.LG, cs.AI, cs.DB]目的:時空間データの効率的なモデル学習に用いるための,コンパクトなデータセットの生成
- 交通予測や気象予測など,現実世界の問題解決に時空間データ分析が不可欠である。
- データ量とモデルの複雑化により,深層学習モデルの学習に膨大な時間と計算資源を要する。
- 時空間データの両次元(空間・時間)を同時に圧縮することで,学習コストを削減し,性能を維持する。
- 提案手法STemDistは,既存手法と比較して,学習時間を最大6倍,メモリ使用量を最大8倍削減可能である。
- STemDistによって蒸留されたデータセットを用いることで,予測誤差を最大12%低減できる。
- クラスタレベルでの蒸留と,部分集合に基づく詳細な蒸留を組み合わせることで,効率と精度を両立している。
ネットワーク侵入検知システムの強化:敵対的攻撃を緩和するための多層アンサンブルアプローチ [cs.CR, cs.AI]目的:敵対的攻撃に対するネットワーク侵入検知システムの堅牢性向上
- 機械学習の活用はネットワークセキュリティの自動化に不可欠であり,その重要性は増している。
- 機械学習を用いた侵入検知システムは,敵対的サンプルによって容易に欺瞞される脆弱性を抱えている。
- 敵対的攻撃に対する耐性を高めることで,機械学習ベースの侵入検知システムの信頼性を確保することを目指す。
- 提案手法は,スタッキング分類器とオートエンコーダーの二層構造により,敵対的攻撃に対する耐性を高める。
- GANとFGSMという二つの敵対的サンプル生成手法を用いて評価を行い,提案手法の有効性を検証した。
- UNSW-NB15とNSL-KDDのデータセットを用いた実験により,提案手法が敵対的攻撃への耐性を向上させることが示された。
劣化段階同期サンプリングとクロスドメインオートエンコーダを用いたドメイン適応型ヘルスインジケータ学習 [cs.LG, cs.AI]目的:効果的な予知保全およびヘルス管理のための高品質なヘルスインジケータの構築
- 設備の健全性維持は,産業界において重要な課題であり,稼働停止による損失を最小限に抑えることが求められる。
- 異なる稼働条件下では,データ分布の不一致が生じやすく,既存のヘルスインジケータモデリング手法の性能が低下する。
- データ分布の不一致を解消し,より高精度なヘルスインジケータを学習することで,設備の予知保全能力を向上させる。
- 提案手法では,劣化段階同期バッチサンプリング(DSSBS)により,ソースドメインとターゲットドメインのミニバッチを故障段階で同期させることで,クロスドメインのAlignmentを改善した。
- さらに,クロスドメインアラインメント融合ラージオートエンコーダ(CAFLAE)は,長距離の時間的依存性を捉え,優れたドメイン不変表現を学習するバックボーンとして機能する。
- 韓国国防システムデータセットとXJTU-SYベアリングデータセットでの実験により,提案手法は最先端手法と比較して平均24.1%の性能向上を達成した。
GGMP:一般化ガウス混合過程 [cs.RO, cs.LG, stat.ML]目的:多峰性条件密度推定
- 不確実性の定量化が重要であり,ガウス過程はそのための有効な枠組みを提供する。
- 標準的なガウス過程回帰は単峰性のガウス予測形式に制限されている。
- 多峰性かつ非ガウス性の強い条件密度推定を可能にする手法の確立。
- GGMPは,局所ガウス混合モデルの適合,入力間成分のアライメント,および成分ごとの異分散ガウス過程学習を組み合わせる。
- その結果,閉形式のガウス混合予測密度が得られ,計算効率とスケーラビリティに優れている。
- 合成データおよび現実世界のデータセットにおいて,非ガウス性と多峰性において既存手法を上回る性能を示した。
FP4量子化LLM学習における平均バイアスの呪いと恵み [cs.LG, cs.AI]目的:LLM表現におけるスペクトル異方性の主要因である平均バイアス
- 自然言語処理の発展に伴い,大規模言語モデルの重要性が増している。
- 低ビット化学習では,数値的安定性が課題となる。
- 平均バイアスを除去することで,低ビット化学習の安定性を向上させる。
- 平均バイアスは,LLM表現におけるスペクトル異方性の主要な成分であり,活性化値の極端な分布を引き起こす。
- 提案手法である平均除去は,損失のBF16との差を縮小し,下流タスクの性能を回復する。
- 平均除去は,SVDに基づくスペクトル手法と同等の安定性をもたらしつつ,計算コストを削減できる。
拡散モデルにおけるプロンプト不要なインスタンス・アンラーニング [cs.LG, cs.CV]目的:プロンプトで指定できない出力の選択的忘却
- 拡散モデルは強力だが,倫理的・プライバシー上の問題が懸念されるため,望まない出力の除去が重要である。
- テキストプロンプトで特定できない望まない出力(顔,誤った文化的描写など)を除去する方法が不足している。
- 拡散モデルから,プロンプトなしで特定できない特定の出力を削除し,プライバシーと倫理を保護すること。
- 提案手法は,画像編集,時間ステップ加重,勾配手術を用いて,拡散モデルに特定の出力を忘れさせる。
- 実験により,提案手法がプロンプトベースの手法や他の手法よりも,顔や誤った文化的描写といったプロンプト指定困難な出力を効果的に削除することが示された。
- 本手法は,拡散モデルプロバイダーがプライバシー保護と倫理遵守を確保するための実用的な解決策となる。
