arXiv雑要約
AI - 2026/01/30 公開
速度は自信である [cs.LG]目的:最初の信号に基づく意思決定の原理の適用
- 生物学的ニューラルシステムは,限られたエネルギーの中で高速な処理が求められる。
- 既存のモデルでは,推論ステップ数が多い,あるいは分散が大きいという課題がある。
- 推論コストを抑えつつ,より正確な意思決定を可能とする手法を開発すること。
- Sudoku-Extremeにおいて,最初の停止選択は97%の精度を達成し,確率平均よりも高い性能を示した。
- 並列潜在状態を利用した学習のみで,アンサンブル性能と同等の精度を,1/2以下の分散で実現した。
- ベースラインモデルの失敗の多くは選択の問題に起因しており,精度向上に余地があることが示唆された。
機械学習コンパイラのための単純な統一レイアウト抽象化Axe [cs.DC, cs.AI, cs.LG, cs.PL]目的:機械学習ワークロードのスケーリングのためのデータと計算の配置
- 深層学習の発展により,デバイス間の効率的なデータ配置が不可欠となっている。
- 異なるハードウェア構成への対応が難しく,最適化に手間がかかる。
- ハードウェアを意識した抽象化による,統一的なレイアウト管理を実現する。
- Axe Layoutは,論理テンソル座標を名前付き軸を介して物理空間にマッピングする。
- Axeは,デバイス間分布とオンデバイスレイアウトを統一し,スケーラブルな深層学習を可能にする。
- 最新のGPUデバイスやマルチデバイス環境において,手動調整されたカーネルに近い性能を実現する。
TinyTorch:機械学習システムを基礎から構築する [cs.LG]目的:機械学習システムの理解を深めるための教育カリキュラム
- 機械学習は社会の様々な分野で活用が広がっており,その重要性は増している。
- アルゴリズムの学習と,それを実行するシステムの理解との間に隔たりが存在する。
- アルゴリズムだけでなく,システムの基礎から理解することで実践的なスキルを習得する。
- TinyTorchは,PyTorchの主要コンポーネントを純粋なPythonで実装する20モジュールのカリキュラムである。
- このカリキュラムは,プロファイリングやベンチマークを通じて,複雑さを段階的に理解させ,実践的なスキルを習得させる。
- 4GBのRAMとGPUなしでも,TinyTorchは深い機械学習システムの理解が可能であることを示している。
レコメンデーションのためのLLMベースの説明エージェントの頑健性の評価:RobustExplain [cs.IR, cs.AI, cs.LG]目的:LLMベースの説明エージェントのレコメンデーションにおける頑健性の評価
- 推薦システムにおいて,自然言語による説明はユーザーの理解と信頼獲得に不可欠である。
- ユーザー履歴データにはノイズが含まれることが多く,説明の安定性や信頼性に影響を及ぼす可能性がある。
- LLMベースの説明エージェントの頑健性を定量的に評価するフレームワークを構築し,現状の課題を明らかにする。
- RobustExplainは,ユーザー行動のノイズに対する説明の頑健性を評価するためのフレームワークである。
- 実験の結果,現在のLLMは中程度の頑健性しか示さず,より大規模なモデルの方がわずかに安定性が高いことが示された。
- この研究は,説明エージェントの頑健性を評価するためのベンチマークを確立し,信頼できる推薦システム構築の重要性を示唆する。
LLMをオーケストレーターとして:制約を満たすマルチエージェント最適化による推薦システム [cs.IR, cs.AI, cs.LG, cs.MA]目的:推薦システムにおける制約を満たしたマルチエージェント最適化
- 推薦システムは,ビジネス上の制約を満たしつつ,複数の目的を最適化する必要がある。
- 既存手法では制約をソフトなペナルティとして扱うため,実運用で制約違反が頻発する。
- LLMを用いて制約を満たした推薦システムの最適化を可能にすることを目的とする。
- 提案手法DualAgent-Recは,Amazon Reviews 2023データセットにおいて100%の制約充足率を達成した。
- 既存手法と比較して,Paretoハイパーボリュームを4-6%改善し,精度と多様性のトレードオフを維持した。
- LLMが,実用的な制約を満たす推薦システムのための効果的なオーケストレーションエージェントとして機能することが示された。
Apple Siliconにおける大規模言語モデルおよびマルチモーダル大規模言語モデルの推論 [cs.LG, cs.DC, cs.ET]目的:Apple Silicon上での効率的なLLMおよびMLLM推論
- 機械学習開発においてApple Siliconの利用が拡大しており,その独特の統合メモリアーキテクチャを活用する効率的な推論ソリューションが求められている。
- 既存のツールはネイティブな最適化が不足するか,テキストモデルにしか焦点を当てておらず,マルチモーダルワークロードが十分にサポートされていない。
- 本研究は,Apple Silicon上でネイティブにMLXを基盤とするLLMおよびMLLM推論フレームワークを提供し,その性能を向上させることを目指す。
- テキストモデルにおいて,Qwen3-0.6BからNemotron-30Bまでのモデル群でllama-cppと比較して21%から87%高いスループットを達成した。
- マルチモーダルモデルでは,コンテンツハッシュを用いて同一画像を識別し,冗長な画像エンコーディングを排除するコンテンツベースのプレフィックスキャッシングを導入した。
- Apple M4 Max上での評価により,テキストモデルで最大525トークン/秒のスループット,反復画像クエリで最大28倍の高速化,マルチモーダルレイテンシを21.7秒から1秒未満に短縮した。
モデルフリー出力フィードバックによる方策勾配法を用いた安定化 [eess.SY, cs.LG, cs.SY, math.OC]目的:未知の線形動的システムにおける出力フィードバックによる安定化
- 制御システムの分野において,動的システムの安定化は多くの複雑なタスクの基盤となる重要な問題である。
- 既存の方策勾配法は,多くの場合,システムの完全な状態が観測できる状況を前提としている。
- 本研究は,部分観測可能な線形動的システムに対するモデルフリーな出力フィードバックによる安定化問題に取り組む。
- 提案手法は,システムの軌跡に基づくゼロ次の方策勾配更新を利用し,定常点への収束性を活用することで,安定化する出力フィードバック方策を得る。
- 離散時間線形動的システムに対して,提案アルゴリズムが安定化する出力フィードバック方策を導出することを示す。
- アルゴリズムのサンプル複雑度を明示的に特徴づけ,数値例を通じてその有効性を検証した。
PROTEUS:ラグランジュRLによるSLAを意識したルーティング - マルチLLM提供システム向け [cs.AI]目的:多様なワークロードにおけるコストと品質要件を満たすLLMルーティング手法
- LLMの利用拡大に伴い,効率的なモデル提供システムの構築が重要となっている。
- 既存のLLMルーティングは,パラメータ調整が難しく,精度予測が困難である。
- SLA(サービス品質)を満たすルーティング決定を,リアルタイムで行うことを目指す。
- PROTEUSは,精度目標を直接入力として受け付け,ラグランジュ双対制御を用いることでSLAを満たすルーティングを実現した。
- RouterBenchおよびSPROUTの評価により,PROTEUSは目標精度を満たす割合が90%を超え,ベースラインを大幅に上回った。
- 単一のモデルで幅広い精度範囲に対応可能であり,コスト削減効果も89.8%に達した。
AACR-Bench:包括的なリポジトリレベルのコンテキストを用いた自動コードレビューの評価 [cs.IR, cs.SE, cs.AI]目的:自動コードレビューの評価基準
- LLMを活用した自動コードレビューの品質向上は,ソフトウェア開発効率の改善に不可欠である。
- 既存の評価基準は,多言語対応や正確な欠陥情報の不足により,モデルの性能を正しく評価できない場合がある。
- より厳密で信頼性の高い評価基準を確立し,LLMによる自動コードレビューの性能を正確に測定すること。
- AACR-Benchは,複数言語に対応し,リポジトリ全体を考慮した包括的な評価基準である。
- 「AI支援,専門家検証」という注釈パイプラインにより,従来の基準よりも285%多くの欠陥を検出できた。
- LLMの性能評価において,コンテキストの粒度や検索方法が重要な影響を与えることが示された。
1つのトークンで十分:シンクトークンによる拡散言語モデルの改善 [cs.IR, cs.RO, cs.CL, cs.CG, cs.DC, cs.CL, cs.AI]目的:拡散言語モデルにおける注意シンクの安定化
- 近年,並列テキスト生成が可能な拡散言語モデルが注目を集めている。
- 拡散言語モデルには,注意シンクが拡散ステップ間で移動する不安定性がある。
- 本研究は,追加のシンクトークンを導入することで注意シンクを安定化させる。
- 追加のシンクトークンは,自己へのみ注意を向け,他のトークンからはグローバルに参照されるように設計された。
- 実験結果から,このトークンが注意シンクを安定化させ,モデル性能を大幅に向上させることが示された。
- その効果はトークンの位置に依存せず,意味的な内容もほとんど含まないことが確認された。
GAVEL:活性化モニタリングによるルールベースの安全性向上 [cs.AI, cs.CR, cs.LG]目的:活性化に基づく安全性評価におけるルールベースのアプローチ
- 大規模言語モデルの安全性を確保することは,社会実装において不可欠である。
- 既存の活性化安全アプローチは,精度が低く,柔軟性や解釈可能性に課題がある。
- ドメイン固有の行動をより正確に捉える,ルールベースの活性化安全システムを開発すること。
- 活性化を認知要素としてモデル化し,それらの組み合わせで複雑な行動を表現する。
- 認知要素に対する述語ルールを定義することで,リアルタイムに安全性の侵害を検出する。
- モデルの再学習を伴わずに,安全対策の構成と更新が可能となり,透明性と監査可能性を向上させる。
グラフTransformerと定常流データ拡張を用いたリアルタイム拍動流予測:多様な脳動脈瘤形態への応用 [cs.LG]目的:脳動脈瘤の形態から血壁せん断応力などのバイオメカニカルマーカーを高精度に予測すること
- 脳動脈瘤における流体力学的マーカーは疾患進行リスク評価に有用だが,臨床応用は限定的である。
- 詳細なCFD解析には専門知識と時間がかかり,臨床試験での利用が難しいという課題がある。
- 深層学習モデルにより,リアルタイムでバイオメカニカルマーカーを推定し,臨床応用を促進すること。
- グラフTransformerモデルが,心周期全体にわたる壁面せん断応力を高精度に予測することを示した。
- 構造類似性指標(SSIM)は最大0.981,最大相対L2誤差は2.8%を達成し,最適な性能を確認した。
- 定常流CFDデータを拡張データとして活用することで,限られた拍動流CFDデータでも高い性能が実現された。
オンラインNetCVR予測のためのカスケード遅延フィードバックモデリング:ベンチマーク,洞察,および解決策 [cs.LG]目的:オンラインNetCVR予測のためのモデリング手法の開発
- レコメンダーシステムにおいて,CVRはトラフィック配分に広く利用されるが,返品行動を考慮していない点が課題である。
- NetCVR予測は,クリックから購入,購入から返品という複雑な多段階のカスケード遅延フィードバックプロセスを含むため,困難である。
- 本研究では,NetCVR予測の課題を解決するため,大規模なデータセットと継続学習スキームを提案する。
- CASCADEデータセットの分析から,NetCVRには強い時間的変動があり,オンライン継続モデリングが必要であることが示された。
- CVRと返品率のカスケードモデリングが,直接的なNetCVRモデリングよりも優れていることが明らかになった。
- 遅延時間は,CVRと返品率の両方と相関があり,NetCVR予測の重要な特徴であることが示された。TESLAは,RI-AUCで12.41%,RI-PRAUCで14.94%の絶対的な改善を達成した。
摂動誘発線形化:線形分類器のみを用いた学習不能データの構築 [cs.LG, cs.AI]目的:学習不能データの構築
- 深層学習モデルの訓練にはウェブデータが広く利用され,データの不正利用が懸念されている。
- 既存手法は深層ニューラルネットワークを摂動生成の代替モデルに用いており,計算コストが高い。
- 線形代替モデルのみを用いた,計算効率の良い摂動生成手法を提案し,データ保護を目指す。
- 提案手法PILは,既存手法と同等以上の性能を,大幅に短い計算時間で達成する。
- 深層モデルの線形化を誘導することが,学習不能データの効果を説明する重要なメカニズムを明らかにした。
- パーセンテージに基づく部分摂動下における学習不能データの特性に関する分析も提供する。
異なる意図を伝えたらどうだったか? LLMベースの自律制御のための反事実生成 [cs.AI]目的:LLMベースの自律制御における反事実的推論の枠組み
- LLMエージェントの活用が期待される中で,意図と行動の関連性の理解が重要である。
- ユーザーは結果を見て,意図の表現を変えた場合の可能性を検討したいというニーズがある。
- 意図の言い換えによる結果の違いを,信頼性をもって検証することを目指す。
- 提案手法は,ユーザー,LLM,環境の相互作用を構造因果モデルとして捉える。
- テスト時スケーリングにより,複数の反事実的結果候補を確率的推論によって生成する。
- 反事実生成(CCG)は,真の反事実的結果を高い確率で含む結果セットを保証する。
MEG向け次脳トークン予測のスケーリング [cs.LG, eess.IV]目的:MEGデータセットおよびスキャナ間の長文脈における次トークン予測の拡大
- 脳機能研究において,MEGは高時間分解能で脳活動を計測する重要な手法である。
- MEGデータの解析には,計算コストが高く,長時間のデータ処理が困難という課題がある。
- 大規模なデータセットを用いて,長時間のMEGデータを効率的に処理・予測するモデルを開発する。
- 本研究では,500時間以上のMEGデータを用いて,大規模な自己回帰モデルを構築し,次脳トークンを予測することに成功した。
- 生成されたMEGデータは,長時間のロールアウトにおいても比較的安定しており,実際のデータ分布に近いことが示された。
- 異なるデータセット間での一般化性能も確認され,モデルの有用性が示唆された。
NeuraLSP:共役勾配法のための効率的かつ厳密なニューラル左特異部分空間前処理法 [cs.LG, cs.AI]目的:偏微分方程式の数値解法における前処理法の効率化
- 科学技術計算において,偏微分方程式の解法は不可欠であり,その効率が重要である。
- 既存の前処理法は,行列のグラフ構造化によるランクの増加や収束速度の低下を招く場合がある。
- 特異部分空間を利用し,ランクの増加を抑制し,収束速度を向上させる新たな前処理法を開発する。
- NeuraLSPは,システムの行列の近零空間ベクトルの左特異部分空間を利用した新しいニューラル前処理法である。
- スペクトル情報を固定された低ランク演算に圧縮することで,理論的保証と経験的な頑健性を実現している。
- 多様な偏微分方程式に対して,最大53%の高速化を達成し,理論的進歩を裏付けている。
クロスドメイン画像分類における因果駆動特徴評価 [cs.LG, cs.AI]目的:クロスドメイン画像分類における特徴量の因果的効果の評価
- 現実世界では,テストデータの分布が訓練データと大きく異なることが多く,汎化性能が重要となる。
- 既存手法はドメイン不変な表現を追求するが,不変性は信頼性を保証しない。
- 分布シフト下での必要性と十分性を評価し,よりロバストな汎化を目指す。
- 提案手法は,ドメイン間の因果的効果を直接測定するセグメントレベルのフレームワークを採用している。
- マルチドメインベンチマーク実験において,特に困難なドメインシフト下でOOD性能が向上した。
- 因果的評価が,ロバストな汎化に不可欠であることを示唆する。
MALLOC:大規模シーケンシャル推薦のためのメモリ効率を考慮した長系列圧縮のベンチマーク [cs.CL, cs.HC, cs.IR, cs.AI]目的:大規模シーケンシャル推薦におけるメモリ効率を考慮した長系列圧縮手法の評価基盤
- 推薦システムはデータ量とモデル規模の拡大傾向にあるため,計算コストの増大が課題。
- 既存手法は過去行動の保存にメモリを消費し,大量ユーザーに対応する際のメモリ使用量が問題。
- LLMのメモリ管理戦略を推薦タスクへ適用し,メモリ効率の良い圧縮手法を評価・開発する。
- MALLOCは,大規模シーケンシャル推薦のためのメモリ管理技術を体系的に分類・評価するベンチマーク基盤である。
- 最新の推薦モデルに様々なメモリ管理技術を組み込み,再現性とアクセス性を確保した。
- 精度,効率,複雑さの観点から実験を行い,MALLOCの信頼性と有用性を実証した。
制約を考慮した損失関数とクロス学習モジュールを用いた決定トランスフォーマーによる自動入札の強化 [cs.LG, cs.GT]目的:自動入札のための決定トランスフォーマーの性能向上
- オンライン広告における入札戦略は,広告効果と費用対効果に直結する重要な課題である。
- 従来の決定トランスフォーマーは,状態,行動,残りの報酬間の相互相関のモデリングが不十分であり,最適な行動とそうでない行動を区別できていない。
- 状態,行動,残りの報酬間の相関関係を強化し,制約条件を考慮した損失関数によって最適な行動の学習を促進すること。
- 提案手法C2は,クロスアテンションを用いたクロス学習ブロック(CLB)と,予算およびCPA制約を組み込んだ制約を考慮した損失関数(CL)を導入することで,決定トランスフォーマーの性能を向上させている。
- AuctionNetデータセットを用いたオフライン評価の結果,C2は様々な予算設定において最先端の手法と比較して一貫した性能向上(最大3.2%)を示した。
- CLBとCLの相乗効果を示すアブレーションスタディにより,C2が自動入札において優れていることが確認された。
MobileBench-OL:実環境におけるモバイルGUIエージェント評価のための包括的な中国ベンチマーク [cs.CL, cs.AI]目的:モバイルGUIエージェントの評価
- モバイルGUIエージェントの進化に伴い,その性能を客観的に評価する基準の必要性が高まっている。
- 既存のオンラインベンチマークは,タスク遂行能力に偏重し,推論能力や環境ノイズへの対応が不十分である。
- 実環境におけるGUIエージェントのタスク実行,推論,ノイズ耐性の評価を包括的に行うベンチマークを提供する。
- MobileBench-OLは,80の中国製アプリから構成される1080のタスクを含むオンラインベンチマークである。
- 12の主要なGUIエージェントの評価により,実環境要件を満たすための改善の余地が示された。
- 人間による評価も,MobileBench-OLが実環境でGUIエージェントの性能を信頼性高く測定できることを確認した。
概念成分分析:LLMにおける概念抽出のための原理的なアプローチ [cs.LG]目的:大規模言語モデルにおける概念抽出のための原理的枠組み
- LLMの信頼性向上には,人間が理解可能な解釈が不可欠である。そのため,LLMの内部動作の解明が重要視されている。
- 既存の概念抽出手法は理論的な曖昧さを抱えており,明確な評価基準が確立されていない。
- LLM表現を概念の事後確率の線形混合として近似し,原理的な概念抽出法を開発する。
- 本研究では,概念成分分析(ConCA)という新しいフレームワークを提案し,LLM表現から概念の対数事後確率を回復する。
- ConCAは,スパース性事前分布を活用することで,概念抽出の逆問題を解決する。
- 複数のLLMにおいてConCAの有効性を検証し,既存のSAEと比較して理論的根拠に基づいた優位性を示す。
人間とAIの協調における規範的同等性:協調を促進するのはアイデンティティではなく行動 [cs.AI, cs.GT, cs.HC, econ.GN, q-fin.EC]目的:人間とAIが混ざったグループにおける協調的規範の創発と維持機構
- 社会生活において協調は不可欠であり,集団の持続可能性に大きく影響する。
- AIエージェント導入により,従来の人間関係に基づく規範がどのように変化するか不明である。
- AIエージェントが協調規範に与える影響を明らかにすることで,より良い人間とAIの協調を促進する。
- 反復的な公財ゲーム実験の結果,協調は相互作用と行動慣性によって主に促進されることが示された。
- AIエージェントのラベルは,協調レベルに有意な差をもたらさず,規範的メカニズムは条件間で一貫していた。
- この研究は,協調規範がAIエージェントにも適用可能であることを示唆し,集団意思決定における人間とAIの境界を曖昧にする。
PathWise: 自己進化型LLMによる自動ヒューリスティック設計のためのワールドモデルを通じた計画 [cs.AI, cs.CL]目的:組み合わせ最適化問題に対する自動ヒューリスティック設計
- 組合せ最適化問題は現実世界の様々な場面で現れ,効率的な解法が求められている。
- 既存手法では固定的な進化ルールやプロンプトテンプレートに依存し,探索が局所的になりがちである。
- 過去の探索履歴を考慮した計画的なヒューリスティック生成により,より効率的な設計を目指す。
- PathWiseは,推論グラフを状態記憶として活用し,ヒューリスティック生成を逐次的な意思決定プロセスとして定式化した。
- 計画エージェント,ワールドモデルエージェント,批評エージェントが連携し,LLMベースの自動ヒューリスティック設計を試行錯誤から推論による計画へとシフトさせる。
- 多様な組合せ最適化問題において,PathWiseはより高速に,より優れたヒューリスティックに収束し,異なるLLMでも有効であることが示された。
継続的なGUIエージェント [cs.CL, cs.LG, cs.CV]目的:GUI環境の変化下における継続学習
- デジタル環境は常に変化しており,GUIデータも時間とともに更新されるため,エージェントの適応が重要である。
- 静的な環境で訓練されたエージェントは,GUIの分布が変化すると性能が低下するという課題がある。
- GUI分布の変化に対応し,安定したGUI操作を実現するための継続学習フレームワークを提案する。
- 提案手法GUI-AiFは,既存のベースライン手法を大きく上回る性能を示した。
- GUI-AiFは,報酬関数に「アンカリングポイント報酬」と「アンカリング領域報酬」を導入することで,変化するGUI要素への適応を促進する。
- 本研究は,GUIエージェント向けの最初の継続学習フレームワークを確立し,強化学習によるファインチューニングの可能性を示す。
埋め込みに基づくTop-$k$検索のための十分な次元数:$\mathbb{R}^{2k}$ [cs.LG, cs.AI, cs.IR]目的:部分集合メンバーシップの埋め込みに必要な最小次元数の理論的限界
- 情報検索において,効率的な類似度検索は重要な課題である。大規模データに対する高速な検索手法が求められている。
- 高次元空間における埋め込み表現の次元数は,検索性能と計算コストに影響を与える。適切な次元数の決定が課題となっている。
- 埋め込み表現に必要な最小次元数を明らかにすることで,効率的な検索アルゴリズムの設計に貢献する。
- 最小埋め込み次元(MED)の理論的な上限を導出し,様々な距離尺度で検証した。
- シミュレーションにより,MEDと埋め込み要素数の間に対数的な関係があることを示した。
- 埋め込みに基づく検索の限界は,主に学習の困難さに起因すると示唆され,今後のアルゴリズム設計の指針となる。
カメラ・IMU融合によるロバストな路面分類のための新規データセットとフレームワーク [cs.CV, cs.AI]目的:路面分類のためのロバストなフレームワークの提案
- 環境認識型予測保全システムにおいて,路面分類は重要な役割を果たす。
- 既存手法は,限られたセンサの種類や多様性の低いデータセットにより,様々な環境下での汎化性能が低い。
- 環境変化に対するロバスト性を高めるため,カメラとIMUの情報を効率的に融合するフレームワークを開発する。
- 提案手法は,PVSベンチマークで最先端手法よりも1.4pp,新規データセットROADのマルチモーダルサブセットで11.6ppの性能向上を達成した。
- 特に少数クラスにおけるF1スコアが向上し,夜間や雨天など困難な視覚条件下でも安定した性能を示した。
- 安価なカメラとIMUセンサの組み合わせとマルチモーダルアテンション機構により,環境変動が大きくコスト制約のある地域でも路面理解が可能となる。
オプション価格決定における機械学習:ネットワークアーキテクチャの実証的研究 [q-fin.CP, cs.LG]目的:オプション価格またはインプライド・ボラティリティの学習
- 金融工学において,オプション価格決定はリスク管理やポートフォリオ最適化の基盤となる重要な課題である。
- 従来の数値解析手法は計算コストが高く,複雑なモデルへの適用が困難な場合がある。
- 機械学習を活用することで,高速かつ高精度なオプション価格決定モデルの構築を目指す。
- 一般化ハイウェイネットワークが,ブラック・ショールズおよびヘストンモデルにおいて,平均二乗誤差と学習時間の両方で最良の性能を示した。
- インプライド・ボラティリティ変換問題においては,簡略化されたDGM変種が最も低い誤差を達成した。
- 実勢市場データを用いた実験においても,同様の結果が得られた。
LLMが電話ゲームをする:文化的な引力体としてのLLMの多段階設定における評価ツール [physics.soc-ph, cs.AI, cs.MA]目的:LLM間の多段階的な情報伝達における情報変容のメカニズム解明
- LLMの利用拡大に伴い,生成されるテキストの質と変化を理解する必要性が高まっている。
- LLMの単独の振る舞いは研究されているが,複数LLM間での反復的な相互作用は未解明である。
- LLMの連鎖的な伝達過程で生じるバイアスや引力体の存在と,その影響を明らかにすること。
- 実験の結果,テキストの毒性,ポジティブ度,難易度,長さが連鎖的な伝達を通して変化し,特定の引力体が存在することが示された。
- 指示の自由度が高いほど,引力体の影響が強くなることが明らかになった。また,毒性は長さよりも強い引力体となることが示された。
- LLMの多段階的な伝達ダイナミクスを考慮することが,LLMの文化的ダイナミクス理解には不可欠である。
データ駆動型確率的空気-海洋フラックスパラメータ化 [math.OC, cs.MA, physics.ao-ph, cs.LG, stat.AP, stat.ML]目的:空気-海洋フラックスの確率的表現
- 気候変動予測には,海洋と大気の相互作用の正確な理解が不可欠である。
- 従来のパラメータ化では,フラックスの変動性を十分に捉えられていない。
- フラックスの不確実性を考慮した確率的パラメータ化手法を開発する。
- ニューラルネットワークを用いて,フラックスの平均値と分散を推定することに成功した。
- 提案手法は,既存のバルクアルゴリズムと比較して,より現実的なフラックス変動を再現する。
- 単一カラム海洋モデル実験で,フラックスアルゴリズムの変更が海面温度や混合層深に季節的な影響を与えることが示された。
逐次モンテカルロサンプラーへのChEES基準の組み込み [stat.CO, cs.LG, cs.SY, eess.SY, stat.ML]目的:ノンパラメトリックベイズ推論におけるサンプリング手法の改良
- ベイズ推論は確率モデルの学習に不可欠だが,計算コストが高いという課題がある。
- 従来のMCMC法は計算に時間がかかり,GPUなどの並列処理に不向きな場合がある。
- ChEES-HMCをSMCに組み込み,GPU環境での効率的なサンプリングを実現する。
- 提案手法は,NUTSと比較してGPU上での実行速度が向上し,同等の性能を示す。
- SMCサンプラーにChEES-HMCを組み込むことで,柔軟な提案分布選択が可能となる。
- いくつかのタスクにおいて,NUTSよりも高速かつ効率的なサンプリングを実現した。
MindGrab:コマンドラインとブラウザ向け高速かつ高精度な頭蓋剥離 [eess.IV, cs.AI, cs.CV, cs.NE]目的:頭蓋剥離の高速化と利便性の向上
- 脳画像解析において,頭蓋の除去は前処理として不可欠であり,解析精度に影響する。
- 既存手法は計算コストが高く,専用ハードウェアを必要とするため,利用の妨げとなっていた。
- 計算資源の限られた環境でも利用可能な,高速かつ高精度な頭蓋剥離手法の開発。
- MindGrabは,従来の頭蓋剥離手法と比較して,最大40倍の高速化とメモリ使用量の削減を実現した。
- 様々なデータセットと画像モダリティにおいて,平均Dice係数95.9%という高い精度を達成した。
- コマンドラインツールとウェブアプリケーションの両方で提供され,幅広い環境で利用可能である。
動的治療レジメンのための悲観的モデルベースの方策学習アルゴリズムPOLAR [stat.ML, cs.IT, cs.LG, math.IT, stat.ME]目的:動的治療レジメン最適化における新しい悲観的モデルベースの方策学習アルゴリズム
- 医療,教育,デジタル介入など,時間経過に伴い個別軌跡に応じた意思決定が求められる分野で重要。
- 既存手法は強いポジティビティの仮定に依存し,データ不足に弱いという課題があった。
- オフラインデータのみで,統計的保証と計算効率を両立した最適化手法を開発する。
- POLARは,オフラインデータから遷移ダイナミクスを推定し,各履歴-行動ペアの不確実性を定量化する。
- 報酬関数に悲観的なペナルティを組み込み,不確実性の高い行動を抑制することで,方策の最適化を目指す。
- 合成データとMIMIC-IIIデータセットにおいて,最先端の手法を凌駕し,ほぼ最適な履歴認識型治療戦略を実現した。
ガウス過程に対するVecchia誘導点全スケール近似 [stat.ML, cs.LG, stat.ME]目的:ガウス過程の計算効率化
- 機械学習や統計において柔軟な確率モデルとして広く利用されるが,大規模データへの適用が計算コストで制限される。
- 従来の近似手法では,低次元入力と高次元入力,あるいは滑らかな共分散関数とそうでない関数で性能に差が生じる。
- 誘導点法とVecchia近似の利点を組み合わせ,より広範な状況に対応できる効率的な近似手法を開発する。
- 提案手法VIF近似は,既存の近似手法と比較して計算効率,精度,数値安定性の点で優れていることが,シミュレーションデータおよび実データによる実験で示された。
- VIF近似では,残差過程のVecchia近似において,相関に基づいた効率的な近傍探索戦略を採用し,修正されたカバーツリーアルゴリズムにより実装されている。
- 非ガウス尤度への拡張のため,反復法を導入し,ラプラス近似を用いた際の計算コストを大幅に削減することに成功した。
大きな幅の極限におけるテンソル重みと創発的なフェルミオンのウィック則を持つニューラルネットワーク [hep-th, cond-mat.dis-nn, cs.LG, hep-ph]目的:ニューラルネットワーク量子場理論におけるテンソル値の隠れ層から出力層への重みを持つ複素数値ニューラルネットワークの研究
- 量子場理論と機械学習の融合は,新たな計算手法や物理現象の理解に繋がる可能性を秘めている。
- 従来のニューラルネットワーク量子場理論はボゾン場に限定され,フェルミオン場の記述には至っていない。
- ニューラルネットワークにフェルミオン的な対称性を組み込む道筋を示すことが本研究の目的である。
- 無限幅の極限において,ネットワーク出力の相関関数にフェルミオンのような符号構造が誘導されることを示した。
- 等しい数の生成消滅演算子を持つ相関関数は,フェルミオンのウィック則に従い,スカラーのユークリッドカーネルで構築された行列式として記述できる。
- これにより,ニューラルネットワーク量子場理論はボゾン場を超え,フェルミオン的な対称性をエンコードする可能性が示唆された。
文脈だけでは不十分:車間追従行動における説明不能な変動のモデル化 [stat.AP, cs.LG, cs.RO]目的:車間追従行動における変動と予測不可能性のモデル化
- 交通シミュレーションの精度向上は,交通流の理解と最適化に不可欠である。
- 従来のモデルは,ドライバーの潜在的な意図や認知誤差を捉えきれていない。
- 文脈に依存しない変動を考慮し,より現実的なシミュレーションを実現する。
- 提案手法は,ドイツの高速道路データセットHighDを用いて,従来のモデルを上回る予測性能を示した。
- 非定常ガウス過程と深層ニューラルネットワークを統合することで,加速に関する不確実性を定量化することが可能となった。
- 解釈可能性と精度の両立により,交通分析や安全関連アプリケーションへの応用が期待される。
OrthoInsight:マルチモーダル大規模モデルに基づく肋骨骨折の診断とレポート作成 [eess.IV, cs.AI, cs.CV]目的:肋骨骨折の診断およびレポート作成
- 医療画像データ量は増加の一途を辿り,特に肋骨骨折のような筋骨格系損傷の迅速な診断が求められている。
- 手動による画像診断は時間と労力を要し,見落としなどの誤りが生じやすいという課題がある。
- マルチモーダル学習を用いて,医療画像分析の効率化と放射線科医支援を目指す。
- OrthoInsightは,CT画像と専門的なテキストデータを統合し,臨床的に有用な診断結果を提供する。
- 28,675枚のCT画像と専門レポートによる評価において,診断精度,内容の完全性,論理的な整合性,臨床ガイダンス価値において高い性能を示した。
- 平均スコア4.28は,GPT-4やClaude-3などの既存モデルを上回る結果である。
最適な微分プライバシーカーネル学習:ランダム射影によるアプローチ [stat.ML, cs.LG, stat.ME]目的:微分プライバシーカーネル学習の最適化
- プライバシー保護の重要性が増す中,学習アルゴリズムへの応用が求められている。
- 既存手法では,プライバシー保護と汎化性能のバランスが課題となっていた。
- ランダム射影を用いたカーネル学習により,効率的かつ最適なプライバシー保護を実現する。
- 提案手法は,二乗損失およびリプシッツ滑らかな凸損失関数に対して,ミニマックス最適化された超過リスクを達成した。
- 従来の次元削減手法と比較して,より優れた汎化性能を示すことが理論的に証明された。
- 実証実験により,ランダム射影が統計的に効率的で,最適にプライバシーが保護されたカーネル学習を可能にすることが示された。
騒音環境下における人工内耳音響符号化シミュレーションのためのエンドツーエンドな聴覚-視覚学習 [eess.AS, cs.AI, cs.SD, eess.IV]目的:人工内耳の音響符号化における聴覚と視覚情報の統合
- 重度の難聴者にとって人工内耳は有用だが,騒音下での聴取は依然として課題である。
- 従来の符号化戦略では,騒音環境下での性能向上が限定的である。
- 聴覚と視覚情報を統合することで,騒音環境下での人工内耳の性能を向上させる。
- 提案手法AVSE-ECSは,客観的な音声明瞭度を高く維持する。
- AVSE-ECSは,先進的な組み合わせエンコーダ(ACE)戦略と比較して,信号対誤差比(SER)を7.4666 dB改善した。
- これらの結果は,AVSEに基づく人工内耳音響符号化の可能性を示唆する。
自己整合性による償却モデル比較の精度向上 [math.MG, cs.CG, math.CO, stat.ML, cs.LG, stat.CO]目的:償却モデル比較における精度向上
- ベイズ推論の高速化が求められ,ニューラルネットワークによる近似が注目されている。
- 統計モデルの誤指定により,ニューラルネットワークの予測が不安定になる問題がある。
- モデル比較において,誤指定されたモデルが存在する場合でもロバストな比較を目指す。
- 自己整合性(SC)を用いた学習は,パラメータ事後分布に基づくモデル比較の精度を向上させる。
- 尤度が利用可能な場合,SC学習はモデルの誤指定に対するロバスト性を高める。
- 尤度が利用できない場合,SCの効果は限定的であり,一貫性がない場合がある。
MIMO-OFDMチャネル生成における非同一拡散モデル [eess.SP, cs.AI, cs.LG]目的:無線OFDMチャネルの生成への非同一拡散モデルの応用
- 無線通信システムの性能評価や最適化において,正確なチャネルモデルは不可欠である。
- 従来のチャネルモデルでは,チャネル推定の信頼性のばらつきを適切に表現できない場合がある。
- チャネル推定の信頼性に応じたノイズ進行を制御することで,より現実的なチャネル生成を目指す。
- 本研究では,要素ごとに異なる時間指標を用いる非同一拡散モデルを提案し,その有効性を示した。
- 特に,パイロット信号の配置による信頼性のばらつきが大きいため,MIMO-OFDMチャネル生成において有効であることが確認された。
- 次元ごとの時間埋め込み戦略により,理論的および数値的な両面からモデルの正当性と有効性を実証した。
確率的マッチングバンディットにおける稀な最適化更新 [stat.ML, cs.LG]目的:多項ロジット選択モデル下での確率的マッチングに関するバンディットフレームワーク
- 資源配分や推薦システムなど,様々な分野で最適なマッチングが重要視されている。
- マッチング問題は計算複雑性が高く,リアルタイムでの最適化が困難である。
- 最適化更新回数を抑制することで,計算コストを削減し,実用的なバンディットアルゴリズムを開発する。
- 本研究では,最適化更新回数を全体期間を通じてΘ(log log T)回に制限するバッチ処理アルゴリズムを提案した。
- 提案アルゴリズムは,高価な組み合わせ最適化を僅かなラウンド数でのみ実行することで,計算オーバーヘッドを大幅に削減する。
- その結果,√Tのオーダーの regret bound を達成し,計算効率と性能の両立を実現した。
テキスト音声生成拡散モデルにおける反記憶ガイダンスによるデータ複製軽減 [eess.AS, cs.LG, cs.SD, eess.SP]目的:テキスト音声生成拡散モデルにおけるデータ複製軽減策
- 生成モデルの発展は,高品質な音声コンテンツの自動生成を可能にするため重要である。
- 生成モデルが学習データを無意識に複製してしまう問題が存在する。
- 拡散モデルにおける反記憶ガイダンスによって,データ複製を抑制しつつ高品質な音声を生成することを目指す。
- 反記憶ガイダンス(AMG)は,拡散モデルのサンプリング過程を調整することで,記憶を抑制する。
- 実験結果から,AMGがStable Audio Openを用いたテキスト音声生成において,データ複製を大幅に軽減できることが示された。
- AMGは,音声の忠実度や意味的整合性を損なうことなく,記憶の抑制に貢献する。
報酬検証なしの韻律:TTSにおける嗜好性誘導韻律学習へ [eess.AS, cs.AI, cs.CL, cs.SD]目的:TTSにおける韻律の自然性最適化
- 音声合成技術は,人間と自然なコミュニケーションを可能にする上で不可欠である。
- 韻律の評価は自動化が難しく,客観的な報酬設計が課題となっている。
- 人間の嗜好に基づいて韻律を直接最適化することで,自然な音声合成を目指す。
- 提案手法は,KoCC-TTSデータセットにおいて,既存手法や商用システムを上回る人間の嗜好スコア(ELO)を獲得した。
- 転写エラー率(CER)も競争力のある水準を維持しており,韻律と明瞭度の両立を実現している。
- 人間の嗜好最適化が,韻律の自動評価が困難な状況下における実用的かつデータ効率の良い解決策となりうることを示唆する。
音を聞き分ける学習:頑健なオーディオビジュアルインスタンスセグメンテーションの向上 [eess.AS, cs.AI, cs.MM, cs.SD]目的:オーディオビジュアルインスタンスセグメンテーションにおける音源とオブジェクトの関連付けの改善
- 映像と音響を統合することで,より高度な状況理解が可能となり,ロボティクスや自動運転などの応用が期待される。
- 既存手法は視覚情報に偏りがちであり,音源情報が十分に活用されていないという課題がある。
- 音源に特化したクエリ生成と,音源数の明示的な学習により,視覚情報の偏りを抑制し,セグメンテーション精度向上を目指す。
- 本研究では,クロスアテンションを用いた音響中心のクエリ生成により,各クエリが特定の音源に選択的に注目できるよう改善した。
- さらに,音源数の順序回帰と単調性制約によるSound-Aware Ordinal Counting (SAOC)損失を導入し,視覚情報のみへの収束を抑制した。
- AVISegベンチマーク実験の結果,mAPが+1.64,HOTAが+0.6,FSLAが+2.06と一貫して改善し,提案手法の有効性が確認された。
学習に基づく適合的新規性検出の敵対的頑健性について [stat.ML, cs.LG, eess.SP, stat.ME]目的:学習に基づく適合的新規性検出における敵対的頑健性
- 異常検知は,様々な分野で重要な役割を担っており,その信頼性が求められている。
- 既存手法は,敵対的摂動に対して脆弱であり,誤検出率の増加を招く可能性がある。
- 敵対的攻撃に対する脆弱性を定量的に評価し,その対策を検討することを目的とする。
- AdaDetectと一類分類器ベースのアプローチに対し,敵対的摂動が偽発見率を顕著に増加させることが示された。
- 攻撃は検出能力を維持しつつ,偽発見率を上昇させることが確認された。
- 現在の誤差制御型新規性検出法の限界が明らかになり,より頑健な手法の開発が求められる。
RNAGenScape:特性誘導,最適化されたmRNA配列生成のための多様体 Langevin力学 [q-bio.QM, cs.LG, q-bio.BM]目的:mRNA配列の特性最適化生成
- ワクチン設計やタンパク質補充療法など,応用展開が期待される重要な分野である。
- 限られたデータ,複雑な配列と機能の関係,生物学的に実行可能な配列空間の狭さが課題となる。
- データ多様体からの逸脱による非機能配列生成を回避し,生物学的妥当性を維持した配列生成を目指す。
- RNAGenScapeは,実データ学習された多様体上でmRNA配列を生成することで,生物学的妥当性を保ちながら特性向上を実現した。
- 3つの実データセットを用いて,特性の平均増加率を最大148%,成功率を最大30%向上させた。
- 既存の生成アプローチと同程度の推論効率を維持しながら,高い性能を示した。
部分観測ダイナミクスシステムに対するオンラインベイズ実験計画 [stat.ML, cs.LG, stat.CO]目的:部分観測ダイナミクスシステムにおける情報収集の最適化
- 動的なシステムを理解するためには,効率的なデータ収集が不可欠である。ベイズ実験計画はそのための強力な手法。
- 既存手法では,観測が不完全な場合や,リアルタイムでの推論・設計が困難であるという課題が存在する。
- 潜在状態を考慮し,オンラインで効率的に実験計画を最適化することで,この課題を解決する。
- 提案手法は,潜在状態を明示的に周辺化することで,非線形状態空間モデルにおける計算可能性を高めた。
- ネストされた粒子フィルタを用いることで,状態とパラメータの効率的なオンライン推論を保証する。
- SIRモデルや移動源位置推定タスクへの応用により,部分観測とオンライン推論の両方を成功裡に処理できることを示した。
モデル検証のための規則体系 [stat.ME, cs.LG, stat.ML]目的:データ駆動型モデルの汎化性能評価
- 現実世界の複雑な問題を解決するためにデータ駆動型モデルの利用が増加している。
- モデルの検証方法は標準化されておらず,結果の信頼性が低い場合がある。
- 信頼性の高い検証計画の作成と透明性の高い結果報告を支援すること。
- 本研究では,モデル検証のための一般的な規則体系を提案した。
- これらの規則は,実用的な検証戦略の確保,限界の明確な議論,比較可能な性能指標の報告に役立つ。
- 完璧な検証法はないが,提案規則により検証の質を向上させることが期待される。
ノイズの多い量子強化学習ポリシーの形式的検証 [quant-ph, cs.AI, cs.FL]目的:量子強化学習ポリシーにおける安全性要件の検証
- 量子計算の発展は,従来計算では困難な問題を解決する可能性を秘めている。
- 量子強化学習ポリシーは量子測定やハードウェアノイズの影響を受けやすく,安全性が懸念される。
- 特定のノイズ条件下での安全性要件を満たすか否かを系統的に検証する手法が求められている。
- QVerifierは,確率的モデル検査を用いて,ノイズの有無にかかわらず量子強化学習ポリシーを分析する形式的検証手法である。
- 実験の結果,QVerifierは様々なノイズモデルが安全性に与える影響を正確に測定し,性能低下やノイズが有利に働く場合も明らかになった。
- QVerifierは,量子ハードウェアへのアクセスコストが高い状況下で,安全性を事前に検証する上で不可欠なツールとなる。
