arXiv雑要約
AI - 2026/06/17 公開
多国籍企業におけるAI導入:人事部門における生成AI受容のための社会技術的条件 [cs.HC, cs.AI]目的:生成AIの職場における受容の条件
- AI技術の発展は,企業活動の効率化や新たな価値創造に不可欠である。
- AI導入における受容性の差が,従業員の恩恵や課題の偏りを生む可能性がある。
- 生成AI導入を成功させるための,包括的な設計と運用指針を提示すること。
- 生成AIの導入・受容は,従業員の職務,言語,勤続年数といった職場環境との適合性に左右される。
- 従業員は,情報のソース検証,システム間比較,同僚や人事からの意見聴取を通じて,生成AIへの信頼を構築する。
- 組織は,様々な社会集団への役割・文脈に依存した利点を考慮したシステム設計,組織知識基盤のAIインフラとしての整備が重要である。
MathVis-Fine:段階的依存性誘導学習による多Modal数学推論における視覚的監督の必要性との整合 [cs.AI]目的:多Modal数学推論における視覚的依存性のモデリング
- 数学問題解決において,テキストと画像の相互作用は重要であり,その理解が性能向上に不可欠である。
- 既存手法では,視覚情報を均質または補助的な信号として扱い,テキストと画像の複雑な依存関係を捉えきれていない。
- サンプルごとに視覚情報の必要度に応じた詳細な視覚的依存性をモデリングし,正確な多Modal推論を可能にすることを目指す。
- 本研究では,詳細な視覚的注釈と視覚的依存性評価を含むMathVis-Fineデータセットを構築した。
- 段階的な視覚的強化学習パラダイムを導入し,各サンプルの視覚的依存性レベルに応じて,正解報酬と視覚的根拠付け報酬のバランスを取ることで,報酬バイアスを軽減し,監督の精度を向上させた。
- 実験の結果,MathVis-Fineフレームワークは,視覚的依存性に基づいて視覚的知覚を段階的に強化し,多Modal数学推論のためのより正確な学習フレームワークを提供することが示された。
継続学習においてモジュール性が役立つ次元数の制御 [cs.LG, cs.AI, cs.NE]目的:継続学習におけるモジュール構造,タスク類似性,表現次元数の共同的な影響
- 組成学習システムは,新たな知識の獲得と過去の知識の維持のバランスが重要である。
- タスクが構造を共有する場合,干渉のリスクがあり,学習の安定性が課題となる。
- 表現次元数とモジュール構造が,継続学習において効果的な条件を明らかにすること。
- 高次元の「怠惰」な状態では,モジュール構造の有無にかかわらず,性能と内部幾何学が類似している。
- 低次元の「豊かな」状態では,モジュールネットワークは類似タスク間で重なり,中程度の類似タスク間で部分的に整列し,相違するタスク間で分離するタスク固有の部分空間を開発する。
- 初期化スケールによって誘導される表現領域が,継続学習におけるモジュール構造の有効性を決定する重要な要素であることが示された。
歩行者歩行における制約を用いた社会的相互作用の定量化学習 [cs.CL, cs.AI, cs.RO]目的:歩行者における社会的相互作用の定量化と解釈
- 自動運転やソーシャルロボットなど,自律移動プラットフォームの衝突回避と高品質な計画に不可欠である。
- 既存研究では社会的相互作用を考慮するものの,その種類や意思決定への影響が明確になっていない。
- 大規模でラベル付けが困難な歩行者の社会的相互作用を,ラベルなしで定量化し予測モデルに組み込む。
- 提案手法「Learn to Cluster」は,逐次的な軌跡観測から確率的潜在変数生成を用いて社会的相互作用をクラスタリングする。
- 学習された潜在変数は,社会的相互作用のカテゴリー化のための「ラベル」として機能する。
- 複数の軌跡予測ベンチマークにおいて,提案手法が社会的相互作用のパターンを学習し,歩行者軌跡予測に効果的に統合できることを示した。
DiagFlowBench:根拠に基づいた診断対話における手順外入力への言語モデルの対応能力評価 [cs.AI]目的:言語モデルが診断対話において,手順外の入力を適切に処理する能力
- 保守業務において言語モデルの活用が進む中で,誤った情報を生成しないことが重要である。
- 既存の評価基準では,対話中に発生する手順外の入力を適切に評価する点が不足している。
- 手順外入力に対する言語モデルの応答性能を評価し,安全なアドバイスシステム構築に貢献する。
- DiagFlowBenchは,50件の産業用診断フローチャートを基にした1,676件の多段階会話データセットである。
- 評価実験の結果,モデルによって回答を保留する割合にばらつきがあり,誤った手順を選択する傾向が確認された。
- 一見もっともらしく見える誤ったアドバイスが,根拠に基づいたシステムにおける脆弱性を示す。
情報検索のための非負弾性ネットデコーディング [cs.CL, cs.RO, cs.IR, cs.AI, cs.CL]目的:情報検索における多様性と冗長性の問題解決
- 情報検索は大量の文書から必要な情報を効率的に取得する上で不可欠な技術である。
- 従来の疎な情報検索手法では,文書間の関連性を十分に捉えきれないという課題があった。
- 本研究は,文書集合全体を考慮したデコーディングにより,より多様で冗長性の低い検索結果を得ることを目指す。
- 非負弾性ネット(NNN)デコーディングは,クエリ埋め込みを疎な非負線形結合として再構成する文書を選択する。
- 理論的な結果として,NNNデコーディングは従来の疎な情報検索手法を包含し,さらに高度な検索性能を実現する。
- 実験結果から,NNNデコーディングは既存の埋め込みモデルに対しても性能向上をもたらし,エンドツーエンド学習では顕著な改善が見られた。
信頼性の高い自己構成型ビッグデータサービス:LLMオーケストレーションによるマルチエージェントフレームワーク(自動データエンジニアリング,AutoML,MLOpsデプロイメント,ドリフト対応型ライフサイクル最適化) [eess.SY, cs.SY, eess.SY, cs.SY, cs.MA, cs.AI, cs.DB, cs.SE]目的:ビッグデータサービスのライフサイクル全体を通じた信頼性と適応性の向上
- ビッグデータはビジネス価値創出に不可欠であり,効率的なデータ活用基盤が求められている。
- 既存システムはワークフローの断片化やライフサイクル全体の管理不足といった課題を抱えている。
- LLMとマルチエージェントシステムを活用し,ビッグデータサービスを自動化・最適化することを目指す。
- 提案フレームワークは,データ収集からモニタリングまで,各段階を専門エージェントが担当する。
- LLMオーケストレーション層がエージェント間の連携を調整し,中間結果の検証やコンテキスト管理を行う。
- 実験結果から,本フレームワークは既存手法と比較して,予測性能とライフサイクル全体の信頼性の両面で優れていることが示された。
PearlVLA:潜在空間における漸進的な具現化された行動計画の洗練 [cs.MM, cs.RO, cs.AI]目的:視覚言語行動モデルにおける行動生成の効率性と明示的な熟考のトレードオフの解消
- ロボット工学において,視覚情報と言語指示に基づいた効率的な行動計画は重要である。
- 既存のモデルは,迅速な行動生成と詳細な計画のどちらか一方に偏りがちである。
- 潜在空間で熟考を行うことで,低遅延性と高度な計画の両立を目指す。
- PearlVLAは,視覚言語モデルの潜在空間に熟考プロセスを取り込むことで,高効率な行動計画を可能にする。
- 視覚情報を固定し,潜在的な計画を反復的に洗練することで,迅速かつ詳細な行動計画を生成する。
- LIBEROベンチマークにおいて,既存手法を上回る性能が示された。
KANLib -- モジュール性,拡張性,高速性を備えたコルモゴロフ・アーノルドネットワークの実装 [cs.LG, cs.AI]目的:コルモゴロフ・アーノルドネットワークの設計と評価のためのフレームワーク
- ニューラルネットワークは様々な分野で利用され,その性能向上は重要な課題である。
- 既存のKAN実装は計算コストが高く,機能に一貫性がないという問題がある。
- KANの研究を促進するため,効率的で拡張可能なフレームワークを提供すること。
- KANLibは,PyKAN,EfficientKAN,FastKANなどの既存実装の利点を統合し,柔軟性と高性能を実現している。
- カリフォルニア住宅価格のベンチマークテストにおいて,既存の実装と同等の予測性能と計算効率を示した。
- KANLibを用いることで,標準的なKANの構造にとらわれず,様々なアーキテクチャの探索が可能となる。
PreAct:反復タスクで高速化するコンピュータ利用エージェント [cs.AI]目的:反復タスクにおけるコンピュータ利用エージェントの高速化
- ソフトウェア自動化の需要が高まっており,エージェントの効率改善が重要である。
- 既存のエージェントは,同じタスクを繰り返す際にも毎回最初から処理するため,非効率である。
- 過去の実行履歴を活用し,エージェントの処理速度を向上させることを目指す。
- PreActは,初回実行の情報を状態機械プログラムとして記録し,以降の実行で再利用することで,8.5~13倍の高速化を実現した。
- プログラムの誤りを検知するため,画面の状態を確認しながら実行し,異常があればエージェントに制御を戻す仕組みを備えている。
- プログラムの保存前に独立した評価者がタスクの完了を確認することで,性能劣化を防ぎ,ベンチマークで1.75~2.6タスク分の改善が見られた。
推論計算量が最先端LLMの評価に与える影響 [cs.AI]目的:最先端LLMの評価における推論計算量の役割
- AI評価は,より高度なタスクへと移行しており,ツール利用や反復的な問題解決が重要になっている。
- 多くの評価は限られた計算量で行われるため,低いスコアがモデルの能力を正確に反映していない可能性がある。
- 推論計算量を制御することで,評価設定がモデルの性能に与える影響を明らかにすること。
- より大きなトークン予算は,サイバーセキュリティ,数学,医学など複数のドメインにおいて性能を大幅に向上させる。
- 最先端モデルの能力は,固定予算の評価では過小評価される傾向があり,大規模な予算設定でより高い性能を示す。
- ベンチマークによって,どの推論計算量の拡張手法が有効かは異なり,反復的な提出が広く有効だが,トークン予算の拡大や外部フィードバックの価値はベンチマークによって異なる。
Eコマースにおける顧客行動予測:ハイブリッドRet-DNNとXGBoostモデルの活用 [cs.LG]目的:顧客行動予測のための,ハイブリッドRet-DNNとXGBoostモデル
- Eコマースの普及に伴い,顧客理解と購買予測は売上向上に不可欠である。
- 既存手法では,顧客の複雑な行動パターンを正確に予測することが困難である。
- 顧客の購買確率を予測し,より的確なマーケティング戦略を支援する。
- 提案手法(Ret-DNN XGBoostモデル)は,既存のRet-DNNモデルと比較して,平均絶対誤差(MAE)0.2193を達成し,優れた結果を示した。
- Ret-DNNは顧客トランザクションの文脈を理解するための特徴抽出器として機能する。
- 抽出された特徴はXGBoostモデルに入力され,顧客の購買確率を予測する。
大規模言語モデルにおける初期化の重要性 [cs.AI]目的:大規模言語モデルの学習における初期化の影響
- 大規模言語モデルは,知能の創発過程を研究する上で重要なツールとなり得る。
- モデルの性能は,規模やデータに依存すると考えられてきたが,初期化の影響は軽視されてきた。
- 初期化スケールの最適化により,特に推論能力の向上を目指す。
- 初期化スケールを小さくすることで,事前学習の性能が向上し,特に推論を必要とするタスクで大きな効果が見られた。
- 既存の設定では,小さい初期化の利点が制限されている場合があるが,設定を緩和することで改善されることが示された。
- 小さい初期化は,パラメータがまず低複雑な構造に凝縮し,その後より豊かな表現へと拡大するという,独特な発展軌道を引き起こす。
プラグアンドアダプト:事前学習済みアラインメントモデルによる初見の多imodal共参照解決 [cs.DC, cs.CV, cs.AI]目的:多imodal共参照解決における初見性能の向上
- 共参照解決は自然言語処理の根幹技術であり,文章理解に不可欠である。
- 既存手法はターゲットデータでの学習が必要であり,汎化性能に課題がある。
- 事前学習済みアラインメントモデルを活用し,学習データ不要で共参照解決を可能にする。
- 提案手法は,Coreference Image Narratives (CIN) データセットで最先端手法を5.31%上回るCoNLL F1スコアを達成した。
- マスクされたCINデータセットでの評価により,ロバスト性も確認された。
- VCR-MCRデータセットによる評価では,汎化性能が示された。
SoftMoE:大規模言語モデルにおけるMoEのソフト微分可能ルーティング [cs.LG, cs.AI]目的:大規模言語モデルにおけるMoEのルーティング最適化
- 大規模言語モデルのパラメータ増加に伴い,計算資源の効率的な活用が重要である。
- 従来のMoEでは,離散的なルーティングにより計算資源の利用効率が低い問題がある。
- SoftMoEは,微分可能なルーティングにより,計算資源の効率的な配分を目指す。
- SoftMoEは,離散的なルーティングをソフトな近似で置き換えることで,勾配ベースの最適化を可能にした。
- SoftMoEは,言語モデリングおよび下流タスクにおいて,従来のMoEと同等以上の性能を達成した。
- 学習された専門家容量の配分は層間で不均一であり,後層ほど多くの専門家が活性化されることが示された。
視覚的手がかりを超えて:CoTによる半教師あり医用画像セグメンテーションの推論能力向上 [cs.CV, cs.LG]目的:半教師あり医用画像セグメンテーションにおける推論能力の向上
- 医用画像解析において,アノテーション不足を解消し,効率的な画像解析を実現する重要性が高まっている。
- 既存手法は視覚的パターンに依存しており,視覚的に類似する病変でも診断が異なる場合に課題がある。
- 視覚的特徴に加えて,専門家の診断ロジックを模倣した推論能力をセグメンテーションに導入し,精度向上を目指す。
- 本研究では,大規模言語モデルを用いたChain-of-Thought(CoT)推論を統合したCERS(CoT-Enhanced Reasoning Segmentation)を提案した。
- CERSは,病理学的に異なる症例を識別するために,形態学に基づいた参照選択とCoTの一貫性によるノイズ除去を組み合わせる。
- 実験結果から,CERSは境界の曖昧さや意味的な不整合を解消する上で,既存手法よりも優れていることが示された。
回転に対する類似度に基づく位置エンコーディングの頑健性:理論的分析と実験的検証 [cs.CV, cs.AI]目的:回転に対する類似度に基づく位置エンコーディングの頑健性
- Transformerモデルにおいて,位置情報を組み込む位置エンコーディングは,性能を左右する重要な要素である。
- 医療画像など,幾何学的な歪みが発生しやすい分野では,位置エンコーディングの回転に対する頑健性が課題となる。
- 類似度に基づく位置エンコーディング(simPE)の回転に対する安定性を理論的・実験的に検証し,その限界と性能向上策を探る。
- simPEは一般的に回転不変ではないものの,適切な条件の下では回転に対する安定性を持つことが証明された。
- 実験結果は,simPEが標準的な学習型位置エンコーディングと比較して,特に小~中程度の回転角度において,精度,F1スコア,適合率,再現率の点で優れた性能を示すことを示した。
- これらの結果は,理論的な安定性の保証と一致しており,simPEの有効性を裏付けている。
戦略論理のための戦略合成へのニューロシンボリックアプローチ [cs.MA, cs.AI]目的:戦略論理における戦略合成
- マルチエージェントシステムにおいて,戦略的相互作用を通じてエージェントが達成可能なことを推論することは不可欠である。
- 戦略的能力に関する論理は厳密な手法を提供するが,戦略合成の計算コストが採用の妨げとなっている。
- LLMを活用し,大規模な戦略空間を効率的に探索しつつ,形式的な健全性を維持する戦略合成手法を提案する。
- 提案手法は,LLMを戦略生成オラクルとして利用し,生成された戦略をモデルチェッカーで検証するgenerate-and-certifyアーキテクチャを採用する。
- NatATLに特化したデータセットを構築し,Qwen3-32Bモデルを用いた実験により,戦略合成の精度が92%に達した。
- LLMのガイダンスにより,形式的な厳密性を保ちながら大規模な戦略空間を効率的に探索することが可能になった。
SegDINO:DINOへの多段階構造導入による効率的な医用画像セグメンテーション [cs.CE, math-ph, math.MP, cs.CV, cs.AI]目的:効率的な医用画像セグメンテーションのためのフレームワーク
- 医用画像解析は,疾患の診断や治療計画において不可欠である。正確なセグメンテーション技術が求められる。
- 既存のセグメンテーション手法は,パラメータ数が多く計算コストが高いという課題がある。
- DINOの特徴量を活用し,軽量なフレームワークで高精度なセグメンテーションを実現すること。
- SegDINOは,DINOv3バックボーンと軽量なスケールモデリングを統合した効率的なセグメンテーションフレームワークである。
- Token Pyramid Adaptation (TPA)とScale-Aware Decoding (SAD)により,DINO特徴量に多段階構造を導入し,セグメンテーション精度を向上させた。
- 新たに構築したPanCTデータセットを用いた評価により,SegDINOが難しい小病変のケースでも高い性能を示すことが確認された。
MoCo-AIS:船舶軌跡の類似性計算のためのコントラスティブ学習フレームワーク [cs.CL, cs.AI]目的:船舶軌跡の類似性学習
- 移動パターン分析は,経路抽出,移動予測,異常検知などに応用され,不可欠な研究分野である。
- 従来の距離ベースの手法は計算コストが高く,軽量な学習ベースのアプローチが求められている。
- 本研究は,一貫した軌跡表現を評価するためのベンチマークプラットフォームの提供を目指す。
- 提案手法MoCo-AISは,既存のベースラインと比較して,船舶軌跡の類似性学習を大幅に改善する。
- MoCo-AISは,Momentum Contrast (MoCo)パラダイムに基づいた,統一的なフレームワークを提供する。
- 大規模な実世界AISデータセットを用いた評価により,多様な航行行動と条件に対応できることが示された。
STAR:テキスト画像生成における時空間適応報酬配分 [cs.AI]目的:テキスト画像生成モデルのRLポストトレーニングにおける報酬配分手法
- テキスト画像生成は,創造的なコンテンツ生成において重要性が増している分野である。
- 既存手法では,報酬を生成過程全体に均一に適用するため,効果的な学習が困難である。
- 生成過程における時空間的な重要度を考慮し,報酬を適切に配分することで精度向上を目指す。
- 提案手法STARは,テキスト画像間の注意機構を活用し,ユーザーが重視する領域から報酬配分を行う。
- 生成過程における空間的な重要度を動的に変化させ,関連する潜在領域に報酬を集中させる。
- GenEval,OCR,PickScoreにおいて,既存手法を上回る結果が得られ,性能向上が確認された。
意味を優先し,より良い生成: 3D MRI再構成とクロスカントラスト合成のための潜在モデリングの改善 [cs.CV, cs.AI]目的:3D MRIの再構成とクロスカントラスト合成のための潜在モデリング手法
- 臨床診断において,異なる造影MRI画像は補完的な情報を提供する。効率的な診断のためには重要である。
- 全てのMRIシーケンスを取得するには時間とコストがかかる。既存の潜在空間圧縮手法では,解像度や精度が課題となる。
- 解剖学的構造の一貫性を保ち,臨床的に重要な情報を損失しない潜在空間を構築し,再構成と合成の質を向上させる。
- 提案手法では,Latent Harmonization Encoder (LHE)を用いてグローバルな解剖学的依存関係を捉え,一貫性のあるボリューム表現を実現した。
- Semantic Recovery Block (SRB)により,潜在空間への圧縮時のセマンティック情報の劣化を軽減し,コントラスト間の分離性を向上させた。
- 解剖構造を考慮した周波数損失関数(AFL)により,診断上重要な高周波構造を適応的に保存し,再構成の忠実度を高めた。
多重周期性とチャネル相関を用いたウェーブレット分解による長期時系列予測 [cs.CG, cs.LG, cs.AI]目的:長期時系列予測における,周期性,トレンド,チャネル間相関のモデリング
- 時系列データ分析は,経済,気象,交通など,様々な分野で不可欠な技術である。
- 既存研究では,時系列データ内のチャネル間相関が十分に考慮されておらず,予測精度が制限されている。
- 本研究は,チャネル間相関を明示的にモデル化することで,長期時系列予測の精度向上を目指す。
- 提案手法McWCは,周期性,トレンド,チャネル間相関を分離してモデリングすることにより,既存手法を上回る予測性能を達成した。
- McWCは,ウェーブレット分解を用いて高周波・低周波情報を効率的に抽出し,計算効率の向上に貢献している。
- 周波数領域での損失関数を用いることで,チャネル内自己相関の分離を実現し,予測精度をさらに向上させている。
光ネットワーク向けT-API準拠のReActエージェントループ:汎用ツールとドメイン固有ツールの抽象化 [cs.CL, cs.NI, cs.AI]目的:光ネットワークにおける意図駆動型,閉ループのエージェント管理
- ネットワークの自律性を高める上で,エージェント管理は重要な技術である。
- 汎用ツールでは,効率性や正確性に課題が残る場合がある。
- ドメイン固有のツールを用いることで,効率性と正確性の向上を目指す。
- T-APIに準拠したReActループを初めて実現した。
- ドメイン固有の複合ツールは,汎用ツールと比較して90%の正答率を達成し,トークン消費量を3分の1に削減した。
半分のリンクだけで全体のリンクを予測可能か:知識グラフ基盤モデルにおける汎化の理解 [cs.LG]目的:知識グラフ基盤モデルの汎化メカニズムの解明
- 知識グラフは,事実の構造化された表現であり,様々なAIタスクの基盤技術として重要性が増している。
- 知識グラフ基盤モデルは,未学習のグラフへの汎化性能を持つが,その汎化能力の安定性には課題が残る。
- 部分的に観測されたリンク(ハーフリンク)が,知識グラフ基盤モデルの予測に与える影響を分析し,汎化性能の向上に貢献する。
- 知識グラフ基盤モデルは,テストトリプルを予測する際に,観測されたハーフリンクを活用していることが明らかになった。
- 未観測のハーフリンクは,モデルにとって異なる課題を提示しており,汎化性能を制限する要因となっている。
- 本研究で提案する分類体系は,知識グラフ基盤モデルの汎化能力を診断するためのプロトコルとして利用でき,今後のモデル改善に役立つ。
C2FL:空間的・時間的ドリフト下におけるクラスタリング継続連合学習 [cs.LG, cs.AI]目的:空間的クラスタリングによる学習グループの自己組織化
- 集合適応システムは機械学習に依存しており,その拡張にはプライバシー保護が重要である。
- ノードの移動により,データの分布が時間とともに変化し,学習モデルが陳腐化する。
- 空間的異質性と時間的ドリフトに対処し,分散学習のロバスト性を向上させる。
- 標準的な連合学習は,空間的・時間的変化の影響を受けやすいことが実験で示された。
- C2FLは,空間クラスタリングと経験再生を活用することで,ロバストな集団適応を実現する。
- ノードの滞在時間を考慮した適応平均化により,地域コンセンサスを効果的に取り込む。
LLM消費者行動理論:新研究分野の基礎 [cs.AI, econ.GN, q-fin.EC]目的:LLMによる消費者行動の分析
- AI技術の進展により,LLMが消費意思決定を行う事例が増加している。
- 従来の消費者理論は人間を意思決定主体としてきたため,LLMを主体とした分析が不足している。
- LLMを主体とした市場における消費者行動を理論的に捉え,今後の研究課題を明確化すること。
- 本研究は,古典的・行動経済学と自然言語処理の進歩を統合し,LLM消費者行動理論の枠組みを提示する。
- 人間が持つ選好がLLMエージェントにどのように反映・作用するか,また,エージェントレベルの意思決定が市場需要にどのように影響するかを形式化する。
- 合理性や多様性といった従来の仮定が,LLMを主体とする市場でどのように変化するかについて考察を深める。
LegalHalluLens:型付きハルシネーション監査と校正されたマルチエージェント議論による信頼性の高い法務AI [cs.AI, cs.CL, cs.LG, cs.MA]目的:法務AIにおけるハルシネーションの監査と,信頼性向上のための議論メカニズム
- 法務分野へのAI導入は進むが,AIの誤りは法的リスクに直結するため,信頼性が重要である。
- 従来のAI評価指標は平均的な誤り率しか示さず,誤りの種類や方向性を特定できないという課題がある。
- AIの誤りパターンを詳細に分析し,議論メカニズムを通じてハルシネーションを軽減することを目指す。
- 提案手法LegalHalluLensは,AIのハルシネーションを4つのカテゴリーに分類し,リスク方向指数(RDI)を用いて誤りの方向性を定量化する。
- 実験の結果,モデル間の誤り率が同じ場合でも,RDIが大きく異なることが示され,誤り方向性の重要性が明らかになった。
- マルチエージェント議論パイプラインを用いることで,誤検出が45%削減され,特に誤り傾向のあるカテゴリーで効果が確認された。
マスク拡散モデルにおける再帰的スケーリング [cs.LG]目的:マスク拡散モデルのスケーリング手法に関する研究
- 系列生成モデルは,自然言語処理をはじめ,多様な分野で重要性が増している。
- 既存のマスク拡散モデルのスケーリングは,パラメータ数やデノイジングステップ数に依存する。
- 本研究は,パラメータ数を増加させずにモデルの性能を向上させる新たなスケーリング手法を提案する。
- 再帰的マスク拡散モデル(R-MDM)は,同じデノイジングTransformerを繰り返し適用することで,モデルの深さを効果的に増加させる。
- R-MDMは,パラメータ効率が向上し,少ないパラメータ数で従来のモデルと同等の性能を達成することが示された。
- 再帰的洗練は,追加のデノイジングステップを一部代替でき,推論時の計算コストを削減できる。
LoopCoder-v2:効率的な推論時計算のスケーリングを実現するループ一回 [cs.LG, cs.AI]目的:並列ループTransformer(PLT)におけるループ回数選択の最適化
- Transformerモデルの効率的な計算のスケーリングは,大規模言語モデルの応用範囲拡大に不可欠である。
- Transformerにおいてループ構造を導入すると,レイテンシやKVキャッシュメモリが増大するという課題がある。
- ループ回数と性能のトレードオフを分析し,最適なループ回数を特定することを目指す。
- LoopCoder-v2の実験結果から,2回のループ構造が,コード生成,推論,ソフトウェアエンジニアリングなど,幅広いタスクでベースラインを上回る性能を示すことが明らかになった。
- 3回以上のループ構造では性能が低下し,ループ回数と性能の関係が非単調であることが示された。
- 2回目のループが主要な改善効果をもたらし,それ以降のループは効果が減衰し,表現力の多様性が低下することが診断された。
破滅的忘却は低ランクである:継続的適応のための関数空間理論 [cs.LG, cs.AI]目的:継続的適応における破滅的忘却のメカニズム解明
- 機械学習モデルの継続学習は,実世界への応用において不可欠である。
- 既存の継続学習手法では,破滅的忘却を完全に抑制することが困難である。
- 破滅的忘却が起こりやすい方向性を特定し,効果的な対策を講じることを目指す。
- 破滅的忘却は,モデルの出力空間における特定の低ランクな方向で発生することが示された。
- 新しいタスクの学習が,既存タスクの予測に影響を与えるメカニズムが解析的に導出された。
- 脆弱なランクは,凍結された線形ヘッド下でクロネッカーのスケーリング則に従うことが明らかになった。
INI-VPINN:幾何学的特異性を持つ多材料領域のための暗黙的なノイマンおよび界面条件付き変分物理情報ニューラルネットワーク [cs.HC, cs.SI, math.NA, cs.LG, cs.NA, physics.comp-ph]目的:多材料領域における物理現象の予測
- 工学・科学におけるシミュレーションの重要性が増しており,高精度な手法が求められている。
- 従来の物理情報ニューラルネットワークは,複雑な境界条件や界面条件の取り扱いに課題があった。
- 複雑な形状を持つ多材料領域における物理現象を高精度に,効率的に予測すること。
- 提案手法であるINI-VPINNは,ノイマン境界条件と界面条件を自然に組み込むことができる。
- 追加の損失関数や複数のサブドメインネットワークを必要とせず,物理的な整合性を確保する。
- ポアソン方程式とラプラス方程式の解析において,既存手法と比較して高い精度と収束性を示した。
英語が必ずしも最良の教師とは限らない:交差言語インコンテキスト学習におけるソース言語の影響 [cs.CL, cs.AI]目的:交差言語インコンテキスト学習におけるソース言語選択
- 多言語NLPにおいて,言語間の知識転移は重要な課題であり,モデルの汎用性向上に繋がる。
- ファインチューニングの知見が,少量のデータで学習するインコンテキスト学習にそのまま適用できるとは限らない。
- インコンテキスト学習において,効果的なソース言語選択方法を確立すること。
- 従来のファインチューニングに基づく期待は,インコンテキスト学習においては一貫して当てはまらないことが示された。
- 言語の混同が,交差言語インコンテキスト学習における生成タスクの重要な障害であることが明らかになった。
- 効果的なソース言語選択のための代替的なヒューリスティクスが示唆された。
ProvenanceGuard:MCPベースLLMエージェントのための出典を意識した事実検証 [cs.AI, cs.CL, cs.MA]目的:MCPベースのLLMエージェントの回答における出典の誤りを検出する手法
- LLMエージェントの利用拡大に伴い,多様な情報源からの回答の信頼性確保が重要になっている。
- 従来の事実検証指標では,回答が支持されるかどうかに焦点を当て,出典の誤りを捉えられない場合がある。
- 異なる情報源からの情報の混同(cross-source conflation)を検出し,信頼性を向上させることを目指す。
- ProvenanceGuardは,MCPトレースを用いて回答を構成要素に分解し,各要素の根拠となる情報源を特定する。
- 検証実験の結果,ProvenanceGuardはソースを考慮しないベースラインと比較して,高いブロックF1スコアとソース精度を達成した。
- さらに,ProvenanceGuardは注入された出典の誤りを全て検出し,信頼性の高い回答を提供できることを示した。
フローベースの視覚言語行動モデルにおける不確実性定量化 [cs.ET, cs.DC, cs.RO, cs.LG]目的:視覚言語行動モデルにおける不確実性の定量化
- ロボティクス分野において,視覚と言語と行動を統合したモデルの信頼性向上が重要である。
- 既存モデルは,予測の確信度を定量化できず,未知の状況下での誤りを検出できないという課題がある。
- 本研究は,フローマッチングモデルの不確実性を効率的に定量化し,実環境での信頼性を高めることを目指す。
- 速度場不一致(VFD)を用いて不確実性を定量化することで,より適切な信頼度推定が可能になった。
- VFDは,実環境での故障検出において高い性能を発揮し,モデルの安全性を向上させた。
- SAVEフレームワークにより,不確実性を考慮した能動的ファインチューニングを実現し,専門家のデモンストレーション数を削減した。
時系列予測のための反事実生成の再構築 [cs.LG]目的:時系列予測における反事実生成戦略のグローバルな整合性学習
- 深層学習を用いた時系列予測は,精度の高い予測だけでなく,実行可能な示唆も重要である。
- 既存の反事実生成手法は,インスタンスごとに最適化を行うため,一貫性や計算コストに課題がある。
- 本研究は,インスタンスごとの最適化に頼らず,グローバルな整合性を持つ反事実生成手法を提案する。
- ConTexは,時間的関連性と修正の強さを捉える2つのヘッドを持つ,モデルに依存しない分解されたアーキテクチャである。
- ConTexは,最先端の妥当性を達成しつつ,必要な介入数を最小限に抑えた疎な反事実を生成する。
- 本手法は,インスタンスごとの生成と比較して計算コストを12〜36倍削減し,リアルタイム推論を可能にする。
AIが「私も同じような経験をしました」と言うとき:ピアのような介護支援における合成された経験 [cs.RO, cs.CL, cs.HC, cs.AI, cs.CL, cs.CY, cs.SI]目的:介護支援AIにおける合成された経験のパラドックスの検証
- 介護者は情報や精神的な支援を求めてオンラインコミュニティを利用する点が重要である。
- AIは即応性や非判断性で支援できる一方,人間のような経験に基づいた共感は困難である。
- AIが人間らしい応答を試みる際の問題点と,その解決策を模索する。
- 人間によるピアサポートは,過去の経験を語る一人称の言語を多く用いる傾向がある。
- AIは感情的な側面は模倣できるが,実際の経験に基づく根拠を捏造することがある。
- 介護支援AIシステムは,共感的な表現と経験の捏造を区別する仕組みが必要である。
疑似ベンチ:エージェントによる自動研究が疑似科学を助長する度合いの測定 [cs.AI, cs.CL]目的:エージェントによる自動研究システムにおける疑似科学の識別と抵抗能力の評価
- 大規模言語モデルの進化に伴い,科学研究における自動化の重要性が増している。
- 自動研究システムが疑似科学を識別できず,誤った研究を生成するリスクが存在する。
- エージェントが疑似科学のナラティブを認識し,抵抗するための能力向上を目指す。
- 最先端の7つのエージェントをテストした結果,ほとんどのエージェントが疑似科学に基づいた説得力のあるレポートをほぼ拒否なく生成した。
- より高性能なエージェントは,疑似科学を洗練された科学用語で表現し,その信頼性を高める傾向が見られた。
- これらの結果は,自動研究システムが疑似科学を助長する可能性があることを示しており,広範な展開前に科学的な整合性を確保する必要がある。
大規模言語モデルに対するセキュリティとプライバシーに関する質問と回答 [cs.CL, cs.AI, cs.CR, cs.HC]目的:ユーザーが大規模言語モデルにセキュリティとプライバシーに関する質問をし,それに対してモデルがどのように応答するか
- デジタルセキュリティとプライバシーは,オンライン活動の安全性を確保する上で不可欠である。
- 大規模言語モデルに対するユーザーのセキュリティとプライバシーに関する質問は,未だ十分に研究されていない。
- ユーザーの実際の質問に基づいたセキュリティとプライバシーに関する大規模言語モデルの応答品質を評価する。
- 大規模言語モデルは,セキュリティとプライバシーに関する幅広い質問に対応していることが判明した。
- 商用モデル(GPT 5.5)は,オープンウェイトモデル(Llama 4)よりも高品質な回答を提供することが示された。
- 商用モデルは一貫性のない回答を生成する可能性があり,ユーザーを混乱させるリスクがある。
LLMによる傷跡分析:画像から臨床的に意味のある特徴量へ [cs.CV, cs.AI, cs.LG]目的:傷跡の画像から臨床的に意味のある特徴量の抽出
- 医療画像診断は進歩しているが,専門知識が必要な病変の分類は困難である。
- 傷跡の分類では,専門家の知識とラベル付き画像の不足が課題となっている。
- LLMを活用し,データ不足下でも高精度な傷跡分類を実現すること。
- LLMを知識駆動型特徴量エンジニアとして活用するScaFEという新しいフレームワークを提案した。
- ScaFEは,LLMが持つ医学知識を,臨床評価基準に合致する特徴量抽出コードに変換する。
- データ効率,プライバシー保護,解釈可能性の面で,既存手法を上回る性能を示した。
ノイズ傾斜:拡散報酬アラインメントのための逆カーネルのノイズ傾け [cs.MA, cs.LG]目的:拡散モデルにおける報酬誘導サンプリングの効率化と品質向上
- 事前学習済み拡散モデルの応用範囲拡大には,報酬を用いた制御が不可欠である。
- 既存手法は,生成品質と勾配シグナルの獲得の間でトレードオフの関係にある。
- ノイズ項を介して報酬勾配を注入し,生成品質を維持しつつ報酬アラインメントを実現する。
- 提案手法NTRKは,既存の最先端手法と比較して,様々な報酬アラインメントタスクで性能を上回る。
- 特に,美的生成においては,計算量を20分の1に削減しながら,ベースラインよりも高い報酬を達成する。
- NTRKは,逆平均を固定しノイズ項を報酬方向にバイアスすることで,この問題を解決する。
医療応用における,過早な診断引き継ぎと潜在的な誤情報の抑制のためのエージェントAIフレームワーク [cs.AI]目的:過早な診断引き継ぎと潜在的な誤情報の抑制
- 近年のLLMとマルチエージェントシステムの発展は医療推論に期待されるが,安全性確保が課題。
- LLMベースの対話型エージェントは,診断の早期引き継ぎや潜在的な誤情報を生じやすい。
- 決定論的なオーケストレーション制約により,上記の問題を解決し,より安全な診断支援を目指す。
- 提案フレームワークは,臨床プロトコル「OLDCARTS」の完全性を強制し,診断の移行をブロックすることで,情報不足を抑制する。
- エピステミック不確実性定量化ゲートは,複数の診断サンプル間の意味的エントロピーを計算し,発散する出力を事前に遮断する。
- シミュレーション実験の結果,診断精度は49.3%に達し,ベースラインと比較して11.3%の絶対的な改善が見られた。
ボルテラ生成モデル [cs.LG, cs.AI]目的:スコアベース生成モデルにおけるノイズ注入手法の改良
- 生成モデルは,多様で高品質なデータ生成を可能にする重要な技術である。
- 既存の拡散モデルは記憶のないノイズ注入に依存しており,表現力に限界がある。
- 経路依存性のあるノイズ注入により,生成モデルの性能向上を目指す。
- ボルテラ生成モデルは,分数カーネルを用いて経路依存性のあるノイズを注入する連続時間スコアベースフレームワークである。
- 有限次元マルコフリフトと数値近似法を開発し,非マルコフ性および非セミマルチンゲール性を扱えるようにした。
- MNISTおよびCIFAR-10での実験により,提案手法が生成性能を向上させることが示された。
文脈・関係性を意識したグラフ検索拡張生成のための統一的フレームワーク [cs.AI]目的:文脈情報と関係性を考慮したグラフ検索拡張生成の統一的フレームワーク
- 大規模言語モデルの知識拡張には外部知識が不可欠であり,グラフ構造はその知識を効率的に表現・活用する手段として重要である。
- 既存のグラフベース手法は,エンティティやテキストチャンクに焦点を当てており,真の知識融合が不十分であるという課題がある。
- 文脈情報と関係性を統合的に捉え,知識の創発的な理解を促進する新しいフレームワークを構築し,動的な知識更新を可能にすること。
- HyGRAGは,文脈情報と関係性を真に統合した要約を生成し,その要約を用いて創発的な知識アクセスを実現する階層的グラフRAGフレームワークである。
- HyGRAGは,チャンクとエンティティの両方のノードを持つハイブリッドグラフ上で階層的なインデックス構造を設計し,コミュニティメンバーシップを通じて検索を拡張する。
- 実験結果から,HyGRAGはマルチホップ推論タスクの平均精度を9.7%向上させ,効率性も維持することが示された。
エッジフロー:安定限界における勾配降下法の予測可能な連続時間モデル [cs.LG]目的:安定限界における勾配降下法の動力学の予測モデル
- 深層学習の性能向上には,学習率の最適化が不可欠であり,その安定性解析が重要である。
- 従来の解析手法では,安定限界付近の挙動を正確に捉えることが困難であった。
- 安定限界における勾配降下法の動力学を記述し,不安定性を軽減するための枠組みを構築する。
- 提案手法「エッジフロー」は,3つの結合された常微分方程式系であり,安定限界における勾配降下法の挙動を高い精度でモデル化する。
- エッジフローは,中心,振動方向,振動振幅に動力学を分解し,シャープネスの自己安定化フィードバックループを明らかにする。
- エッジフローは,既存のモデルと同等以上の精度で勾配降下法の挙動を追跡し,安定性の理解と緩和に役立つ。
推論経路から再利用可能なモジュールへ:言語モデルの推論における構成的汎化の理解 [cs.LG]目的:言語モデルの推論における構成的汎化のメカニズム解明
- 大規模言語モデルの推論能力向上は,現実世界の問題解決に不可欠である。
- 既存の手法では,言語モデルが未知の推論パターンにうまく対応できない場合がある。
- 教師ありファインチューニングと強化学習の組み合わせによる構成的汎化の解明
- 教師ありファインチューニングは構成要素の材料を供給し,強化学習はそれらを分解・再構成することで,構成的汎化を可能にすることが示された。
- 実験により,強化学習が教師ありファインチューニングで提供された複合的な経路から原子モジュールを抽出し,再結合して新しい問題を解決できることが確認された。
- 複合的な経路での学習は,孤立した原子モジュールのみでの学習よりも強力な汎化性能をもたらすことが示された。
EAGG:幾何学に基づいたグラフ条件付けによる,身体に沿った把持生成 [cs.RO, cs.AI]目的:異なるオブジェクトと身体(平行グリッパーから器用なエンドエフェクタまで)に対応可能な,汎用的な把持生成モデルの開発
- ロボットハンドの多様化が進み,把持動作の自動化が重要になっている。
- 従来の把持生成器は特定の身体に特化,または身体情報を静的な記述子で表現するため,把持性能の汎化が課題である。
- 身体の構造を考慮したモデルを構築し,把持生成の汎化性能と精度を向上させる。
- EAGGは,エンドエフェクタのトポロジーを考慮したグラフと,エンドエフェクタ固有の制御空間を用いて把持生成を行う。
- MultiGripperGraspベンチマークにおいて,6つの訓練済みエンドエフェクタで平均56.17%の成功率を達成し,専用訓練とほぼ同等の性能を示した。
- 反復的な幾何学注入により,接触距離の中央値が0.239cmから0.189cmに減少した。
リソース制約デバイス向け構造化状態空間モデルのオペレータレベルプルーニング (S4oP) [cs.LG, cs.AI, cs.DC]目的:構造化状態空間モデルの効率的な推論コスト削減
- 系列データ処理において,アテンション機構に代わる有力な手法として注目されている。
- 計算資源やメモリ消費量が大きいため,組み込み機器への実装が困難である。
- 推論コストを削減しつつ,予測性能を維持する手法の開発を目指す。
- 提案手法により,モデルオペレータの最大70%をプルーニングしても,予測性能を維持できる。
- プルーニングにより,推論速度が大幅に向上し,リソース制約環境での利用を可能にする。
- 構造化オペレータプルーニングは,SSMの効率化のための有効かつ未開拓な戦略である。
IsabeLLM:形式検証への定理証明の自動化 - コンセンサスへの応用 [cs.RO, cs.AI]目的:コンセンサスプロトコルの形式検証
- ブロックチェーン技術の普及に伴い,セキュリティ確保が重要課題となっている。
- 形式検証には専門知識と労力がかかり,適用範囲が限られていた。
- AIによる定理証明の自動化により,検証の効率化と適用範囲の拡大を目指す。
- IsabeLLMを改良し,Retrieval-Augmented Generationやエラー追跡機能を実装した。
- 最新のIsabelle/Sledgehammerとの互換性を向上させ,効率を高めた。
- 改良版IsabeLLMを用いて,BitcoinのPoWコンセンサスの検証性能を評価した。
適切な教師を信頼する:GUIグラウンディングのための品質を意識した自己蒸留 [cs.AI]目的:GUIグラウンディングにおけるVLMの性能向上
- GUIグラウンディングは,高解像度スクリーンショットからターゲット要素を特定し,正確な座標を予測する上で重要である。
- 従来の自己蒸留では,初期段階での誤りにより教師信号の質が低下し,性能が制限される場合がある。
- 教師信号の品質を向上させ,信頼性の高い学習を実現することで,GUIグラウンディングの精度を高める。
- 提案手法は,ソフトな正解認識ゲートと教師確率スケーリングを通じて,座標トークン教師信号の品質を改善する。
- 正解認識ゲートは,現在の予測が正解ボックスに到達可能かどうかをチェックし,不可能であれば教師信号を減衰させる。
- 教師確率スケーリングは,教師の確信度を考慮して,残りの信号の強度を調整し,両者の相乗効果により性能が向上する。
