arXiv雑要約
AI - 2026/01/30 公開
量子レゴ学習:ハイブリッド人工知能のためのモジュール設計原理 [cs.LG, quant-ph]目的:ハイブリッド量子古典学習モデルにおけるモジュール設計
- 近年,古典的なニューラルネットワークと量子回路を組み合わせたハイブリッド学習が注目されている。
- 既存手法は特定のタスクに依存し,汎用性や転移学習性に課題がある。
- 量子・古典コンポーネントを再利用可能なブロックとして扱い,学習のモジュール化を目指す。
- 本研究では,「量子レゴ学習」というモジュール化された学習フレームワークを提案した。
- 事前学習済みの古典ニューラルネットワークを特徴抽出ブロックとし,量子回路を学習可能な適応モジュールとした。
- この分離により,限られた量子資源下での効率的な学習と,ハイブリッドモデルの分析が可能となる。
船舶の単一視点3D再構築のための合成-実世界ドメインブリッジング:海事モニタリングへの応用 [cs.CV, cs.AI, cs.GR]目的:船舶の単一視点3D再構築パイプライン
- 海事モニタリングにおいて,視覚化,検査,意思決定の向上に3D再構築は不可欠である。
- 既存手法は多視点,3Dアノテーション,高計算コストが必要で,リアルタイム海上展開が困難である。
- 合成データで学習し,単一視点での実船3D再構築を可能にし,実運用での課題を解決する。
- 合成データと実データ間のドメインギャップを埋めることで,効率的かつ高精度な3D再構築を実現した。
- YOLOv8ベースのセグメンテーションモジュールと画像処理を統合し,再構築ネットワークとの互換性を確保した。
- AISデータとホモグラフィーマッピングを用いて,再構築された3Dモデルをインタラクティブな地図上に配置した。
大規模言語モデルのビジネスプロセスモデリング能力評価 [cs.SE, cs.AI]目的:大規模言語モデルが生成したビジネスプロセスモデルの能力
- ビジネスプロセスモデリングは,業務効率化や自動化に不可欠であり,企業の競争力向上に貢献する。
- 既存の研究では,大規模言語モデルが生成したモデルの体系的な評価が不足しており,品質保証が課題となっている。
- 大規模言語モデルのビジネスプロセスモデリングにおける強みと弱みを特定し,改善の方向性を示す。
- 大規模言語モデルは,構文品質とプラグマティック品質において優れた性能を発揮する。
- しかし,セマンティック品質においては,人間の専門家の方が高い性能を示す。
- この結果は,大規模言語モデルのビジネスプロセスモデリングへの応用可能性と,更なる改善の必要性を示唆する。
ECSEL:符号式方程式学習による説明可能な分類 [cs.LG, cs.AI, stat.ML]目的:説明可能な分類手法の開発
- 機械学習の解釈性は,信頼性と応用範囲拡大に不可欠である。
- 既存手法では,精度と解釈性の両立が課題であった。
- 符号式方程式学習を用いて,解釈性と精度の高い分類モデルを構築する。
- ECSELは,符号式方程式という閉じた形式の表現を学習することで分類と説明を同時に行う。
- 標準的なベンチマークにおいて,既存手法よりも多くのターゲット方程式を再現し,計算コストも大幅に削減した。
- ECSELは,解釈性を損なうことなく,確立された機械学習モデルと同等の分類精度を達成する。
NetMamba+: 効率的かつ正確なネットワークトラフィック分類のための事前学習済みモデルフレームワーク [cs.HC, cs.LG]目的:ネットワークトラフィック分類のためのフレームワーク
- 暗号化されたトラフィック増加に伴い,セキュリティとQoS確保が重要となる。
- Transformerの計算コスト,不十分な特徴表現,ロングテール分布への対応が課題。
- MambaとFlashAttentionを活用し,効率と精度を向上させる。
- NetMamba+は,既存の最先端手法と比較して最大6.44%のF1スコア向上を達成した。
- NetMamba+は,最高のベースラインと比較して1.7倍の高い推論スループットを実現し,メモリ使用量は同程度に維持された。
- NetMamba+は,少ないラベルデータでも優れた分類性能を示すFew-shot学習能力を備えている。
知識ベクトル弱体化:大規模ビジョン言語モデルの効率的な学習不要アンラーニング [cs.LG]目的:大規模ビジョン言語モデルからの特定データの影響除去
- プライバシー保護や有害コンテンツ抑制の重要性が増しており,モデルの安全性が求められている。
- 既存のアンラーニング手法は計算コストが高く,大規模モデルへの適用が困難である。
- 勾配計算を必要としない,効率的なアンラーニング手法の確立を目指す。
- 知識ベクトル弱体化(KVW)は,勾配計算なしでモデルの知識ベクトルを直接弱体化する。
- KVWは,忘却対象データで活性化する知識ベクトルを特定し,その寄与を段階的に弱める。
- 実験結果から,KVWは忘れと保持のバランスを保ちつつ,計算効率が向上することが示された。
タスク表現を用いた効果的なLoRAアダプタのルーティング [cs.LG, cs.AI]目的:LoRAアダプタのルーティング手法
- 大規模言語モデルの効率的な利用が重要であり,LoRAはそのための有力な手段である。
- 多数のアダプタが存在する中で,適切なアダプタを選択・組み合わせることが課題である。
- タスク表現を用いてルーティングすることで,アダプタ数が増加しても効率的なルーティングを実現する。
- 提案手法LORAUTERは,既存手法と比較して一貫して高い性能を示す。
- タスクに合致するアダプタが存在する場合,オラクル性能に匹敵する結果が得られた。
- 大規模でノイズの多いアダプタプールに対しても堅牢性を持つことが示された。
知識注入双方向ヘッド学習による知識に基づいた有害ミーム検出 [cs.CL, cs.AI]目的:有害ミーム検出のための知識に基づく学習手法
- インターネットミームはデジタル文化の伝達手段であり,その有害なコンテンツの検出は重要である。
- ミームは比喩や文化的背景に依存するため,自動モデレーションが困難である。
- ミームに含まれない背景知識を活用し,有害性をより正確に検出することを目指す。
- 提案手法KIDは,知識注入と双方向ヘッド学習により,ミーム理解を構造化された推論チェーンとして表現する。
- KIDは,英語,中国語,ベンガル語のデータセットにおいて,既存の最先端手法を2.1%~19.7%上回る性能を達成した。
- 知識注入と双方向ヘッド学習の有効性は,消去実験によって確認された。
BioAgent Bench:バイオインフォマティクスのAIエージェント評価スイート [cs.AI]目的:バイオインフォマティクスのAIエージェントの性能と堅牢性の評価
- バイオインフォマティクスは,生命科学研究において不可欠であり,データ解析の自動化が重要である。
- 既存のAIエージェントのバイオインフォマティクス分野における評価方法が確立されていない。
- AIエージェントのバイオインフォマティクスにおけるタスク実行能力を客観的に評価する。
- BioAgent Benchは,RNA-seq,バリアントコール,メタゲノミクスなどのタスクを含むベンチマークデータセットである。
- 最先端のエージェントは,複雑なパイプラインを構築でき,最終成果物を確実に生成する傾向があることが示された。
- しかし,入力の摂動に対する堅牢性テストでは,誤った段階レベルの推論が明らかになった。
内管吸引活動の認識のための統一的なXAI-LLMアプローチ [cs.AI]目的:内管吸引活動の認識とフィードバック生成のためのフレームワーク
- 内管吸引は侵襲的だが不可欠な医療行為であり,患者リスクを最小限に抑える高度な技術が必要とされている。
- 家庭医療や教育現場では監督が限られるため,内管吸引のトレーニング支援システムが不足している。
- 本研究は,トレーニングの効率化と患者安全性の向上を目指し,解釈可能な自動フィードバックシステムを構築する。
- 提案するLLMベースのアプローチは,従来の機械学習および深層学習モデルと比較して,認識精度とF1スコアが約15-20%向上した。
- LLMを中核としたフレームワークは,時空間的な活動認識と説明可能な意思決定分析を可能にし,複雑な技術情報を理解しやすいガイダンスに変換する。
- 異常検知とXAIに基づくパイロット学生支援モジュールは,正しい行動を強調し,改善点を提案する解釈可能なフィードバックを提供する。
道徳的憤りが注意を超えてコミットメントを形成する:韓国とアメリカのYouTubeにおける多imodalな道徳的感情 [cs.CY, cs.AI, cs.CL, cs.SI]目的:メディアレトリックが視聴者の関与をどのように形成するかについての理解
- アテンションエコノミーにおいて,メディアが世論を形成するメカニズムの解明は重要である。
- 道徳的感情を多角的に捉えた研究が不足しており,特にYouTubeのような多imodalプラットフォームでの分析が課題である。
- YouTubeにおける道徳的感情表現とユーザーの行動との関連性を明らかにすることで,情報拡散のメカニズム解明に貢献する。
- 主流ニュースチャンネルによる道徳的感情表現が,韓国とアメリカにおいて,視聴者の様々なレベルのコミットメント(閲覧,いいね,コメント)を増加させる。
- 特に,他者を批判する道徳的憤りの表現は,文化を超えて一貫してエンゲージメントを高める効果が認められた。
- 道徳的憤りは,注意を引き付けるだけでなく,積極的な参加を促す効果的な感情戦略であると考えられる。分極化を深める可能性への懸念も示唆された。
嗜好データからの非パラメトリック大規模言語モデル評価 [cs.LG]目的:大規模言語モデルの性能評価手法
- 大規模言語モデルの性能向上は,自然言語処理の発展に不可欠である。
- 既存手法は,制約的な仮定に依存するか,不確実性の評価が不十分である。
- 嗜好データに基づき,柔軟で信頼性の高い評価を実現することを目的とする。
- 提案手法DMLEvalは,デバイアス機械学習を用いて大規模言語モデルを比較・ランク付けする非パラメトリック統計フレームワークである。
- 一般化された平均ランキングスコア(GARS)を導入し,Bradley-TerryモデルやPageRank等の既存モデルを拡張し,複雑な人間の応答に対応する。
- 理論的・実験的に,合成データと実データを用いてDMLEvalの有効性を示す。大規模言語モデルの比較・ランキングのための強力な手法を提供する。
階層型エッジにおける大規模言語モデルエージェントの協調オーケストレーションによるユビキタス6Gインテリジェンスの実現 [cs.AI]目的:6Gにおけるユビキタスインテリジェンスの実現
- 6Gネットワークと大規模言語モデルの進展により,生活の様々な側面でシームレスな接続性と分散型AIが求められている。
- 階層型ネットワークにおける計算資源の断片化と不均一性が,複雑な推論タスクの実行を阻害している。
- 分散型エージェント間の効率的かつ迅速な協調を可能にするフレームワークを構築し,システム効率とタスク完了率を向上させる。
- COREフレームワークは,異なる役割を持つ複数のLLMをモバイルデバイスと階層型エッジサーバーに分散配置することで,協調学習システムを実現した。
- リアルタイム知覚,動的な役割オーケストレーション,パイプライン並列実行の3つの最適化モジュールを統合し,分散エージェント間の効率的な協調を促進した。
- 実世界の環境での実証実験により,COREの堅牢性と実用性が確認され,6Gアプリケーションの様々なシナリオにおいてシステム効率とタスク完了率が大幅に向上した。
スパイクニューロンにおける汎用的な自己予測強化 [cs.NE]目的:スパイクニューロンの自己予測強化手法
- 脳の効率的な情報処理機構を模倣することで,低消費電力なAI実現に貢献する。
- スパイクニューラルネットワークの学習は,微分不可能性や性能・効率・生物学的妥当性のトレードオフが課題。
- 予測符号化の原理に基づき,スパイクニューラルネットワークの学習安定性と精度向上を目指す。
- 提案手法は,入力・出力履歴から内部予測電流を生成し,膜電位を調整することで,勾配消失問題を緩和し学習を安定化させる。
- 実験結果から,様々なネットワーク構造,ニューロン型,時間ステップ,タスクにおいて性能向上が確認された。
- 本手法は,遠位樹状突起変調やエラー駆動型シナプス可塑性といった生物学的な原理にも合致している。
DASH:高スループット再現性のあるLLM学習のための決定論的注意スケジューリング [cs.LG, cs.DC]目的:決定論的注意のスケジューリングによる,LLM学習のスループット向上
- 大規模言語モデルの学習において,再現性は不可欠であり,その重要性は増している。
- 決定論的な実装は性能低下を招くことが多く,特に注意機構の実装で課題となっていた。
- 決定論的な注意の性能損失を最小限に抑え,再現性と効率性を両立することを目指す。
- DASHは,決定論的注意のバックワードパスをDAG上のスケジューリング問題として定式化し,クリティカルパス長を最小化するスケジューリング戦略を提案する。
- 提案手法であるDescending Q-Tile IterationとShift Schedulingにより,パイプラインストールを削減し,スループットを最大1.28倍に向上させる。
- NVIDIA H800 GPU上での評価により,DASHが決定論的注意の性能ギャップを縮小することが示された。
精度を超えて:心電図ファウンデーションモデルの包括的ベンチマーク [cs.CL, cs.RO, cs.AI]目的:心電図ファウンデーションモデルのベンチマーク手法
- 心電図は安価でアクセスしやすく,広く利用される診断ツールであり,AI支援による解釈の重要性が増している。
- 既存のベンチマークは,主に下流タスクのパフォーマンス評価に焦点を当てており,表現の一般化可能性の評価が不足している。
- ファウンデーションモデルの埋め込み表現の一般化可能性を深く理解し,信頼性の高い利用を可能にすること。
- 本研究で提案するベンチマーク手法は,パフォーマンス評価に加え,SHAPやUMAPを用いた表現レベルの分析を組み合わせる。
- 異なる大陸のデータセットやデータ不足といった現実的な医療シナリオ下で,複数の心電図専門ファウンデーションモデルを評価した。
- ベンチマークプロトコルは,モデルの埋め込みパターンに関する豊富な洞察を提供し,表現構造と一般化可能性の理解を深める。
機械学習モデルによる場予測のための目標駆動型適応サンプリング戦略 [cs.LG]目的:機械学習モデルによる場予測のためのサンプリング戦略
- 高コストなシミュレーションの代替として機械学習が注目されており,効率的な予測手法の確立が重要である。
- 必要な精度を最小限の計算コストで達成する方法が課題であり,特に場予測への適用は限定的である。
- モデル構造に依存しない場予測のための能動学習戦略を提案し,計算コスト削減を目指す。
- 提案手法は,スカラー値の参照値と場予測の誤差を同時に低減するアプローチを採用している。
- NASAの共通研究モデルを用いた不確実性伝播タスクにおいて,従来のサンプリング手法と比較して高い精度を低コストで実現した。
- 本研究で提案する能動学習戦略は,様々なモデルアーキテクチャに適用可能であることが示された。
サーロゲートニューラルカーネルによるスケーラブルな線形化ラプラス近似 [cs.LG]目的:線形化ラプラス近似のカーネル近似手法
- 深層学習モデルの不確実性推定は,安全性や信頼性向上に不可欠である。
- 大規模モデルでのラプラス近似計算には,ヤコビアン行列の計算コストが課題となる。
- ヤコビアン行列の直接計算を回避し,効率的な不確実性推定を実現すること。
- 提案手法は,ニューラルタンジェントカーネルを模倣するサーロゲートDNNを用いて,ラプラス近似のカーネルをスケーラブルに近似する。
- 既存のラプラス近似手法と同等またはそれ以上の精度で不確実性推定と校正が可能である。
- 学習されたカーネルにバイアスを導入することで,分布外検出性能が大幅に向上する。
信頼できる知能教育:進捗,課題,将来の方向性に関する体系的視点 [cs.CY, cs.AI, cs.IR]目的:知能教育における信頼性の体系的レビュー
- 教育は個人情報や学習成果に関わるため,信頼性が不可欠である。学習者の保護と質の高い教育実現が重要。
- 既存研究は個別課題に偏り,信頼性に関する全体像や体系的な分類が不足している。
- 知能教育における信頼性の課題を整理し,今後の研究方向を示すことを目指す。
- 本研究では,学習能力評価,教材推薦,学習分析など5つの主要なタスクカテゴリを提示した。
- 安全性,堅牢性,公平性,説明可能性,持続可能性という5つの信頼性に関する視点から既存研究をレビューした。
- 信頼性に関する研究手法と解決策を整理し,今後の課題と研究方向を考察した。
テスト時の計算ゲーム [cs.CY, cs.AI, cs.GT, cs.LG]目的:LLMのサービス提供における計算効率の改善
- LLMの推論能力向上が重要視される中,計算コストの増大が課題となっている。
- LLMサービス提供者は,出力品質向上に寄与しない計算量の増加にも収益を上げるインセンティブがある。
- LLMサービス市場における非効率性を解消し,費用対効果の高いシステムを構築することを目指す。
- 本研究では,逆セカンドプライスオークション機構を提案し,提供者間の価格と品質競争を促す。
- Llama,QwenモデルやDeepSeek-R1から蒸留された推論モデルを用いて,数学・科学データセットで実験を実施した。
- 実験結果は,提案機構が社会的に効率的なLLMサービス市場の実現に貢献することを示唆している。
予測精度と在庫KPIの連携:シミュレーションに基づくソフトウェアフレームワーク [cs.AI, cs.SE]目的:予測精度と在庫管理KPIの関連性の評価手法
- 自動車部品のアフターマーケットでは,需要の変動が大きく,適切な在庫管理が重要である。
- 従来の予測モデルの評価は,統計的な精度のみに焦点を当て,実際の運用パフォーマンスとの関係が不明確である。
- 予測モデルの精度向上と在庫管理KPIの改善を結びつけ,運用上の関連性を評価するためのフレームワークを構築する。
- シミュレーションの結果,従来の精度指標の改善が必ずしも運用パフォーマンスの向上に繋がらないことが示された。
- 統計的な誤差プロファイルが類似するモデルでも,コストとサービスレベルのトレードオフに大きな違いが生じることが明らかになった。
- 予測パフォーマンスの特定の側面が在庫結果にどのように影響するかを分析し,モデル選択のための指針を得た。
制約付きメタ強化学習における証明可能なテスト時安全性 [cs.LG]目的:テスト時の安全性確保とサンプル複雑度の削減
- 実世界への応用において,安全性は不可欠であり,ロボティクスやヘルスケア等の分野で重要性が増している。
- メタ強化学習ではテスト時の安全性が課題であり,特に制約付き環境下での保証が困難である。
- 本研究は,テスト時の安全性を証明可能に保証しつつ,サンプル効率の良い学習アルゴリズムを提案する。
- 提案アルゴリズムは,訓練中に学習されたポリシーを改良することで,テストタスクにおいてほぼ最適なポリシーを学習する。
- 安全性とサンプル複雑度に関する証明可能な保証を得ることができた。
- サンプル複雑度の理論的な下限を導出し,提案手法の最適性が示された。
メタブラックボックス最適化のための報酬発見 [cs.LG, cs.NE]目的:メタブラックボックス最適化における報酬関数の自動発見
- 最適化問題解決は科学技術の根幹であり,効率的な手法の確立が求められている。
- 既存手法では,専門家による報酬設計に偏りが生じ,報酬ハッキングのリスクがある。
- 大規模言語モデルを用いて,偏りのない報酬関数を自動的に発見し,最適化性能を向上させる。
- 提案手法は,進化のヒューリスティックスという考え方を導入し,反復的なLLMベースのプログラム探索プロセスにおいて継続的な改善を保証する。
- マルチタスク進化アーキテクチャにより,多様なメタBBOアプローチに対する並列報酬発見を支援し,タスク間の知識共有によって収束を加速する。
- 実験結果から,提案手法によって発見された報酬関数が既存のメタBBO手法の性能向上に貢献することが示された。
視覚的解きほぐし拡散オートエンコーダ:基盤モデルのためのスケーラブルな反事実生成 [cs.LG]目的:基盤モデルにおける反事実生成
- 基盤モデルの性能向上は,AI応用の幅を広げ,様々なタスクの自動化を可能にするため重要である。
- 基盤モデルは,見かけ上の相関関係に頼りがちで,「Clever Hans」戦略に陥りやすいという課題がある。
- 既存手法の課題を克服し,効率的かつ勾配を用いない反事実生成による性能改善を目指す。
- DiDAEは,凍結された基盤モデルと解きほぐし辞書学習を統合した新しいフレームワークである。
- DiDAEは,既存手法よりも高速に,多様で解きほぐされた反事実を生成できる。
- DiDAE-CFKDは,不均衡データセットにおけるショートカット学習の軽減において最先端の性能を達成した。
LEMUR:学習されたマルチベクトル検索 [cs.IR, cs.LG]目的:マルチベクトル検索の効率化
- 情報検索において,検索精度向上の重要性が増している。
- マルチベクトル検索は遅延が大きく,実用上の課題となっている。
- マルチベクトル検索の高速化を実現し,実用性を高める。
- LEMURは,マルチベクトル類似性検索を教師あり学習問題として定式化する。
- 推論を潜在空間での単一ベクトル類似性検索に還元し,既存のANNS手法を活用する。
- ColBERTv2を含む様々な埋め込み表現で,既存手法よりも大幅な高速化を達成した。
KnowBias:知識-偏見ニューロン強化によるLLMの社会的偏見の軽減 [cs.NI, cs.MA, cs.SY, eess.SY, cs.FL, cs.AI]目的:LLMにおける社会的偏見の軽減
- LLMの普及に伴い,倫理的な問題が重要視されるようになっている。
- 既存の偏見軽減手法は脆弱で,汎用性が低く,能力を損なう可能性がある。
- 偏見知識をエンコードするニューロンを強化することで,偏見を軽減すること。
- KnowBiasは,わずかな数の偏見知識質問を用いて偏見知識をエンコードするニューロンを特定し,推論時にそれらを強化する。
- 本手法は,汎用性を維持しつつ,多様な偏見と属性に対して高い軽減性能を示す。
- 再学習を必要とせず,わずかなデータで効果を発揮し,実用性に優れている。
MoHETS:異種専門家混合による長期時系列予測 [cs.LG, cs.AI]目的:長期時系列予測における性能向上
- 実世界の時系列データは複雑であり,予測は困難である。正確な予測は,意思決定や計画において不可欠である。
- 既存のMoE手法は,均質なエキスパートを使用しており,多様な時間的ダイナミクスを捉えきれないという課題がある。
- 異種エキスパートを用いることで,多様な時間的パターンを捉え,予測精度を向上させることを目指す。
- MoHETSは,Transformerエンコーダーに異種専門家混合(MoHE)層を組み込むことで,長期時系列予測の性能を向上させる。
- MoHEは,シーケンスレベルの連続性とパッチレベルの周期構造を捉えるために,Depthwise-convolutionエキスパートとフーリエベースのエキスパートを組み合わせる。
- 7つの多変量ベンチマークにおいて最先端の性能を達成し,既存手法と比較して平均二乗誤差を12%削減した。
WebArbiter:原理に基づいた推論プロセス報酬モデル [cs.AI]目的:ウェブエージェントのための報酬モデルの構築
- ウェブエージェントは複雑なタスクを自動化する可能性を秘めているが,その実現には課題が多い。
- 既存のプロセス報酬モデルは,粗雑な信号や脆いテンプレートマッチングに依存し,汎化性能が低い。
- WebArbiterは,原理に基づいた推論と強化学習により,よりロバストで解釈可能な報酬モデルを目指す。
- WebArbiterは,報酬モデリングをテキスト生成として捉え,構造化された根拠と行動選択を提供する。
- WebPRMBenchという新しいベンチマークを用いて評価した結果,既存のGPT-5を9.1ポイント上回る性能を示した。
- WebArena-Liteでの実験では,最良の既存モデルを最大7.2ポイント上回り,実用的な価値を証明した。
表現と環境次元の拡大下における低ランクプラススパース行列転移学習 [cs.LG, stat.ML]目的:表現と環境次元が拡大する状況下における構造化行列推定のための転移学習
- 機械学習システムは時間と共に特徴量や潜在表現を拡張し,新たな構造を付加することが重要である。
- ソースタスクからターゲットタスクへの転移学習において,次元の拡大に伴う情報損失が課題となる。
- ソースタスクの知識を活用し,次元拡大下での効率的な学習を実現することを目指す。
- ターゲットパラメータを埋め込みソース成分,低次元低ランクの革新,スパースな編集に分解する汎用的な転移学習フレームワークを提案した。
- 転移された部分空間を維持しつつ,低次元革新とスパース修正のみを推定するアンカー付き交互投影推定器を開発した。
- ランクとスパース性の増分が小さい場合に,ターゲットノイズ,表現の拡大,ソース推定誤差を分離する決定論的誤差限界を確立した。
ベンチマークの進化:大規模言語モデルによるブラックボックス最適化ベンチマーク設計 [cs.RO, cs.NE]目的:ブラックボックス最適化のためのベンチマーク設計
- 最適化問題の性能評価には適切なベンチマークが不可欠であり,その重要性は高い。
- 既存のベンチマークは専門家の知識に依存し,多様性に欠けるという課題がある。
- 大規模言語モデルを用いて,客観的で多様性のあるベンチマークを自動的に生成することを目指す。
- 提案手法EoBは,ベンチマークの多様性とアルゴリズムの識別能力を最大化する二目的最適化問題としてベンチマーク設計を定式化する。
- EoBは大規模言語モデルにベンチマークプログラムを進化させさせ,反射に基づく手法でランドスケープとプログラムを共進化させる。
- 実験により,EoBがブラックボックス最適化アルゴリズムのベンチマーク,学習支援型アルゴリズムの訓練・テスト,実問題のプロキシとして有効であることが示された。
astra-langchain4j:LLMとエージェントプログラミングの統合事例 [cs.AI, cs.MA]目的:LLMとエージェントプログラミングの統合に関する経験
- 近年,生成AIの発展とエージェントAIへの注目が高まっており,その影響は大きい。
- 従来のAgent Toolkitの活用方法や,新たなエージェントプラットフォーム設計に課題がある。
- ASTRAプログラミング言語へのLLM統合プロトタイプの開発を通して,課題解決を目指す。
- 本研究では,ASTRAプログラミング言語へのLLM統合の経験を概説した。
- Toolkitの概要と,3つの実装例を紹介し,得られた知見について議論した。
- 従来のAgent Toolkitの経験が,新しいエージェントプラットフォーム設計に役立つことを示した。
ノード識別子が存在する場合におけるグラフニューラルネットワークの表現力 [cs.LO, cs.LG]目的:グラフニューラルネットワークの表現力
- グラフ構造データ分析において,グラフニューラルネットワークは広く用いられている。
- ノード識別子のような特徴量がグラフに含まれる場合,その影響は明確ではなかった。
- ノード識別子に依存しないグラフ構造に関するクエリを表現できる範囲を調査する。
- 本研究では,ローカルmax- or sum-aggregationを持つ様々なクラスのGNNに対する結果が得られた。
- グラフニューラルネットワークのキー不変表現力に関する初期的な研究を行った。
- これにより,有限モデル理論における順序不変定義可能性との関連性が示された。
コスト正則化による決定重視学習における解の安定性管理 [cs.LG]目的:決定重視学習における解の安定性向上
- 予測だけでなく,意思決定の質を直接改善する学習が重要視されている
- 組み合わせ最適化問題の微分計算が難しく,近似手法に頼る状況がある
- 摂動強度の変動による学習の不安定化を,コスト正則化で解決する
- 摂動強度変動が学習の効率を低下させ,解の安定性を損なうことが示された
- 推定されたコストベクトルに対する正則化が,学習の堅牢性と信頼性を向上させる
- 数値実験により,提案手法の有効性が確認された
高コスト制約なし多目的最適化問題の収束速度を加速する適応サロゲートベース戦略 [cs.RO, cs.NE]目的:高コストな制約なし多目的最適化問題における収束速度の加速
- 多目的最適化は,複雑な現実世界の問題解決に不可欠であり,産業応用への需要が高い。
- 計算コストの高い問題では,従来の多目的進化アルゴリズムの性能が著しく低下する。
- 本研究は,高コストな問題における最適解探索の効率化を目指し,早期収束を促進する。
- 提案手法は,NSGA-IIおよびMOEA/Dと統合し,31のベンチマーク問題と実世界の問題で評価した。
- ガウス過程回帰,1次元畳み込みニューラルネットワーク,ランダムフォレスト回帰を用いることで,多目的最適化アルゴリズムの初期段階における収束速度が大幅に向上した。
- サロゲートモデルを活用した適応的な加速器により,少ない関数評価回数で良好な解を得ることが可能となった。
多様体への射影によるフローマッチングのClassifier-Free Guidanceの改善 [cs.CV, cs.AI]目的:拡散モデルおよびフローベースモデルにおける制御可能な生成のためのClassifier-Free Guidanceの改善
- 拡散モデル等の生成モデルにおいて,生成されるコンテンツの制御は重要な課題である。
- 従来のClassifier-Free Guidanceは,ガイダンススケールに敏感であり,安定性に課題があった。
- 本研究は,多様体への射影により,ガイダンススケールへの依存性を軽減し,生成品質を向上させることを目指す。
- 本研究では,Classifier-Free Guidanceを最適化問題として解釈し,多様体制約を持つホモトピー最適化として再定式化した。
- 提案手法は,追加の学習を必要とせず,生成された画像の忠実度,プロンプトへの適合性,ガイダンススケールへのロバスト性を向上させる。
- DiT-XL-2-256,Flux,Stable Diffusion 3.5など,大規模モデルを用いた実験により,その有効性が確認された。
コードの複雑さとLLMの推論能力:データ中心の研究 [cs.LG]目的:コードの複雑さとLLMの推論能力の関係性
- LLMの推論能力向上は,AI研究における重要な課題であり,その性能限界の探求が求められている。
- コードはLLMの能力向上に寄与するが,どのコード特性が有効か不明確であり,効率的な学習方法が課題である。
- コードの構造的複雑性がLLMの推論に与える影響を解明し,データ中心的な改善策を提示する。
- コードによるLLMの推論能力向上は可能だが,構造的特性がその有用性を大きく左右する。
- 83%の実験で,特定の構造的複雑さ範囲のデータに限定したファインチューニングが,多様なコードでの学習を上回った。
- LLMの推論能力向上のために,モデルのスケール拡大だけでなく,データセットの構造的特性を考慮することが重要である。
Learn-to-Distance: LLM生成テキスト検出のための距離学習 [cs.CL, cs.AI, stat.ML]目的:LLM生成テキストの検出
- LLMの進化は学習,仕事,コミュニケーションを変革したが,誤情報や学術不正のリスクも高めている。
- LLMが生成するテキストの人間らしさから,信頼性の高い検出アルゴリズムの確立が急務となっている。
- 既存の書き換えベース検出アルゴリズムの原理を明らかにし,より効果的な距離学習に基づく検出手法を提案する。
- 書き換えベースの検出アルゴリズムは,原文と書き換えテキスト間の距離を学習することで,LLM生成テキストを効果的に検出できることが示された。
- 提案手法は,固定距離を使用する既存手法と比較して,GPT,Claude,Geminiといった複数のLLMにおいて相対的に57.8%~80.6%の性能向上を達成した。
- 適応的に学習された距離関数を用いることで,より正確なLLM生成テキストの検出が可能となることが理論的・実験的に示された。
汎用性の高い大規模MIMO事前符号化のための低複雑度プラグアンドプレイ深層学習モデル [cs.LG, eess.SP]目的:大規模MIMOダウンリンク事前符号化の実現可能性向上
- mMIMOはスペクトル効率を向上させるが,実用化には計算量やチャネル推定精度が課題となる。
- 従来の深層学習ベースの解決策は,ロバスト性に欠け,各設置場所での再学習が必要となる。
- 設置場所や送信電力,チャネル推定誤差に依存しない,再学習不要な事前符号化モデルの構築。
- 提案手法PaPPは,デジタルおよびハイブリッドビームフォーミングに対応可能であり,異なる環境下でも高い性能を示す。
- PaPPは,従来の方式や他の深層学習ベースラインと比較して,計算エネルギーを21倍以上削減し,省エネルギーなmMIMO事前符号化を実現する。
- 少量の現地データを用いた微調整により,チャネル推定誤差下でも良好な性能を維持できる。
スケーリングに敏感な損失地形を通じてモデルを結合不可能にする [cs.AI, cs.CR]目的:モデル結合の不正利用を防ぐための保護フレームワーク
- モデルハブの普及により再利用可能なモデル部品へのアクセスが容易になり,モデルの活用範囲が広がっている。
- モデルのモジュール性ゆえに,安全対策やライセンス条項を回避する不正なモデルの再構成が可能となる問題がある。
- 様々なアーキテクチャやリリース形式に対して,一貫した保護を提供するフレームワークを開発すること。
- 本研究では,\textsc{Trap}$^{2}$というアーキテクチャに依存しない保護フレームワークを提案する。
- このフレームワークは,ファインチューニング時の更新に保護機能を組み込み,モデルの結合時に重みをスケーリングすることで不正利用を抑制する。
- 単独での使用においてはモデルの有効性を維持しつつ,モデル結合における重みの再スケーリングによって性能を低下させる。
地域障壁の打破:世界規模の空気質予測のための誘導的意味的トポロジー学習 [cs.LG]目的:世界規模の空気質予測における,地域差を超越した汎化性能の実現
- 大気汚染は健康と環境に深刻な影響を与えるため,正確な予測が不可欠である。
- 既存モデルは空間的な不均一性に弱く,未知の地域への汎化が課題となっていた。
- 空間的に不均一なネットワークにおける,長距離相関の捕捉と予測精度の向上を目指す。
- 提案手法 OmniAir は,18のベースラインモデルと比較して最先端の性能を達成した。
- 特にデータが少ない地域において,モニタリングギャップを効果的に解消することを示した。
- 既存モデルの約10倍の速度で,高い効率とスケーラビリティを維持している。
経路介入による大規模基盤モデルの堅牢な安全性確保:TraceRouter [cs.CV, cs.AI, cs.CY, cs.MM]目的:大規模基盤モデルにおける有害な意味の因果伝播経路の特定と遮断
- 大規模基盤モデルは強力だが,攻撃に脆弱である。安全性の確保は重要な課題。
- 従来の防御は局所的な介入に頼り,分散した有害な意味に対処できない。
- 有害な意味の因果経路を特定し,選択的に抑制することで安全性を高める。
- TraceRouterは,注意の分散を分析して感受性の高い層を特定する。
- スパースオートエンコーダと微分活性化分析を用いて,悪意のある特徴を分離する。
- 特徴影響スコアにより経路を特定し,有害な情報の流れを遮断することで,堅牢性と実用性の両立を実現する。
ハードウェアトリガー型バックドア [cs.LG, cs.CR]目的:機械学習モデルにおけるハードウェアトリガー型バックドアの作成と対策
- 機械学習モデルの利用が拡大する中で,ハードウェアの信頼性確保が重要となる。
- ハードウェアの設計差による数値誤差が,セキュリティ上の脆弱性となりうる。
- 異なるハードウェアで予測を操作する新たな攻撃手法への対策を提示する。
- 本研究では,ハードウェアの数値的な差異を利用し,同じ入力に対して異なる予測を出力するバックドアを作成できることを示した。
- このバックドアは,決定境界を特定の入力に近づけ,ハードウェアごとの数値偏差を調整することで実現可能である。
- 一般的なGPU環境でバックドアの作成が実証され,第三者モデル利用における新たな攻撃リスクが示唆された。
メタ思考から実行へ:汎化性と信頼性の高いLLM推論のための認知的に整合したポストトレーニング [cs.DL, cs.IR, cs.AI, cs.CL]目的:汎化可能かつ信頼性の高いLLM推論
- LLMの推論能力向上は,自然言語処理の発展に不可欠である。
- 既存手法では,抽象的な戦略と問題固有の実行が混同され,汎化性が低い。
- 人間の認知プロセスを模倣し,汎化性と効率性を両立するポストトレーニング手法を開発する。
- 提案手法CoMTは,抽象的な推論パターンに焦点を当てた教師あり学習により,汎化可能な戦略を獲得する。
- CCRLは,中間ステップにおける信頼度を考慮した報酬を用いて,タスクへの適応を最適化し,誤りの連鎖を防ぐ。
- 実験結果から,提案手法は標準手法と比較して,分布内および分布外でそれぞれ2.19%,4.63%の性能向上を示し,学習時間とトークン消費量を削減した。
ProRAG:検索拡張生成のためのプロセス監視型強化学習 [cs.AI, cs.CL, cs.IR]目的:検索拡張生成におけるプロセス監視型強化学習フレームワークの開発
- 複雑な推論タスクにおいて,検索拡張生成の性能向上が求められている。
- 従来の強化学習では,報酬の疎さと効率的なクレジット割り当てが課題である。
- ステップレベルでの監視学習を統合し,より精密なフィードバックを提供する。
- ProRAGは,構造化された推論形式とMCTSベースのプロセス報酬モデルを導入した。
- プロセス報酬とグローバルな結果信号を組み合わせることで,正確なフィードバックを実現した。
- 5つのマルチホップ推論ベンチマークで,既存手法を上回る性能が確認された。
JADE:動的なエージェント式RAGにおける戦略と実行のギャップの架け橋 [cs.AI, cs.CL, cs.IR]目的:戦略と実行の乖離問題の解決
- 大規模言語モデルの性能向上のため,外部知識を活用するRAGが重要視されている。
- 既存のRAGシステムでは,計画と実行の最適化が分離されており,性能向上が限定的である。
- 計画と実行を協調的に最適化し,戦略と実行の一貫性を高めることを目指す。
- JADEは,計画と実行を共同最適化する統一的なフレームワークである。
- JADEは,計画側が実行側の能力を考慮し,実行側が戦略的意図に沿うように進化する「協調適応」を実現する。
- 実験結果から,JADEがモジュール間の相乗効果を生み出し,効率性と有効性のバランスを調整できることが示された。
マルチエージェント強化学習による思考の連鎖の自己圧縮 [cs.AI, cs.CL]目的:思考の連鎖における冗長性の削減
- 大規模言語モデルの推論能力は高いが,計算コストが大きい。
- 冗長な推論は対話性を損ない,実用化のボトルネックとなる。
- 冗長な部分を特定し,重要な論理を維持する自己圧縮手法の開発。
- SCMAは,応答長を11.1%から39.0%削減し,同時に精度を4.33%から10.02%向上させた。
- SCMAは,分割エージェントとスコアリングエージェントの協調により,重要度に応じた長さペナルティを学習する。
- 実験結果から,マルチエージェント強化学習が強力な言語モデルの創出に貢献することが示された。
仕事の未来から労働者の未来へ:尊厳ある人間とAIのインタラクションに向けたAIによる非症状的損害への対処 [cs.HC, cs.AI, cs.CY]目的:AI導入による専門知識や主体性の低下という潜在的な損害
- AI技術の発展は生産性向上に貢献するが,労働者の能力や尊厳への影響が懸念される。
- AI導入による専門性の低下は自覚しにくく,放置するとスキルの低下や自己同一性の喪失につながる。
- AI導入によるスキルの低下を検出し,抑制し,回復するための枠組みを提案すること。
- がん専門医への1年間の調査から,AI利用により専門家の判断力が鈍化する「直感の錆」が確認された。
- 労働者と共につくり上げたフレームワークは,組織の質的目標と労働者の能力向上を両立する。
- ヘルスケアとソフトウェア開発における評価を通じて,尊厳ある人間とAIのインタラクションの基盤を確立する。
タスクシフトにおける楽観的転移:ベルマンアラインメントによるアプローチ [cs.LG, stat.ML]目的:オンライン転移強化学習におけるタスクシフト下の性能向上
- 強化学習は複雑な意思決定問題を解決する強力な手法であり,様々な分野で応用が期待されている。
- 従来の転移学習では,タスク間の類似性を報酬や遷移で定義するのに対し,オンライン強化学習はベルマン回帰ターゲットを扱うため,バイアスが生じやすい。
- ベルマンアラインメントを用いて,継続値を再ターゲット化し,遷移の不一致を補正することで,タスク間のバイアスを軽減し,効率的な転移学習を実現する。
- 本研究では,1ステップベルマンアラインメントがオンライン強化学習における転移の適切な抽象化であることを示した。
- 提案手法であるRWTは,タスクの不一致を固定された1ステップ補正に減らし,ソースデータの統計的に妥当な再利用を可能にする。
- 実験結果から,RWTは単一タスク学習や単純なプーリングと比較して,一貫して性能が向上することが示された。
LoRIF:スケーラブルな学習データ帰属のための低ランク影響関数 [cs.RO, cs.CL, cs.LG]目的:モデルの予測に最も影響を与えた学習事例の特定
- 機械学習モデルの信頼性向上には,モデルの判断根拠の解明が不可欠である。
- 大規模データセットにおける影響関数の計算コストが課題となっている。
- 低ランク構造を利用し,計算・記憶コストを削減することで,スケーラビリティと精度を両立する。
- LoRIFは,投影された勾配の保存・クエリにかかるコストを大幅に削減する。
- ヘッセ行列近似のメモリ使用量を削減し,大規模モデルへの適用を可能にする。
- 0.1Bから70Bパラメータのモデルで,LoGRAと同等以上の帰属品質を維持しつつ,20倍のストレージ削減と高速化を達成した。
AgenticSimLaw: 説明可能な高リスク表形式意思決定のための少年法廷マルチエージェント討論シミュレーション [cs.DC, cs.AI]目的:高リスク表形式意思決定における透明性と制御可能なテスト時推論の提供
- 重要な意思決定において,その根拠を明確に説明できることが求められている。
- 従来のブラックボックス型アプローチでは,意思決定プロセスが不透明である。
- 説明可能な意思決定プロセスを構築し,倫理的な複雑さへの対応を目指す。
- 構造化されたマルチエージェント討論は,単一エージェント推論と比較して,より安定した汎化性能を示す。
- 精度とF1スコアの相関がより強く,説明可能性を高める完全な対話記録を生成する。
- このフレームワークは,倫理的な配慮が必要な分野において,責任あるシステム構築に貢献する。
