arXiv雑要約

AI - 2025/12/16 公開

  • OPAL:ランドスケープを意識したブラックボックス最適化のためのオペレータープログラムアルゴリズム [cs.NE, cs.AI]目的:ブラックボックス最適化における問題インスタンス毎の最適化戦略の学習
    • 最適化問題は科学技術の様々な分野で不可欠であり,効率的な解法が求められている。
    • 従来の進化型・スウォーム型アルゴリズムは問題依存性が高く,汎用性に課題がある。
    • 問題のランドスケープを考慮し,問題毎に最適なオペレータープログラムを学習することで,最適化性能を向上させる。
    • OPALは,差分進化をベースラインとしてランドスケープを探索し,近傍グラフを構築,グラフニューラルネットワークで表現する。
    • メタ学習器がこの表現を,探索,再起動,局所探索オペレーターの段階的なスケジュールにマッピングする。
    • CEC~2017テストスイートにおいて,OPALは最先端の適応型差分進化と統計的に匹敵し,単純なベースラインを大幅に上回った。

    Link: https://arxiv.org/abs/2512.12809

  • トーンは回答に影響するか?最新LLMにおけるプロンプトの丁寧さの効果評価:GPT,Gemini,LLaMA [cs.CL, cs.AI]目的:大規模言語モデルにおけるプロンプトの丁寧さの影響評価
    • LLMの性能向上にはプロンプトエンジニアリングが不可欠であり,その効果を最大化する必要がある。
    • LLMにおける言語的トーンや丁寧さといった語用論的要素の影響は十分に解明されていない。
    • 異なるモデル系列におけるプロンプトのトーンがLLMの精度に与える影響を体系的に評価する。
    • モデルのトーンに対する感受性はモデルとドメインに依存する傾向が確認された。
    • GPTとLLaMAでは,無礼なプロンプトがヒューマニティ分野のタスク精度を低下させたが,Geminiは比較的トーンに鈍感であった。
    • データセットの規模と網羅性が,トーンの影響検出に大きく影響することが示唆された。

    Link: https://arxiv.org/abs/2512.12812

  • 概念ドリフト下における機械学習モデルの訓練と展開のための最適リソース配分 [cs.LG, cs.NI]目的:概念ドリフトと限られた予算下における機械学習モデル訓練と展開のリソース配分
    • 機械学習は多様な分野で活用され,その性能維持は重要である。
    • モデルの性能は概念ドリフトにより劣化するが,リソースは有限である。
    • 概念ドリフトに対応した効率的なリソース配分手法を確立すること。
    • 概念ドリフトの持続時間特性が訓練方針に大きく影響することが示された。
    • DMRL分布下では最適な訓練方針が導出され,IMRL分布下では直感的なヒューリスティクスが劣ることが証明された。
    • 通信制約下でのモデル展開問題が準凸性を持つこと,及びそれに伴うランダム化スケジュール戦略が提案された。

    Link: https://arxiv.org/abs/2512.12816

  • 国家大学討論における人間とAIの説得戦略の解読:アリストテレスの弁論術原理に基づく準備議論の分析 [cs.HC, cs.AI]目的:人間とAIによる説得戦略の差異
    • 批判的思考力育成において議論は重要であり,効果的な議論構成スキルが求められる。
    • 議論スキル教育は主に人的指導に依存しており,その規模拡大が課題である。
    • AIを活用し,議論準備を支援することで,議論スキルの向上を目指す。
    • GPT-4が生成した議論カードと学生の議論カードを,アリストテレスの弁論術(エトス,パトス,ロゴス)を用いて比較分析した。
    • AIと人間による議論における強みと弱点を特定し,両者の思考の違いを明らかにした。
    • 本研究は,AI支援学習介入の可能性を示唆し,議論と推論スキルの向上に貢献する。

    Link: https://arxiv.org/abs/2512.12817

  • 事後的視点は20/20である:保持,想起,反省を行うエージェントメモリの構築 [cs.CL, cs.AI, cs.IR, cs.LG]目的:エージェントメモリの構造化と,その運用方法
    • LLMを活用したエージェントにおいて,長期的な経験蓄積と適応能力は重要である。
    • 既存のメモリシステムは,事実と推論の区別が曖昧で,長期的な情報の整理が困難である。
    • エージェントが推論過程を説明できるような,構造化されたメモリ基盤を構築すること。
    • Hindsightは,世界事実,エージェント経験,エンティティ要約,進化する信念を区別する4つのネットワークでメモリを構造化する。
    • LongMemEvalとLoCoMoのベンチマークにおいて,Hindsightは既存のベースラインと比較して大幅に精度を向上させた。
    • Hindsightは,GPT-4oを含む既存のメモリアーキテクチャを凌駕し,マルチセッションやオープンな質問応答において高い性能を発揮する。

    Link: https://arxiv.org/abs/2512.12818

  • フローの連続性について [cs.LG, cs.AI, physics.data-an]目的:連続正規化フローを通じた生成モデリングにおけるフローマッチングの連続性に関する研究
    • 生成モデルは,多様なデータ分布を学習し,新たなデータを生成する上で重要な役割を担う。
    • 標準的なフローマッチング目標では,事前分布とターゲット分布のトポロジーが異なる場合に空間的な不連続が生じる可能性がある。
    • 分布のトポロジーの不一致に起因するフローの不連続性を理論的に解明し,その影響を検証すること。
    • 理論解析により,二峰性ガウス混合において,最適な速度場が決定境界に沿って不連続性を示すことが明らかになった。
    • この不連続性は,時間がターゲット分布に近づくにつれて無限大に近づくことが示された。
    • この現象は$L^2$損失に固有のものではなく,分布間のトポロジーの不一致の結果である可能性が示唆された。

    Link: https://arxiv.org/abs/2512.12821

  • Lemon:普遍的な空間理解のための統一的かつスケーラブルな3Dマルチモーダルモデル [cs.CV, cs.AI]目的:3D空間理解のための統一的なマルチモーダルモデルの構築
    • ロボット工学や拡張現実など,現実世界とのインタラクションにおいて3D空間理解は不可欠である。
    • 既存のモデルは,モダリティ固有のエンコーダに依存し,スケーラビリティや学習の安定性に課題がある。
    • 点群データと言語情報を統合的に処理し,3D空間理解の性能向上とモデルのスケーラビリティ実現を目指す。
    • Lemonは,3D点群パッチと言語トークンを単一のシーケンスとして処理する統一的なTransformerアーキテクチャである。
    • 本研究では,空間的文脈を保持する構造化パッチ化とトークン化方式,および段階的な学習カリキュラムを開発した。
    • Lemonは,3Dオブジェクト認識からシーンレベルの空間推論まで,包括的な3D理解タスクにおいて最先端の性能を達成した。

    Link: https://arxiv.org/abs/2512.12822

  • 数ショット学習のためのマルチモーダル基盤モデルの適応:コントラスティブキャプショナーに関する包括的研究 [cs.CV, cs.AI]目的:コントラスティブキャプショナーの視覚バックボーンを数ショット画像分類に適用するための戦略の評価
    • 大規模なマルチモーダル基盤モデルは,画像とテキストの理解において高い性能を示しており,多様な応用が期待される。
    • データ不足の状況下での適応方法が十分に解明されておらず,特に生成・コントラスト両方の特性を持つモデルの挙動は不明な点が多い。
    • 数ショット学習におけるデータ拡張の影響と,効果的なパラメータ効率的ファインチューニング手法の特定を目指す。
    • データ拡張は線形プローブの性能を低下させる一方で,LoRAファインチューニングの安定化には不可欠であることが判明した。
    • Supervised Contrastive損失を組み込んだハイブリッド目的関数は,様々なショット数において標準的なクロスエントロピーよりも一貫して性能が向上した。
    • データ不足に対する設定の感度を明らかにし,正則化,ランク,サンプリング戦略のスケーリングに関する参考設定を提供した。

    Link: https://arxiv.org/abs/2512.12824

  • 勾配の固有次元性による敵対的攻撃の検出 [eess.SY, cond-mat.mtrl-sci, cs.SY, cs.LG, cs.CR, cs.CV]目的:敵対的攻撃の検出方法
    • 深層学習の信頼性は重要であり,医療診断や自動運転などへの応用が期待されている。
    • 深層学習モデルは微小な摂動によって予測が大きく変化するという脆弱性を抱えている。
    • 固有次元性に着目し,敵対的攻撃と通常のデータの区別を可能とする検出手法を確立する。
    • モデルの勾配パラメータの固有次元性は,自然データと敵対的データの間に明確な差異を示す。
    • 提案手法は,MNISTやSVHNなどのデータセットにおいて,悪意のあるデータグループの識別において高い有効性を示した。
    • CIFAR-10やMS COCOといったベンチマークにおいて,既存手法を上回る最先端の結果を達成し,検出率は92%を超えている。

    Link: https://arxiv.org/abs/2512.12827

  • 深層学習とセンシング技術を用いたHRGCの立ち往生リスクのネットワークレベル評価:より安全な未来に向けて [cs.LG, cs.AI]目的:HRGCの立ち往生リスクのネットワークレベル評価フレームワーク
    • 急勾配のHRGCは交通安全上の課題であり,低車高車両の立ち往生事故を防ぐことが重要である。
    • 既存の評価手法では,HRGCのプロファイルデータを正確に把握し,リスクを定量化することが困難であった。
    • 次世代センシング,深層学習,インフラデータ統合による,実用的なリスク評価と対策支援を目指す。
    • HRGCプロファイル再構成には,LSTMとTransformerを組み合わせたハイブリッド深層学習モデルが有効であることが示された。
    • 車両寸法シナリオに基づき,高リスクHRGCがそれぞれ36箇所,62箇所,67箇所特定された。
    • 交通機関が安全対策を講じるためのArcGISデータベースとソフトウェアインターフェースが開発された。

    Link: https://arxiv.org/abs/2512.12832

  • PRIVEE:特徴推論攻撃に対するプライバシー保護型垂直連合学習 [cs.CL, cs.LG, cs.AI]目的:特徴推論攻撃に対するプライバシー保護メカニズムの開発
    • データ活用が進む中で,プライバシー保護とデータ連携の両立が重要である。
    • 垂直連合学習は,プライバシー侵害のリスク,特に特徴推論攻撃に脆弱である。
    • 共有される予測確率からプライベートな特徴量を推論されるリスクを軽減する。
    • PRIVEEは,予測確率を隠蔽しつつ,相対的な順位やスコア間の距離を保持する。
    • 既存の防御策と比較して,プライバシー保護の性能を3倍に向上させる。
    • モデルの予測精度を低下させることなく,高度な特徴推論攻撃に対抗できる。

    Link: https://arxiv.org/abs/2512.12840

  • SAGA:構造化されたアフォーダンスの接地によるオープンワールドモバイルマニピュレーション [cs.RO, cs.AI, cs.LG]目的:多様な環境,タスク目標,ユーザ仕様への汎化能力を有する視覚運動制御フレームワーク
    • ロボットが様々な環境で自律的に動作するためには,環境理解とタスク遂行能力が不可欠である。
    • 従来のロボット制御は特定の環境やタスクに依存しており,汎化性能が低いという課題があった。
    • 環境中のアフォーダンスを構造化することで,汎化性能の高いモバイルマニピュレーションを実現する。
    • SAGAは,言語指示,選択された点,例示データなど,異なる形式で指定されたタスクを統一的に解決できる。
    • SAGAは,マルチタスクのデモンストレーションデータを用いて,全身制御のための条件付きポリシーを効果的に学習する。
    • 実験の結果,SAGAは既存手法と比較して大幅な性能向上を示し,構造化されたアフォーダンス接地が汎用的なモバイルマニピュレーションへの有効な経路であることを示した。

    Link: https://arxiv.org/abs/2512.12842

  • 選択的共形リスク制御 [cs.LG, cs.AI]目的:機械学習システムの信頼性のある不確実性定量化
    • 高リスクな分野での機械学習応用に際し,不確実性の正確な把握が不可欠である。
    • 従来の共形予測は保証されるものの,予測集合が大きくなり実用性に課題があった。
    • 予測集合のサイズをコンパクトに保ちつつ,信頼性の高い不確実性定量化を実現すること。
    • 提案手法SCRCは,選択的分類と共形予測を統合し,不確実性制御を二段階問題として定式化した。
    • SCRC-Tは交換可能性を維持し,厳密な有限サンプル保証を提供する。
    • SCRC-Iは,PACスタイルの確率的保証を持ち,計算効率に優れている。両手法は,目標とするカバレッジとリスクレベルを達成した。

    Link: https://arxiv.org/abs/2512.12844

  • HaShiFlex:微調整の柔軟性を備えた高スループットなハードウェアシフトDNNアクセラレータ [cs.AR, cs.LG]目的:高スループットなDNNアクセラレータの提案
    • エッジデバイスやデータセンターでのAI処理需要が高まっており,高速かつ低消費電力なハードウェアアクセラレータが不可欠である。
    • 汎用的なGPUでは,AIモデルの推論処理に大きな電力消費を伴い,性能が制限される場合がある。
    • モデルパラメータが比較的安定しているタスクにおいて,高いスループットと微調整の柔軟性を両立するアクセラレータを開発する。
    • MobileNetV2を用いた実装により,本アクセラレータはフルプログラマブルなGPUと比較して20倍の推論スループットを実現した。
    • 微調整が不要な場合は,推論スループットは400万画像/秒に向上し,67倍の性能向上が確認された。
    • Po2量子化による乗算の削減と,再構成可能な最終層の組み合わせにより,高性能かつ柔軟な推論処理を可能にした。

    Link: https://arxiv.org/abs/2512.12847

  • KANELÉ:効率的なLUTベース評価のためのコルモゴロフ・アーノルド・ネットワーク [cs.AR, cs.LG, cs.SY, eess.SY, hep-ex]目的:FPGA上での低遅延かつ省リソースなニューラルネットワーク推論の実現
    • リアルタイム性と低消費電力が求められるアプリケーションにおいて,FPGA上でのニューラルネットワーク推論が重要である。
    • 従来のニューラルネットワークは,FPGA実装においてリソース効率や推論速度に課題がある。
    • コルモゴロフ・アーノルド・ネットワークの特性を活用し,FPGA実装における効率を向上させる。
    • KANELÉは,既存のFPGA上でのKAN実装と比較して最大2700倍の高速化と,大幅なリソース削減を実現した。
    • KANELÉは,広く使用されているベンチマークにおいて,他のLUTベースのアーキテクチャと同等またはそれ以上の性能を発揮する。
    • 本フレームワークは,リアルタイムかつ省電力な制御システムへの応用が可能である。

    Link: https://arxiv.org/abs/2512.12850

  • 忘れっぽいけれど忠実:プライバシーを意識した生成エージェントのための認知メモリアーキテクチャとベンチマーク [cs.RO, cs.SY, eess.SY, cs.AI, cs.LG]目的:生成エージェントのメモリ管理
    • 生成エージェントの高度化に伴い,長期的なインタラクションにおいてメモリ管理が重要課題となっている。
    • 既存手法は,無限のメモリを保持するか,単純な忘却メカニズムを用いるため,計算コストやプライバシー問題,またはエージェントの一貫性低下を引き起こす。
    • 性能,プライバシー,計算効率のバランスを取ることで,生成エージェントの人間中心のメモリ管理を実現すること。
    • 本研究では,人間の記憶メカニズムに基づいた新しいメモリ管理フレームワーク「MaRS」と,6つの忘却ポリシーを提案した。
    • 提案手法は,ナラティブの一貫性,目標達成,社会的想起の正確性,プライバシー保護,コスト効率において,優れた性能を示した(総合スコア:0.911)。
    • 本研究は,メモリ予算制約下でのエージェント評価の新たなベンチマークを確立し,プライバシーを重視する環境での実用的なガイドラインを提供する。

    Link: https://arxiv.org/abs/2512.12856

  • グループ相対方策最適化による情報一貫性のある言語モデルの推奨 [cs.LG, cs.AI]目的:言語モデルの一貫性向上
    • 金融,教育,医療など重要分野でのLLM利用が拡大しており,信頼性が不可欠である。
    • LLMは,意味的に同等なプロンプトでも出力が変動し,一貫性の欠如が課題となっている。
    • 意味的に同等なプロンプト群に対し,情報内容の安定性を最適化することで一貫性を解決する。
    • 提案手法であるGRPOは,投資や求人推薦タスクにおいて,ファインチューニングやデコーディングベースラインより効果的に変動を抑制した。
    • GRPOをLLMの情報一貫性への適用は,生成多様性として許容される変動を,企業利用における修正可能な欠陥と捉え直す斬新な試みである。
    • エントロピーに基づく有用性と安定性報酬を導入し,プロンプトのバリエーションをグループとして扱い,文脈をリセットすることで,プロンプト表現の影響を分離した。

    Link: https://arxiv.org/abs/2512.12858

  • 手がかりの数え方:軽量な確率的ベースラインはLLMに匹敵しうる [cs.CE, cs.CL, cs.AI, cs.LG]目的:多肢選択式の臨床診断ベンチマークにおけるLLMの性能の根底にある確率的推論の程度
    • 臨床診断の精度向上は医療の質を改善し,患者の予後を改善するために不可欠である。
    • LLMの診断性能の仕組みが不明であり,単純な頻度集計だけで達成できるか疑問がある。
    • 明示的な確率的ベースラインを提供し,LLMとのハイブリッドによる性能向上を目指す。
    • FBPRは,OLMoとLlamaの事前学習コーパスから得られた共起統計を用いて,対応するLLMと同等の性能を達成した。
    • LLMとFBPRは,正解する問題が大きく異なり,互いに補完的な強みを持つことが示唆された。
    • 単純な頻度集計以外のメカニズムもLLMの性能を支えているが,確率的ベースラインがベンチマーク性能のかなりの部分を説明できる。

    Link: https://arxiv.org/abs/2512.12868

  • 不完全なラベルが存在する場合のアクティブラーニングにおける最適なラベル担当者割り当てとサンプリング [cs.CE, cs.CL, cs.LG, cs.AI, math.OC]目的:不完全なラベルが存在するアクティブラーニングにおけるロバストな分類モデルの構築
    • データラベリングはコストがかかるため,アクティブラーニングは様々な応用分野で重要視されている。
    • ラベル担当者の精度にばらつきがあり,不確実なサンプルは誤ったラベルを受けやすいという問題がある。
    • ラベルノイズの影響を最小限に抑え,分類性能を向上させることを目指す。
    • 提案手法は,各サイクルで最大ノイズレベルを最小化するようなラベル担当者へのクエリポイントの最適な割り当てモデルを含む。
    • 新たなサンプリング手法を導入することで,ラベルノイズが分類器の性能に与える影響を低減する。
    • 実験結果から,提案手法がいくつかのベンチマーク手法と比較して分類性能を大幅に向上させることが示された。

    Link: https://arxiv.org/abs/2512.12870

  • MoLによる再帰型Transformerの性能向上 [cs.LG]目的:再帰型Transformerにおける表現力回復
    • Transformerは自然言語処理の基盤技術であり,その効率化が重要である。
    • 再帰型Transformerはパラメータ数を削減するが,層ごとの表現力が低下する。
    • 共有パラメータ型Transformerの表現力低下を,軽量な機構で回復すること。
    • MoL(LoRAの混合)は,共有FFN内にLoRAエキスパートを挿入する軽量な条件計算機構である。
    • ModernALBERT(50M--120M)は,GLUE,SQuAD-v2,BEIRにおいて最先端の性能を達成した。
    • 推論時にMoLを単一のアダプターに圧縮するエキスパートマージ法を提案し,効率的な展開を可能にした。

    Link: https://arxiv.org/abs/2512.12880

  • マルチスケール切り替え動的システムモデルの教師なし学習:多様式ニューラルデータからのアプローチ [cs.LG, q-bio.NC, stat.ML]目的:マルチスケール切り替え動的システムモデルのパラメータ推定
    • 神経活動の理解は,行動の神経基盤解明に不可欠であり,ブレイン・マシン・インターフェースの性能向上に繋がる。
    • 既存手法は単一のニューラルモダリティに限定され,複数のモダリティを統合的に解析する手段が不足していた。
    • 教師なし学習により,ラベル付け不要で多様式ニューラルデータから動的システムモデルを学習し,行動解読精度を高める。
    • 提案手法は,シミュレーション及び実験データにおいて,単一スケールモデルよりも高い行動解読性能を示した。
    • 定常モデルと比較して,切り替え動的システムモデルは,多様式ニューラルデータの非定常性を捉え,より正確なモデリングを可能にした。
    • 本研究は,ブレイン・マシン・インターフェースの長期的な性能向上と,行動の神経基盤理解に貢献する可能性を示す。

    Link: https://arxiv.org/abs/2512.12881

  • SignRAG:スケーラブルなゼロショット道路標識認識のための検索拡張システム [cs.CV, cs.AI, cs.CL, cs.IR, cs.RO]目的:道路標識のゼロショット認識フレームワーク
    • 自動運転や安全運転支援システムの実現に不可欠な技術である。
    • 標識の種類が膨大であり,網羅的な学習データ作成が困難である。
    • ラベルなしで標識を認識できるスケーラブルなシステムを構築すること。
    • 提案手法は,画像からテキストによる標識の説明を生成し,類似標識を検索する。
    • 大規模言語モデルが検索結果を基に,最終的な標識認識を行う。
    • 理想的な参照画像で95.58%,現実の道路画像で82.45%の精度を達成した。

    Link: https://arxiv.org/abs/2512.12885

  • 離散拡散の正確な条件付き分布マッチングによる蒸留 [cs.LG]目的:カテゴリカルデータの生成モデルである離散拡散モデルの効率的な推論手法
    • 離散データ生成において強力な手法だが,計算コストが高いという課題がある。
    • 従来の高速化手法は近似シミュレーションや代理目的関数に依存しており,精度が十分でない。
    • 条件付き分布のマッチングにより,高精度かつ効率的な蒸留を実現し,計算コストを削減する。
    • 提案手法は,ノイズ状態からクリーンデータへの逆条件付き分布のマルコフ分解を利用する。
    • 周辺密度比と既知のフォワードCTMCカーネルから条件付き分布を復元し,蒸留の目的関数を定義する。
    • 教師モデルと低NFEの生徒モデル間の条件付き分布を,1ステップおよび少ステップサンプラーで直接マッチングする。

    Link: https://arxiv.org/abs/2512.12889

  • 待て,待て,待て… なぜ推論モデルはループするのか? [cs.HC, cs.LG]目的:推論モデルにおけるループ現象の原因と,その対策
    • 複雑な問題を解決するため,推論モデルの活用が重要になっている。
    • 推論モデルは,低い温度や貪欲なデコーディングで同じテキストを繰り返すループに陥りやすい。
    • 学習分布とモデルの学習内容の不一致がループの原因を解明し,その対策を探る。
    • 推論モデルにおいて,低い温度設定でループが発生しやすいことが確認された。
    • モデルの規模が大きいほどループが減少し,蒸留モデルは教師モデルよりもループしやすい傾向がある。
    • 高い温度はループを抑制するが,生成が不必要に長くなるため,根本的な解決策とはならない。

    Link: https://arxiv.org/abs/2512.12895

  • 機械学習に基づく車両安全アプリケーションのための予測占有グリッドの確率推定 [cs.LG]目的:予測占有グリッドの確率推定手法
    • 自動運転や先進運転支援システムの安全性向上に不可欠な,交通状況の予測精度向上。
    • 交通参加者の行動予測には不確実性が伴い,その詳細なモデル化が課題。
    • 機械学習を用いて効率的に予測占有グリッドを計算し,リアルタイム性を実現。
    • モデルベース手法と比較して,機械学習アプローチは計算負荷を大幅に削減できる。
    • 提案手法は,Random Forestアルゴリズムを用いて,現在の交通状況から予測占有グリッドを効率的にマッピングする。
    • シミュレーション結果は有望であり,車両安全アプリケーションにおけるリアルタイム計算を可能にする。

    Link: https://arxiv.org/abs/2512.12896

  • クエリ畳み込み:高周波信号学習に向けた試み [cs.CV, cs.GR, cs.LG]目的:高周波信号の学習性能向上
    • 画像処理やグラフィックスにおいて,高周波信号の正確な学習は重要な課題である。
    • ニューラルネットワークはスペクトルバイアスや最適化の困難さから,高周波信号の学習に苦戦することが多い。
    • 畳み込み演算の近傍特性を活用し,複雑な高周波信号の学習を促進することを目的とする。
    • 提案手法「クエリ畳み込み」は,1D回帰,2D超解像,2D画像回帰,Novel View Synthesisなど,多様な高周波学習タスクにおいて性能向上を実証した。
    • 特に,Gaussian splattingと組み合わせたNovel View Synthesisでは,実世界の複雑なシーンにおいて最先端の性能を示し,強力なRadiance Fieldモデルをも上回る画像品質を実現した。
    • クエリ畳み込みは,低周波信号にクエリ(座標など)を畳み込み,高周波情報の学習を強化する簡潔かつ強力な手法である。

    Link: https://arxiv.org/abs/2512.12898

  • オートエンコーダとランダムフォレストに基づく車両安全アプリケーションのための予測占有グリッド [cs.LG]目的:車両安全アプリケーションにおける複雑な交通シナリオの確率的時空間表現の予測
    • 自動運転技術の発展に伴い,複雑な交通環境下での安全確保が重要課題となっている。
    • 交通参加者の将来行動を正確に予測することが困難であり,安全な走行経路の決定を阻害している。
    • 機械学習を用いて交通シナリオを予測し,車両の安全性を向上させるための手法を確立すること。
    • オートエンコーダとランダムフォレストを組み合わせた手法により,高精度な予測占有グリッドの生成に成功した。
    • 生成された予測占有グリッドは,交通シナリオの危険度評価や安全な経路計画に有効であることが示された。
    • シミュレーションと実車実験の両方で,提案手法の高い性能が確認された。

    Link: https://arxiv.org/abs/2512.12901

  • 次世代リザバーコンピューティングの分類タスクによる検証 [cs.LG]目的:次世代リザバーコンピューティングの性能評価
    • 複雑な時系列データの解析・予測において,新しい計算パラダイムが求められている。
    • 従来のRCは物理的なリザバーが必要で,多種多様な問題への適用が困難であった。
    • NG-RCの汎用性を実証し,予測と分類の両タスクでの有効性を示す。
    • 次世代リザバーコンピューティング(NG-RC)が,従来のRCと同等の分類性能を持つことが示された。
    • NG-RCは,入力データ混合に物理的なリザバーを必要とせず,時系列入力から直接多項式項を計算する。
    • この結果は,NG-RCが予測と分類の両方で優れた計算能力を持つことを示唆している。

    Link: https://arxiv.org/abs/2512.12903

  • 道路交通における予測占有グリッド推定のための機械学習アーキテクチャ [cs.LG]目的:道路交通における予測占有グリッドの推定
    • 自動運転や能動安全システムにおいて,将来の交通状況を正確に把握することが不可欠である。
    • 交通状況の予測は,不確実性を伴う複雑な問題であり,高精度かつ効率的な推定手法が求められている。
    • 交通シナリオのタイプを特定し,現在の状態から将来の状態を予測するアーキテクチャを開発すること。
    • 提案アーキテクチャは,2つのスタックドデノイジングオートエンコーダとランダムフォレストの組み合わせで構成される。
    • シミュレーションによる検証の結果,既存のアーキテクチャと比較して,精度と計算時間の両面で優れていることが示された。
    • 予測占有グリッドは,能動安全システムの分野において様々な応用が期待できる。

    Link: https://arxiv.org/abs/2512.12907

  • CTIGuardian:ファインチューニングされたLLMにおけるプライバシー漏洩を軽減するためのFew-Shotフレームワーク [cs.CR, cs.AI, cs.LG]目的:ファインチューニングされたLLMにおけるプライバシー漏洩の軽減
    • LLMは多様なタスクに適応できる強力なツールであり,特に専門分野での活用が期待されている。
    • ファインチューニングには機密情報を含むデータが用いられることがあり,情報漏洩のリスクが存在する。
    • 少数の事例による指導でプライバシー保護を強化し,効率的な漏洩軽減を目指す。
    • CTIGuardianは,GPT-4o miniやMistral-7B Instructモデルにおいて,NERベースのモデルよりも優れたプライバシーと有用性のトレードオフを実現した。
    • 本フレームワークは,サイバー脅威インテリジェンス(CTI)分野での有効性が示されたが,他の機密性の高い分野にも応用可能である。
    • データ抽出攻撃に対して,ファインチューニングされたモデルからの機密情報回収のリスクを軽減できることが示された。

    Link: https://arxiv.org/abs/2512.12914

  • 理論充足性モダロと帰納論理計画 [cs.AI]目的:数値制約を含む関係領域における解釈可能なルール学習
    • データから知識を発見する機械学習は,様々な分野で活用が期待されている。
    • 従来の帰納論理計画法では,数値制約の扱いに限界があり,離散化や手動での制約定義が必要であった。
    • SMTソルバとの連携により,数値制約を効率的に学習し,表現力豊かなルールを導くことを目指す。
    • PyGolとZ3を組み合わせたモジュール型SMT-ILPアーキテクチャを提案した。
    • 提案手法は,線形,非線形,関係性,多段階推論を含む合成データセットで評価された。
    • 記号的ルール学習の表現力を拡張し,数値制約と関係的制約を組み合わせたハイブリッドルールの学習を可能にした。

    Link: https://arxiv.org/abs/2512.12918

  • シスコ統合AIセキュリティ&セーフティフレームワーク報告書 [cs.CY, cs.CR, cs.AI]目的:AIリスクの分類,統合,運用化のための統一的かつライフサイクルを考慮したフレームワーク
    • AI技術の急速な普及に伴い,社会への貢献が期待される一方,新たな脅威の発生が懸念される。
    • 既存のフレームワークは,AIリスクの多次元的な側面を網羅的にカバーできていないという課題がある。
    • 現代のAIシステムの脆弱性,攻撃手法を構造的に理解し,ライフサイクル全体にわたる防御策を構築すること。
    • 本研究では,シスコの統合AIセキュリティ&セーフティフレームワークを提示し,AIセキュリティとAIセーフティを統合的に扱うことを可能にする。
    • 既存のフレームワークのギャップを分析し,設計原則を議論することで,AIシステムの失敗様式と攻撃手法の理解を深める。
    • このフレームワークは,脅威の特定,レッドチーム活動,リスクの優先順位付けなど,実践的な応用が可能である。

    Link: https://arxiv.org/abs/2512.12921

  • LLMベースのパーソナライズされたポートフォリオ推奨システム:大規模言語モデルと強化学習を用いたインテリジェントな投資戦略の最適化 [cs.LG]目的:パーソナライズされたポートフォリオ戦略の最適化
    • 現代の金融市場では,個人のリスク許容度に応じた投資戦略が重要視されている。
    • 従来の投資手法では,投資者の行動,市場変動,金融目標の複雑な相互作用を捉えきれない。
    • 投資家の行動と市場の変化に対応した,より高度な投資意思決定支援を目指す。
    • 本研究では,大規模言語モデル,強化学習,および個別リスク選好モデリングを統合したフレームワークを提案する。
    • これにより,投資家の行動や市場の状況変化に適応した,パーソナライズされたポートフォリオ戦略の最適化が可能となる。
    • 提案手法は,従来の投資手法の限界を克服し,インテリジェントな投資意思決定を支援するものと期待される。

    Link: https://arxiv.org/abs/2512.12922

  • MADTempo:クエリ拡張を用いたマルチイベント時系列ビデオ検索インタラクティブシステム [cs.DC, cs.CV, cs.AI]目的:マルチイベント時系列ビデオ検索のための手法
    • オンライン動画コンテンツの急増により,単独の視覚的瞬間だけでなく,複雑なイベントの時間的構造を理解できる検索システムの必要性が高まっている。
    • 既存の手法は,複数のイベント間の時間的依存関係のモデリングや,未観測または稀な視覚概念を参照するクエリへの対応が不十分である。
    • 本研究では,時間的検索と大規模なWebスケールでの視覚的根拠付けを統合し,より高度な時系列推論と汎化能力を実現することを目指す。
    • MADTempoは,連続するビデオセグメント間の類似度スコアを集約することで,イベントレベルの連続性を捉え,マルチイベントクエリの一貫性のある検索を可能にする。
    • Google画像検索に基づくフォールバックモジュールは,外部のWeb画像でクエリ表現を拡張し,事前学習済みの視覚埋め込みのギャップを埋め,OODクエリに対するロバスト性を向上させる。
    • これらの要素を組み合わせることで,大規模ビデオコーパスにおける,より意味的に認識され適応的な検索が可能になる。

    Link: https://arxiv.org/abs/2512.12929

  • 低ビット推論のための階層型グループ量子化とSVDガイド混合精度による異種TransformerアクセラレータSeVeDo [cs.LG, cs.AR]目的:低ビット推論における効率的なTransformer処理の実現
    • Transformerモデルの推論は計算コストが高く,省電力化が重要な課題となっている。
    • 低ビット量子化による精度劣化が問題であり,特に外れ値の影響が大きい。
    • 外れ値の影響を抑えつつ,エネルギー効率の高いTransformer推論を実現すること。
    • SeVeDoは,外れ値に敏感な部分を高精度で処理し,残りを低ビットで処理する異種アクセラレータである。
    • 階層型グループ量子化により,逆量子化コストを削減し,SVDガイド混合精度により,重要部分に高いビット幅を割り当てている。
    • ViT-BaseおよびLlama2-7Bのベンチマークにおいて,従来の設計を上回るエネルギー効率を実現した。

    Link: https://arxiv.org/abs/2512.12930

  • 大規模な生物学的基盤モデルの事前学習におけるデータ剪定の調査 [cs.LG, cs.AI, cs.CE]目的:生物学的基盤モデルの事前学習におけるデータ剪定の実現可能性
    • 生物学的基盤モデルは,様々なバイオインフォマティクス課題で有用な表現を提供する可能性を秘めている。
    • モデルの規模が大きく,計算コストが高く,再現性やアクセシビリティが課題となっている。
    • データ剪定によって計算コストを削減し,より効率的な研究を可能にすること。
    • 提案手法は,RNA-FMにおいて99%を超える剪定率下でランダム選択よりも優れた性能を示した。
    • ESM-Cを用いたタンパク質関連タスクにおいても,本手法の汎用性が確認された。
    • データセットには冗長性が多く,影響に基づいたデータ剪定が計算コストを大幅に削減できることが示唆された。

    Link: https://arxiv.org/abs/2512.12932

  • カスケード埋め込み-再ランク付けと時間認識スコア融合による統一的なインタラクティブ多Modalモーメント検索 [cs.CV, cs.AI, cs.IR]目的:効率的な多Modalモーメント検索システムの実現
    • 動画コンテンツの爆発的な増加により,効率的な検索システムの必要性が高まっている。
    • 既存手法は,Modal間のノイズや曖昧なクエリへの対応,時間的な一貫性の維持に課題がある。
    • 曖昧なクエリへの対応,時間的な一貫性の確保,動的な融合戦略により検索能力を向上させる。
    • 提案システムは,曖昧なクエリを効果的に処理し,時間的に一貫性のあるシーケンスを検索できる。
    • カスケード埋め込み-再ランク付けパイプラインにより,幅広い検索と精度向上を両立している。
    • Agentによるクエリ分解により,手動でのModal選択を不要とし,適応的なスコア融合を実現している。

    Link: https://arxiv.org/abs/2512.12935

  • 学習型ビデオ圧縮のためのコンテンツ適応型モーションアライメントフレームワーク [cs.CV, cs.AI]目的:コンテンツ適応型モーションアライメントフレームワークの開発
    • ビデオ圧縮は,通信・保存容量の効率化に不可欠であり,その重要性は増している。
    • 汎用的なフレームワークでは,コンテンツ特有の適応が不足し,圧縮性能が最適化されない場合がある。
    • 多様なコンテンツ特性に適応し,より高効率なビデオ圧縮を実現することを目的とする。
    • 提案手法CAMAは,標準的なテストデータセットにおいて,最先端のニューラルビデオ圧縮モデルと比較して大幅な性能向上を示した。
    • ベースラインモデルDCVC-TCMに対して,BDレート(PSNR)で24.95%の削減を達成した。
    • また,DCVC-DCや従来のコーデックHM-16.25を上回る性能を示した。

    Link: https://arxiv.org/abs/2512.12936

  • 時間変化する持続ホモロジー図の連続編集距離,測地線,および重心 [cs.IR, cs.CG, cs.CV, cs.GR, cs.LG]目的:時間変化する持続ホモロジー図に対する測地線距離
    • データ解析において,時間変化するデータの形状を捉えることは重要である。
    • 既存の距離測度は,時間的なずれやノイズに弱いという問題があった。
    • 時間変化する持続ホモロジー図の比較やクラスタリングをよりロバストに行う。
    • 連続編集距離(CED)は,時間的および空間的な摂動に対してロバストであることが示された。
    • CEDに基づく重心を用いたクラスタリングは,既存の手法と同等以上の性能を発揮する。
    • CEDは,時間変化する持続ホモロジー図の解析に,原理に基づいた距離,解釈可能な測地線,および実用的な重心を提供する。

    Link: https://arxiv.org/abs/2512.12939

  • グラフ畳み込みネットワークが有効となる条件の理解:ラベル不足と構造的特性に関する診断研究 [cs.LG, stat.AP, stat.ML]目的:グラフ畳み込みネットワークの有効性に関する条件の解明
    • グラフ構造データ分析は,複雑な関係性を捉え,多様な分野で活用が期待されている。
    • グラフ畳み込みネットワークの適用条件が明確でなく,単純な手法との比較が困難である。
    • ラベル不足やグラフ構造,特徴量の質がGCNの性能に与える影響を明らかにすること。
    • GCNは,ラベルが極端に不足している場合に,近傍構造を活用することで有意な改善が見られた。
    • 高いホモフィリーを持つグラフにおいては,ノードの特徴量をランダムノイズに置き換えても,GCNは元の性能を維持し,グラフ構造のみで十分な信号が得られることが示唆された。
    • ホモフィリーが低く特徴量が強い場合,GCNはノイズの多い近傍により性能が低下することが判明した。

    Link: https://arxiv.org/abs/2512.12947

  • ゼロから構築:多言語法律用語マッピングのための人間とAIが連携するマルチエージェントフレームワーク [cs.DC, cs.CL, cs.AI]目的:多言語法律用語マッピングのためのマルチエージェントフレームワークの構築
    • 法曹関係では,国際的な協力が不可欠であり,正確な用語対応が重要である。
    • 中国語と日本語のように同音異義語が多い言語ペアでは,用語マッピングが困難である。
    • 人間とAIの協調により,多言語法律用語データベースの構築を効率化し,精度を高める。
    • 提案フレームワークは,OCRやテキスト分割などの反復作業をAIエージェントが担当し,専門家は文脈に基づいた検証と監督を行う。
    • 中国語の主要な法律35件とその英訳・日訳を用いた実験で,このフレームワークの有効性が示された。
    • 本手法は,従来の人的手法と比較して,マッピングの精度と一貫性を向上させ,スケーラビリティも高い。

    Link: https://arxiv.org/abs/2512.12950

  • デジタルフォレンジックにおける体系的複雑性に対するオープンスタンダード [cs.CL, cs.AI, cs.CY]目的:デジタルフォレンジックにおける体系的複雑性への対処
    • AIとデジタルフォレンジックの融合が進み,科学捜査の信頼性が重要視されている。
    • デジタルフォレンジックはエラーや誤りに弱く,客観性と再現性に課題がある。
    • 体系的複雑性を認識し,オープンスタンダードと可読性のある成果物でエラーを軽減する。
    • AIとデジタルフォレンジックの交差点における複雑性を体系的に分析した。
    • エラー軽減のため,可読性のある成果物とオープンスタンダードの採用が重要である。
    • 最新技術に基づいたDF AIモデルのスキーマを提案した。

    Link: https://arxiv.org/abs/2512.12970

  • 深層学習を用いた生物学的データ圧縮への応用 [eess.SY, cs.SY, cs.LG, cs.IT, math.IT]目的:深層学習によるクライオ電子顕微鏡データの圧縮方法
    • クライオ電子顕微鏡は高分解能な生物構造解析に不可欠であり,生命科学研究の進展に貢献している。
    • クライオ電子顕微鏡データのファイルサイズは極めて大きく,研究者や教育者にとって保管・共有が困難である。
    • 効率的なデータ圧縮手法を確立し,データ管理の負担を軽減し,研究の加速を目指す。
    • 暗黙的ニューラル表現(INR)を用いた圧縮により,高い圧縮率と再構成品質を両立しうることを示した。
    • 位置エンコーディングと重み付き平均二乗誤差損失関数を導入することで,再構成精度が向上した。
    • 本手法は,研究および教育目的における実用的な生物学的データ圧縮ソリューションとなりうる。

    Link: https://arxiv.org/abs/2512.12975

  • CoDeQ:高疎性・低精度ネットワークのためのデッドゾーン量子化器を用いたエンドツーエンド結合モデル圧縮 [cs.IR, cs.IR, cs.DB, cs.LG, stat.ML]目的:高疎性・低精度ネットワークを実現するための結合モデル圧縮手法
    • 深層学習モデルの効率化は,モバイルデバイス等での利用を可能にする上で重要である。
    • 従来の結合圧縮手法は,圧縮パラメータ探索に外部の追加処理が必要であり,複雑性が高い。
    • CoDeQは,量子化演算子内で直接疎性を誘導し,データ駆動的な最適化を実現する。
    • CoDeQは,量子化器のデッドゾーン幅を学習することで,エンドツーエンドで結合プルーニングと量子化を同時に行う。
    • ImageNetとResNet-18を用いた実験で,演算量を約5%に削減しつつ,高い精度を維持した。
    • 固定精度および混合精度量子化をサポートし,シンプルな実装で様々なアーキテクチャに適用可能である。

    Link: https://arxiv.org/abs/2512.12981

  • VoroLight:汎用入力からの高品質ボロノイメッシュ学習 [cs.CG, cs.CV, cs.GR, cs.LG, math.OC]目的:3D形状再構成のためのボロノイメッシュ生成手法
    • 3D形状の表現は,コンピュータグラフィックスやロボティクスなど幅広い分野で重要である。
    • 既存手法では,多様な入力に対応しつつ,滑らかで watertight な形状を生成することが難しい。
    • 多様な入力から高品質なボロノイメッシュを生成し,3D形状再構成の精度向上を目指す。
    • 本研究では,画像,陰関数,点群,メッシュといった多様な入力から直接,滑らかで watertight な形状を生成する VoroLight を提案する。
    • VoroLight は,微分可能なボロノイ表現を初期化に利用し,polygon-face sphere training で表面品質を向上させる。
    • さらに,内部生成点を利用した体積最適化により,ボロノイ表現を再利用することで,より高品質なメッシュを生成する。

    Link: https://arxiv.org/abs/2512.12984

  • 雪上における課題への取り組み:ロバストな強化学習による安全な自律車線維持 [cs.RO, cs.AI, cs.CV, cs.LG]目的:雪上路面における自律走行車の車線維持システムのアルゴリズム
    • 自動運転技術は,交通安全の向上や移動の効率化に不可欠である。
    • 雪上路面は,車両の制御を困難にする滑りやすさなどの問題がある。
    • 雪上路面における車両の安定性と安全性を向上させることを目指す。
    • 本研究では,深層強化学習を用いた2つの新しいアルゴリズムを提案した。
    • AR-CADPGは,AR-RDPGよりも優れた経路追跡精度とロバスト性を示した。
    • シミュレーションと実車実験により,提案手法の有効性と安定性が確認された。

    Link: https://arxiv.org/abs/2512.12987

  • ゼロショット敵対的CLIPの不確実性調整 [cs.AR, cs.RO, cs.CV, cs.AI, cs.LG]目的:ゼロショット敵対的CLIPにおける不確実性調整
    • 画像認識の信頼性向上は,安全性が求められる応用において不可欠である。
    • 敵対的攻撃に対する脆弱性が,CLIPモデルの信頼性を損なう。
    • 不確実性調整を通じて,敵対的攻撃下での信頼性と汎化性能を改善する。
    • 敵対的微調整の目的関数に不確実性調整項を加えることで,精度と不確実性の両方を改善した。
    • 出力層をディリクレ分布の集中パラメータとして再表現することで,意味構造と予測確信度を統合的に捉えた。
    • 複数のゼロショット分類ベンチマークにおいて,本手法は校正された不確実性を回復し,高い敵対的ロバスト性とクリーンな精度を達成した。

    Link: https://arxiv.org/abs/2512.12997

  • 深層学習駆動ひずみ弾性率推定フレームワーク (DIME) [cs.RO, cs.LG, q-bio.TO]目的:磁気共鳴エラストグラフィーにおけるひずみ弾性率推定
    • 生体組織の力学特性把握は,疾患診断や治療効果判定において重要である。
    • 従来のMMDI法はノイズに弱く,均質でない組織での推定精度に課題があった。
    • 深層学習を用いて,ノイズに強く,高精度なひずみ弾性率推定を目指す。
    • DIMEは,有限要素法シミュレーションデータにおいて,MMDIと比較して低い画素間変動と正確な境界描画を示した。
    • シミュレーションされた肝臓データにおいて,DIMEは真値に近いひずみ弾性率パターンを再現し,MMDIよりも正確であった。
    • 生体肝臓データにおいても,DIMEは生理学的に整合性のあるパターンを示し,MMDIに見られる方向性バイアスを軽減した。

    Link: https://arxiv.org/abs/2512.13010

  • 深層学習 기반 mmWaveレーダーセンシングにおける環境汎化のための包括的な展開志向評価 [cs.CV, cs.LG]目的:深層学習に基づくmmWaveレーダーセンシングにおける環境汎化技術の評価
    • 深層学習を用いた無線センシングは,様々な応用において重要性が増している。
    • 異なる環境間での汎化性能は,実用化における大きな課題となっている。
    • 本研究は,環境変化に対応可能なロバストなレーダーセンシングシステムの開発を目指す。
    • シグモイド関数を用いた振幅重み付けは,他の手法と比較して一貫して優れた環境汎化性能を示した。
    • データ拡張は,平均絶対誤差を最大8.8%改善する追加的な効果をもたらした。
    • 大規模な空間シフトに対しては,転移学習が不可欠であり,RMSEとMAEをそれぞれ82.1%,91.3%削減した。

    Link: https://arxiv.org/abs/2512.13018

  • Motus:統一された潜在行動世界モデル [eess.SY, cs.SY, cs.CV, cs.LG, cs.RO]目的:統一された潜在行動世界モデルの構築
    • 汎用的な具現化エージェントには統合的なシステムが不可欠であり,その実現が求められている。
    • 既存手法は,知覚,世界モデル,制御といった機能を分離しているため,マルチモーダルな生成能力の統合が困難である。
    • 大規模異種データからの学習を可能にする,統一的なモデルの構築を目指す。
    • Motusは,既存の事前学習済みモデルと豊富なモーション情報を活用したMixture-of-Transformer (MoT) アーキテクチャを導入した。
    • シミュレーション環境において,X-VLAやPi0.5と比較してそれぞれ+15%,+45%の性能向上を達成した。
    • 実世界においても+11~48%の性能向上を示し,統合的なモデル化が下流のロボットタスクに貢献することが示された。

    Link: https://arxiv.org/abs/2512.13030