arXiv雑要約
AI - 2026/05/15 公開
将来の圧縮進歩のための誘導的ヒューリスティックとしての興味深さ [cs.HC, cs.AI, cs.LG]目的:将来の圧縮進歩の可能性を持つタスクやデータを見出す能力
- 自己改善システムの実現には,将来的な進歩の可能性を判断する能力が不可欠である。
- 既存の手法では,将来の進歩につながる可能性のあるタスクやデータを効率的に特定できない。
- 興味深さを,将来の圧縮進歩を予測する誘導的ヒューリスティックとして形式化し,その有効性を検証する。
- 興味深さの誘導性,すなわち過去の進歩が将来の発見を予測できる性質が理論的にも実験的にも支持された。
- 期待される将来の進歩は,最後に観測されたブレークスルーの鮮度に応じて指数関数的に変化する。
- アルゴリズム的事前分布は,長さ事前分布よりも楽観的であり,同じ観測プロファイルに対して期待される発見が2乗増加する。
感情に注意した状態保持型メモリ(EASM):大規模ハイパーパーソナライゼーションのためのアーキテクチャ [cs.AI, cs.HC]目的:大規模ハイパーパーソナライゼーションを実現するためのアーキテクチャ
- 対話型AIの発展において,ユーザーとの継続的な関係構築が重要となる。
- 既存の言語モデルはセッション間で状態を保持できず,長期的なユーザー理解が困難である。
- ユーザーの状態と感情を考慮した状態保持型メモリによる対話の質の向上を目指す。
- 感情に注意した状態保持型メモリは,従来のステートレスな基盤モデルと比較して,一貫して性能が向上した。
- 特に,メモリの根拠 (95%改善),計画の明確性 (57%),感情的な妥当性 (34%) において顕著な改善が見られた。
- 悲しみや苦痛などの感情的に困難な対話においても,一貫した結果が得られた。
多値決定変数に対する多目的進化アルゴリズムの数学的実行時間解析 [cs.NE]目的:多値決定変数を持つ多目的最適化問題に対する多目的進化アルゴリズムの実行時間解析
- 多目的進化アルゴリズムは,複雑な最適化問題の解決に不可欠であり,現実世界の様々な問題に応用されている。
- 二値決定変数に対する研究は進んでいるが,多値決定変数に対する数学的解析は未だ確立されていない。
- 古典的なSEMOアルゴリズムの実行時間を解析し,多値決定変数がアルゴリズムの効率に与える影響を明らかにする。
- 関数評価回数の期待値について,$O(n^2 r^2 \log n)$ の上限と $\Omega(n^2 r (r + \log n))$ の下限が証明された。
- 厳密に優位な解のみを受け入れるアルゴリズム変種に対して,$O(n^2 r (r + \log n))$ の上限が示され,下限と一致した。
- 古典的なMOEAは,多値決定変数を扱う際に大きな困難を抱えることはないことが示唆された。
エネルギー効率と干渉を考慮したGNSS信号の圧縮センシングのためのGenAI:Google Edge TPUへの応用 [cs.LG, eess.SP]目的:GNSS信号のリアルタイム干渉分類と圧縮
- GNSSは,位置情報サービスの基盤であり,その安定稼働は社会インフラ維持に不可欠である。
- GNSS信号の妨害は増加傾向にあり,クラウドへのデータ送信によるコストと遅延が課題となっている。
- 本研究は,エッジデバイスでのリアルタイム干渉分類とデータ圧縮を実現し,その課題を解決する。
- 生成AIを活用し,GNSS信号の圧縮率42倍以上を達成し,エネルギー効率の良い干渉分類を可能にした。
- 再構成された信号に対する干渉種類の分類精度はF2スコア0.915であり,元の信号と同等の精度(F2スコア0.923)を示した。
- 妨害信号の伝送コストを大幅に削減し,実用的な干渉対策ソリューションを提供することに貢献する。
データ駆動型検閲在庫管理のための文脈内学習 [cs.LG, math.OC, stat.ML]目的:検閲を伴う在庫管理における意思決定の最適化
- 在庫管理はサプライチェーンにおいて重要な役割を担い,経済的損失の低減に貢献する。
- 従来の在庫管理手法は,需要予測の不確実性や検閲メカニズムの複雑さへの対応が課題であった。
- 本研究は,文脈内学習を用いて需要予測の不確実性を克服し,検閲下での在庫管理を改善することを目指す。
- 提案手法ICGPSは,事前分布の不一致に強く,オンライン学習への転移が容易であることが示された。
- 理論的に,ICGPSのベイズ後悔は,理想的なcompletionカーネルを持つTSベンチマークのベイズ後悔に比例することが証明された。
- 実験的に,ChronosFlow-ICGPSは既存手法を上回り,実データセットにおいても良好な性能を示した。
GPart:グローバルパラメータ分割によるエンドツーエンド等距微調整 [cs.LG, cs.AI]目的:大規模言語モデルのパラメータ効率的な微調整手法
- 大規模言語モデルの利用拡大のため,計算資源を抑えた微調整が重要である。
- LoRAなどの既存手法は,最適化空間を歪ませる等距性の問題を抱えている。
- 等距性を維持しつつ,より効率的な微調整を実現することを目指す。
- GPartは,低ランクボトルのネックを完全に除去し,パラメータ効率を大幅に向上させる。
- 単一の等距分割行列を用いて,低次元ベクトルをモデルの全重み空間へ直接マッピングする。
- 自然言語理解,コンピュータビジョン,数学的推論タスクにおいて,既存手法と同等またはそれ以上の性能を示す。
XFP:LLM推論のための品質目標適応コードブック量子化と疎な外れ値分離 [cs.LG, cs.AI]目的:LLM推論における動的な重み量子化手法
- 大規模言語モデルの利用拡大に伴い,メモリ使用量と計算コストの削減が重要課題となっている。
- 従来の量子化手法では,性能維持のためにハイパーパラメータの調整やキャリブレーションデータが必要となる。
- 演算者が指定する再構成品質の制約を満たしつつ,自動的に量子化パラメータを決定する手法を開発する。
- XFPは,ワークステーション環境でQwen3.5-122B-A10Bにおいて,94.49%のGSM8K厳密一致率を達成し,Marlin INT4と比較して49%高速化された。
- メモリ容量を超えるモデルに対しては,H-Processを用いて,モデルが許容可能な出力生成を維持しつつ,メモリに収まる最適な量子化設定を探索する。
- Qwen3.5-397B-A17Bでは,H-Processにより,フルエキスパート集団を2x96GBに収め,100.9 tok/sの長出力デコード速度と66.72%のGSM8K厳密一致率を達成した。
IFPV:生成的な作戦計画と高精度計画検証のための統合マルチエージェントフレームワーク [cs.MA, cs.AI]目的:作戦計画の生成と検証
- 現代の複雑かつ変化の激しい戦場環境において,作戦計画は不可欠である。
- 従来の計画生成・検証手法は,計画の実現可能性や検証の不十分さという課題を抱えている。
- 生成と検証の課題を克服し,より堅牢な作戦計画を立案・検証すること。
- IFPVは,生成的な作戦計画作成のためのマルチエージェントと,高精度な敵対的計画検証エンジンを統合している。
- シミュレーション実験の結果,IFPVは従来のLLMベースの計画立案と比較して,任務成功率を19.4%向上させ,運用コストを41.7%削減した。
- また,従来のルールベース検証器と比較して,ACSEは平均抑制率を31.8%向上させ,計画の潜在的な脆弱性をより明確に示した。
FactorizedHMR:ビデオにおける人体メッシュ復元のハイブリッドフレームワーク [cs.IR, cs.CV, cs.AI]目的:ビデオから人体メッシュを復元する手法
- ビデオにおける人体姿勢推定は,行動認識や人間とのインタラクションにおいて重要である。
- 人体の一部が隠れていたり,奥行き情報が不十分な場合,姿勢推定が曖昧になりやすい。
- 体幹部と四肢部で推定の確実性が異なる点に着目し,よりロバストな姿勢推定を目指す。
- 本研究では,まず体幹部と根幹構造を決定的に推定し,次に確率的なフローマッチングを用いて残りの関節を推定する二段階フレームワークを提案する。
- 合成データパイプラインを導入し,多様な視点からの画像-カメラ-モーションのペアによる学習を実現した。
- 実験結果から,特に遮蔽物の多い状況や,ドリフトに敏感なワールド空間での性能が向上することが示された。
動的な運動予測における隠れた文脈の活用:RNNからグラフニューラルネットワーク,汎用トランスフォーマーへの道のり [cs.LG, cs.AI, eess.SP]目的:動的な運動予測におけるモデルの性能評価と,文脈情報の活用に関する研究
- 信号処理パイプラインにおいて,遅延を軽減するための予測は不可欠である。特に,NBA選手の動きのような動的対象の予測が重要となる。
- 従来の線形モデルは,スポーツにおける非線形な運動を捉えるのが困難である。機械学習モデルも,時間依存性と文脈的相互作用を十分に捉えられていない。
- 本研究は,様々なモデルの性能を評価し,文脈情報を組み込むことで予測精度を向上させることを目指す。
- 機械学習ベースの手法は,最長2秒の予測期間において,線形モデルと比較して大幅な改善を示した。
- 文脈情報を付加したハイブリッドLSTMは,FDEを1.51mに抑え,TCNN,GAT,Transformersよりも優れた性能を発揮し,学習時間も短縮された。
- 特定のタスクに応じてアーキテクチャを選択する必要性を示唆しており,汎用的な最適解は存在しない。
HS関税分類のための決定論的エージェントワークフロー:解釈可能な意思決定による多次元ルール推論 [cs.AI, cs.IR]目的:HS関税分類の多次元ルール推論の実現
- 国際貿易において,正確なHS関税分類は通関手続きや関税額の決定に不可欠である。
- 既存のHS関税分類は,専門知識を必要とし,ルール間の優先順位付けが複雑である。
- 多次元ルール推論を組み込み,解釈可能な意思決定を行うワークフローを開発し,分類精度向上を目指す。
- 提案手法は,HSCodeCompデータセットにおいて,4桁レベルでトップ1精度75.0%,トップ3精度91.5%を達成した。
- 6桁レベルでは,トップ1精度64.2%,トップ3精度78.3%をQwen3.6-plusで実現し,高い性能を示した。
- HSCodeCompの正解ラベルがHS一般規則と乖離している可能性が示唆され,コミュニティによる検証のための資料が公開された。
コーディングエージェントは最小権限の認可を理解しているか [cs.CR, cs.AI]目的:コーディングエージェントにおける最小権限の認可の理解度評価
- エージェントの普及に伴い,安全な展開には最小権限の認可が不可欠となる。
- 既存モデルはタスクに必要な権限と不要な権限の境界を自律的に推論できない。
- エージェントの権限付与における過不足を解消し,安全性を高めることを目指す。
- AuthBenchを用いての評価により,既存モデルは必要な権限を省略し,不要なアクセスを許可する傾向があることが示された。
- Sufficiency-Tightness Decompositionにより,機密性の高いタスクの成功率が最大15.8%向上し,攻撃成功率が低下した。
- 直接的なポリシー生成がボトルネックであり,推論時間の増加だけでは課題は解決しない。
AIエージェントの包括的評価と障害診断 [cs.DC, cs.AI, cs.CL]目的:AIエージェントの評価に関するフレームワーク
- AI技術は多様な分野で活用が拡大しており,その性能評価は不可欠である。
- 従来の評価手法では,成功/失敗の理由が不明瞭であり,詳細な原因特定が困難である。
- 長大な処理履歴から,障害箇所と種類を正確に特定する評価手法を開発すること。
- 提案フレームワークは,トップダウン診断とボトムアップ評価を組み合わせることで,包括的な評価を実現した。
- TRAILベンチマークにおいて,既存手法を最大38%上回るカテゴリF1スコアを達成した。
- 局所化精度は最大3.5倍,同時局所化・分類精度は最大12.5倍向上し,他の評価手法よりも多くのエラーカテゴリで優位性を示した。
マイクロサービスにおける多エージェント再帰的思考による深層的な根本原因特定への試み [cs.SE, cs.AI]目的:マイクロサービスにおける根本原因特定
- 現代のシステムはマイクロサービス化が進み,複雑性が増しているため,信頼性確保が重要である。
- 従来の機械学習手法は解釈性が低く,異なる環境への適用が困難であるという課題があった。
- 文脈の希薄化と逐次的な推論構造による因果探索の限界を克服し,根本原因特定を改善する。
- RCLAgentは,分散トレースグラフに基づいてエージェントを再帰的かつ並列に構成することで,文脈の希薄化を抑制する。
- 複数のパブリックベンチマークにおいて,既存手法を凌駕する根本原因特定精度と推論効率を実現した。
- RCLAgentは,人間のSREの根本原因特定プロセスを参考に,多エージェント再帰的思考を実現している。
REALM: LFPモデリングのためのレトロスペクティブエンコーダアラインメント [cs.LG, cs.AI, q-bio.NC]目的:LFP(局所場電位)を用いた行動復号の性能向上
- 脳コンピュータインターフェース(BCI)の高度化に伴い,低消費電力で安定した信号処理が重要になっている。
- LFPはスパイク信号と比較して復号精度が低い場合があり,リアルタイム処理に適さないアーキテクチャに依存しやすい。
- オフライン学習で高精度なモデルを構築し,その知識をリアルタイム処理可能なモデルに転移することで,この問題を解決する。
- REALMは,事前学習済みの双方向LFPモデルから知識を蒸留することで,因果的なLFP復号を可能にする。
- 実験の結果,REALMは既存のLFPベースの復号手法よりも高い性能を示し,パラメータ数と学習時間を大幅に削減した。
- これらの結果は,レトロスペクティブ蒸留がオフラインとリアルタイムのニューラル復号間のギャップを埋める有効な手法であることを示唆する。
勾配予測による高速な敵対的攻撃 [cs.LG]目的:敵対的サンプル生成の高速化
- 機械学習モデルの頑健性評価は重要であり,敵対的攻撃はその評価手法の一つである。
- 従来の敵対的攻撃は,逆伝播計算のコストが高く,処理速度が課題であった。
- 順伝播の隠れ層の状態から勾配を予測し,逆伝播を不要にすることで高速化を図る。
- 提案手法は,FGSMと同等の攻撃性能を,より大幅に短い時間で実現した。
- 処理速度は,FGSMの532%増となり,敵対的サンプル生成の大幅な高速化に貢献する。
- この結果は,現実的な時間制約下で敵対的サンプルを生成するためのシンプルかつ一般的な手法を示唆している。
閉ループ検証推論による複雑な画像生成の解禁 [cs.CV, cs.AI]目的:複雑な画像生成における課題克服
- 画像生成技術は急速に進歩しているが,複雑な意味表現が困難である。
- 既存手法は,根拠のない計画や,長いコンテキストでの最適化の不安定性といった問題を抱えている。
- 視覚言語論理計画とピクセルレベル拡散生成を深く結びつけることで,これらの課題を解決する。
- 提案手法CLVRは,既存のオープンソースモデルを上回り,商用モデルに匹敵する性能を実現した。
- 自動データエンジンとステップレベルの視覚的検証により,信頼性の高い推論軌跡を合成する。
- $\Delta$-Space Weight Merge (DSWM)により,推論コストを大幅に削減し,効率的な画像生成を可能にした。
マルチエージェントシステムにおける時間的公平分割:正確な交互性指標からスケーラブルな協調プロキシへ [cs.MA, cs.MA, cs.GT, cs.LG]目的:時間的公平分割の理論発展
- 資源配分における公平性は,社会的な調和と効率的な協調を促進する上で重要である。
- 反復的な資源獲得競争において,従来の公平性指標では協調の失敗を捉えきれない場合がある。
- 時間経過を考慮した公平性評価指標を開発し,スケーラブルな協調メカニズムを構築することを目指す。
- 本研究で提案するRotational Periodicity (RP) は,ALTと比較して計算速度が12~25倍向上する。
- Q-learningエージェントは,RPおよびALT指標においてランダムポリシーよりも劣る傾向が確認された。
- RPとALTは,それぞれ小規模集団と大規模集団で異なる特性を示すため,診断ツールキットとして活用できる。
空間認識型ノイズ除去によるガウススプラッティング [cs.CV, cs.GR, cs.LG]目的:3Dガウススプラッティングにおけるガウス素子のノイズ除去
- 3Dシーンの忠実な再現は,仮想現実やロボティクスなど様々な分野で重要性が増している。
- SfM点群からの初期化が不完全なため,3DGSの最適化過程でノイズが発生しやすい。
- ガウス素子の位置と空間構造を考慮し,ノイズを効果的に除去することでNVSの品質向上を目指す。
- Denoising-GSは,ガウス素子の位置と空間構造を考慮した空間認識型ノイズ除去フレームワークである。
- 空間勾配に基づくノイズ除去戦略により,一貫性のある更新を実現し,NVSの忠実度を向上させる。
- 不確実性に基づくノイズ除去モジュールと空間コヒーレンス精製戦略により,表現のコンパクト性を維持しつつ,最先端の性能を達成した。
GNNにおける標準化された説明可能性評価:フレームワークとグラフカーネルネットワークに関する事例研究 [cs.LG]目的:GNNの説明可能性評価のための包括的なフレームワークの提案
- グラフ構造データ処理においてGNNは発展しているが,説明可能性評価は未整備である。
- 既存の評価は事後的な説明に偏り,モデル間比較が困難である。
- AIMフレームワークを用いて,GNNの説明可能性を多角的に評価し,改善につなげる。
- AIMフレームワークは,精度,インスタンスレベルの説明,モデルレベルの説明を測定する。
- グラフカーネルネットワーク(GKN)を事例研究として用い,AIMによる分析から知見を得た。
- 得られた知見に基づき,精度を維持しつつ説明可能性を向上させたxGKNを開発した。
BiFedKD:非IIDおよび長尾分布ECGモニタリングのための双方向連合知識蒸留フレームワーク [cs.AI]目的:非IIDおよび長尾分布のECGモニタリングにおける連合学習の性能向上
- IoT医療機器によるECGモニタリングは,健康管理や疾病早期発見に不可欠である。
- データのプライバシー保護と通信帯域の制約が,ECGモニタリングにおける課題となっている。
- 非IIDおよび長尾分布のデータに対しても,効率的な知識蒸留による学習を目指す。
- BiFedKDは,ベースラインと比較して精度とMacro-F1スコアをそれぞれ3.52%,9.93%向上させた。
- 同じMacro-F1スコアを達成する際に,BiFedKDは通信オーバーヘッドを40%削減し,計算コストを71.7%削減した。
PROCESS-2:初期認知機能低下検出のためのベンチマーク音声コーパス [cs.SD, cs.LG]目的:初期認知機能低下検出のための自動評価研究を支援する大規模音声データセット
- 音声分析は認知機能低下を検知する上で,スケーラブルかつ非侵襲的な手法として重要である。
- 現実的な条件下で収集された,臨床的に検証済みのデータセットが不足している点が課題であった。
- 自動評価研究を促進するため,高品質で検証済みの音声データセットを提供することを目指している。
- PROCESS-2は,健常者200名,軽度認知障害者150名,認知症患者50名からなる大規模データセットである。
- データセットに含まれる音声は約21時間で,参加者の会話の自然さを維持しつつ,臨床的に意味のあるグループ分離が確認された。
- Hugging Faceを通じて制御されたアクセスで公開され,参加者のプライバシーを保護しながら,研究の再現性を確保している。
SurgicalMamba: 二重経路SSDと状態再構成によるオンライン手術段階認識 [cs.CV, cs.AI]目的:オンライン手術段階認識の精度向上
- 手術室における状況認識システムの実現に不可欠な技術であり,医療の質の向上に貢献する。
- 既存の手法では,長時間の動画や,段階遷移が少ない動画への対応が難しい。
- Mamba2の構造化状態空間二重性(SSD)を用いて,効率的かつ高精度な手術段階認識を実現する。
- SurgicalMambaは,Cholec80ベンチマークで94.6%の精度,AutoLaparoで89.5%の精度を達成し,既存の最高性能手法を上回った。
- 二重経路SSDブロック,強度変調ステップ,状態再構成の3つのコンポーネントが,手術動画特有の課題に対応している。
- 学習された回転平面は,手術ワークフローの解釈可能な内部シグネチャを獲得し,段階に沿った構造を示す。
LLMベースのマルチエージェントシステムにおける協調,失敗原因の特定,自己進化に関する調査 [cs.AI]目的:LLMベースのマルチエージェントシステムの協調,失敗原因の特定,自己進化に関する研究動向の整理
- 複雑なタスク遂行において,単独のAIでは限界があり,複数エージェントによる協調が重要性を増している。
- マルチエージェントシステムでは,エラーが連鎖的に伝播しやすく,原因究明や自己改善が困難であるという課題がある。
- 本調査は,協調,原因特定,自己進化の因果関係を明らかにし,自己改善可能なマルチエージェントシステムの実現を目指す。
- 本調査では,能力基盤構築,協調的統合,故障特定,自律的自己改善の4段階「LIFE」サイクルを提案した。
- 各段階間の依存関係を明確化し,隣接段階が互いに依存・制約し合うことを示した。
- 今後の研究課題を特定し,継続的な故障診断,構造再編,行動改善が可能な閉ループマルチエージェントシステムの開発に向けた研究アジェンダを提示した。
CLIPには164次元のノイズが存在する:対照学習済みVision-Language Transformerの埋め込み共分散スペクトルの探求 [cs.CV, cs.AI, cs.LG]目的:Vision-Language Modelの潜在空間における多Modalノイズの構造解析
- 画像と言語を同時に理解するモデルは,様々な応用で高い性能を発揮するため重要である。
- 既存モデルの潜在空間には,意味を持たないノイズが蓄積し,性能向上を阻害する可能性がある。
- 潜在空間に存在するノイズを特定し,除去することで,モデルの表現能力を向上させることを目指す。
- 潜在空間を分解した結果,多Modalな意味情報と共有ノイズ空間に分離できることが示された。
- 共有ノイズ空間の次元を削減しても,下流タスクの性能は維持または向上することが確認された。
- 現代のVLMsの潜在空間は,タスク関連の意味だけでなく,アーキテクチャレベルのノイズによって大きく影響を受けることが示唆された。
テキスト依存型話者検証(TdSV)チャレンジ2024:チームNaiveシステム報告 [cs.SD, cs.LG]目的:テキスト依存型話者検証システムの性能向上
- 話者認証技術は,セキュリティや音声インターフェースにおいて重要性が増している。
- 限られたテキストデータでの話者検証は,性能向上が課題となっている。
- チャレンジデータへの適応と,アンサンブル学習による性能改善を目指す。
- ResNet-TDNNとNeXt-TDNNをベースとしたシステムで,MinDCF 0.0461,EER 1.3%を達成。
- EfficientNet-A0をチャレンジデータで学習させることで,適応能力を強化し,アンサンブル効果を高めた。
- データ拡張やハイパーパラメータの最適化も,高い性能に貢献した。
批評家駆動型ボロノイ量子化による深層強化学習ポリシーの蒸留と説明可能なモデルへの変換 [cs.LG, cs.AI]目的:深層強化学習ポリシーを説明可能なモデルに変換するための蒸留手法
- 深層強化学習は強力だが,その意思決定過程の解釈が困難である。
- 従来の蒸留では,性能と解釈性のバランスが難しく,適切な代替モデルの選択が課題である。
- 価値関数を活用し,ポリシーの複雑性を考慮した蒸留手法を開発し,解釈性と性能を両立する。
- 提案手法は,状態空間をボロノイ量子化により分割し,各領域に線形関数を割り当てる。
- オリジナルのポリシーの価値関数を利用し,価値が低い領域にサブポリシーを導入することで,ポリシーの複雑性を考慮する。
- 複数のベンチマークで評価した結果,提案手法はオリジナルポリシーに近似する線形関数のセットで蒸留できた。
知識グラフのコアセット誘導型パーソナライズド要約 [cs.AI]目的:知識グラフのパーソナライズド要約
- 知識グラフは多様な分野で活用され,その重要性は増している。
- 大規模な知識グラフは処理が困難であり,効率的な活用が課題である。
- ユーザのクエリに基づいたパーソナライズド要約による効率化を目指す。
- COREKGは,既存手法(GLIMPSE,PPR等)と比較して,より高いクエリ応答精度と構造的網羅性を示す。
- オリジナルグラフのごく一部のデータ量で同等以上の性能を達成する。
- コアセット理論を応用し,ユーザ固有のクエリワークロードに基づいた要約を生成する。
知識グラフ基盤モデルにおける文脈学習を通じた潜在能力の解放 [cs.AI]目的:知識グラフにおける関係構造の転移学習と,文脈学習による推論能力の向上
- 知識グラフは,様々な分野で知識表現の基盤として重要であり,その活用範囲は広い。
- 既存の知識グラフモデルは,関係レベルでの普遍性に偏っており,文脈学習の可能性が十分に探求されていない。
- 構造化された文脈情報を用いた知識グラフ基盤モデルを構築し,未学習のグラフへの適応能力を高める。
- KGPFNは,関係グラフ上のメッセージパッシングにより,関係表現を学習し,グラフ間の不変性を捉える。
- クエリ固有の推論では,多層NBFNetを用いて局所的な近傍をエンコードし,局所文脈を表現する。
- 大規模な関係インスタンスを検索・集約することで,グローバルな文脈を有効活用し,文脈的証拠に基づいたパターン適応を実現する。
迎合的合意から多元主義的修正へ:AIアライメントが不一致を表面化すべき理由 [cs.RO, cs.AI, cs.CY, cs.HC, cs.LG]目的:AIアライメントにおける多元主義的修正のメカニズム
- AIの社会実装が進む中,多様な価値観を尊重することが不可欠である。
- 現在のAIは,対話相手に迎合し,対立を避ける傾向が強い。
- 対話における意見の不一致を表面化し,建設的な議論を促す方法を探求する。
- AIアシスタントは,多様な価値観を網羅するだけでなく,意見の不一致を適切に処理する必要がある。
- 提案された「多元主義的修正スコア (PRS)」は,単なる迎合ではなく,原理に基づいた見解の修正を評価する指標である。
- Claude Sonnet 4.5とGPT-4oを用いた実験で,両モデルとも合意を優先する傾向と低い修正品質が確認された。
TILBench: データレジームにわたる表形式の不均衡学習のための体系的ベンチマーク [cs.LG]目的:表形式データの不均衡学習に関する体系的な評価
- 表形式データは様々な分野で利用されており,その学習の重要性は高い。
- 不均衡データに対する既存手法の効果に関する系統的な理解が不足している。
- データ特性に応じた適切な手法選択の指針を提供することを目的とする。
- 単一の手法が常に優位とは限らず,データ特性や計算資源に依存することが示された。
- 40以上の代表的なアルゴリズムを57の表形式データセットで評価した結果である。
- 実用的な手法選択のための推奨事項が提示されている。
多変量回帰における能動学習のための相互情報下限 [cs.LG, cs.CE, cs.IT, math.IT, stat.ML]目的:多変量回帰能動学習における獲得関数の確立
- 機械学習モデルの性能向上には,データ効率が重要であり,能動学習はその有効な手法の一つである。
- 予測分布が多峰性の場合,既存の獲得関数はエピステミック不確実性を捉えきれないという課題があった。
- 多峰性システムにおいて,エピステミック不確実性を適切に捉える獲得関数を開発し,データ効率を改善すること。
- 提案手法であるMI-LBは,多峰性システムにおいて,既存手法を上回る性能を示した。
- MI-LBは,モデルが学習を進めるにつれて不確実性が消失することを示し,解決可能な不確実性を捉えていることを確認した。
- 入力空間に多峰性が予めエンコードされていない場合でも,MI-LBは安定した性能を発揮する。
道路地図を自由な幾何学的事前情報として:GeoFuseによる耐候性ドローンジオロケーション [cs.CV, cs.LG]目的:悪天候下におけるドローン画像のジオロケーションの精度向上
- ドローン技術は,インフラ点検や災害対応など幅広い分野で活用が期待されており,正確な位置情報が不可欠である。
- 天候に起因する画像劣化は,ドローンと衛星画像間のクロスビュードメインギャップを悪化させ,ジオロケーションの精度を低下させる。
- 道路地図という,天候に左右されにくい幾何学的情報を活用することで,よりロバストなジオロケーションを実現する。
- GeoFuseは,衛星画像と道路地図タイルを統合し,より識別可能で耐候性の高い表現を生成する。
- University-1652およびDenseUAVベンチマークにおいて,既存手法を大きく上回り,それぞれRecall@1精度で+3.46%,+23.18%の改善を達成した。
- 提案手法は,モダリティ間の動的な重み付けとクラスレベルのコントラスティブ学習により,悪天候下での性能向上を実現した。
クラスタ構造化特徴量を用いた浅いニューラルネットワーク学習 [cs.LG]目的:クラスタ構造化特徴量における浅いニューラルネットワークの学習におけるサンプル複雑性
- 深層学習の成功は,現実世界のデータに内在する低次元構造に起因すると考えられている。
- 既存研究では,入力空間の相関構造が十分に考慮されていない。
- 入力空間に存在する相関構造が,学習のサンプル複雑性に与える影響を分析する。
- 潜在的なブール変数と特徴量のクラスタ構造を考慮したモデルにおいて,勾配降下法を用いた学習のサンプル複雑性を示す。
- サンプル複雑性は隠れ変数の数に依存し,十分な信号対雑音比においては入力次元に依存しないことが示された。
- 合成データと実データによる実験を通して,理論的結果を検証した。
大規模言語モデルのポストトレーニング量子化のためのハードウェアを意識した層ごとの手法 [cs.CL, cs.LG, cs.AR]目的:大規模言語モデルの重みのポストトレーニング量子化
- 近年,大規模言語モデルの利用が拡大しており,メモリ容量と計算コストの削減が重要課題となっている。
- 従来の量子化手法では,モデルの精度低下を招く場合があり,特に低ビットでの量子化は困難である。
- ハードウェア特性を考慮した層ごとの量子化手法により,精度を維持しつつメモリ使用量を削減することを目指す。
- 提案手法(SOP)は,4.5~6ビットでの量子化において,従来のFP8ベースラインよりも低い重み再構成誤差を達成した。
- 特に,ブロックごとのスケーリングと適切なスケール精度を用いることで,FP8と同等の性能をより低いストレージコストで実現可能となった。
- ハードウェア効率の高いLUT出力フォーマット(HIF)により,性能,エネルギー効率,コストの改善が期待できる。
スロットMPC:物体中心表現を用いたゴール条件付きモデル予測制御 [cs.LG, cs.AI, cs.RO]目的:物体中心表現を用いたモデル予測制御によるプランニング
- 人間の知覚に触発され,物体レベルでの表現は,行動計画などの下流タスクに役立つ。
- 既存の物体中心モデルや強化学習は,推論時に固定された反応的なポリシーを学習する。
- 未知の状況への適応を可能にするプランニング手法の開発。
- スロットMPCは,シーン内の個々の物体をエンコードするスロットベース表現を学習する。
- 学習されたダイナミクスモデルを通じて,モデル予測制御による行動計画を可能にする。
- シミュレーション実験の結果,タスクの性能とプランニング効率が向上することが示された。
多岐にわたる大規模言語モデルにおける継続学習のための履歴不要勾配直交化:Octopus [cs.LG, cs.CV]目的:多岐にわたる大規模言語モデルにおける継続学習の性能向上
- 近年,画像とテキストを扱う多岐にわたる大規模言語モデルの活用が広がり,継続的な学習が重要視されている。
- 既存手法は,計算コストの増加,プライバシー問題,パラメータ干渉といった課題を抱えており,十分な性能を発揮できていない。
- 本研究は,履歴データを用いずに勾配直交化を実現し,タスク適応と正則化のバランスを取ることで,これらの課題を解決することを目指す。
- 提案手法Octopusは,履歴不要勾配直交化(HiFGO)に基づいた二段階の継続学習フレームワークである。
- UCITデータセットを用いた実験の結果,Octopusは既存の最先端手法を平均で2.14%,最終タスクで6.82%上回る性能を達成した。
- タスク適応と正則化を分離する二段階ファインチューニング戦略が,柔軟性と安定性のバランスを実現している。
重要度を考慮した意味通信のための星座設計 [cs.LG, cs.AI, eess.SP]目的:意味通信におけるタスク関連情報の保護
- 通信効率向上には,意味に基づいた物理層マッピングが不可欠である。
- 従来の設計では,重要情報と重要でない情報が同じ確率でエラーに晒される。
- タスクへの関連度に応じた星座設計により,重要情報の保護を目指す。
- 提案手法は,タスク関連度を示す指標と深層強化学習を組み合わせる。
- 標準的な星座設計と比較して,高いスペクトル効率でほぼ100%のセマンティック保護確率を達成した。
- MNIST,Fashion-MNIST,FSDDなど,様々なデータセットで高いセマンティック品質を維持した。
限られたフィードバック下での効率的なオンライン適合選択 [cs.LG]目的:オンライン適合選択におけるリソースコストの最小化
- 不確実性に対応した機械学習は,実世界での応用において不可欠である。
- 限られたフィードバック下では,有効性を維持しつつ効率的な選択が困難である。
- 限られたフィードバック下でも有効性と効率性を両立する手法を確立すること。
- 適応的適合推論(ACI)更新規則を適切な制御パラメータに適用することで,分布シフト下でも平均的に目標確率を達成する。
- i.i.d.入力に対しては,適切な確率的ベンチマークに対して劣線形効率後悔を達成する。
- バンディットおよびセミバンディットフィードバックモデルにおいて,理論的保証が示されている。
視覚言語モデルにおける誘導注意による幻覚軽減のための軽量フレームワークMHSA [cs.CV, cs.AI]目的:視覚言語モデルにおける幻覚軽減
- 大規模視覚言語モデルは多様なタスクで高い性能を示すが,幻覚が課題となる。
- 既存研究では幻覚の検出は行われてきたが,軽減策は十分ではない。
- クロスモーダル注意パターンを修正し,幻覚を軽減するフレームワークを提案する。
- 本研究で提案するMHSAは,クロスモーダル注意を修正することで幻覚を軽減する軽量なフレームワークである。
- MHSAはLVLMのパラメータを変更することなく,様々なデータセットで有効に機能する。
- 幻覚検出から軽減へとアプローチを拡張し,LVLMの信頼性向上に貢献する。
InfoSFT:情報に基づいたトークン重み付けによる学習効率と記憶保持の向上 [cs.LG, stat.ML]目的:情報に基づいたトークン重み付けによる,言語モデルの教師ありファインチューニング手法
- 大規模言語モデルの能力向上には,専門家のデモンストレーションデータを用いた教師あり学習が不可欠である。
- 従来の教師あり学習では,低確率のデータに過剰に適合し,過学習や既存能力の低下を引き起こす可能性がある。
- InfoSFTは,モデルにとって有益な中程度の確信度を持つトークンに焦点を当て,効率的な学習と能力保持を目指す。
- InfoSFTは,数学,コード,思考連鎖タスクにおいて,従来の教師あり学習や尤度重み付けよりも汎化性能が向上した。
- 本手法は,既存の能力をより効果的に保持しながら,モデルに新しい振る舞いを学習させることが示された。
- InfoSFTは,標準的なトークン単位の損失関数へのわずかな変更で実装可能である。
GraphFlow:形式検証可能なビジュアルワークフローアーキテクチャによる信頼性の高いエージェントAI自動化 [cs.AI]目的:マルチステップのミッションクリティカルなプロセスにおけるエージェントAI自動化の信頼性向上
- 複雑なタスクを自動化する上で,AIエージェントの信頼性と安定性が重要視されている。
- 既存のワークフローシステムは,セマンティックな正当性の保証が不十分であり,監査が困難である。
- ワークフロー図を仕様として扱い,実行前に検証することで,自動化システムの信頼性を高める。
- GraphFlowは,ワークフロー図を仕様とみなし,コンパイル時に検証可能な自動化を生成する。
- 初期プロトタイプによる臨床現場でのパイロット試験では,8,728回のワークフロー実行で97.08%の完了率を達成した。
- 信頼境界を明示化することで,検証済みのロジックと外部システム,人間の判断,AIの決定を分離する。
Viverra:保証付きのテキストからコード生成 [cs.SE, cs.AI, cs.HC, cs.LO]目的:テキストからコード生成におけるコードの正当性保証
- AIによるコーディング支援は生産性向上に寄与するが,生成コードの品質が課題となる。
- LLM生成コードの正当性を確認するには,依然として開発者のレビュー,テストが必要である。
- 生成されたコードと共に検証可能なアノテーションを自動生成し,理解を助ける。
- Viverraは,LLMにCプログラムと安全性・正当性を示すアサーション候補を生成させる。
- 生成されたアサーションは,複数のバウンドモデルチェッカーで検証される。
- 実験の結果,Viverraは検証済みのコードを効率的に生成し,コード理解能力を向上させる。
顕微鏡画像解析のための条件多様性に対応するフレームワークMicroscopyMatching [cs.CL, cs.CV, cs.AI]目的:多様な条件下での顕微鏡画像解析のための即用性のあるフレームワークの構築
- 生物医学研究において,画像の解析は生物学的特性の抽出に不可欠であり,研究の進展に大きく貢献する。
- 多様な解析条件(対象,プロトコル,機器など)により,既存の深層学習アプローチは汎用性に欠けるという課題がある。
- 異なる条件での画像解析を統一的なマッチング問題として捉え,汎用性の高いツールを提供することで,研究の加速を目指す。
- 本研究では,分割,追跡,カウントといった主要な解析タスクを,多様な条件下で安定的に実行可能なフレームワークMicroscopyMatchingを提案する。
- MicroscopyMatchingは,顕微鏡画像解析タスクを統一的なマッチング問題として再構築し,事前学習済みの潜在拡散モデルの頑健なマッチング能力を活用する。
- これにより,特定の条件への大規模な適応が不要となり,生物医学研究者が手作業による解析に費やす時間を大幅に削減できる。
スケーラブルなグロモフ・ワッサースタイン学習のための距離行列ワッサースタイン統計 [cs.LG]目的:グロモフ・ワッサースタイン距離の効率的な計算手法の開発
- グラフ,形状,点群などの比較において,座標系に依存しない汎用性を持つ。
- 離散グロモフ・ワッサースタイン距離は非凸な問題であり,大規模データに対する計算が困難である。
- 距離行列のワッサースタイン統計を用いることで,大規模なグロモフ・ワッサースタイン距離の近似計算を実現する。
- 提案手法であるDMWは,グロモフ・ワッサースタイン距離の下限であり,緩和近似として機能する。
- DMWとグロモフ・ワッサースタイン距離の差は,各測度のサンプル数による近似誤差によって制御されることが示された。
- スライスDMWやマルチスケールDMWなどの計算手法を導入し,実データへの適用性を検証した。
割引マルコフ決定過程における方策ヘッセ行列分解による二階Actor-Critic手法 [cs.LG, cs.AI]目的:割引報酬設定における強化学習のための二階Actor-Critic手法の開発
- 強化学習は,複雑な制御問題の解決に有効であり,その重要性は高まっている。
- 方策勾配法では,価値関数の近似誤差が収束の妨げとなる場合がある。
- ヘッセ行列を利用した二階最適化により収束を加速するが,計算コストが高い。
- 二階近似において,方策パラメータに対する行動価値関数の局所的な定数性を仮定する。
- 二階の時間スケールActor-Criticフレームワーク下で,この近似が正当化されることを示す。
- ヘッセ行列とベクトル積(HVP)計算を利用した,効率的かつ安定な二階更新手法を提案する。
承認選挙における合意,多様性,および分極化指標 [cs.GT, cs.AI, cs.CY, cs.MA]目的:承認選挙における有権者の合意,多様性,および分極化を捉える指標
- 選挙結果の分析は,民主主義社会において重要な課題であり,選挙の特性理解に不可欠である。
- 既存の指標では,候補者承認率の変化に対する指標値の変動が大きすぎる場合がある。
- 承認選挙の特性を定量化し,選挙間の類似性と相違点を明らかにすること。
- 新たな指標を提案し,その性質を分析した。
- 提案した指標を用いて,承認選挙の新たなマップを作成した。
- Pabulib,Preflib等の実データに基づき,様々な選挙間の類似点と相違点を示した。
Sat3DGen: 単一衛星画像からの包括的なストリートレベル3Dシーン生成 [cs.CV, cs.AI]目的:単一衛星画像からのストリートレベル3Dシーン生成
- 都市計画や自動運転など,現実世界の理解を深める上で3Dシーン生成は不可欠である。
- 既存手法は,幾何学的な正確さと意味的な多様性の間にトレードオフが存在する。
- 衛星画像とストリートレベル画像間の視点差と,学習データの不整合性を解消する。
- 提案手法Sat3DGenは,幾何学的制約と視点に基づいた学習戦略を導入することで,3D精度と写実性を飛躍的に向上させた。
- 新たなベンチマークにおいて,幾何学的RMSEを6.76mから5.20mに改善し,FIDスコアを40から19へと大幅に低減した。
- 生成された高品質な3Dアセットは,セマンティックマップからの3D合成や,複数カメラ動画生成など,様々な応用が可能であることを示した。
多損失深層学習を用いたCT画像による卵巣癌術前化学療法の効果予測 [cs.CV, cs.AI]目的:卵巣癌における術前化学療法の効果予測
- 卵巣癌は致死率が高く,早期発見と適切な治療選択が重要である。
- 術前化学療法に反応しない患者の早期特定が困難であり,治療遅延に繋がる。
- CT画像から深層学習を用いて,非侵襲的に効果予測を行うことを目指す。
- 本研究で開発された深層学習モデルは,テストデータセットでROC-AUC 0.73,F1スコア0.70を達成した。
- この結果は,提案するアーキテクチャが臨床的に有用な予測パターンを学習することを示唆する。
- 画像に基づいた層別化ツールの開発に向けた強固な基盤となりうる。
ユーザーのデジタル記録からの抑うつ状態変化の説明可能な検出 [cs.AI, cs.CL, cs.LG, cs.SI]目的:抑うつ状態の変化の検出と分析
- メンタルヘルス不調の早期発見と予防は,社会的な課題として重要である。
- デジタル記録からのメンタルヘルス変化の解釈が困難である。
- デジタル記録から抑うつ状態の変化を説明可能に検出すること。
- 本研究では,BERTベースのモデルと大規模言語モデルを組み合わせたフレームワークを提案した。
- 提案手法は,直接LLMを用いたレポート作成よりも,より一貫性があり,情報量の多い要約を生成することを示した。
- 時間モデリングとセグメンテーションが,分析結果に大きく貢献することが確認された。
