arXiv雑要約

AI - 2026/03/11 公開

疎な変換分析に基づく教師なし表現学習 [cs.LG, cs.CV]目的：系列データからの表現の学習
- 表現学習は，機械学習の性能向上に不可欠であり，データから有用な特徴を抽出する上で重要である。
- 既存手法では，学習された表現が解釈困難であったり，変換に対する汎化性能が低いという課題があった。
- 潜在変数の変換を疎な成分に分解することで，解釈性と汎化性能を向上させることを目指す。
- 提案手法は，系列データから疎な変換場を学習し，データの尤度と近似的な等変性誤差において最先端の結果を達成した。
- 学習された表現は，独立な因子だけでなく，独立な変換素因子の組み合わせによって表されるため，解釈可能性が高い。
- 確率フローモデルを回転場とポテンシャル場に分解することで，表現の学習を効率的に行うことを可能にした。
Link: https://arxiv.org/abs/2410.05564
マルチエージェント間の相互作用における責任割り当ての学習：制御バリア関数を用いた微分可能最適化アプローチ [eess.SY, cs.LG, cs.MA, cs.RO, cs.SY]目的：マルチエージェント間の安全かつ効率的な相互作用を規定する責任の割り当て
- 自動運転や配送など，多様な分野でマルチエージェント間の安全な協調が重要となっている。
- 社会規範や状況に応じた行動決定など，相互作用の動的モデル化が困難である。
- データからエージェントの責任割り当てを効率的に学習し，安全性を確保する。
- 制御バリア関数と微分可能最適化に基づくデータ駆動型モデリングアプローチを提案した。
- 合成データと実データを用いて，エージェントが安全を確保するために行動をどの程度調整するかを定量的に評価できた。
- 環境に応じてエージェントが他者の安全のためにどれだけ責任を負うかの解釈可能な理解を得た。
Link: https://arxiv.org/abs/2410.07409
大規模グラフ表現学習におけるスケーラブルなメッセージパッシングニューラルネットワーク：大規模グラフ表現学習におけるアテンションの必要性の否定 [cs.LG]目的：大規模グラフ表現学習のためのスケーラブルなメッセージパッシングニューラルネットワークの開発
- グラフ構造データは，ソーシャルネットワークや知識グラフなど，様々な分野で現れるため，その効率的な学習は重要である。
- 従来のグラフニューラルネットワークは，深層化が難しく，大規模グラフへの適用に課題があった。
- アテンション機構を用いずに，深層化が可能で，大規模グラフにも適用可能な新しいアーキテクチャを提案すること。
- 提案手法であるSMPNNsは，大規模グラフの半教師あり学習において，既存のGraph Transformerを上回る性能を示す。
- SMPNNsは，アテンション機構を必要とせず，計算コストとメモリ使用量を削減できる。
- 理論的な分析により，オーバースムージング問題に対する残差結合の重要性が示された。
Link: https://arxiv.org/abs/2411.00835
ロボットダイナミクス学習のための形態的対称性不変異種グラフニューラルネットワーク [cs.RO, cs.LG]目的：ロボットダイナミクス学習における形態的対称性とロボットの運動構造の統合
- ロボットの制御やシミュレーションにおいて，正確なダイナミクスモデルは不可欠である。
- 従来の学習手法では，汎化性能が低く，大量のデータが必要となる場合がある。
- ロボットの構造的制約を組み込み，汎化性能と学習効率を向上させることを目指す。
- 提案手法MS-HGNNは，ロボットの運動構造と形態的対称性を単一のグラフネットワークに統合する。
- MS-HGNNは，その形態的対称性不変性を数学的に証明し，複数の四脚ロボット学習問題で有効性を示した。
- 実環境とシミュレーションの両方のデータを用いて検証を行い，高い汎化性能と効率性を示した。
Link: https://arxiv.org/abs/2412.01297
CuriousBot: 行動可能な3次元関係オブジェクトグラフによるインタラクティブな移動探索 [cs.RO, cs.CV, cs.LG]目的：行動可能な3次元関係オブジェクトグラフを用いた，インタラクティブな移動探索
- ロボットの自律探索は重要であり，環境理解と効率的な行動計画を可能にする。
- 既存手法は受動的な知覚に偏っており，ロボットの環境との積極的な相互作用が不足している。
- 本研究は，大規模な空間や複雑な行動空間における，積極的な相互作用による探索課題を解決する。
- 3次元関係オブジェクトグラフを導入することで，多様な物体間の関係性を表現し，探索行動を可能にした。
- 様々なシーンでの実験により，本システムの有効性と汎化性能が実証された。
- 視覚言語モデルのみに依存する手法と比較して，性能が向上した。
Link: https://arxiv.org/abs/2501.13338
機械学習がパーソナル化されるとき：予測と説明の評価 [cs.LG]目的：モデルのパーソナル化が予測と説明に与える影響の定量化
- 医療などの重要分野において，機械学習システムへの個人情報提供は，より正確な診断や説明に繋がると期待されている。
- パーソナル化が予測精度と説明可能性に及ぼす影響が一致しない場合があり，その妥当性は十分に検証されていない。
- パーソナル化の影響を評価するための枠組みを提示し，効果検出の条件や限界を明らかにすること。
- モデルのパーソナル化によって，予測精度が変化しないにも関わらず，説明可能性が向上または低下することが示された。
- 特定のグループにおけるパーソナル化効果を検知するための仮説検定の誤り確率の下限が，データセットの特性と属性数に基づいて導出された。
- 実データ分析の結果，データセットの統計的特性によっては効果を検証することが原理的に不可能になるケースが存在することが明らかになった。
Link: https://arxiv.org/abs/2502.02786
準価値に基づくデータ評価における効用関数の影響 [cs.AI, cs.GT, cs.LG]目的：準価値に基づくデータ評価の効用関数に対する頑健性
- データはAI開発の重要な資源であり，その価値を定量化する需要が高まっている。
- 準価値に基づくデータ評価は，効用関数設定に依存するため，結果の安定性に課題がある。
- データセットの空間的署名を用いて，効用関数変化に対する頑健性を評価する手法を提案する。
- データ点を低次元空間に埋め込むことで，任意の効用関数が線形関数となり，評価の幾何学的解釈を可能にする。
- 提案手法は，効用関数の変化に対するデータ評価結果の変動を定量化する頑健性指標を提供する。
- 多様なデータセットでの検証により，ランキング相関分析と整合性があり，効用関数の選択が頑健性に与える影響を明らかにしている。
Link: https://arxiv.org/abs/2502.06574
MKE-Coder：中国電子カルテにおけるICDコーディングのための多軸知識と証拠検証 [cs.CL, cs.AI]目的：中国電子カルテにおけるICDコーディングのための多軸知識と証拠検証のフレームワーク
- 医療分野におけるICDコーディングは，医療データの標準化と分析に不可欠である。
- 中国電子カルテ特有の簡潔な記述と構造により，コード関連情報の抽出が困難である。
- 既存手法では，疾患に基づいた多軸知識の活用と臨床証拠との関連性が不十分である。
- MKE-Coderは，中国電子カルテに基づくICD自動コーディングにおいて，高い性能を示すことが実験的に確認された。
- 提案手法は，コーディングの精度と速度の両方を向上させ，実際のコーディング業務を大幅に支援することが示された。
- 多軸知識と証拠検証を組み合わせることで，候補コードの妥当性を検証し，より信頼性の高いコーディングを実現する。
Link: https://arxiv.org/abs/2502.14916
視覚駆動型変形可能線形物体操作における物体中心エージェント適応のためのReal2Sim2Real分布処理 [cs.CY, cs.CL, cs.RO, cs.LG]目的：視覚知覚に基づく変形可能線形物体（DLO）操作のReal2Sim2Real問題に対する統合的なフレームワーク
- ロボット工学において，現実世界での物体操作は重要な課題であり，その自動化には高い精度が求められる。
- シミュレーションと現実世界の乖離が大きく，シミュレーションで学習したポリシーを現実世界で適用することが困難である。
- 現実世界での適用性を高めるため，シミュレーションから現実世界への転移を円滑にする手法を確立すること。
- 提案手法では，DLOの物理パラメータの事後分布を計算するために，尤度フリー推論（LFI）を活用している。
- この事後分布をドメインランダム化に利用し，シミュレーションで物体固有の視覚運動ポリシーを学習することで，ゼロショット転移を実現した。
- 実験結果から，提案手法が現実世界でのDLO操作において有効であることが示された。
Link: https://arxiv.org/abs/2502.18615
ノイズを含むガウス混合モデルにおけるクラスタリング品質評価の改善 [cs.LG, stat.ML]目的：ノイズの影響を受けにくいクラスタリング品質評価手法
- 機械学習やデータ分析において，クラスタリングは重要な手法であり，様々な分野で活用されている。
- 既存のクラスタリング品質指標は，特徴量の関連性に影響を受けやすく，高次元データやノイズの多いデータでは信頼性が低下する。
- 特徴量の分散に基づいて貢献度を調整し，ノイズの影響を軽減することで，より正確なクラスタリング評価を実現する。
- 提案手法であるFIRは，特徴量の重要度を再調整することで，クラスタリングの妥当性評価を改善する。
- 実験結果から，FIRはノイズや無関係な特徴量を含むデータセットにおいて，クラスタリング品質指標と正解ラベルとの相関を向上させることが示された。
- FIRは，クラスタリング評価の頑健性を高め，データセット間の性能変動を抑制し，クラスタの重なりが大き場合でも効果を発揮する。
Link: https://arxiv.org/abs/2503.00379
LLMアドバイザー：多様な地形における費用対効果の高い経路計画のためのLLMベンチマーク [cs.RO, cs.AI]目的：多様な地形における費用対効果の高い経路計画の評価
- ロボットナビゲーションにおいて，費用対効果の高い経路計画は不可欠であり，特に屋外環境での実用性が求められる。
- 不均一な地形における費用対効果の高い経路計画は，従来のロボット工学研究で十分な注目を集めていない。
- 本研究は，LLMを活用して経路計画の費用効率を向上させ，より現実的なロボットナビゲーションを可能にすることを目指す。
- 提案手法LLMアドバイザーは，A*，RRT*，LLM-A*で計画された経路の費用効率をそれぞれ72.37%，69.47%，78.70%向上させた。
- LLMアドバイザーは，MultiTerraPathデータセットの難易度の高いサブセットにおいても優れた性能を示し，実世界への応用可能性を裏付ける。
- GPT-4o等の最先端LLMは，地形を考慮した経路計画において空間推論能力の限界が示されたが，LLMアドバイザーで改善された。
Link: https://arxiv.org/abs/2503.01236
HyConEx：表形式データのための反事実説明を用いたハイパーネットワーク分類器 [cs.DB, cs.LG, cs.AI]目的：表形式データに対する分類と，その分類根拠の説明
- AIの信頼性向上には，予測精度だけでなく，判断根拠の理解が不可欠である。
- 既存手法では，説明可能性と分類精度の両立が困難であり，モデルの解釈性が低い。
- モデル自身が反事実例を生成することで，分類結果と説明を同時に提供し，解釈性を高める。
- HyConExは，深層ハイパーネットワークに基づいた新しい分類モデルであり，表形式データに対して高い分類精度を示す。
- HyConExは，個々のデータサンプルに対して，別のクラスへと導く反事実例を生成することで，局所的な解釈を提供する。
- HyConExは，予測と説明を同時に行う，All-in-oneのニューラルネットワークであり，従来の解釈可能モデルとは異なる。
Link: https://arxiv.org/abs/2503.12525
最適なモデルツリーの実験 [cs.LG]目的：モデルツリーの構造最適化
- 機械学習における解釈可能性は重要であり，モデルの信頼性向上に繋がる。
- 既存のモデルツリー学習アルゴリズムは局所最適解に陥りやすく，過大な複雑さとなる場合がある。
- 本研究は，グローバル最適化によるモデルツリー構築を目指し，より高精度なモデルを開発する。
- 最適なモデルツリーは，従来の貪欲法によるモデルツリーと比較して，同程度の精度をより小さな構造で達成できる。
- 軸平行分割に加え，多変量分割を導入することで，解釈可能性は低下するものの，精度向上が期待できる。
- 最適なモデルツリーは，古典的な決定木やランダムフォレスト，SVMなどの既存手法と遜色ない性能を示す。
Link: https://arxiv.org/abs/2503.12902
GateLens：自動車ソフトウェアリリース分析のための推論強化LLMエージェント [cs.SE, cs.AI, cs.CL, cs.MA]目的：自動車ソフトウェアリリース分析における信頼性の高いデータ分析
- 安全性やコンプライアンスに直結する分野では，正確なデータ分析が不可欠である。
- 大規模な表形式データの分析は，手作業では時間がかかり，コストと誤りが発生しやすい。
- 自然言語による質問から正確な分析結果を得るための，LLMアーキテクチャを提案する。
- GateLensは，自然言語クエリを関係代数(RA)表現に変換し，最適化されたPythonコードを生成する。
- 実世界のデータセットにおいて，既存のCoT+SCシステムよりも高い性能を示すことが確認された。
- RA層が分析の鍵となる役割を果たし，分析時間を80%以上削減しつつ，高い精度を維持した。
Link: https://arxiv.org/abs/2503.21735
二値分類評価に対する帰結主義的批判：理論，実践，およびツール [cs.LG, cs.AI, stat.ME, stat.ML]目的：二値分類評価の適切な方法論
- 機械学習の意思決定支援は，医療診断や保釈判断など，重要な場面で利用されている。
- 既存の評価指標は，特定の閾値や基盤率に依存し，予測の質を総合的に評価できていない。
- 予測の質を閾値や基盤率全体で評価するためのフレームワークを提案し，実践的なツールを提供する。
- 帰結主義的な視点から，適切なスコアリングルール（Brier score, log loss）の利用を推奨する。
- 主要な機械学習会議における評価指標の使用状況を調査し，top-K指標や固定閾値評価への依存が強い現状を明らかにした。
- 評価指標と適切な利用場面を明確化するフレームワークと，Brier scoreを計算するPythonパッケージ\texttt{briertools}を開発した。
Link: https://arxiv.org/abs/2504.04528
MCP Bridge：軽量でLLMに依存しないモデルコンテキストプロトコルサーバー用RESTfulプロキシ [cs.CR, cs.AI]目的：モデルコンテキストプロトコルサーバーへの接続を可能にする軽量RESTfulプロキシ
- 大規模言語モデルの外部ツール連携が重要視されているため，標準化されたインターフェースの確立が求められている。
- 既存のモデルコンテキストプロトコル実装は，リソース制約のある環境での利用が困難であるという課題がある。
- 本研究は，リソース制約のある環境でもLLMと外部ツール間の連携を実現することを目的とする。
- MCP Bridgeは，複数のモデルコンテキストプロトコルサーバーに接続し，統一されたAPIを通じて機能を提供することで，直接接続の制約を克服する。
- リスクベースの実行モデルとセキュリティレベルを実装し，標準MCPクライアントとの後方互換性を維持しつつ，セキュリティを強化している。
- Agent-Ark/Toucan-1.5MデータセットでファインチューニングしたQwen3 4B/8Bモデルは，MCPToolBench++でGPT-OSS-120Bを上回るF1スコア73.0%を達成した。
Link: https://arxiv.org/abs/2504.08999
概念ドリフト誘導LayerNorm調整による効率的なマルチモーダル比喩認識 [cs.MM, cs.LG]目的：マルチモーダル比喩認識のための効率的なフレームワーク
- 人間の認知とコミュニケーションにおいて，比喩的思考は不可欠である。
- 従来の比喩認識手法は，マルチモーダルな比喩の解釈に苦戦している。
- 計算コストを抑えつつ，マルチモーダル比喩認識の精度向上を目指す。
- 提案手法CDGLTは，MET-Memeベンチマークにおいて最先端の性能を達成した。
- CDGLTは，既存の生成的アプローチと比較して，トレーニングコストを大幅に削減する。
- 概念ドリフトと適応されたLN調整の両方が有効であることが，消去実験で示された。
Link: https://arxiv.org/abs/2505.11237
段階的誘導型方策最適化：GRPOにおける誤った推論の可視化 [cs.LG, cs.AI, cs.CL]目的：大規模言語モデルの推論能力向上
- 言語モデルの推論能力向上は，多様なタスクへの応用を可能にする重要な課題である。
- Group Relative Policy Optimization (GRPO)は有効だが，グループ内の全回答が誤りの場合，方策を更新できないという課題がある。
- 全否定サンプル群の問題を，段階的な判断モデルによる回答の多様性導入で解決する。
- 段階的誘導型方策最適化 (SGPO) は，7B，14B，32Bモデルでオフラインおよびオンライン学習で性能を向上させた。
- 特に，全否定群が多く発生する初期・中期学習において効果が認められた。
- SGPOは正解生成を判断モデルに要求しないため，知識蒸留とは異なる。
Link: https://arxiv.org/abs/2505.11595
ガウス・多項式制限ボルツマン機械：GRBMのポッツモデル拡張 [cs.LG]目的：多値概念を表現可能な，より豊かな潜在状態空間の提供
- 関連性記憶や記号推論など，多くの現実世界のタスクは離散構造化表現から恩恵を受ける。
- 標準的な連続潜在モデルでは，離散構造化表現を表現することが困難であるという課題がある。
- 本研究は，離散推論において，2値潜在変数への単純かつスケーラブルな代替案を提供することを目的とする。
- GM-RBMは，GB-RBMと同等の潜在的割り当て数で，類推的想起や構造化記憶ベンチマークにおいて，競争力のある，場合によっては改善された想起性能を示す。
- GM-RBMは，状態の崩壊を回避するために，温度アニーリングやイントラスロット多様性制約を用いたコントラスティブダイバージェンスという実用的な学習手法を用いる。
- q値の離散的な定式化は，効率的な実装に適しており，Gibbs更新のみを使用しても同等の学習コストで高い性能を発揮する。
Link: https://arxiv.org/abs/2505.11635
自己内省による大規模言語モデルの脱獄：JULI [cs.LG, cs.CR]目的：大規模言語モデルの脱獄手法
- AIの安全性確保は重要であり，特に悪意のあるコンテンツ生成を防ぐことは不可欠である。
- API経由で利用する商用モデルは，モデルの重みや生成過程へのアクセスが制限されているため，既存の攻撃手法では脱獄が困難である。
- 本研究は，モデルの知識のみを用いてAPI経由のLLMを脱獄する手法を開発し，その有効性を検証する。
- 本手法（JULI）は，わずかなプラグインブロック（BiasNet）を用いてトークン対数確率を操作することで，LLMを脱獄する。
- JULIは，ブラックボックス環境下で，上位5つのトークン対数確率のみを知ることで，API経由のLLMを効果的に脱獄できる。
- 実験結果は，JULIが既存の最先端手法よりも優れた有効性を示すことを示している。
Link: https://arxiv.org/abs/2505.11790
対称性不変量を用いた記号的微分方程式の発見 [cs.LG]目的：データからの記号的微分方程式の発見
- 複雑な系の背後にある力学法則を明らかにする上で重要である
- 方程式の探索空間が広大であり，物理法則に反する可能性もある
- 対称性に基づく方程式探索で，物理法則を遵守する方程式の発見
- 本研究では，対称性不変量を用いることで，探索空間を削減し，物理的に妥当な方程式の発見を可能にした。
- 既存の方程式発見法（スパース回帰，遺伝的プログラミング）と統合し，精度と効率を向上させた。
- 流体や反応拡散系などの物理システムへの適用により，簡潔で解釈可能な物理法則を再現できることを示した。
Link: https://arxiv.org/abs/2505.12083
UltraEdit：言語モデルにおける訓練，対象，記憶不要な継続編集 [cs.CL, cs.AI, cs.LG]目的：言語モデルの継続的な知識更新
- 言語モデルは常に進化する情報を扱う必要があり，その適応能力が重要である。
- 既存のモデル編集手法は，大規模な環境下での実用的な継続適応には課題が残されている。
- UltraEditは，大規模かつ現実的な環境下での効率的なモデル編集を実現することを目指す。
- UltraEditは，隠れ状態と勾配のみを用いてパラメータシフトを一度で計算する簡潔かつ効率的な手法である。
- 従来の最先端手法と比較して，7倍高速に編集を行い，VRAM使用量は4分の1で済む。
- 200万件以上の編集ペアを含むUltraEditBenchを用いて，高い精度を維持しながら200万件の編集をサポートすることを示した。
Link: https://arxiv.org/abs/2505.14679
オンデバイスLLMの体系的な評価：量子化，性能，リソース [cs.LG]目的：オンデバイスLLMの能力，効率，リソース制約のバランス評価
- プライバシー保護の観点から，エッジデバイスでのLLM利用が重要視されている
- エッジデバイスの限られたリソースが，LLMの性能向上を阻害する課題となっている
- リソース制約下でのLLM最適化指針の提示を目指している
- 重度量子化された大規模モデルは，高精度な小規模モデルを凌駕する性能を示すことが示された
- リソース使用量はBPWに比例して増加するが，消費電力やメモリフットプリントは量子化アルゴリズムによって異なる
- モデル規模の縮小に伴い，スループットのボトルネックは通信オーバーヘッドから計算遅延に変化する
Link: https://arxiv.org/abs/2505.15030
SATURN：SATに基づく強化学習によるLLMの推論能力の解放 [cs.LG, cs.AI]目的：大規模言語モデルの推論能力を効果的に引き出す強化学習タスクの設計
- LLMの推論能力向上は，自然言語処理の発展に不可欠であり，より高度な応用を可能とする。
- 既存の強化学習タスクは，データ生成コスト，検証の困難さ，および難易度制御の限界を抱えている。
- SAT問題を活用することで，スケーラブルなタスク生成，検証，難易度制御を実現し，LLMの推論能力を段階的に向上させる。
- Saturnを適用したSaturn-1.5BとSaturn-7Bは，SAT問題においてそれぞれ平均Pass@3レートを+14.0%と+28.1%向上させた。
- Saturn-1.5BとSaturn-7Bは，数学およびプログラミングタスクにおいて，ベンチマーク（AIME, LiveCodeBenchなど）でそれぞれ平均スコアを+4.9%と+1.8%改善した。
- Saturnは，既存の最先端の強化学習タスク構築手法と比較して，さらなる+8.8%の改善を達成した。
Link: https://arxiv.org/abs/2505.16368
組み合わせ最適化に対する機械学習ソルバーの現実世界および大規模評価：FrontierCO [cs.LG]目的：組み合わせ最適化問題に対する機械学習ソルバーの実用性と拡張性に関する評価
- 組み合わせ最適化は，物流，スケジューリングなど多岐にわたる分野で重要な役割を担う。
- 既存研究では，現実世界の複雑さや大規模なデータセットでの機械学習ソルバーの性能評価が不足している。
- 現実世界の構造と大規模インスタンスに対する機械学習ソルバーの性能を厳密に評価し，進歩の基盤を確立する。
- FrontierCOは，ルーティング，スケジューリング，施設配置，グラフ問題を含む8つの組み合わせ最適化問題に対応したベンチマークである。
- 評価の結果，構造的に複雑で大規模なインスタンスサイズ（例：TSP 1000万ノード，MIS 800万）において，機械学習ソルバーは古典的ソルバーとの性能差が拡大する傾向が見られた。
- 一方で，特定のケースでは機械学習ソルバーが古典的ソルバーを上回る性能を示すことも確認された。
Link: https://arxiv.org/abs/2505.16952
Daily-Omni：クロスモーダルな時間的アライメントによるオーディオ・ビジュアル推論に向けて [cs.AI]目的：オーディオ・ビジュアルQAベンチマーク
- マルチモーダルな情報処理の重要性が増しており，特にリアルワールドでの応用が期待されている。
- 既存のMLLMは，各モダリティ単体では高い性能を示すものの，クロスモーダルな情報の一貫した処理が課題である。
- 時間的なアライメントが重要なクロスモーダル推論能力を評価し，その改善を促す。
- Daily-Omniは，684の現実世界の動画と1,197の質問を含む，時間的推論を必要とする新しいベンチマークである。
- 24の基盤モデルを評価した結果，時間的アライメントが重要な問題において，多くのMLLMが苦戦していることが示された。
- 時間的アライメントの重要性を示唆する診断基盤モデルも提供し，性能への影響を明確化した。
Link: https://arxiv.org/abs/2505.17862
半教師あり共形予測とラベルなし不適合スコア [cs.LG]目的：不確実性定量のための共形予測における，ラベル付きデータとラベルなしデータの活用
- 不確実性を伴う予測において，信頼区間の保証は重要な課題である。
- 共形予測はラベル付きデータに依存するため，データが不足すると性能が不安定になる。
- ラベルなしデータも活用することで，少ないラベル付きデータでの予測性能を安定化させる。
- 提案手法SemiCPは，ラベルなしデータの活用により共形予測の信頼性を高める。
- Nearest Neighbor Matching (NNM)スコアにより，ラベルなしデータの不適合度を推定する。
- 実験により，SemiCPが少ないラベルデータでも有意に平均カバレッジギャップを削減することが示された。
Link: https://arxiv.org/abs/2505.21147
無限の答えを持つ純粋探索 [eess.SY, cs.SY, cs.LG]目的：無限の答えを持つ純粋探索問題の解析
- 探索問題は，効率的な情報収集の基本であり，様々な意思決定に応用される。
- 既存手法は，答えの数が有限であることが前提であり，無限の場合には最適性が損なわれる。
- 無限の答えを持つ探索問題における漸近的な最適解を達成する手法を開発すること。
- 無限の答えを持つ探索問題に対するインスタンス依存の下界を導出した。
- 既存手法の漸近的最適性の欠如について，導出された下界を用いて議論した。
- Track-and-StopとSticky Track-and-Stopを一般化したSticky-Sequence Track-and-Stopを提案し，漸近的最適性を示した。
Link: https://arxiv.org/abs/2505.22473
LLMの判断に基づくメタ学習による多様な時系列データの品質評価 [cs.LG, cs.AI]目的：多様な時系列データの品質評価
- 時系列モデリングの性能はデータの品質に大きく依存し，高品質なデータが不可欠である。
- 既存手法は個々のドメイン内では精度が高いが，多様なドメインの時系列データに対応できない。
- LLMの知識を活用し，ドメインを横断した時系列データの品質評価を可能にすること。
- TSRatingはLLMの判断を促すプロンプト設計と，それに基づく評価モデルTSRaterのメタ学習によって実現された。
- signSGDを用いることで，ハイパーグラディエント計算の負荷を軽減し，学習効率を向上させた。
- 11のベンチマークデータセットを用いた実験で，既存手法を上回る精度，効率，ドメイン適応性を示した。
Link: https://arxiv.org/abs/2506.01290
協力ゲーム理論に基づくマルチエージェント方策勾配におけるクレジット配分：コアによるアプローチ [cs.MA, cs.AI, cs.GT, cs.LG]目的：協力型マルチエージェント強化学習におけるクレジット配分の問題
- マルチエージェントシステムは複雑なタスクを解決する上で重要であり，各エージェントの協調が不可欠である。
- 従来のクレジット配分方法は，エージェント間の貢献度を適切に評価できず，学習の効率を阻害する。
- 協力ゲーム理論のコア概念を用いて，エージェント間の貢献度をより公平に評価し，最適化を促進する。
- 提案手法CORAは，エージェントの連立に対する周辺貢献を評価することで，連立ごとの利得を推定する。
- コア配分の定式化により，利得の高い連立がより多くのクレジットを受け取るように保証し，協調的な最適行動を促進する。
- 実験結果は，マトリックスゲームや協調タスクにおいて，提案手法が既存手法を上回ることを示している。
Link: https://arxiv.org/abs/2506.04265
ロバストな現実世界の多変量時系列予測に向けたフレームワーク：依存性，非同期性，欠損値への対応 [cs.LG, cs.AI]目的：現実世界の多変量時系列予測におけるロバスト性と信頼性の向上
- 実世界の時系列データは多変量であり，予測の精度と信頼性に不可欠である。
- 既存手法は，チャンネル間の依存性，非同期サンプリング，欠損値といった課題を個別に扱っている。
- これらの課題を統合的に解決し，実用的な環境下での予測性能を向上させる。
- 提案手法ChannelTokenFormerは，Transformerベースの予測フレームワークであり，チャンネル間の相互作用を明示的に捉える。
- 非同期サンプリングと欠損値に柔軟に対応し，既存手法よりもロバストな予測を可能にする。
- 公開ベンチマークデータセットと実世界の産業データセットを用いた実験により，その有効性が確認された。
Link: https://arxiv.org/abs/2506.08660
ユーザーとトピックの相互作用に基づくソーシャルネットワーク活動の解明 [cs.IR, cs.CL, cs.SI, cs.LG, stat.ML]目的：ソーシャルネットワーク活動の解明
- 情報伝達への影響が大きい。意見形成のダイナミクス理解に不可欠。
- 情報拡散の相関関係が考慮されていないことが課題。
- ユーザー活動と情報拡散の相互作用をモデル化し，分析を深める。
- 本研究で提案するMICモデルは，既存手法よりも情報拡散のモデリングにおいて優れた性能を示す。
- MICモデルの学習結果は，実際のソーシャルネットワーク活動データを二層構造で可視化できる。
- MICは，カスケードとユーザー間の複雑な相互作用を捉えることができる。
Link: https://arxiv.org/abs/2506.12842
低リソース言語識別に向けた教師ありコントラスト学習：ConLID [cs.CL, cs.AI, cs.LG]目的：低リソース言語識別のためのドメイン不変な表現学習
- 多言語LLMの事前学習コーパス作成において，言語識別は重要なステップである。
- 低リソース言語はデータ量が限られており，特定のドメインに偏りがちで，性能が低い。
- ドメインの影響を受けにくい表現を学習し，低リソース言語の識別精度を向上させる。
- 提案手法は，低リソース言語におけるドメイン外データの言語識別性能を3.2%向上させる。
- 高リソース言語の性能を維持しつつ，低リソース言語の識別性能を改善する。
Link: https://arxiv.org/abs/2506.15304
OPENXRD：LLM/MLLM XRD質問応答のための包括的ベンチマークフレームワーク [cs.CL, cs.AI]目的：LLM/MLLMにおけるXRD質問応答の評価
- 結晶学研究において，XRDデータ解釈の自動化は効率化に不可欠である。
- 既存のLLM/MLLMは，専門知識を伴うXRD質問への応答に課題を抱えている。
- LLM/MLLMの外部知識の活用能力を定量的に評価するフレームワークの提供。
- OPENXRDは，217のXRD質問を用いて，LLM/MLLMの文脈理解能力を評価する。
- モデルサイズの中規模モデル(7B-70B)が，文脈情報から最も恩恵を受けることが示された。
- 専門家レビュー済みの資料は，AI生成資料よりも性能向上に大きく貢献することが確認された。
Link: https://arxiv.org/abs/2507.09155
固結化問題に対する演算子学習：DeepONetバリアントのアーキテクチャ比較 [eess.SY, cs.SY, cs.LG, physics.geo-ph]目的：固結化問題に対するDeepONetアーキテクチャの体系的な評価
- 偏微分方程式を扱う工学分野で，解演算子の学習は重要性を増している。
- 土質力学分野におけるDeepONetの応用は限定的である。
- 解の変動が大きい場合におけるDeepONetの性能向上を目指す。
- モデル3は標準的な構成（モデル1，2）を上回り，物理に基づいたアーキテクチャの有効性を示した。
- Trunknet Fourier特徴強化型DeepONet（モデル4）は，解の変動に対応し，3次元問題で約1000倍の高速化を実現した。
- DeepONetは，土質力学における不確実性定量化の加速に潜在的な可能性を持つことが示唆された。
Link: https://arxiv.org/abs/2507.10368
ニューラル潜在動態のモデル化のためのランジュバンフロー [cs.LG, q-bio.NC]目的：ニューラル集団の潜在的な動態構造のモデリング
- 脳神経科学において，神経活動を理解するためには，潜在的な動態の解明が不可欠である。
- 既存モデルでは，内在的なネットワーク動態と外部からの影響を同時に捉えることが困難である。
- ランジュバンフローを用いて，複雑な神経集団の動態とその潜在的な影響を包括的にモデル化する。
- ランジュバンフローは，ロレンツアトラクタによって生成された合成神経集団において，真の発火率と高い一致性を示した。
- Neural Latents Benchmark (NLB)において，保持されたニューロン尤度と前方予測精度で，最先端のモデルを上回った。
- 手速度などの行動指標の復号においても，既存手法と同等またはそれ以上の性能を達成した。
Link: https://arxiv.org/abs/2507.11531
潜在的なポリシー操舵：具現化に依存しない事前学習済みワールドモデル [cs.RO, cs.AI, cs.LG]目的：視覚運動ポリシーの性能向上
- ロボットの学習において，大規模データセットが重要となるが，収集コストが高い。
- ロボットと人間のデータセット間における具現化のギャップや行動空間の不一致が存在する。
- 様々な具現化のデータを活用し，少ないデータでも高性能なポリシーを学習すること。
- 本研究では，光流を用いたワールドモデルを事前学習することで，少ないターゲット具現化データでの性能向上を実現した。
- Robomimicタスクにおいて，平均で10.6%の改善が確認された。実世界実験では，より大きな改善が見られた。
- 30-50件のターゲット具現化データで70%の相対的な改善，60-100件のデータで44%の改善が確認された。
Link: https://arxiv.org/abs/2507.13340
MMGraphRAG：解釈可能な多Modal知識グラフによる視覚と言語の架け橋 [cs.AI]目的：視覚と言語を結びつけるための多Modal知識グラフの統合
- 大規模言語モデルの応用拡大には，その信頼性向上が不可欠である。
- 既存の知識グラフはテキスト中心であり，視覚情報の構造的理解が困難である。
- 視覚とテキストを統合し，より正確な知識グラフ構築と推論を実現すること。
- MMGraphRAGは，視覚シーングラフとテキスト知識グラフを新たな融合手法で統合する。
- SpecLinkにより，正確なクロスModalエンティティリンキングとパスベースの検索が可能になる。
- CMEL，DocBench，MMLongBenchでの評価で最先端の性能を示し，汎用性と多Modal情報処理能力を証明した。
Link: https://arxiv.org/abs/2507.20804
マルチモーダルLLM支援進化探索によるプログラム制御ポリシーの探索 [cs.LG, cs.NE]目的：プログラム制御ポリシー探索手法
- 強化学習は制御タスクで成功を収めているが，生成されたポリシーの解釈性が課題である。
- 深層学習で得られたポリシーは不透明で，検証やデバッグが困難である。
- LLMを活用し，透明性・検証可能性の高い制御ポリシーを自動生成すること。
- 本研究で提案するMLESは，PPOと同等の性能を達成した。
- MLESは透明性の高い制御ロジックと追跡可能な設計プロセスを提供する。
- 特定のドメイン言語の制約を克服し，知識の転移と再利用を促進する。
Link: https://arxiv.org/abs/2508.05433
国際的な態度の偏り解消：米中認識変化をシミュレーションするLLMエージェント [cs.SI, cs.AI]目的：米中間の認識変化のシミュレーションを通じた国際的な態度の偏り解消
- 国際的な態度は，世界的な分極化の主要因であり，その理解は国際関係の安定に不可欠である。
- 既存の研究では，メディアの影響を定量的に評価し，客観的な態度モデルを構築することが困難であった。
- LLMエージェントを用いて，メディアの影響を分析し，より人間らしい意見形成を促すための手法を開発すること。
- LLMエージェントを用いたシミュレーションにより，メディアの影響を受けた場合，対中感情が否定的になる傾向が確認された。
- ファクト抽出，批判的視点の導入，反実仮想実験といった3つの偏り解消メカニズムが，その傾向を緩和する効果を示した。
- 特に，批判的視点を持つエージェントの導入が最も効果的であり，モデルの地理的起源に起因する偏りが示唆された。
Link: https://arxiv.org/abs/2508.08837
表情認識のためのパーソナライズされた特徴変換：効率的なソースフリードメイン適応法 [cs.CV, cs.AI]目的：表情認識の性能向上
- 感情を読み取る技術は，人間とコンピュータのインタラクションやヘルスケアなど，幅広い分野で重要性が高まっている。
- 深層学習モデルは，微妙な表情や個人差に弱く，実用的な性能を出すのが難しい。
- ラベルなしのターゲットデータのみを用いて，プライバシーを保護しつつ，モデルを個人に最適化することを目指す。
- 提案手法は，潜在空間で特徴を変換することで，ノイズの多い画像生成を避け，計算コストを削減する。
- BioVid，StressID，BAH，Aff-Wild2などのデータセットで，既存のソースフリードメイン適応法を上回る性能を示した。
- 特に，プライバシー保護が重要な表情認識の状況において有効であることが確認された。
Link: https://arxiv.org/abs/2508.09202
EgoCross：クロスドメイン一人称視点ビデオ質問応答のためのマルチモーダル大規模言語モデルのベンチマーク [cs.CV, cs.AI]目的：クロスドメインにおける一人称視点ビデオ質問応答のマルチモーダル大規模言語モデルの汎化性能評価
- 一人称視点ビデオは，実世界の多様な状況を捉えられ，ロボティクスや医療などへの応用が期待される。
- 既存のベンチマークは日常的な活動に偏っており，現実世界の多様なドメインへの適応性が課題である。
- 現実世界のドメインシフトに対応可能な，頑健なモデル開発を促進することを目的とする。
- 既存の汎用または一人称視点特化型マルチモーダル大規模言語モデルは，日常的な活動以外のドメインへの汎化が困難であることが示された。
- EgoCrossは，外科手術，産業，エクストリームスポーツ，動物視点など，多様なドメインを網羅する約1,000組の質問応答ペアから構成される。
- EgoCrossとその分析が，ドメイン適応型で堅牢な一人称視点ビデオ理解の進展に貢献することが期待される。
Link: https://arxiv.org/abs/2508.10729
クラスタ化転移残差学習：多数の小規模データセットへの適用 [cs.LG]目的：多数の小規模データセットにおける予測精度向上とソースレベルの異質性の維持
- 機械学習は様々な分野で活用され，高い予測精度が求められる。
- データソース間の分布のずれや，サンプルサイズのばらつきが課題となる。
- ソースごとの特性を考慮しつつ，全体的な予測精度を向上させることを目指す。
- 提案手法CTRLは，既存のベンチマーク手法と比較して，複数の大規模データセットで一貫して優れた性能を示した。
- 特に，スイスの難民プログラムにおける地理的配置のアルゴリズムパイロットにおいて有効性が確認された。
- 質の高いクラスタを効率的に学習することで，モデルの再学習の必要性を回避できることを理論的に示した。
Link: https://arxiv.org/abs/2508.11144
仮想アバターによる歌唱シラバス：AI生成音楽とデジタル体現による学生の関与向上 [cs.CY, cs.AI, cs.LG, cs.MM]目的：学生の関与向上
- 教育効果を高めるため，学生の学習意欲を引き出す手法が重要である。
- 従来のテキストベースのシラバスは，学生が十分に読まず理解しないことが多い。
- シラバスの内容をより魅力的に提示し，学生の記憶に残るようにすることを目的とする。
- AIによる歌唱と仮想アバターを活用したシラバスが，学生の注意を引き，感情的な繋がりを育むことが示された。
- 学生からのフィードバックは，AIで歌われたシラバスが，重要なコース情報の認識と想起を大幅に改善したことを示唆している。
Link: https://arxiv.org/abs/2508.11872
eコマースにおける関連性検索のための思考モデルTaoSR1 [cs.IR, cs.AI, cs.CL]目的：eコマース検索におけるクエリと商品の関連性予測
- eコマースの発展に伴い，的確な商品検索が重要性を増している
- BERT系モデルは意味的マッチングに優れるが，複雑な推論能力に欠ける
- LLMの直接的な活用による，関連性分類における思考連鎖の適用を目指す
- TaoSR1は，オフラインデータセットで既存モデルを大きく上回る性能を示した
- オンラインにおける人間評価においても，顕著な改善が確認された
- 思考連鎖を活用した関連性分類の新たなパラダイムを提示する
Link: https://arxiv.org/abs/2508.12365
RF情報に基づくグラフニューラルネットワークによる高精度かつデータ効率的な回路性能予測 [cs.LG]目的：RF回路性能予測の精度向上とデータ効率化
- 現代の無線システムにおいて，RF回路の性能予測は不可欠であり，設計の効率化に貢献する。
- 従来のシミュレーションは計算コストが高く，機械学習モデルは大量のデータが必要となる場合がある。
- RFICドメイン知識を活用し，異なる回路トポロジーへの適応性と知識転移を可能にする。
- 提案手法は，LNA，ミキサー，VCO，PAなどのRF回路クラスの主要な性能指標を高精度に予測できる。
- 平均相対誤差(MRE)は3.45%であり，最先端技術と比較して9.2倍の改善が見られた。
- クラスレベルの汎化性能も約161倍向上し，スケーラブルなRF設計自動化への応用が期待される。
Link: https://arxiv.org/abs/2508.16403
計算多主体社会実験：生成エージェントに基づく社会モデリングフレームワーク [cs.AI, cs.CY, cs.MA]目的：計算多主体社会実験のためのフレームワーク
- 社会現象の理解は，社会課題解決や政策立案に不可欠である。
- 従来のシミュレーションでは，社会の複雑な相互作用を捉えきれない場合がある。
- 社会現象のメカニズム解明と，介入効果の予測を可能とする。
- CMASEフレームワークは，研究者が仮想社会に埋め込まれた参加者として介入・分析を可能とする。
- シミュレーション結果は，統計的パターンとメカニズム的説明の両方と整合性があることが示された。
- これにより，社会科学における学際的な統合を促進し，介入モデリングの価値が示唆される。
Link: https://arxiv.org/abs/2508.17366
VistaWise：クロスモーダル知識グラフを用いたMinecraftのための費用対効果の高いエージェントの構築 [cs.AI]目的：Minecraft環境における費用対効果の高いエージェントフレームワーク
- バーチャル環境での意思決定は重要であり，現実世界への応用も期待される分野である。
- 大規模言語モデルは，特定ドメインの知識不足により性能が制限されることがある。
- ドメイン知識を効率的に統合し，学習データ量を削減することで開発コストを低減する。
- VistaWiseは，クロスモーダル知識グラフを構築し，視覚情報を統合することで環境を正確に理解する。
- タスクに関連する情報を知識グラフから抽出する検索ベースのプーリング戦略を採用している。
- 実験結果から，VistaWiseは開発コストを削減しつつ，最先端の性能を達成することが示された。
Link: https://arxiv.org/abs/2508.18722
反復的な文脈内学習によるLLMの抽象的推論能力の向上：代数的課題のケーススタディ [cs.LG]目的：LLMの抽象的推論能力向上
- LLMは汎用性が高いが，体系的な一般化が課題である。
- 構成的な規則や分布外の事例に対する推論が困難である。
- LLMの代数的課題解決能力の向上を目指す。
- LLMは，標準外の簡略化規則を用いた代数計算において，限定的な能力を示すことが判明した。
- 反復的な少数ショット選択プロンプティング戦略と明示的な推論指示により，LLMの推論能力が向上することが示された。
- 一部のLLMは，テストデータ分布に従った複雑な例よりも，単純な例でより良い一般化性能を発揮することが明らかになった。
Link: https://arxiv.org/abs/2509.01267
ニューラルネットワークによる高温超伝導磁石の電流分布予測のための代理モデル [cs.LG]目的：高温超伝導磁石における電流分布予測
- 高温超伝導磁石は，高磁場・省エネ特性から応用が期待され，技術開発が重要視されている。
- 大規模磁石のシミュレーションには時間がかかり，迅速な設計最適化が困難である。
- ニューラルネットワークを用いた代理モデルにより，シミュレーション時間を短縮し，効率的な磁石設計を実現する。
- FEMシミュレーションデータで学習したFCRNモデルは，FCNモデルより高い予測精度を示した。
- 訓練データ外のパラメータに対する外挿においても，損失や中心磁場の誤差は小さかった。
- 本代理モデルを用いた高速設計により，FEM結果と比較して0.2%の誤差で最適解が得られた。
Link: https://arxiv.org/abs/2509.06067