arXiv雑要約

AI - 2026/02/03 公開

  • 高次元探索,低次元解:最適化と表現の分離 [cs.LG, cs.AI]目的:モデルの最適化における表現の役割解明
    • 深層学習モデルの性能向上には,モデルサイズの拡大が不可欠と考えられている。
    • モデル幅が過剰に大きいことが,学習のボトルネックになっている可能性が指摘されている。
    • モデルの本質的な次元を捉え,効率的な学習と軽量化を実現することを目指す。
    • 大規模モデルは,最適化のための冗長性を持つことが示された。
    • ResNet,ViT,BERT等の表現は,最大16倍の圧縮が可能であり,性能劣化は軽微である。
    • 本研究は,Subspace-Native Distillationという新しいパラダイムの基礎となる。

    Link: https://arxiv.org/abs/2512.23410

  • エンジニアリングシミュレーションにおける幾何形状準備とメッシュ生成のためのAI手法調査 [cs.CE, cs.AI, cs.LG]目的:エンジニアリングシミュレーションにおける幾何形状準備とメッシュ生成のためのAI手法
    • シミュレーションの精度向上には,高品質なメッシュが不可欠であり,その自動化が求められている。
    • 従来のメッシュ生成は手作業に依存する部分が多く,効率と品質の向上が課題であった。
    • AIを活用し,メッシュ生成ワークフローの自動化と効率化を図る。
    • 本調査は,CADからメッシュへのパイプラインにおける各ワークフロー段階でのAIの活用事例を整理した。
    • AIは,既存の幾何形状処理とメッシュ生成アルゴリズムを補完する役割を担うことが示唆された。
    • データ,ベンチマーク,信頼性のある統合における課題が指摘され,今後の展望が示された。

    Link: https://arxiv.org/abs/2512.23719

  • コミュニティ間影響を考慮した影響力最大化のためのコミュニティ認識フレームワーク [cs.SI, cs.AI, stat.ML]目的:ソーシャルネットワークにおける影響力最大化
    • ソーシャルネットワーク分析は,情報拡散のメカニズム解明や,効果的な情報戦略立案に不可欠である。
    • 既存手法では,コミュニティ間の独立性を仮定し,現実のネットワークにおけるコミュニティ間影響が無視されている。
    • コミュニティ間影響を明示的にモデル化することで,影響力最大化の精度と効率を向上させる。
    • 本研究で提案するCommunity-IM++は,既存手法と比較して,同程度の情報拡散効果をより高速に達成する。
    • コミュニティベース拡散度(CDD)に基づいたヒューリスティックと漸進的予算配分戦略により,計算コストを大幅に削減する。
    • 大規模実ネットワークでの実験により,Community-IM++の有効性が実証された。

    Link: https://arxiv.org/abs/2512.23973

  • 種ペアリングはいつ分散を低減するか:マルチエージェント経済シミュレーションからの証拠 [cs.LG, stat.ML]目的:種ペアリングによる分散削減の条件
    • 機械学習の評価において,再現性と統計的信頼性が重要であり,そのための手法開発が求められている。
    • 従来の評価方法は独立性を仮定しており,共通の乱数シードによる相関を無視している。
    • 共通乱数シードを利用することで分散を削減し,より信頼性の高い評価を実現すること。
    • 種ペアリングは,結果がシードレベルで正の相関を持つ場合に,分散を厳密に減少させる。
    • マルチエージェント経済シミュレーションにおいて,ペアリング評価は,独立評価では統計的に決定できない集約的・分布的結果の系統的な違いを明らかにした。
    • 共通の乱数シードを用いることで,より効率的かつ正確な比較評価が可能となる。

    Link: https://arxiv.org/abs/2512.24145

  • FaithSCAN:忠実な視覚的質疑応答のためのモデル駆動型単一パスでの幻覚検出 [eess.SY, cs.SY, cs.CV, cs.AI]目的:視覚的質疑応答における幻覚の検出
    • 視覚と言語を組み合わせたAIの信頼性は重要であり,特に安全性が求められる応用分野では不可欠である。
    • 既存手法は計算コストが高いか,モデルの不確実性を十分に捉えられておらず,幻覚検出の性能に限界がある。
    • モデル内部の信号を活用し,効率的かつ高精度な幻覚検出を実現すること。
    • FaithSCANは,トークンレベルの不確実性,中間的な視覚表現,クロスモーダルアラインメント特徴などの豊富な内部信号を活用する軽量なネットワークである。
    • 実験の結果,FaithSCANは既存手法と比較して,有効性と効率の両面で大幅に性能が向上することが示された。
    • 幻覚は,視覚的認識,クロスモーダル推論,言語デコーディングにおける体系的な内部状態の変化に起因することが明らかになった。

    Link: https://arxiv.org/abs/2601.00269

  • 軌道レベルの生成埋め込みによる観測からの模倣学習 [cs.LG]目的:観測データからのオフライン模倣学習における性能向上
    • ロボットの自律学習において,人間の専門家からの示範データは貴重な学習資源である。
    • 既存手法は,データが不十分,または専門家の行動と乖離している場合,性能が低下しやすい。
    • 不完全なデータからも有効な学習信号を抽出し,頑健な模倣学習を実現すること。
    • 提案手法TGEは,時間拡散モデルを用いて潜在空間で専門家の状態密度を推定し,高密度で滑らかな代替報酬を構築する。
    • TGEは,学習された拡散埋め込みの滑らかな形状を利用することで,長期間のTemporal Dynamicsを捉え,分布が異なるデータ間のギャップを埋める。
    • D4RLのLocomotionおよびManipulationベンチマークにおいて,既存のオフライン模倣学習手法と同等またはそれ以上の性能を示した。

    Link: https://arxiv.org/abs/2601.00452

  • 確率を考慮した駐車場選択 [eess.SY, cs.AI, cs.SY, stat.AP]目的:駐車場選択に関する研究
    • 都市交通における円滑な移動には,駐車場の情報が不可欠である。
    • 従来のナビゲーションシステムは駐車場検索時間や徒歩移動時間を考慮せず,到着時間を過小評価する問題がある。
    • 駐車場情報の確率的変動を考慮し,最適な駐車場選択を実現することで,到着時間予測の精度向上を目指す。
    • 提案手法は,駐車場の空き状況の確率に基づいて,期待される到着時間を最小化する動的計画法フレームワークである。
    • シミュレーション実験の結果,確率を考慮した戦略は,確率を考慮しない戦略と比較して最大66%の移動時間短縮を達成した。
    • 実データを用いた実験では,観測頻度を上げることで,空き状況の推定誤差を7%から2%以下に低減できることを示した。

    Link: https://arxiv.org/abs/2601.00521

  • 二分拡散ポリシー最適化 [cs.LG, cs.RO]目的:拡散に基づくポリシーの安定性と制御可能な最適化
    • 意思決定タスクにおいて,拡散ポリシーの表現力と推論時の制御可能性が注目されている。
    • 強化学習による大規模拡散ポリシーの学習は,不安定性や計算コストの問題を抱えている。
    • KL正則化の課題を克服し,安定した学習と柔軟な制御を実現する。
    • 提案手法DIPOLEは,報酬最大化と最小化を目的とした二分化されたポリシーを学習する。
    • 推論時にこれらのポリシーを線形結合することで,貪欲性を柔軟に制御可能となる。
    • ExORL,OGBench,NAVSIM等のベンチマークで有効性が確認された。

    Link: https://arxiv.org/abs/2601.00898

  • 高次元測度空間における品質多様性最適化のための割引モデル探索 [cs.LG, cs.NE]目的:品質多様性最適化における割引モデル探索
    • 複雑な問題に対し,多様な解を効率的に探索する手法の重要性が高まっている。
    • 高次元測度空間では,解が類似した測度空間に集中し,探索が停滞しやすい。
    • 割引モデル探索により,高次元測度空間における解の識別能力を高め,探索を継続する。
    • 割引モデル探索は,高次元測度空間において,既存手法よりも優れた性能を示すことが確認された。
    • 画像空間のような高次元測度空間において,新たな品質多様性最適化の可能性を拓いた。
    • 画像データセットを用いた測度指定により,手動での測度関数設計の負担を軽減できる。

    Link: https://arxiv.org/abs/2601.01082

  • 正解性は効率性ではない:LLM生成コードにおける実行時メモリの相違 [cs.SE, cs.AI]目的:LLM生成コードの実行時メモリ安定性の評価
    • LLMはプログラム生成に利用されるが,テスト合格と実際の挙動は必ずしも一致しないため,信頼性評価が重要である。
    • テストをパスする正解コード間でも,メモリ使用量や実行時間に大きな差が生じることが問題となっている。
    • LLM生成コードの実行時メモリ安定性を定量化し,運用リスクを軽減する手法を提案すること。
    • 同一タスクに対する複数の正解コードにおいて,実行時メモリ使用量に顕著な差異が認められた。
    • サンプリング温度の上昇により,コードの安定性が低下する傾向が確認された。
    • メモリ安定性と,認知・サイクロマチック複雑さといったソフトウェアエンジニアリング指標との間に関連性が見られた。

    Link: https://arxiv.org/abs/2601.01215

  • 信頼性の高いグリッド予測:安全性が重要なエネルギーシステムのための状態空間モデル [eess.SY, cs.AI, cs.LG, cs.SY]目的:グリッド負荷予測の信頼性向上
    • エネルギーシステムの安定運用には,正確なグリッド負荷予測が不可欠である。
    • 従来の評価指標では,供給不足リスクを十分に捉えられていない。
    • 一方的な信頼性リスクを定量化し,安全性を考慮した予測を可能にする。
    • 標準的な精度指標だけでは,運用上の安全性を評価するには不十分であることが示された。
    • 明示的な気象情報の統合は,誤差分布を狭め,温度上昇による需要急増の影響を低減する。
    • バイアス/OPR制約を導入することで,テールリスクの最小化と過大予測の防止のトレードオフを調整可能となる。

    Link: https://arxiv.org/abs/2601.01410

  • テキスト画像拡散モデルにおける批評家誘導強化学習によるアンラーニング [cs.LG]目的:テキスト画像拡散モデルからの特定の概念の除去
    • 画像生成AIの発展に伴い,生成された画像からの不要な情報の削除が重要となっている。
    • 既存のアンラーニング手法は,精度と汎用性の点で課題が残されている。
    • 強化学習を用いたアンラーニングにおいて,不安定性や報酬の希薄性を克服することを目指す。
    • 提案手法は,ノイズステップに応じた批評家を用いることで,より安定した学習を実現した。
    • 本手法は,既存のベースラインと比較して,同等またはより優れたアンラーニング性能を示した。
    • 画像品質や安全なプロンプトへの応答性を維持しながら,概念の忘却を効果的に達成した。

    Link: https://arxiv.org/abs/2601.03213

  • MHRC-Bench:多言語ハードウェアリポジトリレベルのコード補完ベンチマーク [cs.PL, cs.AI]目的:多言語ハードウェアコード補完のためのベンチマーク
    • ハードウェア設計は複雑化しており,効率的な開発手法が求められている。
    • 既存のコード補完ベンチマークは主にソフトウェアに偏っており,ハードウェア記述言語への対応が不十分である。
    • ハードウェア記述言語に対応したコード補完ベンチマークを構築し,その性能評価を行う。
    • MHRC-Benchは,リポジトリレベルでの多言語ハードウェアコード補完を目的とした初のベンチマークである。
    • 3つの主要なハードウェア設計スタイルを対象とし,コード構造とハードウェア指向のセマンティックラベルが付与されている。
    • 評価実験の結果から,MHRC-Benchが効果的なベンチマークであることを示した。

    Link: https://arxiv.org/abs/2601.03708

  • 臨床データはMEDSで?OWLで意味を明確にしよう [cs.LG, cs.AI]目的:医療データの標準化と意味的明示性の確保
    • 医療データへの機械学習応用は,データ活用と医療の発展に不可欠である。
    • データ形式の非標準化により,異なるデータセット間の相互運用性が低い。
    • MEDSとSemantic Webの連携により,データ活用基盤を強化する。
    • MEDS-OWLは,MEDSデータをRDFグラフとして表現する軽量なOWLオントロジーである。
    • meds2rdfライブラリにより,MEDSイベントをRDFグラフに変換し,オントロジーとの整合性を保証する。
    • 本研究は,イベントベースの臨床データの再利用性と相互運用性を高める基盤を提供する。

    Link: https://arxiv.org/abs/2601.04164

  • 統一的マルチモーダル外部接触推定:UNIC [cs.RO, cs.AI, cs.CV]目的:外部接触推定のための統一的マルチモーダルフレームワーク
    • 接触豊富な操作には信頼性の高い接触推定が不可欠。計画,制御,方針学習に重要な情報を提供する。
    • 既存手法は,定義された接触タイプ,固定された把持構成,カメラキャリブレーションなどの制約がある。
    • 未知の物体や非構造化環境への汎化性能を向上させ,カメラキャリブレーションを不要とする。
    • UNICは,事前知識やカメラキャリブレーションなしで動作する統一的なマルチモーダルフレームワークである。
    • 未知の接触位置における平均Chamfer距離誤差は9.6mmであり,未知の物体や動的カメラ視点に対しても頑健性を示す。
    • 本研究は,接触豊富な操作のための実用的かつ汎用性の高い外部接触推定能力を確立する。

    Link: https://arxiv.org/abs/2601.04356

  • SCALER:推論のための合成スケーラブル適応学習環境 [cs.AI]目的:推論能力向上のための適応学習環境
    • 大規模言語モデルの推論能力向上は,AI研究の重要な課題である。
    • モデル能力とタスク難易度の不整合や,問題パターンの偏りが学習の停滞を招く。
    • 動的な環境設計により,効果的な学習シグナルを維持し,学習の継続的な改善を目指す。
    • SCALERは,実世界のプログラミング問題を検証可能な推論環境に変換するスケーラブルなパイプラインを導入した。
    • 適応的なマルチ環境RL戦略により,インスタンスの難易度を調整し,モデルの能力範囲を追跡することで,報酬の希薄化を防ぐ。
    • 多様な推論ベンチマークにおいて,データセットベースのRLと比較して一貫して優れた性能を示し,安定した長期的な学習ダイナミクスを実現した。

    Link: https://arxiv.org/abs/2601.04809

  • FibreCastML:電界紡糸ナノファイバー径分布予測のためのオープンウェブプラットフォーム [cs.LG]目的:電界紡糸ナノファイバーの径分布予測
    • 生体材料,薬物送達,創傷治療などへの応用が期待される電界紡糸技術の重要性が高まっている。
    • 既存の研究では平均繊維径のみ予測しており,スキャフォールド性能を左右する径分布の予測が課題であった。
    • 電界紡糸パラメータから繊維径の完全な分布を予測し,プロセス構造相関の洞察を提供する。
    • FibreCastMLは,16種類の生体高分子ポリマーに関する68538個の繊維径データを用いた機械学習フレームワークである。
    • 非線形モデルは線形モデルよりも優れた性能を示し,多くのポリマーで決定係数が0.91を超えた。
    • 溶液濃度が繊維径分布の主要な制御因子として同定され,実験的検証により予測と測定値の良好な一致が確認された。

    Link: https://arxiv.org/abs/2601.04873

  • 不確実性下における人間とAIの能力均等の錯覚:確率的パラダイムによる曖昧な正解の探求 [cs.RO, cs.CL, cs.AI]目的:AIシステム能力評価における不確実性の影響の理論的解明
    • AI技術の発展は目覚ましいが,その能力を客観的に評価する手法の確立が急務である。
    • 専門家による正解データ自体に不確実性が含まれている点が,評価の信頼性を損ねている。
    • 正解のばらつきが評価に与える影響を考慮し,より正確な能力評価を可能にすること。
    • 正解データの確実性が低い場合,専門家と非専門者の成績に差が見られない可能性がある。
    • 期待精度と期待F1スコアという概念を導入し,正解のばらつきを考慮した評価を提案した。
    • システムの能力評価においては,正解の確率に基づいた層別化が重要であり,特に全体精度が80%を下回る場合に有効である。

    Link: https://arxiv.org/abs/2601.05500

  • 会話型AIとの対話における脳波からの作業負荷と合意の解読 [cs.HC, cs.AI]目的:会話型AIとの対話中の作業負荷と合意の解読
    • AIとの自然な対話を実現するためには,人間の状態を理解することが重要である。
    • 脳波を用いたメンタル状態の解読は実験環境下では進んでいるが,実際の対話場面への応用は難しい。
    • 会話型AIシステムに脳波情報を統合し,より自然な対話を可能にすることを目指す。
    • 確立された脳波分類器を会話型AIとの対話に適用し,作業負荷の解読が可能であることを示した。
    • 暗黙的な合意の解読においても,継続的な適用と会話イベントとの正確な時間的整合性を確認した。
    • 構成概念の転移やイベントベース分類器の非同期適用に課題があることも明らかになった。

    Link: https://arxiv.org/abs/2601.05825

  • 幾何における注意:適応密度場とFAISS加速カーネルによるスケーラブルな空間モデリング [cs.CL, cs.LG, cs.CV, cs.GR]目的:幾何学的注意機構の構築
    • 空間データの解析は,都市計画,気象予測,ロボティクスなど幅広い分野で重要である。
    • 大規模空間データに対する効率的な空間モデリング手法が課題となっていた。
    • 適応密度場を用いて,スケーラブルな空間モデリングを実現し,空間構造の抽出を可能にすること。
    • 本研究では,空間集約を連続空間における距離に基づく注意機構として定式化した適応密度場(ADF)を提案した。
    • ADFは,近似最近傍探索を注意機構の固有要素として組み込むことで,FAISSによる高速化を実現している。
    • 成都市の航空機軌跡分析において,軌跡に依存する影響圏(ZOI)を抽出し,反復的な空域構造と局所的な逸脱を明らかにした。

    Link: https://arxiv.org/abs/2601.06135

  • 継続学習におけるバックプロパゲーションフリーなフィードバック・ヘブ学習ネットワーク [cs.NE, cs.LG]目的:継続学習のダイナミクスに関する研究
    • 脳の学習メカニズム解明には,生物学的な妥当性が重要であり,バックプロパゲーションに依存しない学習則の研究が求められている。
    • バックプロパゲーションを用いない学習システムでは,過去の知識を保持しつつ新しい知識を獲得することが困難である。
    • 本研究は,局所的な学習則に基づくフィードバック型ネットワークが,継続学習に必要なダイナミクスを再現可能か検証する。
    • シンプルな二組の関連付けタスクにおいて,層ごとの活動スナップショットや結合強度変化を分析した結果,フィードバック経路が過去の情報を保持する役割を担っていることが示された。
    • 順次学習においては,前方結合が初期の関連付けを抑制する一方で,フィードバック結合が初期関連付けの痕跡を保持することが確認された。
    • 交互学習においては,両方の関連付けが同時に維持されることが示され,フィードバック経路の再生・共同維持の役割が明らかになった。

    Link: https://arxiv.org/abs/2601.06758

  • X-Coder:完全合成タスク,解答,テストによる競技プログラミングの発展 [cs.CL, cs.LG]目的:競技プログラミングにおけるコードLLMの性能向上
    • ソフトウェア開発の自動化において,コード生成AIの重要性が増している。
    • 既存のコードLLMは実データに依存しており,スケーラビリティと汚染の問題を抱えている。
    • 完全合成データを用いて,コードLLMの推論能力を専門家レベルに引き上げること。
    • 高品質な合成データを用いてX-Coderモデルを学習し,LiveCodeBench v5で62.9%,v6で55.8%の平均正答率を達成した。
    • 実データで学習したより大規模なモデルを上回る性能を示し,合成データの有効性を実証した。
    • 合成データのスケーリング,ドメイン適応型特徴進化,コード中心の強化学習に関する重要な知見を得た。

    Link: https://arxiv.org/abs/2601.06953

  • AntiPaSTO:反平行表現による自己教師ありの正直性制御 [cs.CL, cs.LG]目的:モデルの正直性制御手法
    • 大規模言語モデルの能力向上に伴い,その出力の信頼性評価が重要となっている。
    • 既存手法は,内部制御,自己教師あり学習,分布外汎化の全てを満たせていない。
    • 少ない人間介入で,モデルの正直性を高め,双方向制御を実現すること。
    • AntiPaSTOは,反平行な表現空間を構築し,モデルの出力を制御する。
    • DailyDilemmasベンチマークにおいて,プロンプトベースラインを6.9倍上回る性能を示した。
    • プロンプトでは拒否応答を引き起こす場合に,AntiPaSTOは双方向制御を維持する。

    Link: https://arxiv.org/abs/2601.07473

  • JudgeFlow:ブロック判定によるエージェントワークフローの最適化 [cs.AI]目的:LLMベースのエージェントワークフロー最適化手法
    • AIの能力向上には,エージェントワークフローの効率的な最適化が不可欠である。
    • 既存手法は,全体的な評価信号に頼るため,改善点が不明確で非効率な場合がある。
    • 実行トレースに基づき,問題のあるブロックを特定し,効率的な改善を目指す。
    • JudgeFlowは,問題のあるロジックブロックに責任スコアを付与することで,きめ細かい診断を可能にした。
    • この診断信号を利用したLLMベースの最適化により,サンプル効率が向上し,解釈性が高まった。
    • 数学的推論およびコード生成ベンチマークにおいて,既存手法を上回る性能と効率を達成した。

    Link: https://arxiv.org/abs/2601.07477

  • LLMを用いた長文対話のための動的文脈剪定:DyCP [cs.CL, cs.AI]目的:長文対話における効率的な文脈管理手法
    • 大規模言語モデルの対話への応用が拡大しており,長文対話の処理能力が重要である。
    • 長文対話では文脈が長くなり,推論コストと遅延が課題となっている。
    • DyCPは,対話履歴を動的に選択し,効率的な文脈管理を実現する。
    • DyCPは,既存のLLMに追加可能な軽量な文脈管理手法である。
    • LoCoMo,MT-Bench+,SCM4LLMsのベンチマークで,生成品質と推論効率の向上が確認された。
    • DyCPは,事前に定義されたトピック境界に依存せず,対話の順序性を維持しながら文脈を選択する。

    Link: https://arxiv.org/abs/2601.07994

  • TP-Blend:拡散モデルにおける精密なオブジェクトスタイル混合のためのテキストプロンプト注意ペアリング [cs.CV, cs.AI, cs.LG, cs.MM]目的:拡散モデルにおけるオブジェクトとスタイルの同時導入による精密な画像編集
    • 画像生成AIの発展により,テキスト指示に基づいた画像編集のニーズが高まっている。
    • 既存手法では,オブジェクトとスタイルを同時に変更する際に,品質が低下する課題があった。
    • TP-Blendは,オブジェクトとスタイルの両方を精密に制御する画像編集手法の確立を目指す。
    • TP-Blendは,2つのテキストプロンプトを利用し,オブジェクトとスタイルを独立して注入することで高解像度かつ写実的な編集を実現した。
    • Cross-Attention Object Fusion(CAOF)とSelf-Attention Style Fusion(SASF)の組み合わせにより,高品質な編集を効率的に行う。
    • 定量評価および知覚評価において,既存のベースライン手法を上回る性能が確認された。

    Link: https://arxiv.org/abs/2601.08011

  • A.X K1技術レポート [cs.CL, cs.AI]目的:5190億パラメータのMixture-of-Experts言語モデルA.X K1の開発
    • 大規模言語モデルは,自然言語処理の多様なタスクにおいて高性能を発揮し,応用範囲が拡大している。
    • 高性能なモデルは計算資源を大量に消費するため,効率的な推論が課題となっている。
    • 推論効率と推論能力のバランスを取り,多様な環境で利用可能なモデルを開発する。
    • A.X K1は,約10兆トークンで事前学習され,主要なオープンソースモデルと同等の性能を示す。
    • 特に,韓国語のベンチマークにおいて顕著な優位性を確立した。
    • 思考モードと非思考モードを切り替えるThink-Fusionという学習手法を提案し,モデルの制御性を向上させた。

    Link: https://arxiv.org/abs/2601.09200

  • SimMerge: 類似性シグナルからのマージ演算子の学習 [cs.LG, cs.AI]目的:モデルマージにおける高性能なマージの特定
    • 大規模言語モデル開発において,モデル統合は能力を集約する強力な手法であり重要である。
    • マージ演算子,モデル部分集合,マージ順序の選択が性能に影響し,コストのかかる探索が必要となる点が課題である。
    • 類似性シグナルを利用して効率的に高性能マージを予測し,大規模モデル合成のスケール問題を解決することを目指す。
    • SimMergeは,タスクに依存しない類似性シグナルを用いてマージ性能を予測し,反復評価なしに最適な演算子,順序,部分集合を選択する。
    • 7BパラメータLLMで既存手法を上回り,再学習なしに多方向マージや111BパラメータLLMへ一般化可能である。
    • オンラインでタスクや演算子を追加可能なバンディット変種を提案し,評価予算が限られた大規模チェックポイントカタログでのモデル合成を可能にする。

    Link: https://arxiv.org/abs/2601.09473

  • 大規模最適化モデルの自動定式化:構造化ワークフローによるLLMの柔軟性の活用 [cs.AI, cs.LG]目的:大規模最適化モデルの自動定式化
    • 現代のビジネスにおける意思決定の基盤であり,効率化が求められている。
    • モデル構築には専門知識と労力が必要であり,時間もかかる。
    • LLMを活用し,自動的に最適化モデルを定式化する手法を開発する。
    • LEAN-LLM-OPTは,問題記述とデータセットを入力とし,LLMエージェント群によって最適化モデルを自動生成する。
    • GPT-4.1およびgpt-oss-20Bを用いたシミュレーションで,大規模最適化モデリングタスクにおいて高い性能を示した。
    • シンガポール航空の事例では,様々なシナリオで優れた性能を発揮し,実用的な価値を証明した。

    Link: https://arxiv.org/abs/2601.09635

  • VibrantSR:ジェネレーティブフローマッチングを用いたSentinel-2によるサブメートルキャノピー高さモデル [cs.CV, cs.LG]目的:サブメートルキャノピー高さモデルの推定
    • 森林資源管理や炭素循環研究において,高精度なキャノピー高さモデルは不可欠である。
    • 高解像度なキャノピー高さモデルは,航空写真に依存する場合が多く,取得頻度やコストに課題があった。
    • Sentinel-2データから高精度なキャノピー高さモデルを生成し,広域での継続的な森林モニタリングを実現する。
    • VibrantSRは,Sentinel-2画像から0.5mのキャノピー高さモデルを高精度に推定できる。
    • 米国西部22のEPAレベル3生態地域での評価において,既存の衛星ベースのベンチマークを上回る性能を示した。
    • 航空写真ベースのアプローチに比べると精度は劣るものの,広範囲な森林モニタリングを可能にする。

    Link: https://arxiv.org/abs/2601.09866

  • NSR-Boost:産業用レガシーモデルのためのニューロシンボリック残差ブースティングフレームワーク [cs.MA, cs.AI]目的:産業用レガシーモデルの予測精度向上
    • 産業分野では勾配ブースティング決定木が主流だが,モデル更新のコストやリスクが大きい。
    • レガシーモデルのアップデートは,再学習コストやシステムリスクが高く,困難である。
    • レガシーモデルを安全かつ低コストで進化させ,予測性能を改善することを目指す。
    • NSR-Boostは,既存のレガシーモデルを凍結し,予測が失敗しやすい領域に焦点を当てて修正を行う。
    • 大規模言語モデルとベイズ最適化を活用し,解釈可能な専門家を生成し,軽量な集約器でレガシーモデルと統合する。
    • 公開データセットおよびQfin Holdings社の実際の金融リスク管理システムで,既存手法を上回り,不良率を大幅に削減した。

    Link: https://arxiv.org/abs/2601.10457

  • GRACE:安全で倫理的なAIアライメントのための理由に基づくニューロシンボリックアーキテクチャ [cs.AI, cs.CY]目的:AIアライメントの安全性と倫理性を確保するための,理由に基づくニューロシンボリックアーキテクチャ
    • AIの自律性と社会への影響力が増す中,規範的整合性の確保が重要課題となっている。
    • 既存のAIシステムでは,倫理的判断と行動原理が一体化しており,透明性や説明責任が課題である。
    • 倫理的判断と行動原理を分離し,AIシステムの安全性を高めるためのアーキテクチャを提供する。
    • GRACEは,規範的推論と手段的決定を分離することで,AIエージェントの行動を包含し,安全性を確保する。
    • GRACEは,道徳モジュール,意思決定モジュール,ガードの3つのモジュールで構成され,倫理的制約を遵守する。
    • LLMセラピーアシスタントの例を通じて,関係者がエージェントの行動を理解,異議申し立て,改善できることを示した。

    Link: https://arxiv.org/abs/2601.10520

  • 複雑形状におけるニューラル演算子によるソフトマテリアルの形状変形プログラミング [cs.LG]目的:ソフトマテリアルの形状変形設計
    • ソフトマテリアルは多様な応用可能性を秘めており,その形状変形設計は重要な研究分野である。
    • 複雑な形状における高精度かつ多様な変形設計が困難であり,実用化の障壁となっている。
    • 複雑形状における高精度な形状変形予測と,マテリアル分布の最適化を目指す。
    • スペクトル・空間ニューラル演算子(S2NO)により,複雑形状上での高精度な形状変形予測が可能となった。
    • S2NOは,ラプラシアン固有関数エンコーディングと空間畳み込みを統合し,変形の挙動を的確に捉える。
    • 進化アルゴリズムとの組み合わせにより,不規則境界形状,多孔質構造,薄肉構造など,様々な複雑形状でのマテリアル分布最適化を実現した。

    Link: https://arxiv.org/abs/2601.11126

  • 構造的害悪としての美学:テキスト画像生成と分類におけるアルゴリズムによる外見至上主義 [cs.CV, cs.AI, cs.CY]目的:テキスト画像生成AIと性別分類タスクにおけるアルゴリズムによる外見至上主義の構造
    • AI技術の社会実装が進む中,潜在的な偏見や差別構造の解明が不可欠である。
    • AIモデルが社会的な偏見を学習し,それを増幅・固定化する危険性がある。
    • AIビジョンシステムに内在する外見至上主義の構造を明らかにし,その影響を軽減する。
    • Stable Diffusion 2.1と3.5 Mediumで生成された26,400枚の合成顔画像から,AIが顔の魅力と肯定的な属性を関連付ける傾向が確認された。
    • 性別分類アルゴリズムにおいて,特にネガティブな属性を持つ女性の顔で誤分類率が高いという,性別間の不均衡が明らかになった。
    • AIモデルの進化に伴い,年齢の均質化,ジェンダー化された露出パターン,地理的還元主義を通じて,美学的な制約が強まっていることが示唆された。

    Link: https://arxiv.org/abs/2601.11651

  • ハーモニカ:持続可能なMLOpsのための自己適応の模範 [cs.SE, cs.LG]目的:機械学習システムにおける実行時不確実性への適応メカニズム
    • 機械学習システムの普及に伴い,運用環境の変化への対応が重要になっている。
    • 従来のMLOpsは,長期的なシステムの持続可能性を脅かす実行時の不確実性への対応が不足している。
    • ハーモニカは,MLOpsパイプラインにおける自己適応の課題を研究するための模範事例を提供する。
    • ハーモニカは,MAPE-Kループを用いた構造化された適応制御を導入し,高レベルの適応ポリシーと低レベルの戦術実行を分離する。
    • 持続可能性指標を継続的に監視し,動的な適応境界と比較することで,閾値違反時に自動的にアーキテクチャ戦術をトリガーする。
    • 時系列回帰とコンピュータビジョンのケーススタディを通じて,システムの安定性の向上と手動介入の削減が確認された。

    Link: https://arxiv.org/abs/2601.11926

  • TensorRTを用いた効率的な3D物体検出のための混合精度PointPillars [cs.CY, cs.CL, cs.HC, cs.CY, cs.HC, cs.CY, cs.CL, cs.CV, cs.AI]目的:効率的な3D物体検出のための混合精度モデルの構築
    • 自動運転車の実現には,周囲環境の正確かつ高速な認識が不可欠である。
    • LiDARデータは数値分布が広く,外れ値も多く,量子化による性能劣化が課題となる。
    • LiDARデータの特性に適した混合精度化により,性能劣化を抑制し,高速化を実現する。
    • 提案手法は,量子化による性能劣化を最小限に抑えながら,PointPillarsの推論速度を最大2.538倍向上させた。
    • PTQパイプラインにおいて,学習不要で混合精度モデルを生成できることを示した。
    • QATパイプラインにおいては,FPモデルに匹敵する性能を達成した。

    Link: https://arxiv.org/abs/2601.12638

  • AI生成データ汚染が病理学的多様性と診断信頼性を損なう [cs.CY, cs.AI, cs.CL, cs.CV, cs.LG]目的:AI生成データ汚染による臨床的影響の評価
    • 医療AIの発展には,質の高い学習データが不可欠である。データの信頼性が,診断精度に直結する。
    • AIが生成したデータが学習データに混入し,AI自身が生成したデータで学習を繰り返すことで,質の低下が懸念される。
    • AI生成データ汚染が,病理学的多様性と診断信頼性に与える影響を明らかにすること。
    • AIによるデータ生成を繰り返すと,病理学的多様性が失われ,モデルが一般的な表現に収束していくことが示された。
    • 特に,気胸や滲出といった重要な所見がAI生成データから消失し,患者の属性も中年男性に偏る傾向が確認された。
    • AIは誤った自信を持って診断結果を出力し,致命的な病理を見逃す率が3倍に増加することが判明した。医師の評価でも,AI生成ドキュメントの臨床的有用性が失われることが確認された。

    Link: https://arxiv.org/abs/2601.12946

  • プローブとスキップ:効率的な長文脈LLM推論のための自己予測トークンスキップ [cs.CL, cs.LG]目的:長文脈LLM推論における計算コスト削減
    • LLMの推論能力向上に長文脈が不可欠だが,計算負荷が大きい
    • 既存手法は構造最適化不足,選択基準の陳腐化,冗長性干渉の問題がある
    • トークンスキップによる推論効率化と精度維持を目指す
    • 提案手法(SPTS)は,Multi-Head Attention用Partial Attention ProbingとFeed Forward Network用Low-rank Transformation Probingを設計
    • Multi-Stage Delayed Pruningによりスキップ予算を再配分し,冗長トークンを段階的に除去
    • prefillingとend-to-end生成において最大2.46倍,2.29倍の高速化を達成し,最先端の精度を維持

    Link: https://arxiv.org/abs/2601.13155

  • 信頼して,私は専門家だ:大規模言語モデルにおける権威バイアスの解読と制御 [cs.CL, cs.LG]目的:大規模言語モデルにおける権威バイアスのメカニズム解明と軽減
    • 言語モデルの推論能力は,その実用性において重要であり,信頼性向上が不可欠である。
    • 言語モデルは,発言者の信頼性によって誤った情報を受け入れやすいという問題がある。
    • 専門家による誤った示唆がモデルの性能に与える影響を軽減する方法を模索する。
    • 言語モデルは,発言者の専門性が高まるほど,誤った情報に影響を受けやすくなることが示された。
    • 権威のある情報源は,正確性の低下だけでなく,誤った回答に対する自信を高めることが明らかになった。
    • モデル内部に権威バイアスがメカニズム的にエンコードされており,バイアスから誘導することが可能である。

    Link: https://arxiv.org/abs/2601.13433

  • 長期・短期株式取引とリスク調整後リターン最適化のための学習可能なウェーブレットTransformer [cs.LG, cs.AI, q-fin.CP]目的:金融時系列データからの収益性の高い日中取引戦略の学習
    • 金融市場における効率的な資産運用は,経済成長と個人の資産形成に不可欠である。
    • 金融時系列データはノイズが多く,非定常性があり,資産間の相互依存性が高いため,取引戦略の学習が困難である。
    • マルチスケール分解とリターンに着目した意思決定学習を組み合わせることで,取引戦略のパフォーマンスを向上させる。
    • 提案手法WaveLSFormerは,様々な業界グループにおいて,MLP,LSTM,Transformerといった既存手法を安定的に上回る成果を示した。
    • WaveLSFormerは,累積全体戦略リターンで0.607 ± 0.045,シャープレシオで2.157 ± 0.166を達成し,収益性とリスク調整後リターンを大幅に改善した。
    • 学習可能なウェーブレットフロントエンドとLGHIモジュールにより,マルチスケール情報の効果的な統合と安定した学習を実現した。

    Link: https://arxiv.org/abs/2601.13435

  • グラフニューラルネットワークはヒューリスティクスである [cs.AI, cs.LG]目的:組合せ最適化のためのヒューリスティクス
    • 組合せ最適化問題は,現実世界の様々な分野で頻繁に現れるため,その効率的な解決が重要である。
    • 従来の組合せ最適化手法は,問題の規模が大きくなると計算コストが増大し,実用性に課題がある。
    • グラフニューラルネットワークを用いて,効率的かつ効果的なヒューリスティクスを学習し,組合せ最適化問題を解決すること。
    • 単一の学習パスでグラフニューラルネットワークを,組合せ最適化のための教師なしヒューリスティクスへと変換できることが示された。
    • グローバルな構造的制約を誘導バイアスとして組み込むことで,非自己回帰モデルが探索や教師なしで直接解を生成可能となった。
    • 推論時には,ドロップアウトとスナップショットアンサンブルにより,単一モデルが暗黙的なアンサンブルとして機能し,解の多様性を高め,最適性ギャップを縮小することが確認された。

    Link: https://arxiv.org/abs/2601.13465

  • 脳ダイナミクスの理解のための幾何学的状態空間ニューラルネットワーク:リーマン多様体上での研究 [cs.LG, cs.AI]目的:脳ダイナミクス理解のための幾何学的状態空間ニューラルネットワーク
    • 脳機能の解明は,認知や行動のメカニズム理解に不可欠であり,医療応用への期待も大きい。
    • 既存手法は,脳領域間の繋がりを単純化し,全体的な自己組織化ダイナミクスを捉えきれていない。
    • リーマン多様体上での脳活動の軌跡を捉え,より包括的な脳ダイナミクスモデルを構築することを目指す。
    • 提案手法GeoDynamicsは,高次元SPD多様体上での潜在脳状態の軌跡を直接追跡する幾何学的状態空間ニューラルネットワークである。
    • タスク駆動型状態変化やアルツハイマー病,パーキンソン病,自閉症の早期マーカーを検出できることが示された。
    • 人間行動認識ベンチマークにおいても高い汎化性能とロバスト性を示し,多様な領域への応用可能性を提示した。

    Link: https://arxiv.org/abs/2601.13570

  • ConceptCaps:音楽モデルの解釈可能性のための蒸留された概念データセット [cs.SD, cs.AI, cs.LG]目的:音楽モデルの解釈可能性向上のための概念データセット
    • 音楽理解の深まりは,作曲支援や音楽推薦など,多様な応用への道を開く。
    • 既存の音楽データセットは,タグの信頼性や概念の定義が曖昧で,解釈可能性研究の妨げとなる。
    • 明確な概念ラベルを持つデータセットを提供し,音楽モデルの解釈可能性評価を促進する。
    • ConceptCapsは,200の属性分類に基づいた23,000件の音楽-キャプション-オーディオの組で構成される。
    • 属性の共起パターンをVAEで学習し,LLMで高品質なキャプションを生成,MusicGenで対応するオーディオを合成する分離型パイプラインを採用。
    • CLAPスコアやBERTScoreなどの評価により,データセットの品質と音楽的な意味の再現性が確認された。

    Link: https://arxiv.org/abs/2601.14157

  • HELIOS:構造を意識したLLM逆アセンブルのための階層的グラフ抽象化 [cs.CL, cs.SE, cs.AI]目的:LLMを用いたバイナリ逆アセンブルの構造化推論
    • セキュリティ分野において,バイナリ解析はマルウェアの解析や脆弱性の発見に不可欠である。
    • 従来のLLMはコードをテキストとして扱うため,プログラムの制御フローを考慮できず,正確性に課題がある。
    • 制御フローグラフを構造化し,LLMに提供することで,より正確な逆アセンブルを可能にすることを目指す。
    • HELIOSは,Gemini 2.0とGPT-4.1 Miniにおいて,HumanEval-Decompileのオブジェクトファイルのコンパイル成功率を大幅に向上させた。
    • コンパイラからのフィードバックを用いることで,コンパイル成功率は94%を超え,機能的な正しさも改善された。
    • x86,ARM,MIPSといった多様なアーキテクチャにおいて,機能的な正確性のばらつきを抑え,構文的な正確性を維持した。

    Link: https://arxiv.org/abs/2601.14598

  • 結果に基づく強化学習は,適切なデータがあればTransformerに推論をもたらすことが証明される [cs.RO, cs.LG, cs.AI]目的:Transformerにおける,結果に基づく強化学習による推論能力のメカニズム解明
    • Transformerは自然言語処理の分野で急速に発展しており,その性能向上が求められている。
    • 強化学習を用いたTransformerの学習では,推論能力がどのように獲得されるか不明な点が多い。
    • Transformerが推論能力を獲得するためのデータ分布の条件を明らかにする。
    • 最終的な正解のみを報酬として与える強化学習でも,Transformerは体系的なアルゴリズムを学習する。
    • 学習において,少ない推論ステップで解ける「単純な例」が重要な役割を果たすことが示された。
    • 単純な例が十分に存在する場合,Transformerはより長い推論にも対応できる汎化戦略を獲得する。

    Link: https://arxiv.org/abs/2601.15158

  • LangForce:潜在的行動クエリによる視覚言語行動モデルのベイズ分解 [cs.AI, cs.CL, cs.CV, cs.RO]目的:視覚言語行動モデルにおける情報崩壊の抑制と,言語指示へのロバストな言及
    • ロボットマニピュレーションにおいて,視覚と言語と行動を統合するモデルの重要性が高まっている。
    • 既存モデルは,データ収集時のバイアスにより,言語指示が視覚情報から予測可能となり,言語が無視される。
    • 言語指示と行動の相互情報量を最大化し,視覚的ショートカットを抑制することで汎化性能を向上させる。
    • 提案手法LangForceは,ベイズ分解により,視覚のみの事前分布と,言語条件付きの事後分布を推定する。
    • SimplerEnvおよびRoboCasa環境での実験により,LangForceが大幅な性能向上を達成することが示された。
    • 特に,難易度の高いOOD SimplerEnvベンチマークにおいて,11.3%の改善が見られ,言語指示のロバストな言及が確認された。

    Link: https://arxiv.org/abs/2601.15197

  • 交通事故重症度予測のためのマルチエージェントLLMフレームワークTransportAgents [cs.AI]目的:交通事故重症度予測の精度向上
    • 交通安全計画や緊急対応の改善には,正確な事故重症度予測が不可欠である。
    • 既存のLLMは,異質な事故データに対し,偏った予測や不安定性を招く場合がある。
    • TransportAgentsは,LLMの多様な情報を統合し,より安定した予測を目指す。
    • TransportAgentsは,従来の機械学習モデルやLLMベースラインよりも優れた性能を示すことが,二つの米国データセットを用いた実験で確認された。
    • GPT-3.5,GPT-4o,LLaMA-3.3を含む複数のバックボーンモデルで,頑健性,拡張性,データセット間の汎化性能が確認された。
    • TransportAgentsは,標準的なLLMアプローチと比較して,よりバランスの取れた重症度予測を行い,解釈性と信頼性が高い。

    Link: https://arxiv.org/abs/2601.15519

  • 大規模モデルにおける推論が,訓練後に分解可能となる理由 [cs.CC, cs.CL, cs.LG, cs.AI]目的:大規模モデルの推論における構造的分解可能性
    • AIモデルの規模拡大に伴い,推論コストとシステム複雑性が課題となっている。
    • 推論システムが単一の演算子として扱われ,学習過程で形成された内部構造が無視されている。
    • 学習後のモデル構造に着目し,推論を効率化するための構造分解アプローチを提案する。
    • 大規模モデルの勾配更新は局所的であり,訓練後に多くのパラメータ依存関係が初期化分布と区別できなくなることが示された。
    • 推論システムは構造的に均一ではなく,分解可能であるという観察に基づき,統計的基準と構造的アニーリング法を導入した。
    • モデルの機能やインターフェースを変更せずに,構造化された並列推論が可能となる。

    Link: https://arxiv.org/abs/2601.15871

  • SemanticALLI:エージェントシステムにおける推論のキャッシュ,単なる応答ではない [cs.AI, cs.MA]目的:エージェントシステムの冗長な推論のキャッシュ機構
    • 大規模言語モデルを活用したエージェントシステムは,高度な分析能力を提供するが,計算コストが高い。
    • 既存のキャッシュ技術では,推論過程をブラックボックスとして扱うため,中間的な推論の再利用が困難である。
    • 構造化された中間表現をキャッシュすることで,推論コストを削減し,システムの効率を向上させる。
    • SemanticALLIは,分析意図の解決と可視化の合成を分離し,構造化された中間表現をキャッシュ可能な成果物として扱う。
    • 実験結果から,SemanticALLIは従来のキャッシュ技術と比較して,可視化合成段階で83.10%という高いヒット率を達成した。
    • これにより,LLMの呼び出し回数を4,023回削減し,平均遅延時間を2.66ミリ秒に抑えることに成功した。

    Link: https://arxiv.org/abs/2601.16286

  • 分散型マルチ車両自律型バレーパーキング:Autowareを用いたDMV-AVP [cs.RO, cs.AI, cs.MA]目的:マルチ車両自律型バレーパーキング(AVP)の分散シミュレーションシステム
    • 自動運転技術の発展に伴い,より複雑な環境下での車両制御が求められている。
    • 既存のシミュレーション手法は,集中型または非分散型であり,スケーラビリティに限界がある。
    • 分散環境下でのマルチ車両協調制御を実現し,実用的なAVPシステムの開発を支援する。
    • 本研究で開発したDMV-AVPは,複数のホスト上でAutowareインスタンスを協調させることが可能である。
    • 提案手法は,車両の衝突回避,駐車スペースの予約,およびライフサイクル管理を確実に行うことが示された。
    • シミュレーション結果は,分散型AVPシミュレーションの有効性を示し,今後の実環境検証への基盤を提供する。

    Link: https://arxiv.org/abs/2601.16327