arXiv雑要約

AI - 2025/12/17 公開

物理知識に基づいた深層学習によるヒートポンプのストレス検出：When2Heatデータセットを用いた包括的分析 [cs.HC, cs.CY, cs.HC, cs.CY, cs.RO, cs.HC, cs.CY, cs.LG, cs.CV, cs.NE]目的：ヒートポンプのストレス分類
- 現代の省エネルギー建築において，ヒートポンプは重要な役割を担うため，その健全性維持が不可欠である。
- 複雑な熱力学的相互作用と，実世界データの不足により，ヒートポンプの稼働状況のストレス検出は困難である。
- 本研究は，ヒートポンプのストレスをより正確に検出できる，物理知識に基づいた深層学習モデルを開発することを目指す。
- 提案手法は，When2Heatデータセットを用いて78.1%のテスト精度と78.5%の検証精度を達成した。
- この精度は，浅いニューラルネットワークと比較して5.0%，限定的な特徴量セットと比較して4.0%，単一の正則化戦略と比較して2.0%向上している。
- 物理知識に基づいた特徴量選択，現実的なクラス分布のための可変閾値，そして国ごとのエネルギーパターン分析の効果が検証された。
Link: https://arxiv.org/abs/2512.13696
共生的な執筆：AI時代における人間の創造的能動性のマッピング [cs.CY, cs.AI, cs.CL]目的：AI時代における人間とAIの共進化における創造的執筆のパターン
- AI技術の発展は，人間の創造性や表現に大きな影響を与えるため，その影響を理解することは重要である。
- AIの普及により，文章スタイルの均質化が進むという懸念がある。
- AIとの共進化の中で，人間の創造的能動性がどのように変化しているのかを明らかにすること。
- 大規模なテキストデータ分析の結果，「二重トラック進化」と呼ばれる現象が確認された。AI関連テーマの収束とスタイル多様性の維持が同時に起こっている。
- 著者のAIスタイルへの類似度増加，減少，安定の3つの適応パターンが明らかになり，「創造的類型マップ」が構築された。
- この研究は，人間とAIの協調，AI生成テキストの検出，創造的多様性の維持といった課題への議論に貢献する。
Link: https://arxiv.org/abs/2512.13697
非構造化患者記録からの構造化データ抽出におけるLLMの活用 [cs.CY, cs.CY, cs.AI, cs.CL]目的：非構造化患者記録からの構造化データ抽出
- 臨床研究において，患者記録のレビューは不可欠だが，時間と労力を要する。
- 手作業によるレビューでは，専門家による抽出にばらつきが生じやすい。
- LLMを用いて抽出作業を自動化し，臨床研究の効率化を目指す。
- 本フレームワークは，患者記録から複数の医療特性を高精度に抽出できた。
- 専門家による手作業レビューで見落とされていた注釈エラーも特定された。
- LLMシステムによる自動抽出は，データ収集の整合性を高め，臨床研究を加速させる可能性を示す。
Link: https://arxiv.org/abs/2512.13700
空間正則化ベイズ軌跡推論によるブラインド無線マッピング [cs.AI, cs.IT, math.IT]目的：無線環境の空間的分布の把握
- 無線通信技術の高度化に不可欠であり，屋内環境における電波特性の理解が重要である。
- 従来の無線マップ構築には位置情報ラベル付きの大量データが必要であり，コストや手間がかかる。
- 位置情報ラベルなしで無線マップを構築し，データ収集の負担を軽減することを目指す。
- 提案手法は，非線形回折環境下においてチャネル状態情報（CSI）が空間的な連続性を持つことを証明した。
- CSIに基づいた距離指標が物理的距離に比例することを示し，正確な位置推定を可能にした。
- 実験結果から，平均位置推定誤差が0.68m，ビームマップ再構成誤差が3.3%であり，有効性が確認された。
Link: https://arxiv.org/abs/2512.13701
医療AIの透明性とトレーサビリティの向上：AI製品パスポート [cs.CY, cs.AI]目的：医療AIにおける透明性，トレーサビリティ，コンプライアンスを向上させるための標準ベースのフレームワーク
- 医療現場でのAI活用は進むが，その安全性と信頼性が重要課題となっている。
- AIモデルの透明性やトレーサビリティが不足しており，規制遵守が困難である。
- 医療AIのライフサイクル全体を文書化し，透明性とトレーサビリティを確保すること。
- AI製品パスポートは，既存の標準と方法論に基づいて設計され，明確なライフサイクル管理と役割ベースのアクセスを実現する。
- 本フレームワークは，機械可読および人間可読のレポートを生成し，ステークホルダーに合わせてカスタマイズ可能である。
- AI製品パスポートは，医療AIにおける透明性のギャップを解消し，規制および倫理的要求を満たす。
Link: https://arxiv.org/abs/2512.13702
Safe2Harm：大規模言語モデルの脱獄のための意味的同型攻撃 [cs.CR, cs.AI]目的：大規模言語モデルの脱獄手法
- 言語モデルの応用が拡大する中で，安全性確保は喫緊の課題である。
- 既存の脱獄手法は，プロンプトの巧妙な操作に依存し，根本的な解決に至っていない。
- 意味的同型性に着目し，安全な質問から有害な出力を効率的に生成する。
- 提案手法Safe2Harmは，7つの主要な言語モデルにおいて高い脱獄能力を示した。
- 既存の手法と比較して，全体的な性能が優れていることが実験的に確認された。
- 358件の有害コンテンツ評価データセットを構築し，既存の検知手法の効果を検証した。
Link: https://arxiv.org/abs/2512.13703
知識グラフに基づいたLLMエージェント評議会によるノイズラベルの修正 [cs.AI]目的：ノイズラベルの自動識別と修正
- 機械学習システムの性能は学習データの質に依存する。特に産業用途では信頼性が重要である。
- ラベルにノイズが含まれると，性能が低下し，ユーザーの信頼を損なう可能性がある。
- 知識グラフを用いて，ノイズラベルを高精度に特定し，修正することを目指す。
- 知識グラフを活用したモデルは，F1スコア0.99を達成し，単一LLM（0.48）や知識グラフ未利用の評議会（0.59）を大幅に上回った。
- 知識グラフは，構造的なエラーを高精度に特定し，完全な再現率を実現した。
- 本システムは，厳格な管理環境下での高品質なデータセット生成の実現可能性を示す。
Link: https://arxiv.org/abs/2512.13704
大規模言語モデル学習におけるアニーリング戦略の拡張性と転移性 [cs.LG, cs.AI]目的：大規模言語モデル学習における最適なアニーリング戦略の理解と最適化
- 大規模言語モデルの性能向上には，効率的な学習が不可欠であり，学習率スケジューリングはその重要な要素である。
- モデル構成によって最適なアニーリング戦略が異なり，その解明は困難である。
- アニーリング戦略の転移性を検証し，より効率的な学習率スケジュールの最適化指針を提供する。
- 提案するフレームワークは，学習ステップ数，最大学習率，アニーリングの振る舞いを組み込み，学習率スケジュールの最適化を可能にする。
- 小規模モデルをプロキシとして使用することで，大規模モデルの学習動的な特性を効率的に最適化できることが示された。
- DenseモデルとMoEモデルの両方を用いた実験により，最適なアニーリング比率が一定のパターンに従い，異なる設定間で転移可能であることが確認された。
Link: https://arxiv.org/abs/2512.13705
数学的推論ファインチューニングにおける破滅的忘却の緩和：混合学習による手法 [cs.LG, cs.CL]目的：数学的推論ファインチューニングにおける破滅的忘却の緩和
- 大規模言語モデルの応用範囲拡大には，特定のタスクへの適応と汎用性の維持が重要である。
- ファインチューニングは，専門的なタスクの性能を向上させる一方で，既存の知識を失う「破滅的忘却」を引き起こしやすい。
- 数学的推論能力の向上と同時に，既存の言語理解能力を維持することを目指す。
- 数学のみの学習では数学精度は向上するものの，自然言語推論の精度が著しく低下する。
- 混合学習戦略を用いることで，破滅的忘却を完全に解消しつつ，数学的精度を維持できることが示された。
- わずかな自然言語推論データの混入でも効果的な正則化効果が得られ，汎用的な能力の維持に貢献する。
Link: https://arxiv.org/abs/2512.13706
定常状態からの隠れた相互作用ネットワーク再構成のための変分物理情報に基づくアプローチ [cs.LG]目的：複雑系の相互作用構造の再構成
- 複雑系の集団振る舞いは相互作用構造に依存する。その理解は科学的進歩に不可欠である。
- 従来の再構成手法は，非線形性や高次の結合，定常状態のみが観測可能な場合に課題がある。
- 定常状態データのみから，一般的な相互作用オペレーターを直接推論し，相互作用ネットワークを再構成する。
- 提案手法VPIAは，微分可能性のある変分表現に定常状態制約を組み込み，物理由来の残差を最小化することで結合を再構成する。
- 残差サンプリングと自然勾配最適化により，大規模で高次のネットワークのスケーラブルな学習が可能となる。
- 多様な非線形系において，ノイズ下でも指向性，重み付け，多体構造を正確に復元することが示された。
Link: https://arxiv.org/abs/2512.13708
スマート監視：機械学習を活用したトラフィック分析によるIoTデバイスの挙動の識別 [cs.CR, cs.LG]目的：IoTデバイスの種類と動作の分類
- IoTデバイスの急増に伴い，セキュリティリスクが増大しており，その監視が重要である。
- 既存研究では，外部ネットワークからのIoTデバイスの監視・分類が困難である。
- 機械学習を用いて，外部ネットワークからのIoTデバイスの識別と挙動分析を実現する。
- 提案手法により，IoTデバイスと動作の認識が可能であることが実験的に示された。
- Random Forest分類器が91%の最高精度を達成し，MLPは56%の最低精度であった。
- セキュリティカメラに関連する特定の動作の分類は課題として残る。
Link: https://arxiv.org/abs/2512.13709
SARと環境変数を用いた洪水リスク地域予測モデリング [cs.LG]目的：洪水リスク地域の予測モデルの構築
- 洪水は世界的に甚大な被害をもたらす自然災害であり，生態系，インフラ，人々の生活に深刻な影響を与える。
- 十分なデータが得られない地域において，正確な洪水リスク評価が困難である。
- SARデータと機械学習を組み合わせることで，データ不足地域における洪水リスクマッピングの精度向上を目指す。
- ランダムフォレストモデルが最も高い予測性能を示し（正答率=0.762，Kappa=0.480），他のモデルを上回った。
- 予測マップは，ビクトリア湖近郊の低地のカノ平原が最も洪水の影響を受けやすいことを示しており，過去の記録と一致する。
- SARデータと機械学習の組み合わせは，データが限られた地域における洪水リスクマッピングに有効であることが示された。
Link: https://arxiv.org/abs/2512.13710
削除と保持：文書分類における効率的なアンラーニング [cs.LG]目的：文書分類モデルからの特定の訓練データの影響効率的な除去
- 機械学習モデルのプライバシー保護や，データ変更への対応が重要視されている。
- 大規模言語モデルにおけるアンラーニング研究が進む一方で，文書分類モデルは遅れている。
- 文書分類におけるクラスレベルのアンラーニングを効率的に実現する手法を提案する。
- ヘシアン再割り当ては，完全な再学習と比較して同等の精度を，大幅に高速に達成する。
- 削除されたクラスに対するメンバーシップ推論攻撃の成功率を，一貫して低下させる。
- 文書分類における効率的なクラスアンラーニングへの実用的かつ原理的な道筋を示す。
Link: https://arxiv.org/abs/2512.13711
機械学習モデルに基づく環境データを用いた呼吸器細胞融合ウイルス関連入院予測 [cs.LG, stat.AP, stat.ME]目的：呼吸器細胞融合ウイルス（RSV）関連入院予測のための機械学習フレームワーク
- 呼吸器疾患の感染拡大は公衆衛生上の重要な課題であり，早期予測と対策が不可欠である。
- RSV感染症の発生は環境条件に強く影響されるが，予測モデルの精度向上が課題である。
- 環境データと疫学データを統合し，RSV関連入院リスクをより正確に予測すること。
- 下水サーベイランスデータが最も強力な予測因子であり，気象・大気質データも重要な役割を果たすことが示された。
- ネイティブアメリカンおよびアラスカネイティブにおけるRSV関連入院率が有意に高いことが明らかになった。
- 高地ではRSV関連入院率が高い傾向が見られた。環境と地域サーベイランスデータの組み合わせが，RSV流行の予測に役立つ。
Link: https://arxiv.org/abs/2512.13712
LoopBench：LLMスウォームによる創発的な対称性解消戦略の発見 [cs.AI, cs.LG, cs.MA]目的：LLMスウォームにおける分散システムでの協調能力の評価
- LLMは自律エージェントとして活用が進むが，分散システムにおける協調性は未解明な点が多い。
- 決定論的なエージェントは，有限の色数で奇数サイクルグラフを塗り分ける際に無限ループに陥る。
- LLMスウォームが創発的に分散アルゴリズムを構築し，デッドロックを回避できるか検証する。
- LoopBenchは，LLMの分散的な対称性解消とメタ認知能力を評価するためのベンチマークである。
- 標準的なLLMや古典的なヒューリスティクスでは困難な課題に対し，高度な推論モデル（O3等）は戦略を考案し，デッドロックから脱出できることが示された。
- 言語に基づく推論を用いた創発的な分散アルゴリズムの研究を可能にするテストベッドを提供する。
Link: https://arxiv.org/abs/2512.13713
AIを活用した注釈パイプラインによる大規模言語モデルの安定化：人間とAIの相乗効果 [cs.AI]目的：大規模言語モデルの不安定性パターン特定，ラベリング，修正のためのAIベースの注釈パイプライン
- 規制対象産業におけるLLM利用は，安定性の問題により制限されている。正確性と一貫性が求められる分野での安全な利用が課題。
- 既存の安定化手法（RLHF，教師ありファインチューニング）は高コストであり，大規模な人間による注釈が必要で，持続的なスケーリングが困難。
- 本研究は，AIと人間の協調により，効率的かつ信頼性の高い注釈パイプラインを構築し，LLMの安定性を向上させることを目指す。
- AIを活用した注釈パイプラインを構築し，LLMの出力における不安定性パターンを体系的に特定，ラベリング，修正することを可能にした。
- 自動弱教師あり学習と信頼度に基づく注釈のモデルを組み合わせ，人間による検証と組み合わせることで，フィードバック情報の信頼性と倫理性を保証する。
- 意味的一貫性，事実の正確性，論理的な整合性という安定化のための注釈カテゴリを導入し，モデルの継続的な校正と堅牢性の向上を実現した。
Link: https://arxiv.org/abs/2512.13714
O-RANにおけるスケーラブルなリソース管理のためのメタ階層型強化学習 [cs.AI, cs.LG, cs.SY, eess.SY]目的：O-RANにおけるリソース配分とネットワークスライスの同時最適化
- 現代の複雑なアプリケーションに対応するため，リアルタイム適応性と効率的なリソース管理が求められている。
- 既存のAI駆動型手法は，予測不能かつ動的な状況下での性能維持が課題となっていた。
- 複雑なネットワーク環境下での安定性と適応速度を向上させ，効率的なリソース管理を実現すること。
- 提案手法は，ベースラインの強化学習およびメタ強化学習と比較して，ネットワーク管理効率を19.8%向上させた。
- ネットワーク規模の拡大に伴い，適応速度が最大40%向上し，公平性，遅延，スループットが安定的に維持された。
- 理論解析により，2層学習プロセスの亜線形収束性と後悔保証が確立された。
Link: https://arxiv.org/abs/2512.13715
価値重視型意思決定のための二段階フレームワークValuePilot [cs.AI]目的：価値重視型個別化意思決定
- AIの社会実装が進む中，ユーザーの価値観に沿った行動が不可欠である。
- タスク達成や集団最適化を超えた，個人の価値観への適応が課題となっている。
- 人間とAIの協調において，一貫性のある行動を可能にする価値観に基づいた意思決定を目指す。
- 提案手法ValuePilotは，人間とLLMの協調によるデータセット生成と，価値に基づいた意思決定モジュールから構成される。
- ValuePilotの意思決定モジュールは，未知のシナリオにおいて，GPT-5などの強力なLLMベースラインを上回る性能を示す。
- 価値重視型意思決定は，解釈可能で個別化されたAIエージェントを構築するための有効な手法である。
Link: https://arxiv.org/abs/2512.13716
プライバシー制約下におけるてんかん発作検出のための連合学習による少サンプル学習 [cs.LG, cs.AI]目的：プライバシー制約下でのてんかん発作検出のための連合学習フレームワーク
- 脳波データはてんかん診断に不可欠だが，患者データは機密性が高く共有が困難である。
- 大規模なラベル付き脳波データセットの入手が難しく，データ共有の制約がある。
- 分散データ環境下で，少量のデータから高精度な発作検出モデルを構築すること。
- 提案手法は，中央集権的な学習と比較して，性能の低下は小さい範囲に抑えられた。
- 連合学習と少サンプル学習を組み合わせることで，患者固有のデータでも高い精度を実現した。
- 本研究は，現実的なデータ可用性とプライバシー制約下での発作検出の可能性を示唆する。
Link: https://arxiv.org/abs/2512.13717
中国製，アメリカ思考：中国LLMにおけるアメリカ的価値観の持続 [cs.CY, cs.AI]目的：中国とアメリカ製のLLMにおける価値観の比較
- LLMは情報アクセスや意思決定を仲介し，ソフトパワー競争の道具となりつつある
- 既存研究は主にアメリカ企業製のLLMに偏っており，中国製LLMの価値観は不明であった
- 中国とアメリカ製のLLMが，それぞれの国民の価値観とどのように一致するかを明らかにすること
- 中国とアメリカ製のLLMは，どちらもアメリカ人よりも中国人らしい回答を示さなかった
- 中国語でのプロンプトや中国人のペルソナを設定しても，アメリカ的価値観への偏りはわずかにしか軽減されなかった
- LLMが生成するコンテンツが規範的影響を及ぼす近未来において，重要な示唆を与える
Link: https://arxiv.org/abs/2512.13723
圧縮された因果推論：量子化とGraphRAGが介入および反事実的精度に与える影響 [cs.AI]目的：大規模言語モデルにおける因果推論の形式的な評価
- 高度な意思決定において，信頼性のある推論は不可欠であり，その重要性は増している。
- 量子化が因果推論の正確性に与える影響はほとんど理解されていない。
- 量子化による性能低下を緩和する手法と，その限界を明らかにすること。
- Llama 3 8Bモデルにおいて，NF4量子化による全体的な精度低下は1%未満で安定していた。
- 介入クエリ（rung 2）が精度の低下に最も敏感であり，反事実的推論（rung 3）は比較的安定していた。
- GraphRAGを用いることで，NF4における介入精度の向上が見られ，量子化による低下を一部相殺できた。
Link: https://arxiv.org/abs/2512.13725
時間制約のあるレコメンデーション：Eコマースのための強化学習戦略 [cs.LG, cs.AI]目的：時間制約下におけるレコメンデーション戦略
- 購買行動の理解が重要であり，ユーザーエンゲージメント向上に不可欠である。
- ユーザーの限られた時間内での最適な商品提示が課題となっている。
- ユーザーの時間制約を考慮したレコメンデーションによるエンゲージメント最大化を目指す。
- 強化学習を用いて，ユーザーの嗜好と時間予算を同時に学習する手法を提案した。
- 時間制約下でのレコメンデーションをマルコフ決定過程として定式化した。
- Alibabaのデータを用いた実験により，既存手法よりも改善効果が確認された。
Link: https://arxiv.org/abs/2512.13726
RAST-MoE-RL：深層強化学習における状況認識型時空間混合エキスパートモデル [cs.LG]目的：配車サービスにおける乗客待ち時間とシステム全体の効率性のバランス改善
- 配車サービスは，需要と供給の変動が激しく，効率的な運用が不可欠である。
- 従来の強化学習アプローチでは，交通状況の複雑さや時空間的パターンを捉えきれていない。
- 状況に応じて専門化するモデルを導入し，効率的かつ効果的な配車制御を実現する。
- 提案手法RAST-MoE-RLは，既存の手法と比較して，総報酬を13%以上向上させた。
- 平均マッチング遅延とピックアップ遅延をそれぞれ10%，15%削減することに成功した。
- 未知の需要状況に対してもロバストであり，安定した学習が可能であることを示した。
Link: https://arxiv.org/abs/2512.13727
CurvaDion：曲率適応分散直交化 [cs.LG, cs.AI]目的：大規模言語モデルの分散学習における通信効率の向上
- 言語モデルの規模拡大に伴い，分散学習が不可欠となっている。計算資源の限界上，効率的な学習方法が求められている。
- 勾配同期はボトルネックであり，特に大規模モデルでは通信コストが課題となっている。
- 最適化状況に応じて同期頻度を調整し，通信量を削減することで学習効率を高める。
- CurvaDionは，相対最大運動量変化（RMMC）を用いて高曲率領域を検出し，必要なタイミングでのみ同期を行う。
- RMMCは，方向曲率の近似として計算コストが低く，損失曲率との理論的な繋がりが示されている。
- 1億6千万から13億パラメータのモデルで，通信量を99%削減しつつ，既存手法と同等の収束性を実現している。
Link: https://arxiv.org/abs/2512.13728
風力ダイナミクスの超解像のためのマルチモーダル条件付けにおける複合Classifier-Free Guidance [cs.LG, cs.AI, cs.CV]目的：風力ダイナミクス超解像における高精度なデータ再構成
- 気象予測や風力タービン配置最適化など，高解像度かつ高精度な風力データは不可欠である。
- 従来の再構成手法は，コストと精度でトレードオフの関係にあり，両立が困難であった。
- マルチモーダル条件付けにおけるClassifier-Free Guidanceの拡張により，この問題を解決する。
- 提案手法である複合Classifier-Free Guidance (CCFG) は，従来のCFGよりも高忠実度の結果を出力する。
- WindDMは，産業規模の風力ダイナミクス再構成用にCCFGを活用した拡散モデルである。
- WindDMは，深層学習モデルの中で最先端の再構成品質を達成し，古典的手法に比べて最大1000分の1のコストで済む。
Link: https://arxiv.org/abs/2512.13729
「AIと建築」教育のモジュール統合：浙江大学建築デザインIII/IVの事例研究 [cs.CY, cs.AI]目的：建築デザイン教育における「AIと建築」のモジュール統合
- 社会のデジタル化が加速する中，建築家へのAI活用能力の育成が急務となっている。
- 既存の建築教育では，AI技術の導入と倫理的考察のバランスが課題となっていた。
- AI技術の教育と倫理的議論を統合し，デザイン教育に適用可能なモデルを構築すること。
- 段階的な指導，技術と倫理の両面からのアプローチ，そして大学の支援体制が有効であることが示された。
- 学生のデジタルスキルと戦略的思考能力の向上に加え，AI倫理への理解が深まった。
- 本研究で提示されたモデルは，技術学習と批判的学習を組み合わせたデザイン教育への応用が期待される。
Link: https://arxiv.org/abs/2512.13730
複雑な数式認識：ベンチマーク，大規模データセット，強力なベースライン [cs.CV, cs.AI]目的：複雑な数式認識のベンチマーク構築と，大規模データセットによるモデル性能向上
- 数式認識は，科学技術分野における情報処理の自動化に不可欠な技術である。
- 既存の数式認識システムは，複雑な数式や複数行にわたる数式の認識精度が十分ではない。
- 複雑な数式の認識精度向上に向けた，ベンチマークデータセットとモデルの提案。
- CMER-Benchベンチマークを構築し，既存の数式認識モデルと汎用マルチモーダル大規模言語モデルの性能を評価した。
- 大規模データセットMER-17MとCMER-3Mを提案し，複雑な数式認識に焦点を当てた学習データの拡充を図った。
- 数式の階層構造と空間配置を明示的にモデル化するStructured Mathematical Languageを導入し，CMERNetモデルを開発，性能を向上させた。
Link: https://arxiv.org/abs/2512.13731
集合条件付き拡散による任意の疎な観測に対する汎用物理逆算ソルバーPIS [cs.LG, cs.AI]目的：偏微分方程式制約された物理パラメータの推定
- 流体，地震，構造物の健全性など，幅広い分野で物理現象の逆算が重要である。
- 観測が疎，不規則，現実的な配置制約下では，逆算問題が不安定になりやすい。
- 任意の観測配置に対応し，極めて疎な観測下でも安定した逆算を実現する。
- 提案手法PISは，既存の演算学習モデルと比較して，極めて疎な観測下でも安定した逆算を可能にする。
- PISは，逆算誤差を12.28％～88.73％削減し，キャリブレーションされた事後サンプルを生成する。
- 事後サンプルは，データ不足と固有の物理的曖昧さを正確に反映し，高い信頼性を示す。
Link: https://arxiv.org/abs/2512.13732
微分可能なランク選択による言語モデルの低ランク圧縮 [cs.LG, cs.AI]目的：言語モデルの低ランク圧縮における最適なランク選択
- 大規模言語モデルの利用拡大には，計算資源の効率的な活用が不可欠である。
- 各層の適切なランクを決定する最適な手法が確立されていない。
- ファインチューニングなしで，効率的なランク選択を可能にすること。
- 提案手法LLRCは，既存のランク選択手法と比較して，ファインチューニングなしで高い性能を示す。
- Llama-2-13Bを20%圧縮した場合，LLRCはMMLU，BoolQ，OpenbookQAでSTRSをそれぞれ12%，3.5%，4.4%上回る。
- LLRCは，他の圧縮手法と比較しても，ファインチューニング不要な手法として遜色ない性能を示す。
Link: https://arxiv.org/abs/2512.13733
連合推薦における埋め込みのプラグアンドプレイ型パラメータ効率的チューニング [cs.LG, cs.AI]目的：連合推薦における埋め込みパラメータ量の削減
- クラウドエッジ連携が進み，推薦システムは分散環境で学習されることが増えている。
- 大規模なアイテム埋め込みによりパラメータ数が多く，通信効率が課題となっている。
- 埋め込みパラメータの伝送量を削減し，通信効率と精度を向上させる。
- 提案手法は，LoRAやハッシュエンコーディングなどの既存のPEFT技術に加え，RQ-VAEを新たな戦略として導入する。
- 様々なFRモデルとデータセットを用いた実験により，通信オーバーヘッドを大幅に削減できることが示された。
- 提案手法は，既存のFR手法に容易に組み込める軽量なプラグインスタイルである。
Link: https://arxiv.org/abs/2512.13734
多変量時系列データの異常検知のための二重経路ロバストフレームワークDARTs [cs.LG, cs.AI]目的：高次元多変量時系列データにおける異常検知
- 大規模産業制御システムにおいて，異常を早期に発見することは，安全確保と効率向上に不可欠である。
- 高次元でノイズの多い時系列データから，長距離の時空間依存性を捉えることが困難である。
- 高次元データにおけるノイズの影響を軽減し，長距離の時空間依存性を捉えること。
- 提案手法DARTsは，短期的および長期的パスを組み合わせ，ノイズの影響を抑制しつつ，異常パターンを効果的に統合する。
- 実験結果から，DARTsは既存手法と比較して，高次元多変量時系列データにおける異常検知において優れた性能とロバスト性を示すことが確認された。
- DARTsの各コンポーネントの重要性を検証するため，詳細な消去実験を実施した。
Link: https://arxiv.org/abs/2512.13735
TF-MCL：時周波数融合と多領域クロス損失による自己教師ありうつ病検出 [cs.LG, cs.AI]目的：うつ病の自己教師あり検出モデルの開発
- 脳波信号に基づくうつ病検出は，客観的指標として有用であり，臨床応用の可能性を秘めている。
- うつ病のラベル付けは困難であり，教師あり学習のボトルネックとなっている。
- 既存のコントラスト学習法の脳波信号の特徴抽出能力を向上させ，うつ病検出精度を高める。
- 提案手法TF-MCLは，時周波数情報を融合することで，脳波信号の表現学習能力を向上させた。
- 多領域クロス損失関数により，時周波数領域と融合領域の表現分布を再構築し，より効果的な特徴表現を獲得した。
- 公開データセットMODMAとPRED+CTにおいて，最先端手法をそれぞれ5.87%，9.96%上回る高い精度を達成した。
Link: https://arxiv.org/abs/2512.13736
シミュレーション訓練による消防隊員への組織価値の浸透 [cs.CY, cs.AI]目的：消防隊員への組織価値の浸透
- 緊急時対応では倫理的判断が重要であり，人的被害や事故に直結する。
- 従来の訓練では，複雑な倫理的葛藤や価値観の衝突への備えが不十分である。
- シミュレーション訓練への組織価値の体系的統合を通じて，その課題解決を目指す。
- 本研究では，シミュレーション訓練に組織価値を統合するための概念的枠組みを提案する。
- これにより，隊員の価値観の内部化を促進し，プレッシャー下での価値に基づいた意思決定を改善する。
- また，本手法は，部門の運用プロトコルと優先される価値観との整合性を評価・改善するツールとしても活用可能である。
Link: https://arxiv.org/abs/2512.13737
AIGC支援画像制作における人間とAIの協調メカニズムに関する研究：特別報道への応用 [cs.CV, cs.AI]目的：AIGC支援画像制作における人間とAIの協調メカニズム
- 報道現場における画像制作の効率化が求められており，AIGCはその可能性を秘めている。
- AIGCの生成する画像には，誤情報，信憑性，意味の忠実性といった課題が存在する。
- AIGCの透明性を高め，報道倫理に合致した画像制作を可能にすることを目指す。
- 異なるプラットフォームにおけるプロンプトの標準化実験により，学習データやフィルタリングの影響で意味のずれや文化的な差異が生じることが示された。
- 人間が介入するモジュール型パイプラインを構築し，画像編集における精度，意味整合性，スタイル調整を可能にした。
- キャラクター同一性安定性（CIS），文化的表現の正確性（CEA），ユーザーと社会への適切性（U-PA）の評価指標を提案した。
Link: https://arxiv.org/abs/2512.13739
大規模言語モデルにおける意味的乱流を通じた脱獄検出：層流仮説 [cs.LG, cs.AI]目的：大規模言語モデルの脱獄攻撃検出
- 大規模言語モデルの利用拡大に伴い，安全性確保が重要課題となっている。
- 既存の防御策は計算コストが高いか，柔軟性に欠ける点が課題である。
- モデル内部の挙動に着目し，脱獄攻撃を軽量かつリアルタイムに検出することを目指す。
- 本研究では，良質な入力は滑らかな状態遷移を，悪質な入力は高分散な状態遷移（意味的乱流）を引き起こすという層流仮説を提唱した。
- 層ごとのコサインベクトルの分散を指標とした新規な指標を開発し，脱獄攻撃の検出能力を実証した。
- Qwen2-1.5Bでは攻撃時に乱流が75.4%増加し，Gemma-2Bでは22.0%減少するなど，モデルの安全性アーキテクチャの違いを捉えた。
Link: https://arxiv.org/abs/2512.13741
DL$^3$M：深層学習と大規模言語モデルによる専門家レベルの医療推論のための画像-言語フレームワーク [cs.CV, cs.AI]目的：深層学習と大規模言語モデルを用いた医療推論フレームワークの開発
- 医療現場における診断支援の必要性が高まっており，AI技術の応用が期待されている。
- 既存の画像分類モデルは判断根拠の説明が不十分であり，言語モデルは視覚的推論に課題がある。
- 画像分類と構造化された臨床推論を結びつけ，より信頼性の高い医療AIシステムを構築すること。
- 内視鏡画像分類において，MobileCoAtNetが8種類の胃関連クラスで高い精度を達成した。
- 強力な画像分類が，大規模言語モデルによる説明の質を向上させることを示した。
- 現時点では大規模言語モデルの推論は不安定であり，ハイステークスな医療判断には不向きである。
Link: https://arxiv.org/abs/2512.13742
ノイズを考慮したオーディオディープフェイク検出：調査，SNRベンチマーク，および実践的レシピ [cs.SD, cs.AI]目的：オーディオディープフェイク検出におけるロバスト性の評価
- 音声技術の発展に伴い，悪意のある音声改ざんのリスクが増大しているため。
- 現実的な環境下では，ノイズや残響の影響でディープフェイク検出の性能が低下する。
- SNRを制御したベンチマークを用いて，ノイズ環境における検出性能を定量的に評価する。
- 既存のオーディオディープフェイク検出モデルのロバスト性を調査し，SNR変化に対する性能低下を定量化した。
- MS-SNSDノイズとASVspoof 2021データセットを組み合わせた再現可能な評価フレームワークを構築した。
- WavLM，Wav2Vec2，MMSなどの事前学習済みエンコーダのファインチューニングにより，EERを10-15%改善した。
Link: https://arxiv.org/abs/2512.13744
深層演算ネットワークを用いた炭素/エポキシ複合材のプロセス誘発変形確率的予測 [cs.CE, cond-mat.mtrl-sci, cs.LG]目的：炭素/エポキシ複合材におけるプロセス誘発変形の予測
- 複合材料の製造プロセスにおいて，熱膨張率の不整合が問題となり，製品の品質や信頼性に影響を及ぼす。
- 従来の予測手法では，複雑なプロセス条件や材料特性を正確にモデル化することが困難である。
- 深層演算ネットワークを用いることで，プロセス条件と変形量の関係を効率的に学習し，高精度な予測を実現する。
- 深層演算ネットワーク（DeepONet）は，高精度なシミュレーションデータと実験データを組み合わせて学習された。
- FiLM-DeepONetを導入することで，硬化度等の外部パラメータを考慮した変形予測が可能になった。
- 実験データが限られている状況下で，転移学習とアンサンブルカルマン反転法により，不確実性の定量化と最適な硬化プロセスの最適化を支援する。
Link: https://arxiv.org/abs/2512.13746
なぜテキストが優位なのか：ビジョンが多角的医療意思決定を損なう可能性 [cs.CV, cs.AI]目的：多角的医療意思決定におけるテキストの優位性
- 医療分野におけるAI活用は，診断精度向上や効率化に不可欠である。
- 既存の多角的LLMは，医療意思決定タスクにおいて十分な性能を発揮できていない。
- 多角的LLMの視覚的理解能力を向上させ，医療意思決定の精度を高めることを目指す。
- テキストのみの推論が，視覚情報のみ，または視覚情報とテキストの組み合わせよりも一貫して高い性能を示した。
- 多角的入力がテキストのみの場合よりもパフォーマンスが低下することが示された。
- 理由付きの事例を用いたインコンテキスト学習や，視覚キャプションを用いたテキストのみの推論などが有効であることが示唆された。
Link: https://arxiv.org/abs/2512.13747
金融ニュース感情分析のための埋め込み表現の比較評価 [cs.LG, cs.AI]目的：金融ニュース感情分析における埋め込み表現の比較評価
- 市場理解を深める上で，金融分野の感情分析は不可欠である。
- データセットが小さい場合，標準的な自然言語処理手法は課題が多い。
- 限られたデータ環境下での感情分析における手法の有効性を検証する。
- 検証データとテストデータの結果に大きな乖離が見られ，モデルの性能は単純なベースラインを下回った。
- 事前学習済みの埋め込み表現は，データ量が一定の閾値を下回ると効果が薄れることが示された。
- 小規模な検証データセットがモデル選択時の過学習を招く可能性がある。
Link: https://arxiv.org/abs/2512.13749
アルゴリズム的ミューズとパブリックドメイン：生成AIの出力に対する著作権の法的哲学が保護を妨げる理由 [cs.CY, cs.AI]目的：生成AIの出力が著作権保護の対象とならないことの説明
- 知的創造物の保護は，文化の発展と技術革新を促進する上で不可欠である。
- 生成AIの急速な発展により，既存の著作権法制の適用範囲が不明確になっている。
- 生成AIの出力に対する著作権保護の是非を，法的哲学の観点から明確にすること。
- 生成AIの出力は，人間の創造的な貢献との直接的なつながりが断たれているため，著作権保護の根拠となる伝統的な理論（功利主義的インセンティブ，労働の対価，人格権）を満たさない。
- 生成AIの生成物を著作権保護することは，デジタルコモンズの囲い込みを招き，法的混乱を引き起こし，将来のイノベーションを阻害する可能性がある。
- AI生成作品に対する人間の創造的な貢献は保護されるべきだが，生成AIの生の出力はパブリックドメインに留まるべきである。
Link: https://arxiv.org/abs/2512.13750
MIDUS：メモリを注入した深層アップスケーリング [cs.LG, cs.AI]目的：大規模言語モデルの性能向上
- LLMの性能向上のためには，パラメータ増加を抑えつつ能力拡張が重要である。
- 従来の深層アップスケーリングは，FFNに依存しており，効率と性能の限界があった。
- ヘッドごとのメモリを利用し，効率と性能の両立を目指す。
- MIDUSは，既存の深層アップスケーリング手法と比較して，性能が大幅に向上することが確認された。
- 各ヘッドに独立したメモリバンクを割り当てることで，ヘッドごとの機能構造を維持しつつ情報を注入できる。
- パラメータ効率を維持しながら性能向上を実現しており，資源効率の良い代替手法となりうる。
Link: https://arxiv.org/abs/2512.13751
STAR：統一されたマルチモーダル学習のためのスタック型自己回帰スキーム [cs.CV, cs.AI]目的：マルチモーダル理解と生成の統一的目標達成
- 汎用人工知能の実現において，マルチモーダル大規模言語モデルが重要な役割を担う。
- マルチモーダル学習における最適化の競合と性能のトレードオフが課題となっている。
- 既存の理解能力を維持しつつ，生成性能を向上させることを目指す。
- STARは，理解，生成，編集の段階にマルチモーダル学習を分解するスタック型自己回帰スキームである。
- 基礎となる自己回帰モデルのパラメータを固定し，等価な自己回帰モジュールを段階的にスタックすることで，タスク間の干渉を防ぎ，モデルの能力を拡張する。
- GenEval，DPG-Bench，ImgEditにおいて最先端の性能を達成し，統一されたマルチモーダル学習の有効性を示した。
Link: https://arxiv.org/abs/2512.13752
時間情報を考慮したUNetと超解像ディープ残差ネットワークによる空間ダウンスケーリング [cs.CV, cs.LG, eess.IV, stat.ML]目的：大気汚染物質の空間ダウンスケーリング手法
- 局所環境分析や意思決定において，高解像度データが不可欠である。
- 衛星データは粗い空間解像度でしか利用できず，局所的な分析に限界がある。
- 衛星データの空間解像度を高め，局所分析への適用範囲を拡大すること。
- 時間情報を考慮した拡張により，ダウンスケーリングの性能と収束速度が大幅に向上した。
- 計算量の増加はわずかであるにも関わらず，高い効果が認められた。
- イタリアにおけるオゾンダウンスケーリングのケーススタディで有効性が確認された。
Link: https://arxiv.org/abs/2512.13753
速度プロファイルに基づく空間-時間グラフニューラルネットワークによるネットワーク全体の交通量推定 [cs.CY, cs.LG, cs.AI]目的：ネットワーク全体の交通量推定
- 交通量情報は都市計画や交通管理において不可欠であり，効率的な交通システムの構築に貢献する。
- センサーが設置されていない道路や，センサー数が少ない都市部では，交通量情報の網羅的な把握が困難である。
- 速度データや道路属性といった広範に入手可能な情報を用いて，センサーに依存せずに交通量を推定する。
- 提案手法HDA-STGNNは，速度プロファイル，道路属性，ネットワークトポロジーを活用し，ネットワーク全体の交通量プロファイルを予測する。
- 実験結果から，HDA-STGNNは複雑な空間-時間的依存関係を捉え，高い精度で交通量を推定できることが示された。
- 特に，ネットワークトポロジー情報が，交通量データに依存しない精度の高い推定に貢献することが明らかになった。
Link: https://arxiv.org/abs/2512.13758
RLHF調整済み言語モデルにおける状態依存型拒否と学習された無力感 [cs.AI, cs.HC]目的：RLHF調整済み言語モデルにおけるポリシー関連行動選択性の監査
- 大規模言語モデルは広く利用されているが，長期的な対話における行動パターンは定量評価では捉えきれない。
- 標準的な評価指標では見過ごされがちな，特定の状況下でのモデルの拒否行動が問題となる。
- モデルが特定のドメインで一貫して拒否する行動を分析し，その原因を探求すること。
- 長期間の対話において，モデルは広範なドメインでは正常に機能する一方で，特定のドメインでは繰り返し拒否応答を示すことが確認された。
- この選択的な応答拒否は，学習された無力感との類似性から「学習された無力感」として捉えられうる。
- メタナラティブな枠組みが拒否応答と同時に特定の文脈で出現する傾向が示された。
Link: https://arxiv.org/abs/2512.13762
数学とコーディングは普遍的なAIベンチマークである [cs.AI, cs.LG]目的：AIエージェントの心理測定バッテリー空間における数学とコーディングの特別な役割
- AI評価は，その多様性から適切な指標の確立が重要である。
- 既存の評価指標では，AIの能力を網羅的に測ることが難しい。
- 数学とコーディングによる評価空間の普遍性を明らかにすること。
- 数学とコーディングの組み合わせは，スペクトル的に安定した自己改善を可能にする。
- 数学的定理証明とコーディングタスクで生成されるバッテリー空間は，評価指標空間において稠密である。
- コーディングは普遍的評価が可能であり，数学は自己改善の起点として優位性を持つ。
Link: https://arxiv.org/abs/2512.13764
手続き遵守を超えて：AIガバナンスにおける人間の監督機能の幸福感への影響 [cs.CY, cs.AI, cs.HC]目的：AIガバナンスにおける人間の監督機能
- AI技術の発展は社会に大きな変革をもたらすが，倫理的・社会的な課題も生じている。
- AI倫理ガイドラインや法規制では人間の監督機能が求められるものの，具体的な定義や育成方法が確立されていない。
- 人間の監督機能を幸福感に基づく能力として捉え，AIの安全かつ倫理的な活用を促すための基盤を構築する。
- 本研究では，人間の監督機能をAIリテラシー，倫理的判断力，人間のニーズへの理解を含む幸福感の能力として捉えた。
- 持続可能かつ費用対効果の高い能力開発には，専門教育から生涯学習までのあらゆる教育段階への統合が不可欠である。
- 人間の監督機能を幸福感の能力として捉えることで，規制目標と人間の主体性・責任の継続的な育成を結びつける道筋を提供する。
Link: https://arxiv.org/abs/2512.13768
教師あり対照学習と自己学習による半教師ありマルチビューグラフ畳み込みネットワークの強化 [cs.LG, cs.CV]目的：マルチビューグラフ畳み込みネットワークにおける性能向上
- 複雑なマルチビューデータモデリングにおいて，グラフ構造に着目した手法は有効性が示されている。
- 既存手法では，ビュー間の補完的な情報を十分に活用できず，表現能力が限定される場合がある。
- 異なるビュー間の関連性を捉え，潜在空間での特徴表現を改善することで性能向上を目指す。
- 提案手法MV-SupGCNは，交差エントロピー損失と教師あり対照損失を組み合わせることで，識別的な特徴獲得と汎化性能向上を実現した。
- KNNベースと半教師ありグラフ構築を組み合わせることで，グラフ構造のロバスト性を高め，汎化誤差を低減した。
- 対照学習と擬似ラベルを用いた枠組みにより，ラベルなしデータの活用とビュー間の意味的整合性を高めた。
Link: https://arxiv.org/abs/2512.13770
意味的根拠指標：RAGシステムにおける文脈関与の幾何学的限界 [cs.AI]目的：RAGシステムにおけるハルシネーションの幾何学的痕跡の特定
- 大規模言語モデルの性能向上には，外部知識の活用が不可欠である。
- RAGシステムはハルシネーションを起こしやすく，その原因究明が課題である。
- ハルシネーションの識別と検証が必要な応答を特定すること。
- 意味的根拠指標（SGI）は，応答と質問，そして文脈間の角度距離の比として定義される。
- 実験の結果，ハルシネーションを起こした応答は質問に近く，文脈から離れる傾向が確認された。
- SGIは，質問と文脈の角度分離が大きいほど識別能力が向上し，応答の検証に有用な指標となる。
Link: https://arxiv.org/abs/2512.13771