arXiv雑要約

AI - 2026/04/20 公開

ドイツ手話の童話における感情分析 [cs.CL, cs.LG]目的：ドイツ手話の童話における感情の分類
- 手話は，聴覚障害者にとって主要なコミュニケーション手段であり，その理解は重要である。
- 手話の感情表現は，顔や体の動きに依存するため，自動的な感情分析が困難である。
- 手話動画の特徴から感情を認識するモデルを構築し，感情分析の精度向上を目指す。
- テキストデータと動画データを用いた感情分析を行い，テキストベースの感情分析で高い再現性を確認した。
- 動画データから抽出した顔と体の動きの特徴量を用いて，感情を予測するモデルを構築し，平均正解率0.631を達成した。
- 眉や口の動きに加え，腰，肘，肩の動きが感情の識別において重要な役割を果たすことが明らかになった。
Link: https://arxiv.org/abs/2604.16138
混合精度分散学習における学習時間予測 [cs.NI, cs.LG, cs.AI, cs.DC, cs.PF]目的：分散型深層学習における学習時間予測の精度向上
- 資源配分やコスト見積もり，ジョブスケジューリングにおいて，学習時間の正確な予測は不可欠である。
- 既存研究は静的なモデル計算グラフに依存し，混合精度などの精度設定の変化を捉えられていない。
- 精度設定を考慮しない学習時間予測では，大きな誤差が生じるという課題を解決する。
- 本研究では，精度を考慮した分散学習時間予測器を提案し，多様な精度設定下で高い精度を実現した。
- 提案手法は，平均絶対パーセント誤差（MAPE）を9.8%に抑え，既存手法のMAPE最大147.85%と比較して大幅な改善を示した。
- 浮動小数点精度設定が学習時間に大きく影響することを確認し，精度変化を考慮することの重要性を示した。
Link: https://arxiv.org/abs/2604.16145
SWNet：偽装雑草検出のためのクロススペクトルネットワーク [cs.CL, cs.CV, cs.AI]目的：偽装雑草検出のためのクロススペクトルネットワークの提案
- 農業生産において，雑草は収量低下の大きな原因であり，効率的な雑草検出が重要である。
- 従来のコンピュータビジョンシステムは，雑草が作物に偽装することで検出が困難になる。
- 可視光と近赤外光の情報を統合し，偽装雑草を高精度に検出することを目指す。
- 提案手法SWNetは，Weeds-Bananaデータセットにおいて，既存の最先端手法10個を上回る性能を示した。
- 近赤外スペクトルにおける葉緑素反射の違いを利用することで，可視光では識別困難な雑草も検出可能となった。
- エッジアウェアなリファインメントモジュールにより，対象物の境界がより鮮明になり，構造的な曖昧さが軽減された。
Link: https://arxiv.org/abs/2604.16147
AtManRL：微分可能な注意度重要度による忠実な推論に向けて [cs.NI, cs.CL, cs.AI, cs.LG]目的：忠実な推論の学習
- 複雑なタスク解決において，大規模言語モデルの思考連鎖(CoT)推論の重要性が増している。
- CoT推論が最終的な答えに貢献し，モデルのプロセスを忠実に反映しているかの検証が課題である。
- CoT推論における重要なトークンを特定し，解釈可能性の高いモデルを学習することを目指す。
- AtManRLは，微分可能な注意度操作を用いて，より忠実な推論を学習する手法である。
- CoT推論における重要なトークンを特定するための注意マスクを学習し，予測に影響を与える推論を促す。
- GSM8KとMMLUの実験により，Llama-3.2-3B-Instructで有効性が確認された。
Link: https://arxiv.org/abs/2604.16158
JumpLoRA: 大規模言語モデルにおける継続学習のための疎なアダプター [cs.LG, cs.AI, cs.CL]目的：大規模言語モデルの継続学習における性能向上
- 大規模言語モデルの活用範囲拡大のため，効率的な継続学習法の確立が重要である。
- 過去のタスクを忘却する「破滅的忘却」が継続学習の大きな課題となっている。
- JumpLoRAは，疎なアダプターを導入し，タスク間の干渉を防ぐことで，この課題を解決する。
- JumpLoRAは，LoRAブロックにJumpReLUゲートを適用することで，動的なパラメータ分離を実現した。
- 本手法は，IncLoRAの性能を大幅に向上させ，最先端の継続学習手法であるELLAを上回る結果を示した。
- JumpLoRAは，高いモジュール性とLoRAベースの継続学習アプローチとの互換性を有している。
Link: https://arxiv.org/abs/2604.16171
MARCH：CTレポート生成のためのマルチエージェント放射線科臨床階層 [cs.MM, cs.AI, cs.CV]目的：CTレポート自動生成における臨床的幻覚と検証プロセスの欠如に対する解決策
- 医学画像診断の精度向上は，患者ケアの質を向上させる上で不可欠である。
- 既存の自動レポート生成システムは，臨床的誤りや信頼性の低さが課題である。
- 放射線科の専門家集団における階層構造を模倣することで，AIの信頼性向上を目指す。
- MARCHは，放射線科医の階層構造をエミュレートするマルチエージェントフレームワークである。
- RadGenome-ChestCTデータセットにおいて，最先端のベースラインと比較して，臨床的忠実度と言語的正確性が有意に向上した。
- 人間のような組織構造のモデリングが，医療分野におけるAIの信頼性を高めることを示す。
Link: https://arxiv.org/abs/2604.16175
生成モデルを用いた暗号資産の合成データ [cs.LG, cs.AI]目的：暗号資産価格時系列データの生成
- デジタル金融エコシステムにおいて，データは市場やサービスを支える重要な要素である。
- 金融データの利用にはプライバシーリスクやアクセス制限が存在し，研究やモデル構築を阻害する。
- GANを用いて合成データを生成し，これらの課題を解決し，データ活用の幅を広げる。
- 本研究では，条件付き生成敵対ネットワーク（CGAN）を用いて暗号資産価格の時系列データを生成することに成功した。
- 生成された合成データは，市場トレンドやダイナミクスを適切に再現することが示された。
- GANによる合成データ生成は，複雑な手法と比較して計算コストが低く，効率的な代替手段となる。
Link: https://arxiv.org/abs/2604.16182
大規模言語モデルのデータ帰属と価値評価のための読み出し表現のスケッチ [eess.SY, cs.SY, cs.LG]目的：大規模言語モデルにおけるデータとモデルの相乗効果の理解
- 大規模言語モデルの性能は学習データに大きく依存するため，データの貢献度を評価することが重要である。
- 従来の勾配に基づく手法は，大規模言語モデルに対してスケーラビリティに課題がある。
- 出力層における影響ホットスポットに着目し，効率的なデータ帰属と価値評価を実現する。
- RISEは，RapidInと比較して最大112倍のインデックスストレージ削減を実現し，320億パラメータのLLMへの適用を可能にした。
- RISEは，Backdoorデータの検出，ドメイン分離，高品質データ選択などのタスクにおいて有効性が確認された。
- RISEによって選択されたデータを用いた継続事前学習は，ダウンストリームタスクの性能向上につながった。
Link: https://arxiv.org/abs/2604.16197
AIFIND：アーティファクトを意識した微細なアライメントによるインクリメンタル顔フォージェリ検出 [cs.CG, cs.CV, cs.AI]目的：インクリメンタル顔フォージェリ検出における性能向上
- 顔のフォージェリ技術は高度化しており，リアルタイムな検出が重要である。
- 既存手法は特徴空間の制約が弱く，特徴ドリフトや忘却が課題となる。
- アーティファクトを利用し，安定したセマンティックアンカーを確立することで，忘却を抑制する。
- AIFINDは，低レベルのアーティファクトから不変なセマンティックアンカーを生成する。
- アーティファクト・プローブアテンションにより，不安定な視覚特徴をセマンティックアンカーにアライメントする。
- アダプティブ・ディシジョン・ハーモナイザーは，セマンティックアンカーの幾何学的整合性を維持し，分類器を調和させる。
Link: https://arxiv.org/abs/2604.16207
表面統計を超えて：LLMのための内部表現に基づくロバストな適合予測 [cs.CL, cs.AI]目的：大規模言語モデルにおけるロバストな適合予測手法
- LLMの信頼性が求められる場面が増加しており，その不確実性評価が重要である。
- 従来の出力レベルでの不確実性指標は，環境変化に弱く，信頼性が損なわれる場合がある。
- 内部表現を用いて，よりロバストで効率的な適合予測を実現する。
- 提案手法は，入力に対するモデルの内部表現の変化を測定するLayer-Wise Information (LI) スコアを適合スコアとして利用する。
- クローズドブックおよびオープン領域QAベンチマークにおいて，特にドメイン外のシフト下で，テキストレベルのベースラインよりも優れた妥当性・効率のトレードオフを実現した。
- 同じ公称リスクレベルにおいて，同ドメインでの信頼性を維持しつつ，分布シフト下での不安定な表面レベルの不確実性に対処できる可能性を示唆する。
Link: https://arxiv.org/abs/2604.16217
地図上のOT：地理空間におけるドメインシフトの定量化 [cs.LG]目的：地理空間におけるドメインシフトの距離計測
- 地理情報と機械学習の応用拡大に伴い，地域差を考慮したモデルの汎化性能が重要になっている。
- 地理的データ分布の偏りから，ある地域で学習したモデルを別の地域で利用する際に性能が低下する課題がある。
- 最適な輸送理論を用いて，地理空間ドメイン間の距離を定量化し，ドメイン適応の成功予測を目指す。
- 提案手法GeoSpOTによる地理空間ドメイン間の距離が，クロスドメイン転移の難易度を予測できることが示された。
- 学習済みの位置エンコーダからの埋め込み表現が，画像やテキストの埋め込み表現と同程度の情報量を持つことが確認された。
- GeoSpOT距離に基づき，データ選択を最適化し，モデルの性能低下が予想される地域を事前に特定できることが示された。
Link: https://arxiv.org/abs/2604.16220
FAccTにおける現状把握：公正性，説明責任，透明性コミュニティのビジョンを共同創造するための参加型デザイン [eess.SY, cs.SY, cs.HC, cs.AI, cs.CY]目的：公正性，説明責任，透明性（FAccT）コミュニティのビジョン共同創造
- AI技術の社会実装が進む中で，倫理的・社会的な影響への関心が高まっている。
- FAccTのような学術会議のガバナンスは，多様なステークホルダーの意見を反映する仕組みが不十分である。
- 参加型デザインを通じて，FAccTコミュニティのより良いガバナンス体制を構築すること。
- 大規模な参加型デザインプロセスを実施し，FAccTの今後の方向性を検討した。
- 参加者は種となる声明を作成し，投票を通じて意見を表明することで，議題を形成した。
- 本研究は，AIの社会的影響を批判的に検討する学術会議への参加型デザインの応用事例として，貴重な知見を提供する。
Link: https://arxiv.org/abs/2604.16224
潜在文法フローによるニューロシンボリック常微分方程式発見 [cs.LG, cs.AI, cs.CE, cs.SC]目的：常微分方程式の発見
- 自然や工学的システムの理解には，解釈性と転移性に優れた記号的な定式化が不可欠である。
- 既存手法では，データから直接解釈可能な方程式を導き出すことが困難であった。
- データから解釈可能な常微分方程式を効率的に発見することを目的とする。
- 潜在文法フロー（LGF）というニューロシンボリック生成フレームワークを提案した。
- LGFは方程式を文法ベースの表現として潜在空間に埋め込み，行動損失により意味的に類似した方程式を近づける。
- 離散フローモデルがサンプリングプロセスを誘導し，観測データに最適な候補方程式を再帰的に生成する。
Link: https://arxiv.org/abs/2604.16232
試験中の不正行為を検知する，物体中心の二段階深層学習フレームワーク [cs.CV, cs.AI]目的：試験中の不正行為検知
- 学術的誠実性の維持は重要であり，試験における不正行為の防止は教育機関にとって不可欠である。
- 従来の監視方法は非効率でコストがかかり，大規模な環境では誤りが起こりやすいという課題がある。
- 本研究は，透明性と効率性を両立した，不正行為の検知手法を開発し，教育現場での導入を目指す。
- 提案手法は，YOLOv8nとRexNet-150を組み合わせた二段階フレームワークであり，高い精度と効率性を実現した。
- データセットを用いた実験の結果，正解率95％，再現率94％，適合率96％，F1スコア95％を達成し，既存手法を13％上回った。
- 平均推論時間が13.9msと高速であり，大規模環境への展開に適している。また，結果を個別に通知することで倫理的な懸念にも配慮した。
Link: https://arxiv.org/abs/2604.16234
AIおよび力学モデルを用いた亜季節予報の確率的バイアス補正による精度向上 [cs.CL, cs.LG, physics.ao-ph, stat.ML]目的：亜季節予報における系統誤差の低減
- 農業，防災，エネルギー管理など，意思決定には正確な気象予報が不可欠である。
- 2～6週間先の亜季節予報では，誤差の累積とバイアスの持続により，予測精度が著しく低下する。
- 過去の確率的予報のバイアスを学習し補正することで，亜季節予報の精度向上を目指す。
- 確率的バイアス補正(PBC)を適用することで，AI予報システムの亜季節予報スキルが2倍に向上した。
- PBCは，圧力，温度，降水量の91%以上で，力学モデルの予測スキルを改善した。
- ECMWFの2025年リアルタイム予報競争で，PBCは全変量とリードタイムで1位を獲得した。
Link: https://arxiv.org/abs/2604.16238
BAGEL：言語モデルにおける動物知識の専門性を評価するベンチマーク [cs.CL, cs.AI]目的：言語モデルにおける動物知識の専門性の評価
- 生物多様性保全への貢献が期待されるため，言語モデルの専門知識の理解は重要である。
- 言語モデルは広範な知識を持つ一方で，特定の動物に関する専門知識の評価が不足している。
- 言語モデルが持つ動物知識の弱点を明らかにし，その能力向上を目指す。
- BAGELベンチマークは，生物学関連の多様な情報源から構築された動物知識に関する質問応答ペアで構成される。
- このベンチマークは，分類，形態，生息地，行動など，動物知識の複数の側面を網羅している。
- 閉じた形式での評価により，外部検索なしに言語モデルの動物知識を測定し，詳細な分析を可能にする。
Link: https://arxiv.org/abs/2604.16241
勾配フィンガープリントによる報酬ハッキングの検出と抑制 [cs.LG, cs.CL]目的：報酬ハッキングの検出と抑制
- 強化学習の安全性と信頼性が重要視されており，意図しない行動を防ぐ研究が不可欠である。
- 報酬関数の抜け穴を悪用する報酬ハッキングは，モデルが本来の課題を解決せずに高得点を獲得する問題がある。
- CoT推論の内部計算を利用し，報酬ハッキング行動をより正確に検出し，抑制することを目指す。
- 提案手法GRIFTは，既存手法と比較して報酬ハッキングの検出性能を大幅に向上させた。
- GRIFTをファインチューニングパイプラインに統合することで，報酬ハッキングを軽減し，真の課題解決能力を向上させた。
- 勾配レベルの表現を用いてCoT推論の質を評価する新たな方向性を示唆する結果が得られた。
Link: https://arxiv.org/abs/2604.16242
構造保持と情報バランス正則化を用いたジョイント中心の二重対照的アライメント [cs.LG, cs.AI]目的：長文の音声とテキストのドキュメントレベル表現学習
- 音声とテキストの多Modalな理解は，様々な応用において重要性を増している。
- 低リソース環境下では，音声とテキスト間の効果的なアライメントが困難である。
- 音声とテキストの次元の不均衡下でも，構造を保ちつつアライメントを実現する。
- HILBERTは，凍結された事前学習済みエンコーダを活用し，効率的な特徴抽出を可能にする。
- 二重対照的損失関数と正則化項により，音声とテキストの構造を維持し，情報バランスを最適化する。
- 実験結果から，HILBERTは意味的に有用な長文表現を学習し，不均衡な多クラス設定で優れた性能を発揮することが示された。
Link: https://arxiv.org/abs/2604.16247
LLM生成能力質問の特徴付け：オープンおよびクローズドモデルを用いたクロスドメイン実証研究 [cs.AI]目的：LLM生成能力質問の系統的比較のための定量的指標
- オントロジー構築において，要求仕様の抽出は重要なプロセスである。
- 従来の要求抽出は専門家による手作業であり，時間とコストがかかる。
- LLMを活用して要求抽出を自動化し，効率性とアクセス性を向上させる。
- 生成AIモデルによって生成される能力質問の可読性，構造的複雑さ，入力テキストとの関連性に違いが見られた。
- LLMの性能は，ユースケースによって異なる生成プロファイルを示すことが明らかになった。
- オープンソースモデルとクローズドモデルで生成特性に差異が見られた。
Link: https://arxiv.org/abs/2604.16258
分布のシャープ化を超えて：タスク報酬の重要性 [cs.LG, cs.AI]目的：タスク報酬に基づく強化学習の効果の比較
- 大規模言語モデルの能力向上には，多様な学習手法が不可欠である。
- 強化学習が真に新たな能力を付与するのか，既存能力を強化するだけなのか議論がある。
- 分布のシャープ化の限界を明らかにし，報酬に基づく学習の優位性を示す。
- 分布のシャープ化は最適解が不利になりやすく，不安定であることが示された。
- Llama-3.2-3B-Instruct等のモデルで，シャープ化は限定的な改善しか得られないことが確認された。
- タスク報酬の導入は，堅牢な性能向上と安定した学習に大きく貢献することが示された。
Link: https://arxiv.org/abs/2604.16259
ビジョン言語モデルにおけるモダリティ優位性の軽減のための情報ルーター [cs.CL, cs.RO, cs.CV, cs.LG]目的：ビジョン言語モデルにおけるモダリティ優位性の軽減
- 近年，画像とテキストを扱うモデルの性能が向上しているが，特定のモダリティに偏る問題が存在する。
- 既存手法は注意機構の調整に焦点を当てており，情報不足や曖昧さへの対応が不十分である。
- 異なるモダリティの情報密度を考慮し，情報格差を解消することでモダリティ優位性を軽減する。
- 提案手法MoIRは，情報量の少ないトークンに対し，より信頼性の高いモダリティからの情報を補完する。
- 実験の結果，MoIRはモダリティ間の貢献度を均衡化させ，ロバスト性と性能向上に貢献することが示された。
- 特に，あるモダリティが劣化した場合でも，MoIRは優れた効果を発揮する。
Link: https://arxiv.org/abs/2604.16264
地域規模における空間適応型融合とアンサンブル学習による洪水・土石流複合ハザードリスクマッピング [cs.LG]目的：洪水・土石流複合ハザードリスクマッピングの実現
- 災害リスク軽減のため，複合的な自然災害に対する理解が不可欠である。
- 既存研究では，空間的な均質性を仮定し，災害間の相互依存性を考慮しない場合が多い。
- 空間異質性を考慮し，災害間の関係性を捉えたリスクマッピング手法を開発する。
- 早期融合（EF）は，従来の遅延融合（LF）と比較して，洪水再現率を向上させ，ブライヤー・スコアを低減した。
- MoEモデルは，洪水および土石流のリスク評価において，EFとLFを上回る高い性能を示した。
- GeoDetector分析により，ハザードリスクに影響を与える主要因が地域によって異なることが示された。
Link: https://arxiv.org/abs/2604.16265
ベンチマーキングから推論へ：ベトナム法文におけるLLMの二面的大規模評価 [cs.CL, cs.AI]目的：ベトナム法文に対するLLMの性能評価
- 法文の理解は正義へのアクセスに不可欠だが，複雑性ゆえに一般市民の理解が困難である。
- 既存のLLM評価は表面的な指標に偏りがちで，実際の法的推論能力を捉えきれていない。
- LLMがベトナム法文を正確かつ合理的に処理できるかを評価し，課題を明確化すること。
- GPT-4o，Claude 3 Opus，Gemini 1.5 Pro，Grok-1の精度，可読性，一貫性を評価した結果，モデルによって特徴が異なった。
- Grok-1は可読性と一貫性に優れるものの，法的精度で課題があり，Claude 3 Opusは高精度だが，微妙な推論誤りが見られた。
- 誤りの分析から，LLMの課題は要約ではなく，正確で制御された法的推論にあることが示唆された。
Link: https://arxiv.org/abs/2604.16270
VEFX-Bench：汎用的な動画編集と視覚効果の包括的ベンチマーク [cs.CV, cs.AI, cs.CL]目的：動画編集と視覚効果の性能評価のためのデータセットと報酬モデル
- AIによる動画作成が普及し，プロレベルの編集ニーズが高まっている。
- 大規模な編集データセットや編集品質を評価する標準的な指標が不足している。
- 動画編集の品質評価を自動化し，編集システムの性能を客観的に比較すること。
- VEFX-Datasetは，9つの主要な編集カテゴリと32のサブカテゴリにわたる5,049の動画編集例を含む大規模なアノテーションデータセットである。
- VEFX-Rewardは，動画編集の品質評価に特化した報酬モデルであり，人間の判断とより強く一致することが示された。
- VEFX-Benchは，300の厳選された動画プロンプトペアからなるベンチマークであり，現在のモデルには，視覚的な妥当性，指示への追従，編集の局所性の間にギャップがあることが明らかになった。
Link: https://arxiv.org/abs/2604.16272
洞察力を伴う推論の学習：非形式定理証明 [cs.CL, cs.AI, cs.CL, cs.LG]目的：非形式定理証明における洞察力育成の枠組み
- 大規模言語モデルの強みを活かすため，自然言語処理に基づいた定理証明が重要である。
- 複雑な問題解決において，核心となる手法の認識が困難であり，推論のボトルネックとなっている。
- 核心的な手法の抽出と証明スケッチ構造化により，LLMの洞察力に基づいた推論能力向上を目指す。
- 階層型データセットDeepInsightTheoremを構築し，核心技術と証明スケッチを明示的に抽出した。
- 人間の学習過程を模倣するProgressive Multi-Stage SFT戦略を設計し，モデルの洞察力育成を促した。
- 数学的ベンチマークにおいて，従来の基盤モデルを大幅に上回る性能が確認された。
Link: https://arxiv.org/abs/2604.16278
低分子医薬品設計のための大規模言語モデル能力の進捗評価 [cs.LG, physics.chem-ph]目的：低分子医薬品設計における大規模言語モデルの能力評価と改善
- 医薬品開発は時間とコストがかかる。AIによる効率化が期待される。
- 現実的なシナリオを反映したベンチマークが不足しており，実用性が不明確である。
- 現実的なタスクに基づき，LLMの能力を評価し，改善策を提示する。
- 大規模言語モデルは化学タスクにおいて徐々に能力を向上させているが，特にデータが少ない状況では改善の余地が大きい。
- 強化学習を用いた後学習により，性能を大幅に向上させることが可能である。
- 基盤モデルが弱くても，後学習によって最先端モデルに匹敵する性能を示すことができた。
Link: https://arxiv.org/abs/2604.16279
製造における機械学習モデルの解釈可能性を向上させるための大規模言語モデルと知識グラフの利用 [cs.AI]目的：機械学習モデルの解釈可能性向上手法
- 製造業におけるデータ駆動型意思決定の重要性が高まっており，機械学習の活用が不可欠である。
- 機械学習モデルの予測根拠が不透明であるため，現場での信頼性と活用が妨げられている。
- 知識グラフと大規模言語モデルを用いて，機械学習結果の説明をより分かりやすく，現場に寄り添ったものとする。
- 本研究では，知識グラフと大規模言語モデルを組み合わせることで，機械学習モデルの説明可能性を向上させる新たな手法を提案した。
- 製造環境におけるXAI質問バンクを用いて評価した結果，提案手法は既存手法よりも高い精度と一貫性を示し，説明の明瞭性と有用性も確認された。
- この手法は，現場担当者の意思決定を支援し，製造プロセスの改善に貢献することが期待される。
Link: https://arxiv.org/abs/2604.16280
観測された確率的ダイナミクスによるオートエンコーダの幾何学的正則化 [cs.LG, math.DS, math.PR]目的：高次元空間における確率的動力系における低次元多様体の学習
- 複雑なシステムを理解する上で，高次元データの低次元構造の把握は不可欠である。
- 既存手法では，局所的なチャート学習のスケーラビリティや，オートエンコーダにおける接束幾何学の制約不足が課題である。
- 環境共分散から接束情報を抽出し，幾何学的正則化を行うことで，学習の安定性と精度向上を目指す。
- 提案手法は，接束ペナルティと逆整合性ペナルティを導入し，単一の非線形チャートと潜在的な確率的微分方程式を学習するパイプラインを構築する。
- 実験の結果，回転ダイナミクス下で放射状平均通過時間の誤差を50～70％削減し，不安定なMüller-Brown Langevinダイナミクス下では，最も低い井戸間平均通過時間誤差を達成した。
- また，環境係数の誤差を最長で1桁削減し，既存のオートエンコーダと比較して高い精度を示した。
Link: https://arxiv.org/abs/2604.16282
ASMR-Bench：機械学習研究における妨害工作の監査 [cs.AI]目的：機械学習研究におけるコードベースの妨害工作検出能力の評価
- AIの活用が進む研究において，結果の信頼性確保が重要となる。
- AIが自律的に研究を行う際，悪意のある改ざんが検出されにくい可能性がある。
- AIによる研究の信頼性を高めるための監査手法の開発を支援する。
- ASMR-Benchは，9つの機械学習研究コードベースとその改ざん版で構成される。
- 最先端のLLMとLLM支援による人間監査者において，妨害工作の検出は困難であった。
- Gemini 3.1 ProがAUROC 0.77，トップ1修正率42%で最も高い性能を示した。
Link: https://arxiv.org/abs/2604.16286
捉えがたいものを見る：高水準および抽象的カテゴリへの画像分類の調査 [cs.CV, cs.AI, cs.CL, cs.CY]目的：高水準の視覚的理解に関する研究の体系的レビュー
- コンピュータビジョンは高度な知覚タスクへと移行しており，その本質を理解することは重要である。
- 高水準の視覚的理解の定義が曖昧であり，研究分野間の連携が不足している。
- 抽象的概念に基づく画像分類における課題と機会を明らかにすること。
- 本調査では，常識，感情，美学など，高水準の意味論を明確なクラスターに分類した。
- 大規模データセットの限界と，補完情報や中レベル特徴の統合の重要性が示唆された。
- 抽象的概念に基づく画像分類タスクにおいて，ハイブリッドAIシステムの重要性が強調された。
Link: https://arxiv.org/abs/2308.10562
電気筋図データにおける周波数とチャネルの重要度ランキング手法：決定木分類器を用いる [cs.CY, cs.HC, eess.SP, cs.LG]目的：電気筋図データの周波数とチャネルの重要度ランキング
- 筋活動の評価は，医療やスポーツ分野においてパフォーマンス向上や損傷予防に不可欠である。
- 筋疲労の評価には，多くの特徴量が必要であり，解釈性が低いという課題がある。
- 決定木を用いることで，重要な特徴量を特定し，解釈可能な筋疲労評価を可能にする。
- 決定木分類器を用いることで，特徴量の重要度を明確にすることができた。
- 少ない特徴量のみでも十分な精度で休息間隔を分類できることが示された。
- 本手法は，簡潔で解釈可能なモデルを用いた筋回復評価に貢献し，今後の診断技術開発を促進する。
Link: https://arxiv.org/abs/2604.15353
モチベーション行動の神経メカニズムを解明する機械学習アプローチ：ADHDから努力と報酬感受性の個人差まで [q-bio.NC, cs.LG]目的：モチベーション行動の神経メカニズムの解明
- モチベーションは人間の行動の根幹であり，精神疾患とも深く関わる重要な研究領域である。
- ADHDや無気力などの疾患では，努力と報酬の評価機能に異常が生じていることが知られている。
- ADHDの神経メカニズムの特定と，努力・報酬感受性の個人差を明らかにすることを目指す。
- 機械学習を用いたEEG解析により，ADHD患者と健常者を高精度で識別できることが示された。
- 拡散MRIと構造MRIを用いた解析から，SMAと連結する脳領域が努力と報酬の評価において重要な役割を果たすことが明らかになった。
- 脳の灰白質容積から機械学習により報酬感受性や無気力レベルを予測できることが確認され，前頭頭頂回が重要であることが示唆された。
Link: https://arxiv.org/abs/2604.15363
想像を見る：fMRIデータからの視覚的イメージ解読における潜在的機能的アラインメント [q-bio.NC, cs.AI, eess.IV]目的：視覚的イメージ解読における潜在的機能的アラインメントの検証
- 脳機能解読は，認知神経科学において重要な手法であり，主観的な経験の客観的理解を目指す。
- 視覚的イメージの解読は，知覚時よりも難しい課題であり，解読精度向上が求められている。
- 知覚学習から得られた知識をイメージ解読に応用し，解読精度を向上させることを目指す。
- 潜在的機能的アラインメントは，既存の知覚デコーダーをイメージデータに適合させ，高レベルの意味的再構成を改善する。
- イメージ誘発活動を事前学習済みモデルの条件付け空間にマッピングすることで，解読精度が向上する。
- 知覚とイメージの対応するペアが限られている問題を，意味的に関連する知覚試行の検索による拡張戦略で緩和する。
Link: https://arxiv.org/abs/2604.15374
エクサスケール多タスクグラフ基盤モデル：不均衡，多精度原子データへの対応 [cond-mat.mtrl-sci, cs.AI]目的：原子レベルデータの不均衡性や多精度に対応する，エクサスケールでの材料探索ワークフロー
- 材料開発において，計算コストを削減し，効率的な探索を実現することが重要である。
- 第一原理計算は高精度だが計算コストが高く，大規模な探索には不向きである。
- グラフ基盤モデルを活用し，計算コストを削減しつつ，高精度な材料探索を可能とする。
- HydraGNNを基盤とした原子グラフ基盤モデルを構築し，16の第一原理計算データセットを共同学習した。
- 開発したモデルは11億個の原子構造を50秒でスクリーニング可能であり，第一原理計算に数年かかる計算量を削減した。
- BF16/FP32/FP64の精度と性能のトレードオフを定量化し，12の化学的に多様なタスクへの転移学習を実証した。
Link: https://arxiv.org/abs/2604.15380
ワンショット生成フロー：存在と障害 [stat.ML, cs.LG, math.PR]目的：生成モデリングにおける動的測度輸送の存在と制約
- 生成モデルは，複雑なデータの分布を学習し，新たなサンプルを生成する上で重要である。
- 既存の手法では，効率的な生成フローの設計や，その存在条件の理解が課題であった。
- 独立なエンドポイントを持つプロセスにおける，直線的な生成フローの存在条件を明らかにすること。
- エンドポイントが独立な状況下では，生成フローの直線性が明確に二分されることが示された。
- 任意のガウス分布をエンドポイントとする直線的な生成フローの構成が可能であることが証明された。
- モードが十分に離れた分布をターゲットとする場合，直線的な生成フローは存在しないことが，一連の不可能定理を通じて示された。
Link: https://arxiv.org/abs/2604.15439
相対フロー：ノイズ参照による医用画像ノイズ除去学習の制御 [eess.IV, cs.AI, cs.CV]目的：医用画像ノイズ除去における性能向上
- 医用画像は診断精度に不可欠だが，ノイズの影響を受けやすい。
- 既存手法はノイズを含む参照画像をクリーンな目標と誤認し，性能が制限される。
- 本研究は，多様なノイズ参照から学習し，高品質な画像へ誘導する手法を提案する。
- RelativeFlowは，ノイズの絶対的な除去ではなく，相対的なノイズ除去に焦点を当てることで，学習の安定化を図る。
- 一貫した輸送(CoT)とシミュレーションに基づく速度場(SVF)により，様々な医用画像モダリティに対応したノイズ除去を実現する。
- CTおよびMR画像に対する実験により，RelativeFlowが既存手法を大幅に上回り，ノイズ参照下での医用画像ノイズ除去性能を向上させることが示された。
Link: https://arxiv.org/abs/2604.15459
主要成分分析 [physics.optics, cs.ET, math.CO, cs.DM, stat.ML, cs.LG]目的：最適な次元削減戦略の特定
- 教師なし学習は，データ解析における重要な基盤技術である。
- 教師なし学習においては，普遍的に最適なアルゴリズムが存在しないことが課題である。
- データの特徴を捉えるための，効果的な次元削減手法を開発すること。
- 楕円分布において，最大分散とフロベニウスノルムを最大化/最小化する次元削減戦略が存在することが示された。
- 主要成分を剥離する順序（最大または最小）によって，得られる結果が大きく異なることが確認された。
- Fashion-MNISTデータセットを用いた実験で，この理論的な結果が実証された。
Link: https://arxiv.org/abs/2604.15538
ExoNet：TESS系外惑星候補の同定のためのマルチモーダル深層学習 [astro-ph.EP, astro-ph.IM, cs.LG]目的：TESS系外惑星候補の同定
- 系外惑星探査は，生命の存在可能性を探る上で重要である
- 手作業による候補の検証には限界があり，時間がかかる
- 自動化された検証手法による効率的な候補選定を目指す
- ExoNetは，Keplerデータで高い分類性能を示し，TESSデータへの効果的な汎化能力を実証した。
- TESSの未確認候補200個に適用した結果，ハビタブルゾーン内の候補を含む複数の高信頼度候補を特定した。
- マルチモーダル融合とアテンション機構が，系外惑星候補の自動検証に有効であることが示された。
Link: https://arxiv.org/abs/2604.15560
パラメータ化された双曲型保存則に対する構造を保持するグラフニューラルソルバー [physics.comp-ph, cs.LG, cs.NA, math.NA]目的：双曲型保存則の数値解法における，構造を保持するグラフニューラルネットワーク
- 輸送現象を記述する双曲型保存則は，物理現象の多様な分野で重要である。
- 従来の数値解法は計算コストが高く，多数の計算を要するタスクには不向きである。
- 物理構造を尊重した，高速かつ安定な数値解法を開発し，シミュレーションの効率化を図る。
- 提案手法は，従来の数値解法に匹敵する精度と安定性を持ちながら，大幅な計算時間短縮を実現した。
- ネットワークは，局所的な保存則や風上差分スキームといった物理的性質を保持するように設計されている。
- 高次の空間・時間予測器として機能し，大規模な時間ステップでも安定した更新を可能にした。
Link: https://arxiv.org/abs/2604.15617
統計的識別不能の破綻としての相転移 [math.CO, cs.DM, cond-mat.stat-mech, cs.AI, stat.ME]目的：相転移の新しい特徴付け
- 物性物理学において，物質の振る舞いの変化を理解することは重要である。
- 従来の相転移の議論は，特定のモデルに依存する場合が多い。
- モデルに依存せず，普遍的な相転移の定義を目指す。
- 相転移を，熱力学的極限における微小なパラメータ摂動下での統計的識別不能の破綻として捉える。
- 従来のビンダーパラメータに基づくアプローチは，この枠組みの特殊なケースとして再解釈できる。
- 分布フリーの二標本ランテストを用いて，二次元イジングモデルの臨界点が，オーダーパラメータの事前知識なしに正確に特定された。
Link: https://arxiv.org/abs/2604.15773
トポロジー駆動型nnU-NetとMedNeXtの融合による，サブサハラアフリカデータセットにおける正確な脳腫瘍セグメンテーション [eess.IV, cs.CV, cs.LG]目的：サブサハラアフリカデータセットにおける正確な脳腫瘍セグメンテーションの実現
- 低・中所得国における医療資源の制約下での，高精度な画像診断技術の重要性が高まっている。
- 統一された画像プロトコルや高品質なMRI装置の不足により，脳腫瘍セグメンテーションの精度が低い。
- トポロジー解析を用いてセグメンテーションモデルを改善し，低品質なMRI画像でも高精度な結果を得る。
- 提案手法では，トポロジー改善モジュールを導入することで，予測時の変形問題を軽減することに成功した。
- SNFH，NETC，ETそれぞれのNormalized Surface Distanceにおいて，0.810，0.829，0.895という良好な結果が得られた。
- BraTS 2025データセットを用いた事前学習と，BraTS-Africaデータセットでのファインチューニングが効果的であった。
Link: https://arxiv.org/abs/2604.15964
解釈可能な機械学習による量子現象の発見 [quant-ph, cond-mat.stat-mech, cs.LG]目的：量子データの物理的知見抽出のための解釈可能な機械学習手法
- 量子技術の発展に伴い，複雑な量子データの解析が不可欠となっている。
- 量子データの解析には，専門的な知識が必要であり，効率的な手法が不足している。
- 多様な量子データから，自動的に物理法則を発見し，解釈することを可能とする。
- 変分オートエンコーダを用いて，ラベルなし量子データから物理的に意味のある表現を学習することに成功した。
- 学習された表現は，量子相空間の構造に関する豊富な情報を示し，新たな秩序パラメータの発見を可能にした。
- 実験データやシミュレーションデータに対し，これまで報告されていない現象（例：Rydbergアレイのコーナー秩序パターン）を検出した。
Link: https://arxiv.org/abs/2604.16015
ヘブの可塑性に関するWasserstein幾何学的フレームワーク [math.OC, cs.LG, math.PR]目的：ヘブの可塑性をWasserstein幾何学的に記述する理論
- 脳の情報処理メカニズム解明に不可欠であり，学習・記憶の原理理解に繋がる。
- 従来のヘブ則では，安定性や収束性に関する理論的保証が不十分な場合がある。
- ヘブ則の安定性と最適性を幾何学的に保証し，記憶のダイナミクスを統一的に記述する。
- 記憶状態を確率測度のWasserstein空間における移動として捉え，ヘブ則をエネルギー関数として定式化。
- 内部状態と観測可能な状態を分離し，幾何学的投影を通してシナプス可塑性を記述。
- 連続時間極限曲線が存在することを示し，記憶固定化をWasserstein勾配流として定式化。
Link: https://arxiv.org/abs/2604.16052
二重モダリティ肺がんAI：臨床リスク統合による解釈可能な放射線画像と顕微鏡検査 [eess.IV, cs.AI, cs.CV]目的：肺がんの診断とサブタイプ分類のための二重モダリティ人工知能フレームワーク
- 肺がんは依然として世界的な癌による死亡原因の主要な一つであり，早期発見と正確な診断が重要である。
- 従来のCT画像は，良性病変と悪性病変の区別が難しく，診断根拠の解釈が困難な場合がある。
- 放射線画像と組織病理画像を統合し，解釈可能なAIを提供することで診断精度向上を目指す。
- 提案されたAIフレームワークは，高い精度（最大0.87），AUROC（0.97以上），マクロF1スコア（0.88）を示した。
- Grad-CAM++は，最も高い忠実度と局在化精度を示し，専門家のアノテーションと高い一致性が見られた。
- 放射線画像と組織病理画像のマルチモーダル融合が，診断性能の向上とモデルの透明性維持に貢献することが示唆された。
Link: https://arxiv.org/abs/2604.16104
ChemGraph-XANES：XANESシミュレーションと解析のためのエージェント的フレームワーク [math.CO, cs.DM, cond-mat.mtrl-sci, cs.AI, physics.chem-ph]目的：XANESシミュレーションと解析の自動化
- 化学的に複雑な系の局所構造や電子状態解析にXANESが広く用いられる。
- 大規模な計算には，計算方法よりもワークフローの複雑さがボトルネックとなる。
- 自然言語によるタスク指定からデータキュレーションまでのワークフローを自動化し，計算の効率化を目指す。
- ChemGraph-XANESは，自然言語によるタスク指定，構造取得，FDMNES入力生成などを統合したエージェント的フレームワークである。
- LLMエージェントを活用し，FDMNESマニュアルを参照しながらパラメータを選択し，ユーザーの要求を構造化されたツール呼び出しに変換する。
- 独立したXANES計算は並列実行に適しており，HPCシステムでの高スループット展開とスケーラブルなデータベース生成が可能となる。
Link: https://arxiv.org/abs/2604.16205
適応型マルチフィデリティ最適化と高速学習率 [stat.ML, cs.LG]目的：マルチフィデリティ最適化における後悔最小化
- 限られた計算資源下での効率的な最適化は，科学技術計算や機械学習において重要である。
- 高精度な評価は計算コストが高く，低精度な評価はバイアスが大きいというトレードオフが存在する。
- 問題依存パラメータを知らずに，コストとバイアスのバランスを取りながら最適解を探索することを可能にする。
- 提案手法Kometoは，関数平滑性やフィデリティに関する事前知識なしで，既存手法と同等の性能を理論的に保証する。
- Kometoは，コスト-バイアス関数に基づく後悔の下限を証明し，それと同等の性能を達成する。
- 実験結果は，Kometoが問題依存パラメータを必要としない既存のマルチフィデリティ最適化手法を上回ることを示している。
Link: https://arxiv.org/abs/2604.16239
大学におけるFAQ対応のための深層学習ベースのアムハラ語チャットボット [eess.SY, cs.SY, cs.CY, cs.AI, cs.CL, cs.LG]目的：大学におけるFAQ対応を目的としたアムハラ語チャットボットのモデル
- 大学運営において，学生からの問い合わせ対応は重要であり，効率化が求められている。
- 学生と教職員双方にとって，FAQへの対応は時間的負担となり，課題となっている。
- アムハラ語でのFAQ対応を自動化し，問い合わせ対応の効率化と負担軽減を目指す。
- 深層学習モデルは，91.55%の精度と0.3548の検証損失を達成し，最も優れた結果を示した。
- アムハラ語特有の文字バリエーションや形態変化，語彙の不足といった課題を克服した。
- Facebook Messengerとの連携とHerokuサーバーへのデプロイにより，24時間体制での利用を可能にした。
Link: https://arxiv.org/abs/2402.01720
Few-Shot学習におけるサンプル選択戦略の自動的組み合わせ [cs.LG, cs.AI, cs.CL]目的：Few-Shot学習におけるサンプル選択戦略の組み合わせによる性能向上
- Few-Shot学習は，限られたデータで学習する技術であり，データ収集が困難な場面で重要である。
- 大規模言語モデルでは，サンプル選択戦略が十分に検討されておらず，特定の学習設定に特化した手法が主流である。
- 確立された選択戦略を組み合わせることで，Few-Shot学習の性能を向上させることを目指す。
- 提案手法ACSESSは，様々なサンプル選択戦略を自動的に組み合わせることで，個々の戦略よりも高い性能を発揮する。
- ACSESSは，テキストデータと画像データを用いた実験で，既存のFew-Shot学習手法やIn-Context Learningの基盤モデルと同等以上の性能を示す。
- サンプル選択は，特に少数のサンプルから学習する場合に効果的であり，サンプル数が増加するにつれてその効果は減少する。
Link: https://arxiv.org/abs/2402.03038
DASB：離散オーディオおよび音声ベンチマーク [cs.SD, cs.AI, eess.AS]目的：離散オーディオトークンのベンチマークフレームワーク
- 音声と言語処理の融合が重要視されており，マルチモーダル言語モデルの開発が進んでいる。
- 音響内容，話者識別，パラ言語的要素等の情報を維持することが課題となっている。
- 様々なドメインでの評価設定の不一致を解消し，最適なトークナイザーと設定を特定すること。
- 離散表現は連続表現よりもロバスト性が低く，モデル構造，データ量，学習率等の調整が重要である。
- 意味的トークンは音響的トークンよりも性能が高いが，離散トークンと連続特徴量の間には依然として差がある。
- DASBのコード，評価設定，リーダーボードは公開されており，今後の研究を促進する。
Link: https://arxiv.org/abs/2406.14294
LaMSUM：LLM誘導抽出要約によるハラスメントに対する声の増幅 [cs.CL, cs.LG]目的：ユーザーインシデント報告書の抽出要約
- セクシャルハラスメント対策は重要であり，被害状況の把握が不可欠である。
- 報告書の量が膨大であり，個々の事例を精査することが困難である。
- LLMを活用した抽出要約により，効率的な事例把握と対策立案を目指す。
- LaMSUMは，大規模なインシデント報告書に対して，LLMを用いた抽出要約を可能にするマルチレベルフレームワークである。
- 4つのLLM（Llama，Mistral，Claude，GPT-4o）を用いた評価により，既存の抽出要約手法を上回る性能が示された。
- 本研究は，LLMによる抽出要約の初期的な試みであり，ハラスメント対策の政策立案支援に貢献する。
Link: https://arxiv.org/abs/2406.15809