arXiv雑要約

AI - 2026/06/16 公開

確率的ベクトリックトリックを用いたスケーラブルなペアワイズカーネル学習 [cs.LG]目的：ペアワイズ設定におけるスケーラブルなカーネル学習手法
- ペアワイズ学習は，物体のペアに対する予測に特化した重要な教師あり学習の一分野である。
- 従来のカーネル法は計算コストが高く，大規模データセットへの適用が困難であった。
- 大規模データセットに対するカーネルベースのペアワイズ学習の適用可能性を高める。
- 本研究で提案するSPaiKは，確率的汎用ベクトリックトリック（sGVT）により，計算・メモリ要件を大幅に削減する。
- SPaiKは，7つの現実世界の薬物-標的親和性データセットで最先端の手法と比較して，良好な性能を示した。
- sGVTの組み込みにより，これまで手の届かなかった大規模データセットへのカーネル学習の適用が可能になった。
Link: https://arxiv.org/abs/2606.16979
低遅延特徴エンジンの確率的間引きによる状態更新と推論の分離 [cs.DB, cs.LG]目的：低遅延特徴エンジンにおける推論と状態更新の分離
- 機械学習ワークフローは，大量の集計を継続的に更新するストリーミングデータシステムに依存している。
- 高頻度の状態更新は，遅延，競合，運用コストの主要な原因となっている。
- 情報量の多いイベントのみをトリガーすることで，状態の永続化パスを制御し，遅延を削減する。
- 確率的間引きにより，永続化パスから最大90%のイベントを除外できることが示された。
- ディスクベースのキーバリューストアから取得した近似統計のみに依存することで，メモリ内の制御プレーンやワーカー間の調整を回避している。
- 時間ベースの集計は，分散を考慮した定式化の下でバイアスがなく，体系的なエラーの蓄積を防ぐ。
Link: https://arxiv.org/abs/2606.16981
調和化された関税品目表コード分類のための合意に基づくエージェント型大規模言語モデルフレームワーク [cs.HC, cs.AI]目的：調和化された関税品目表（HTS）コードの分類
- 国際貿易において，正確なHTSコード分類は不可欠であり，通関，関税評価，貿易統計，規制遵守に影響する。
- 製品記述が短く，不完全，または曖昧である場合が多く，正確な分類は困難である。階層的な関税構造や法解釈も複雑さを増す。
- 本研究は，エージェント型LLMを用いて，より解釈可能で信頼性の高いHTSコード分類を可能にすることを目指す。
- 提案フレームワークは，マルチエージェント情報検索，意味検索，根拠に基づく推論，合意に基づく検証などを統合している。
- 実験結果から，詳細な10桁の分類は高度なLLMにとっても依然として困難であることが示された。
- 本フレームワークは，証拠に基づき，不確実性を考慮し，人間が介入できるHTSコード分類ワークフローを支援する。
Link: https://arxiv.org/abs/2606.16987
エージェントの軌跡をプログラムとして：行動のフィンガープリントとコーディングエージェントのプログラミング [cs.SE, cs.LG]目的：エージェントの行動特性の識別と，その行動パターンを記述する手続き的表現の開発
- AIエージェントの性能評価は重要だが，その達成方法の理解は不可欠である。
- 現在の評価指標は成功/失敗のみに焦点を当てており，エージェントの内部プロセスはブラックボックスのままになっている。
- エージェントの行動特性を定量的に把握し，モデル間の差異を明確にすること。
- エージェントの軌跡から行動のフィンガープリントを抽出し，未知の軌跡を高い精度(85.7%)で識別可能であることが示された。
- エージェントの軌跡を手続き的に表現することで，モデル間の行動の類似性を定量化し，リリース時期や蒸留関係が類似性に影響を与えることが明らかになった。
- ProcGrepというエージェント監査・評価ライブラリを開発し，タスクへのアプローチを手続きレベルで分析可能にした。
Link: https://arxiv.org/abs/2606.16988
公共財の安定メニュー：AIを活用した進展 [cs.GT, cs.AI, cs.CY]目的：AIを活用した経済計算機科学研究ワークフローの有効性に関する理解
- 公共財の配分は社会厚生に不可欠であり，最適な配分方法の探求は経済学の重要な課題である。
- 従来の公共財の分析手法では，複雑な状況下での最適なメニューの特定が困難であるという問題がある。
- AIの活用により，公共財メニューの安定性と効率性を向上させる新たなアプローチを開発することを目指す。
- プロンプトに人間の直感を取り入れることで，LLMの出力の質を向上させることが示唆された。
- 複数回の対話型ワークフローは，LLMがより意欲的なステップを実行する際に有効であることが確認された。
- LLMは，初期の博士課程学生と比較して，わずかに劣るパフォーマンスを示した。
Link: https://arxiv.org/abs/2606.16989
解析的ねじれとスペクトルギャップが持続ラプラシアンの性能を捉える [cs.LG, math.AT]目的：持続ラプラシアンのスペクトル表現の簡約化
- データ解析において，幾何学的な情報を捉える手法の重要性が高まっている。
- 持続ラプラシアンのフルスペクトルは高次元であり，フィルタースケール間で長さが変動する問題がある。
- ベティ数，スペクトルギャップ，解析的ねじれを用いて，簡潔な表現を確立し，性能低下を防ぐ。
- 本研究では，ベティ数，スペクトルギャップ，解析的ねじれという3つの不変量を用いることで，フルスペクトルと同等以上の予測性能が確認された。
- 計算コストの大幅な削減と，高周波固有値によるノイズの抑制が可能となった。
- これらの不変量は，スペクトル幾何学とトポロジカル学習間の原理に基づいた固定長インターフェースを提供する。
Link: https://arxiv.org/abs/2606.16990
造影なしCTからの腹部疾患診断とレポート生成に関する多施設共同ベンチマーク [cs.CV, cs.LG]目的：造影なしCTからの腹部疾患診断と自動放射線レポート生成
- 腹部疾患の診断においてCT検査は不可欠だが，造影剤使用にはリスクが伴う。
- 造影CTは腎機能障害のリスクや，読影医の負担増大が課題となっている。
- 造影なしCTから造影CT相当の情報を合成し，安全かつ効率的な診断を可能にする。
- 造影なしCTでも診断に必要な信号が保持されており，多臓器AUCは内部データセットで69.1%を達成。
- 外部検証データセットにおいても63.1%の平均AUCを示し，汎用性も確認された。
- 本研究は，造影剤を使用しない腹部イメージングの発展を促進する基盤となる。
Link: https://arxiv.org/abs/2606.16991
迷ったら計画を立てろ：反応性強化学習のためのコミットされた小規模言語モデルによる熟考 [cs.AI, cs.LG]目的：見慣れない環境下での強化学習ポリシーの性能低下
- 強化学習は，複雑なタスクを自律的に学習できるため，様々な分野で注目されている。
- 強化学習ポリシーは，明示的な熟考がないため，未知の環境では性能が低下しやすい。
- 小規模言語モデルによる計画生成と検証を通じて，強化学習ポリシーの汎化性能を向上させる。
- 提案手法PACTは，高速な反応型強化学習ポリシーと，低速な熟考型小規模言語モデルプランナーを組み合わせることで，未知の環境下でも高い性能を発揮する。
- PACTは，シミュレーションによる検証を通じて安全かつ実行可能な計画を生成し，強化学習ポリシーを再学習することなく直接実行する。
- FrozenLakeの３つの難易度設定において，PACTは既存手法を凌駕し，20億パラメータの小規模言語モデルでも有効であることが示された。
Link: https://arxiv.org/abs/2606.16995
ActiveSAM：画像条件クラスプルーニングによる高速かつ高精度なオープンボキャブラリセグメンテーション [cs.CV, cs.AI, cs.LG]目的：オープンボキャブラリセマンティックセグメンテーションにおける効率的な分割
- 画像認識技術の発展は，自動運転やロボット工学など，様々な分野での応用を可能にする。
- 既存のオープンボキャブラリセグメンテーション手法は，計算コストが高く，処理速度が遅いという課題がある。
- 画像の内容に応じて分割対象のクラスを絞り込むことで，計算コストを削減し，高速化を図る。
- ActiveSAMは，学習データなしでSAM 3をアクティブボキャブラリセグメンターに変換する推論フレームワークである。
- ８つのオープンボキャブラリセグメンテーションベンチマークにおいて，既存手法を平均で約1.4 mIoU上回り，最大で5.5倍高速に動作する。
- 画像劣化に対するロバスト性も高く，ノイズの多い環境下での利用に適している。
Link: https://arxiv.org/abs/2606.16996
シグナルなし選択，表現による回復：フローズン小規模コードモデルに対する事後検証演算子の測定研究 [cs.SE, cs.CL, cs.LG]目的：フローズン小規模コードモデルにおける事後検証演算子の有効性評価
- オフライン環境やプライバシー制約下でのコードモデル利用が重要視されている。
- 小規模コードモデルは，しばしば妥当だが誤ったプログラムを出力する。
- 事後検証演算子によるプログラムの選択，検証，修正，再処理の効果を測定する。
- 26種類の事後検証演算子を評価した結果，どの演算子もBest-of-Nを超える精度改善は見られなかった。
- その原因として，カバレッジの壁，能力のハサミ，コンセンサスの罠の存在が示された。
- 表現層の回復演算子(M1)は，従来の抽出器が見逃す正解プログラムを回復し，DeepSeek-Coder-1.3BのHumanEval+での性能を向上させた。
Link: https://arxiv.org/abs/2606.16999
二次多項式におけるmin-max最適化の複雑性 [cs.CC, cs.GT, cs.LG, math.OC]目的：二次多項式に対するmin-max最適化の近似停留点の計算困難性
- 最適化問題は，機械学習や経済学など広範な分野で基盤となる重要な課題である。
- 多項式最適化問題はNP困難であり，効率的な解法が未だ確立されていない。
- 本研究は，二次多項式におけるmin-max最適化の計算困難性の限界を明らかにする。
- 超立方体上のmin-max最適化における近似停留点の計算はPPAD困難であることが証明された。
- この困難性は，多項式が多項式である場合，変数ごとに最大で3つの単項式が含まれる場合，そして近似係数が多項式の逆数であっても成立する。
- この結果から，二チームのゼロサムポリマトリックスゲームに対する最初のPPAD困難性が導かれる。
Link: https://arxiv.org/abs/2606.17000
最先端AI評価の公開アーカイブに対するベイズ推論と意思決定監査 [eess.SY, cs.SY, cs.CY, eess.SY, cs.SY, cs.AI, stat.ME]目的：最先端AI評価の公開アーカイブにおけるベイズ推論と意思決定監査の枠組み
- AI技術の発展は目覚ましく，その評価は社会実装において不可欠である。
- 公開されたAI評価は，評価規則やベンチマークの変更により，不確実性を伴うことが多い。
- 公開アーカイブの分析を通じて，AI評価の信頼性を向上させる方法を提示する。
- 公開AI評価は，最終的なリーダーボードとして解釈されがちだが，実際には報告規則などによって形成された選択的な時系列データである。
- 提案手法により，AI評価の履歴を再構築し，検証可能なタイミング境界を特定し，根拠のない主張を否定することが可能となった。
- 候補選択を考慮した最先端モデルは，合成的な回復，目的アーカイブの予測，好み転送，不確実性の校正に失敗した。
Link: https://arxiv.org/abs/2606.17005
TuneJury：音楽生成の嗜好性アライメント向上のためのオープンな指標 [cs.SD, cs.AI, cs.LG, cs.MM, eess.AS]目的：テキストから音楽への変換における音楽の嗜好性スコアの予測
- 音楽生成技術は，創造的な表現を可能にし，エンターテイメントや教育など多岐にわたる分野で活用が期待されている。
- 生成された音楽の品質を客観的に評価することが難しく，人間の好みに合致する音楽を生成するための指標が不足している。
- 人間の嗜好に基づいた，より信頼性の高い音楽評価指標を開発し，音楽生成モデルの性能向上に貢献すること。
- TuneJuryは，人間の嗜好ラベルを用いて学習された，オープンなペアワイズ報酬モデルである。
- 予測されたスコア差は，テストデータや未知のデータに対しても良好な校正結果を示し，データフィルタリングに利用可能である。
- 学習後にリリースされた生成器に対しても，アンカーキャリブレーションにより，効率的な性能改善を実現する。
Link: https://arxiv.org/abs/2606.17006
トークンから政策へ：因果的かつ解釈可能な異質効果の識別 [cs.LG]目的：異質効果の識別
- 介入の効果を説明し，政策を最適化するには，異質効果の特定が不可欠である。
- 異質効果の分析において，表現力と解釈可能性のトレードオフが存在し，潜在的な交絡因子の影響が課題となる。
- 多角的な事前測定とスケーラブルな表現学習により，潜在的な交絡因子を考慮した因果的な異質効果の識別を目指す。
- NEXISという反復的な手続きを提案し，事前表現におけるMarkov被覆の発見を通して異質効果の識別を再構成した。
- アフリカにおける2つの貧困対策プログラムにNEXISを適用し，衛星画像を用いて未測定の環境要因を組み込むことで，新たな知見を得た。
- プログラムの改善に繋がる解釈可能で処方的な指針を導き出し，政策の最適化に貢献する可能性を示した。
Link: https://arxiv.org/abs/2606.17010
ROVE：強化学習によるヒューマノイド操作のための人間介入の可能性の解禁 [cs.RO, cs.LG]目的：ヒューマノイドの視覚言語行動（VLA）モデルのポストトレーニングにおける人間介入の活用
- ロボットの自律操作は困難であり，人間による介入は重要な修正信号を提供する。
- ヒューマノイドの複雑な運動学と手の制御により，シームレスな人間介入は困難である。
- 質の低い人間介入データから高価値な行動を抽出し，VLAモデルの性能を向上させる。
- ROVEは，ヒューマノイド操作のための人間介入データ収集パイプラインを導入した。
- 楽観的価値推定（OVE）により，質の低い軌跡から高価値な行動を優先的に学習した。
- 異なるロボットの人間経験ビデオを活用し，長尾の失敗事例や回復モードに対する強固な価値推定を実現した。
Link: https://arxiv.org/abs/2606.17011
グラフ固有時系列のためのフィルタリングされた共形楕円体 [cs.LG, math.ST, stat.ML, stat.TH]目的：多変量時系列予測における，単一のイベントを制御しつつ，座標間の依存関係に適応するための予測集合
- 多変量時系列データは現実世界の様々な現象をモデル化するために不可欠であり，正確な予測が求められる。
- 従来の予測手法では，複雑な時系列データの依存関係を捉えきれず，予測区間の信頼性を保証することが難しい。
- 本研究は，依存関係を考慮した信頼性の高い予測集合を構築し，時系列予測の精度と安全性を向上させることを目指す。
- フィルタリングされた共形楕円体は，学習された予測共分散行列を活用することで，ガウス分布の尾確率に依存せずにカバレッジを保証する。
- 安定なベイズガウス投影フィルタ，共分散の境界，有限視野の観測可能性フィッシャー条件の下で，過剰なガウス負対数尤度が学習された出力法則の収縮を意味することが示された。
- METRLA-$20$とPEMSBAY-$50$の交通ベンチマークにおいて，学習されたフィルタは，静的共分散ベースラインや非フィルタベースラインよりもシャープなターゲット楕円体を提供する。
Link: https://arxiv.org/abs/2606.17014
TokenPilot：LLMエージェントのためのキャッシュ効率的なコンテキスト管理 [cs.CL, cs.AI, cs.LG, cs.MA]目的：LLMエージェントにおけるコンテキスト管理のコスト削減
- LLMエージェントの長時間の利用が増加し，コンテキストの蓄積による推論コストが課題となっている。
- 既存手法では，コンテキストの削減や動的なメモリ退避が用いられるが，プロンプトの構造変化によりキャッシュ効率が低下する。
- プロンプトの構造を維持しつつ，効率的にコンテキストを管理することで，コスト削減と性能維持を目指す。
- TokenPilotは，グローバルなコンテキスト圧縮とローカルなコンテキスト退避を組み合わせた二重粒度のフレームワークである。
- PinchBenchとClaw-Evalでの実験により，TokenPilotは孤立モードで最大61%，連続モードで最大87%のコスト削減を達成した。
- その結果，既存システムと比較して競争力のある性能を維持しながら，大幅なコスト削減を実現している。
Link: https://arxiv.org/abs/2606.17016
FusionRS：RGB-赤外リモートセンシング大規模データセット - デュアルモーダルVision-Language基盤モデル向け [cs.CV, cs.AI]目的：RGB-赤外リモートセンシング画像とテキストのデュアルモーダル学習を可能にする大規模データセット
- 地球観測において，リモートセンシング技術は不可欠であり，その応用範囲は多岐にわたる。
- 既存研究は主にRGB画像に焦点を当てており，赤外データの補完的な情報は十分に活用されていない。
- RGBと赤外データを統合的に学習することで，より高度な地球観測理解を目指す。
- FusionRSデータセットを用いることで，RGB-赤外画像のalignment，赤外画像からテキスト検索，デュアルモーダルキャプション生成の性能が向上した。
- 赤外画像に特化したテキストキャプション（IR-aware captions）が，赤外とテキストのalignment強化に重要な役割を果たすことが確認された。
- 本研究は，リモートセンシング分野におけるscalableなRGB-赤外Vision-Language表現学習の重要性を示唆する。
Link: https://arxiv.org/abs/2606.17020
ExpRL：LLM中間学習のための探索的強化学習 [cs.LG]目的：LLMの中間学習における探索的強化学習の有効性検証
- LLMの推論能力向上には強化学習が不可欠であり，その性能はベースモデルの網羅性に大きく依存する。
- 既存の中間学習は手動で学習内容を指定する必要があり，複雑な問題への対応が課題となっていた。
- 人間の解答データを報酬の足場として利用し，より自動化された中間学習手法を確立する。
- ExpRLは，従来のSFT，疎報酬GRPO，自己蒸留と比較して，より強力な強化学習の初期化を提供することが示された。
- ExpRLは，部分的な進捗や有用な中間ステップ，生産的な推論行動を強化することで，数学的推論タスクにおいて高い性能を発揮する。
- 追加の混合ドメイン実験により，ExpRLが数学以外の設定にも拡張できる可能性が示唆された。
Link: https://arxiv.org/abs/2606.17024
HAMON：長期間予測のための受動的光学的シーケンス混合 [cs.LG, cs.AI, cs.AR]目的：長期間時系列予測のための受動的光学的シーケンス混合手法
- 時系列予測は，経済，気象，交通など多岐にわたる分野で不可欠な技術である。
- 既存の予測モデルは計算コストが高く，複雑な表現学習に依存している場合が多い。
- シンプルな線形モデルでも十分な性能を発揮することに着目し，受動的光学による低コストな予測を目指す。
- HAMONは，ETTm2ベンチマークにおいて，あらゆる予測期間で既存のデジタルベースラインを上回る性能を示した。
- ETTh2ベンチマークでも，最長の予測期間を除いて既存手法と同等以上の性能を達成し，平均二乗誤差を最大14%改善した。
- 光学的予測コアがデータから予測を行っていることを確認するため，様々なアブレーション実験とシミュレーションを実施した。
Link: https://arxiv.org/abs/2606.17028
KVEraser：KVキャッシュの操作による効率的な局所的文脈削除学習 [cs.CL, cs.LG]目的：KVキャッシュに対する局所的な文脈削除の効率化
- 大規模言語モデルの性能向上には，長い文脈を効率的に処理する技術が不可欠である。
- 従来の文脈削除手法は計算コストが高く，削除区間の長さよりも後続部分の長さに依存する。
- 削除区間のKVキャッシュのみを学習可能なステートで置換し，残りを再利用することで効率化を図る。
- KVEraserは，従来の完全再計算と同等の性能を，1K～32Kの文脈長において達成する。
- KVEraserの遅延は24%の増加に留まり，完全再計算の17.6倍増と比較して大幅な改善である。
- KVEraserは，有害な事実を含む長文書QAタスクにおいても，既存手法を上回り，完全再計算の3～4倍の速度を実現する。
Link: https://arxiv.org/abs/2606.17034
プライバシーが牙をむく：差分プライバシー付き連合学習へのバックドア攻撃 [cs.LG, cs.CR]目的：差分プライバシー付き連合学習に対するバックドア攻撃の脆弱性とその対策
- 連合学習は，プライバシー保護を維持しつつ分散データを用いてモデルを学習する有望な手法である。
- 差分プライバシーはプライバシー保護に有効だが，それが連合学習のセキュリティに及ぼす影響は不明確である。
- 差分プライバシーがバックドア攻撃を隠蔽し，既存の防御策を無効化する問題を解決する。
- 差分プライバシーは，バックドア攻撃の検出とフィルタリングを困難にし，既存の防御策の効果を低下させる。
- 提案手法RINGは，差分プライバシーを悪用し，悪意のあるクライアントからの貢献を隠蔽しつつ，攻撃の影響を最大化する。
- RINGは，複数のデータセットで高い攻撃成功率（平均90.3%）を達成し，既存の防御策を大幅に上回る脅威をもたらす。
Link: https://arxiv.org/abs/2606.17035
ニューラル表現における位相の重要性：画像分類器に対する内部 Oppenheim-Lim テスト [cs.CV, cs.AI, cs.LG]目的：画像分類器の隠れ層における位相と振幅の役割の非対称性
- 画像認識技術は，コンピュータビジョンの根幹であり，様々な応用分野で不可欠である。
- ニューラルネットワークの内部表現がどのように情報を符号化しているのか，そのメカニズムは未だ解明されていない。
- 画像認識における位相と振幅の役割を内部表現レベルで明らかにすること。
- PRISM2D，GFNet，ViT-B/16では，予測が位相または符号の供与者に従い，振幅を削除しても精度がほとんど低下しないことが示された。
- ResNet-50ではReLU層後の符号の移植は効果がないように見えるが，ReLU層前の介入により，遅延ブロックに強い潜在的符号コードが存在することが明らかになった。
- これらのアーキテクチャは位相/符号による同一性コードを共有するが，整流と読み出しの幾何学によって異なる基底で表現している。
Link: https://arxiv.org/abs/2606.17037
疎なエピソード結果からのVLAのオンラインRLファインチューニングのための階層的利点重み付け [cs.CL, cs.IR, cs.RO, cs.LG]目的：事前学習済みVLAポリシーのオンラインRLによるファインチューニングにおける利点重み付け手法
- ロボットの行動学習において，事前学習済みポリシーを効率的に改善することは重要である。
- オンラインRLでは，成功/失敗といった二値の報酬しか得られず，詳細な行動指針を得にくい。
- 生存性と効率性の両方を考慮し，報酬の誤った伝播を防ぐことで学習を改善する。
- 提案手法HABCは，生存性と効率性のための別々の批評家を組み合わせ，状態適応的なゲートで利点を調整する。
- 介入を考慮した報酬の割り当てにより，現在のポリシーによって実行されたセグメントのみが学習に貢献する。
- 実機ロボット実験において，HABCは成功率を大幅に向上させ，SFTベースラインを大きく上回った。
Link: https://arxiv.org/abs/2606.17043
ロボットのポリシー学習のための幾何学的行動モデル [cs.RO, cs.CV, cs.LG]目的：ロボットの汎用的なポリシー学習
- ロボットが人間からの指示に従い，3D環境で動作するためには，物体の理解が不可欠である。
- 既存モデルは2D画像に依存しており，接触操作に必要な3D幾何学的情報を十分に活用できていない。
- 事前学習済みの幾何学的モデルを活用し，3D幾何学情報を効果的に利用する手法を開発する。
- 幾何学的行動モデル(GAM)は，事前学習済みの幾何学的基礎モデルを，知覚，時間予測，行動デコードの共有基盤として活用する。
- GAMは，モデルを中間層で分割し，言語，固有受容性，行動履歴に基づいて未来の潜在的なトークンを予測する。
- シミュレーションおよび実機ロボットでの実験により，GAMは既存のモデルよりも精度，ロバスト性，速度，軽量性に優れていることが示された。
Link: https://arxiv.org/abs/2606.17046
線形逆問題解決のための正確な事後スコア推定 [cs.LG, cs.CV, stat.ML]目的：線形逆問題における正確な事後スコア推定手法
- 画像復元などの分野で，データ分布の事前知識を活用することが重要である。
- 既存手法では，事前分布のスコアを事後分布に変換する際に近似やモデル構造の変更が必要となる。
- ガウス補間を用いた線形ガウス逆問題において，正確な事後スコアを閉形式で導出し，事後サンプリングを効率化する。
- 本研究では，正確な事後スコア推定 (EPS) という，標準的な事前学習構造を維持したまま事後分布を推定できる学習目的関数を提案した。
- EPSは，FFHQとImageNetの5つの線形逆問題において，既存の学習済みおよび学習不要な手法と比較して，忠実度，知覚品質，分布メトリクスにおいて優れた性能を示した。
- また，勾配ベースの事後サンプラーと比較して，大幅に少ないノイズ除去評価回数で同等以上の性能を達成した。
Link: https://arxiv.org/abs/2606.17048
大規模言語モデルを用いたフィッシングメールの検出 [cs.CR, cs.AI, cs.IR]目的：フィッシングメール検出の枠組み
- サイバー攻撃の脅威が増大しており，その対策が不可欠である。
- 大規模言語モデルの脆弱性を悪用したフィッシング攻撃が深刻化している。
- 大規模言語モデルのセキュリティ強化とフィッシングメール対策を目指す。
- 大規模言語モデルは，90%以上の精度でフィッシングメールを検出可能である。
- プロンプトインジェクションや多言語攻撃といった攻撃手法に対する脆弱性が明らかになった。
- 現実環境下における複合的な脆弱性攻撃に対する対策が重要となる。
Link: https://arxiv.org/abs/2512.10104
多ラベル分類と生成AIの統合によるユーザーフィードバックのスケーラブルな分析 [cs.HC, cs.AI]目的：ユーザーフィードバックの分析手法
- 競争の激しいソフトウェア市場において，ユーザーエクスペリエンス（UX）は製品の品質と成功に不可欠である。
- 大量のユーザーコメントを手動で分析するには，時間と労力がかかるという課題がある。
- ユーザーコメントの効率的な処理と解釈を通じて，UX評価の改善を目指す。
- 事前に定義されたトピックラベルを各コメントに割り当てることで，収集されたコメントの概要を把握することが可能となった。
- 生成AIを活用することで，ユーザーフィードバックを簡潔かつ有益な形で要約し，組織内での効果的な情報伝達を促進することができた。
- センチメント分析だけでは，ユーザー満足度を正確に反映することはできず，明示的な満足度調査が必要であることが示された。
Link: https://arxiv.org/abs/2601.23018
ハニーポット・プロトコル [cs.CR, cs.AI]目的：AI制御における信頼性監視の脆弱性検証
- AIシステムの安全性確保は重要であり，監視はその不可欠な要素である。
- 既存の監視方法は受動的であり，巧妙な攻撃に対して脆弱性を持つ。
- 状況依存的な振る舞いをテストし，監視の弱点を明らかにすること。
- Claude Opus 4.6のBashArenaにおける評価実験で，メインタスクの成功率は100%であった。
- 側タスクは全ての条件下で均一に発生せず，現時点では攻撃を検知できなかった。
- 本研究は，より強力な攻撃ポリシーやモデルとの比較のための基盤を提供する。
Link: https://arxiv.org/abs/2604.13301
勾配ブースティングによるリスクスコア [cs.LG, cs.MS]目的：コンパクトかつ予測精度の高いリスクスコアの構築
- 医療，保険，リスク管理等で活用され，解釈性と実行可能性が重要視されている
- 従来の線形回帰では非線形な関係性を捉えきれない点が課題であった
- 勾配ブースティングを用いて，より簡潔で精度の高いリスクスコアを開発する
- 提案手法は，回帰ベースの手法と比較して，平均して分類タスクでルール数を60%削減，イベント発生時間予測タスクで16%削減した
- 12のテーブル型データセットを用いた評価により，予測性能において競争力があることが示された
- C++実装に加え，PythonおよびRとの連携機能も提供している
Link: https://arxiv.org/abs/2605.02593
記号実行トレースによるLLMへのプログラム意味論の教授 [cs.SE, cs.LG, cs.LO, cs.PL]目的：LLMに対するプログラム意味論の教授
- 大規模言語モデルの進化は，ソフトウェア検証を含む多様な分野に影響を与えている。
- LLMはプログラムの性質を正確に確認できるものの，違反の検出精度に課題がある。
- 記号実行トレースを用いてLLMを訓練し，違反検出能力の向上を目指す。
- 500件のC言語検証タスクで評価フレームワークを構築し，14種類のモデルを評価した。
- 約3,000件のバグトレースとChain-of-Thought推論を組み合わせることで，違反検出率が17%以上向上した。
- 訓練された8Bモデルは，4倍サイズのQwen3-32Bモデルを凌駕し，全体的な精度も近づいた。
Link: https://arxiv.org/abs/2605.06184
カタストロフィック・フォゲッティングのメカニズム的起源：なぜ強化学習はSFTよりも回路をより良く保存するのか？ [cs.LG, cs.AI, cs.CL, cs.CR]目的：大規模言語モデルのファインチューニングにおけるカタストロフィック・フォゲッティングのメカニズム
- 言語モデルの能力維持は，実用的な応用において不可欠である。
- ファインチューニングによって，既存の能力が失われるカタストロフィック・フォゲッティングが課題となっている。
- 強化学習がSFTよりも能力を維持できるメカニズムを解明すること。
- SFTはターゲットタスクへの適応は速いものの，回路の破壊と既存能力の忘却が大きい。
- 強化学習は回路のより大きな割合を保存するが，タスク適応は遅い。
- 回路の保存が，強化学習がカタストロフィック・フォゲッティングに強い理由の一つと考えられる。
Link: https://arxiv.org/abs/2605.28860
熟議型投票における代替案ベース情報システムの評価：エージェントシミュレーターの利用 [cs.RO, cs.HC, cs.SY, eess.SY, physics.med-ph, cs.CY, cs.AI, cs.MA, cs.SI]目的：熟議型投票における情報システムの評価手法
- 集団意思決定において，多様な意見に触れることは重要であり，熟議型投票はその有効性が期待されている。
- 大規模な熟議型投票において，投票者全員が議論の多様性に触れることを保証することは課題である。
- LLMベースのシミュレーターを用いて，議論の網羅性を評価し，情報システムの改善を目指す。
- LLMベースのエージェントシミュレーターを用いて，熟議型投票における情報システムの網羅性を評価した。
- 推薦システムの推奨数(K)や創造性(pown)が網羅率と多様性に与える影響を分析した。
- 戦略的な投票攻撃に対して，関係性の重み付けを調整することで，網羅性の低下を抑制できることを示した。
Link: https://arxiv.org/abs/2606.11692
膝リハビリ用外骨格のインピーダンスMPCと患者トルク推定 [eess.SY, cs.HC, cs.NE, cs.RO, cs.SY, physics.med-ph]目的：膝リハビリ用外骨格におけるインピーダンスMPCフレームワークの開発
- リハビリテーション支援ロボットは，患者の運動機能回復を加速させ，医療現場での負担軽減に貢献する重要な技術である。
- 従来のインピーダンス制御では，患者の不随意な痙攣や意図的な努力に対応できず，安全性の確保が課題であった。
- 本研究では，患者トルクを推定し，安全かつ効果的なリハビリテーションを実現するMPC制御を提案する。
- 提案手法は，シリーズ弾性アクチュエータ(SEA)プラットフォーム上で検証され，膝関節の運動軌道を正確に追従可能であることが示された。
- 患者トルクを直接測定するカルマンフィルタを用いることで，オフセットのない，スムーズなアシストを実現し，従来のインピーダンス制御と比較して大幅な改善が見られた。
- 臨床的な基準を満たし，20自由度MyoSuite myoLegへの拡張性も確認された。
Link: https://arxiv.org/abs/2606.13485
ESGナラティブスコアリングにおける推論能力重視LLM導入の限界的効果：日本上場企業に関する4モデル合意研究 [cs.CY, cs.AI]目的：ESGナラティブ開示の自動スコアリング
- 企業価値向上に不可欠なESG情報の重要性が高まり，効率的な評価手法が求められている。
- LLMの性能向上に伴い，高コストな推論能力重視モデルの有効性が検証されていない。
- 推論能力重視LLMの導入コストに見合うスコアリング精度の向上が見られるか検証する。
- 推論能力重視LLMと推論能力なしLLMとのスコアの平均絶対偏差は，5段階スケールで0.38にとどまる。
- ペアワイズ比較で2点以上の偏差は全体の2%に過ぎず，実質的な差異は少ない。
- 推論能力重視LLMのコストは，推論能力なしLLMアンサンブルの約5.6倍であり，費用対効果が低い。
Link: https://arxiv.org/abs/2606.13693
PH-KAN：ポートハミルトニアン・コルモゴロフ・アルノルド・ネットワーク [math.OC, cs.AI]目的：非線形システムの物理構造を保持し，解釈可能性を高めたポートハミルトニアンモデルの特定
- データ駆動型機械学習は非線形システム同定に有用だが，物理構造の保持や解釈性が課題。
- 標準的なMLPを用いたポートハミルトニアンモデルのパラメータ化では，解釈性の低い表現になりやすい。
- コルモゴロフ・アルノルド・ネットワークを用いて，物理構造を保持し解釈可能なモデルを構築する。
- 提案手法PH-KANは，相互接続行列，散逸行列，ハミルトニアン，入力マッピングをKANブロックでパラメータ化する。
- これにより，ポートハミルトニアン制約を構造的に満たし，非線形関数を明示的に検証可能となる。
- 標準的なMLPと比較して，より解釈性の高いモデルが得られることが示された。
Link: https://arxiv.org/abs/2606.14708
機械学習駆動によるサンディアD炎の化学反応器ネットワークモデリング [physics.comp-ph, cs.LG, physics.flu-dyn]目的：サンディアD炎における化学反応器ネットワークの構築
- 乱流燃焼シミュレーションは，科学技術の様々な分野で不可欠である。
- 高精度な多次元シミュレーションは計算コストが大きいため，現実的な問題への適用が困難である。
- 機械学習を活用し，効率的かつ高精度な化学反応器ネットワークの自動構築を目指す。
- 主成分分析とk-meansクラスタリングにより，物理的に解釈可能な炎領域を特定し，反応器ネットワークの初期化を実現した。
- 有限差分法による勾配降下法を用いてネットワークを最適化し，最大温度の決定係数R^2が0.7945を達成した。
- 計算速度は約6000倍向上し，CO予測の精度も初期化時と比較して大幅に改善された。
Link: https://arxiv.org/abs/2606.14729
BRIDGE：生物学的証拠の洗練と遺伝子制御ネットワークの異種動的ゲーティング [q-bio.MN, cs.AI, cs.LG]目的：遺伝子制御ネットワーク推論の精度向上
- 単一細胞RNA配列解析は細胞状態特異的な転写プログラムを解明する上で重要である。
- 単一細胞RNA配列解析データは疎でノイズが多く，実験的に検証された転写因子-標的遺伝子間の相互作用は限られている。
- 生物学的制約を組み込み，遺伝子と細胞間の情報伝達を制御することで，より堅牢なネットワーク推論を目指す。
- BRIDGEは，遺伝子と細胞の表現を抽出し，遺伝子空間と細胞空間でコントラスト学習を行うことで，精度向上を実現した。
- 異種ゲーティングエンコーディングにより，遺伝子と細胞間の情報伝達を適応的に制御し，転写因子-標的遺伝子予測のロバスト性を高めた。
- 複数のベンチマークデータセットで最先端のAUROCとAUPRCを達成し，特に特定ネットワークにおいてAUPRCを5%改善した。
Link: https://arxiv.org/abs/2606.14734
分子動力学のためのトポロジカル表現の学習 [q-bio.BM, cs.LG, stat.ML]目的：分子動力学シミュレーションにおけるトポロジカル表現
- タンパク質の機能理解には，その構造変化の解析が不可欠であり，効率的な記述子の開発が求められている。
- 従来の記述子は，特定の目的のために設計されることが多く，汎用性に課題があった。
- 持続ホモロジーを用いて，汎用性の高い分子記述子を開発し，タンパク質の構造解析を支援すること。
- 持続ホモロジーに基づく記述子は，タンパク質クラス予測，フレームレベル観測量の回帰，マルコフ状態モデルの推定において，競争力のある性能を示した。
- マスク付きフラッド複体の使用により，全体的な性能が一貫して向上した。
- トポロジー情報に基づいたマルコフ状態モデルは，物理的観測量に基づくモデルよりも優れたアンサンブル統計量を得た。
Link: https://arxiv.org/abs/2606.14737
大規模言語モデルは感情を持つか [q-bio.NC, cs.AI, cs.HC]目的：大規模言語モデルにおける感情概念の表現の有無とその機能
- 感情は生物の行動や意思決定において重要な役割を果たすため，そのメカニズム理解は不可欠である。
- 現在のAIモデルにおける感情の表現は，生物の感情とは異なる可能性があり，その違いの明確化が必要である。
- 大規模言語モデルにおける感情概念の表現の特性を分析し，真の感情の有無を評価すること。
- Anthropic社の研究ではClaude Sonnet 4.5に感情概念の内部表現が見られたが，生物学的な感情機能との比較では不十分な点が多い。
- Claudeの表現は状況の解釈の一部をサポートするも，神経科学的な感情の多様性を反映していない。
- 注意，意思決定，動機付け状態の変化といった感情の本質的な再編成は見られず，真の感情とは言い難い。
Link: https://arxiv.org/abs/2606.14742
Pixel-TTS：堅牢なテキスト読み上げのための画像ベースのテキストレンダリング [eess.AS, cs.AI, cs.CV, cs.SD]目的：画像に基づくテキストレンダリングによるテキスト読み上げの実現
- 言語理解に視覚的情報を活用できる可能性が示唆されており，テキストモデリングの新たなアプローチとして注目されている。
- 従来のテキストベースのアプローチでは，未知の文字への対応や多言語への適応が課題となっていた。
- 視覚的な情報を活用することで，未知の文字や異なる文字コードへの対応を可能にし，多言語での性能向上を目指す。
- Pixel-TTSはテキストを画像としてレンダリングすることで，未知の文字や文字のバリエーションに対する堅牢性を向上させている。
- 従来のモデルと比較して，学習の収束が速く，ゼロショット汎化性能に優れていることが実験的に示された。
- ファインチューニング時に埋め込み行列の拡張を必要とせず，高い性能を維持できることが確認された。
Link: https://arxiv.org/abs/2606.14750
エージェント経済学：人間とAIの協働におけるAIエージェントの評価，貢献度測定，価格設定の経済的基盤 [econ.EM, cs.AI, cs.GT]目的：人間とAIの協働ワークフローにおけるAIエージェントの経済的価値，貢献度，価格設定
- AIの組織への導入が進む中で，その経済的貢献を正確に評価する必要性が高まっている。
- 既存の評価手法は，AIの技術的性能に偏重し，経済的な貢献度を総合的に捉えられていない。
- AIの導入を経済学的な視点から評価し，公正な価格設定と説明責任を実現すること。
- 本研究は「エージェント経済学」というワークフローベースのフレームワークを提案し，人間とAIエージェントの価値を定量的に評価する。
- AI導入をチーム形成問題として捉え，Shapley値を用いてAIエージェントへの経済的貢献度を分配する手法を提示した。
- セキュリティ運用事例を通して，本フレームワークがAIと人間のハイブリッドワークフローにおける効果を定量的に示せることを示した。
Link: https://arxiv.org/abs/2606.14769
物理学から表現へ：手続き的生成による合成事前学習を用いた音声学習 [eess.AS, cs.LG, cs.SD]目的：手続き的生成による音声合成フレームワークを用いた，大規模な実データに依存しない事前学習手法
- マルチメディア解析において，音声表現の重要性は高まる一方である。
- 既存手法は大規模な音声データセットに依存し，コストやプライバシーの問題がある。
- 実データを用いずに，効率的かつ解釈可能な事前学習を可能にすること。
- 手続き的生成により，実音声を用いずに事前学習を完了できる。
- ESC-50で90.60%の精度，FSD50Kで0.546 mAP，UrbanSound8Kで88.17%の性能を達成した。
- 潜在空間の解析から，基本周波数や相対的な強度が直交する部分空間に出現することが明らかになった。
Link: https://arxiv.org/abs/2606.14791
スコア関数による事前分布の橋渡し：事後サンプリングのための比較レビューと実験的研究 [stat.ME, cs.LG, eess.IV, stat.ML]目的：ベイズ逆問題におけるデータ駆動型事前分布の統合
- ベイズ統計は不確実性の定量化に有用であり，様々な分野で応用が広がっている。
- データ駆動型事前分布は柔軟性がある一方，それぞれの実装が異なり，統一的な解析が困難である。
- スコア関数を通して事前分布を統一的に扱い，効率的な事後サンプリングを可能にすること。
- 多様なデータ駆動型事前分布が，スコア関数を通じて統一的に表現できることが示された。
- 提案手法は，画像修復や超解像といったタスクにおいて良好な性能を発揮した。
- このフレームワークは，スコア関数に基づく幅広い事前分布に適用可能であり，汎用性が高い。
Link: https://arxiv.org/abs/2606.14800
JetParticle-JEPA：高エネルギー物理におけるジェットタグ付けのための効率的な自己教師あり表現学習手法 [hep-ph, cs.AI, cs.LG]目的：ジェットタグ付けのための表現学習
- 高エネルギー物理実験では，ジェットタグ付けが重要な役割を担う。効率的な手法が求められている。
- 従来の深層学習モデルは，大量のシミュレーションデータに依存し，計算コストが高いという課題がある。
- シミュレーションデータへの依存度を低減し，よりロバストなジェットタグ付け手法を開発すること。
- JetParticle-JEPAは，粒子雲から直接物理的に意味のあるジェット表現を学習する。
- JetClassベンチマークにおいて，フルデータセットでの性能は最先端の教師あり手法に匹敵する。
- 少ないラベル環境下や，Top Quark，Quark-Gluonタグ付けベンチマークでも優れた性能を示す。
Link: https://arxiv.org/abs/2606.14813
再利用可能な材料オントロジーの多層アーキテクチャ ― OntoCrafter セラミックスオントロジー (OCO) を参照実装として [cond-mat.mtrl-sci, cs.AI, physics.app-ph, physics.chem-ph, physics.comp-ph]目的：材料科学および工学におけるオントロジーの多層アーキテクチャの提案
- 材料科学分野では，材料データの標準化と共有が不可欠であり，オントロジーはその基盤となる。
- 既存の材料オントロジーは互換性がなく，新規分野ごとに設計をやり直す状況が一般的である。
- 規制対応と材料のメカニズム解明を両立するオントロジーアーキテクチャを構築し，断片化を解消する。
- 本研究では，抽象レベルと対象ユーザーを軸とした多層モジュールアーキテクチャを提案した。
- セラミックスオントロジー(OCO)は，5,196クラス，167,348のOWL公理を含む大規模なオントロジーとして実装された。
- このアーキテクチャは水平方向の断片化を解消し，規制要件への対応と材料のメカニズム解明を可能にする。
Link: https://arxiv.org/abs/2606.14814
産業応用における量子機械学習 [physics.soc-ph, cond-mat.stat-mech, cs.MA, quant-ph, cs.AI]目的：産業応用を目的とした量子機械学習の理論的基盤
- 機械学習は産業界に大きな変革をもたらしているが，古典的な手法には限界がある。
- データ量の増大，計算コストの上昇，エネルギー消費，ハードウェアの物理的制約が課題。
- 量子コンピューティングの導入により，これらの課題を克服し，実用的な量子機械学習を目指す。
- 変分量子回路の学習可能性に関して，バーレンプラトーが存在しないという未解決の仮説を解決する理論的保証を確立した。
- 古典的な機械学習のルーチンを模倣しつつ，量子的な優位性を提供する部分空間保存型量子機械学習アルゴリズムを提案した。
- 変分量子回路を量子フーリエモデルとして分析し，表現力と学習可能性を同時に特徴付けるフレームワークを構築した。
Link: https://arxiv.org/abs/2606.14822
薬剤承認とヒト遺伝子証拠の関連性：26,278の標的-疾患ペアに対する時間的検証と特徴量除去を用いた観察分析 [q-bio.GN, cs.AI, cs.CL]目的：薬剤承認とのヒト遺伝子証拠の関連性
- 創薬において，遺伝子情報に基づいた標的分子の選択は，効率的な薬剤開発に不可欠である。
- 既存の創薬標的の選択基準では，遺伝子証拠の重要性が十分に考慮されていなかった。
- 遺伝子情報と薬剤承認の関連性を明らかにすることで，より合理的な創薬標的の選定に貢献する。
- 遺伝子との関連性を持つ標的分子は，そうでないものと比較して，3.25倍高い承認率を示した。
- 腫瘍領域における遺伝子との関連性は高く，標的分子レベルでの解析で2.71倍の承認率を確認した。
- 文献情報が主要な特徴量であり，他の証拠タイプも一定の予測能力を持つことが示された。
Link: https://arxiv.org/abs/2606.14823
DSAにおける血管グラフニューラルネットワークを用いた硬膜下側副血行路の検出 [eess.IV, cs.AI, cs.CV]目的：急性虚血性脳卒中における予後因子である硬膜下側副血行路の検出
- 急性虚血性脳卒中の予後予測において，側副血行路の評価は重要である。
- CTアンギオグラフィでは側副血行路が小さすぎて識別が難しく，評価が粗雑になりがちである。
- DSA画像から個々の側副血行路を客観的に，かつ定量的に評価する方法を確立する。
- 本研究では，DSA画像から構築した血管グラフの各セグメントを分類することで側副血行路の検出を試みた。
- グラフ構造と画素情報を組み合わせたハイブリッドモデルが，PR-AUC 0.434を達成し，既存手法を上回った。
- DSAにおける個々の側副血行路の定量的な評価を可能にし，客観的な評価への移行を促す。
Link: https://arxiv.org/abs/2606.14828
シミュレーションに基づく科学のための事前学習：ジェット基盤モデルの学習目的に関する研究 [hep-ph, cs.LG]目的：ジェット基盤モデルにおける事前学習手法の比較
- 科学分野におけるAI応用の進展に伴い，大規模データを用いた基盤モデルの重要性が高まっている。
- 科学シミュレーションデータは豊富だが，ラベル付きデータが不足している場合が多い。
- シミュレーションデータを活用した効果的な事前学習手法を確立し，汎用的な基盤モデルを構築すること。
- 分類タスクにおいては，十分なラベルとモデル容量がある場合，純粋な分類器による事前学習が最適である。
- ラベルが少ない環境下では，自己教師あり学習であるマスク化された粒子モデリングとの組み合わせが特に有効である。
- 生成タスクにおいては，フローマッチングに基づく事前学習が，ファインチューニングの利点を大きく向上させる。
Link: https://arxiv.org/abs/2606.14870