arXiv雑要約
AI - 2026/05/08 公開
平坦な最小値は幻想か? [cs.RO, cs.DC, math.OC, cs.LG, cs.AI]目的:学習済み関数の完成可能性の体積である「脆弱性」の評価
- ニューラルネットワークの汎化性能は,損失関数の形状に大きく依存することが知られている。
- 従来の汎化性能の指標である「平坦性」は,パラメータ表現に依存するため,本質的な原因の特定が困難であった。
- パラメータ表現に依存しない,汎化性能の真の要因を特定し,その理論的根拠を示す。
- 学習データ量を増加させるにつれて,大規模バッチ学習による汎化性能の向上は消失する傾向にある。
- MNISTおよびFashion-MNISTデータセットにおいて,「脆弱性」は汎化性能と正の相関関係を示すことが示された。
- 従来の「平坦性」や「単純性」といった指標は,汎化性能の予測において信頼性が低いことが明らかになった。
全国EHRベース慢性副鼻腔炎予測:人口統計学的層別モデルの利用 [cs.IR, cs.LG, q-bio.QM]目的:慢性副鼻腔炎の診断予測
- 慢性副鼻腔炎は罹患率が高く,医療費負担も大きい疾患であるため,早期発見が重要。
- 症状が他の疾患と類似しており,多様な病型が存在するため,早期の特定が困難である。
- 全国規模のEHRデータを用いて,より正確な予測モデルを構築し,早期トリアージを支援する。
- 全国EHRデータを用いた分析により,AUC値0.8461を達成し,既存モデルより識別能が向上した。
- 約11万の候補コードから100の解釈可能な特徴を抽出するハイブリッド特徴選択パイプラインを実装した。
- 性別・ライフステージによる層別モデルを構築し,人口統計学的異質性を考慮した。
オープンセットID不正検出のためのレイアウトを意識した表現学習 [cs.CV, cs.AI, cs.LG]目的:オープンセット不正検出におけるレイアウトを意識した表現の学習
- ID書類の不正検出は,セキュリティ上重要な課題であり,経済的損失や社会的な混乱を防ぐ必要がある。
- 従来の不正検出手法は,固定されたラベルに依存するため,巧妙化する攻撃者に対応できないという課題がある。
- 本研究は,分布の変化に対応し,新たな不正パターンを検出できる表現学習手法を開発することを目指す。
- DINOv3を文書ドメインに適合させ,コンテキストを考慮したSimMIMによるファインチューニングと,分離性とコンパクト性を促す複合損失を用いた教師あり距離学習を行った。
- カナダのIDレイアウトで99.83%のレイアウト分類精度を達成し,埋め込み空間分析により276件の適応的物理不正事例を検出した。
- 従来の検出器では検出されなかった222件の事例が含まれており,単一の確認済み事例から関連する事例を拡張できることが示された。
SAT:単調な性能向上を保証する協調器なしプラグ&プレイ多LLM学習のための逐次エージェントチューニング [cs.LG]目的:協調器なしの逐次エージェントチューニングによる多LLM学習手法
- 大規模LLMは高性能だが,導入コストが高い。小規模LLMチームが単一のLLMに匹敵する性能を示す可能性が示唆されている。
- 複数エージェントの同時更新は分布のシフトを引き起こし,学習の協調性と安定性を損なう。
- 逐次エージェントチューニングによって,学習の安定化とエージェントのプラグ&プレイ性を実現すること。
- 逐次エージェントチューニングは,ブロック座標更新を通じて分散学習を可能にし,中央コントローラーを必要としない。
- 理論的には,単調な性能向上を保証し,エージェントの性能向上がチーム全体に影響しないプラグ&プレイ性を証明している。
- 実験的に,3つの4Bエージェントチームが,Qwen3-32BをAIME24/25ベンチマークで平均3.9%上回った。
学習可能な損失バランスと転移学習を用いた物理情報ニューラルネットワーク [cs.LG, cs.AI]目的:データ不足下における科学的機械学習のための物理ベースとデータ駆動型 supervision の適応的バランス
- 科学技術の発展には,物理法則とデータ駆動型アプローチの融合が不可欠である。
- 従来のPINNでは,物理残差とデータ損失の重み付けが固定されており,性能が制限される場合がある。
- 物理モデルとデータ駆動型学習を適応的に組み合わせ,データ不足下での予測精度向上を目指す。
- 提案手法では,損失の重みを学習可能なニューロンで動的に調整することで,安定した学習と汎化性能の向上を実現した。
- 関連ドメインからの表現を再利用する転移学習を組み込むことで,少ないデータでの効率的な学習を可能にした。
- 液体金属微小ヒートシンクの熱伝達予測において,87個のCFDデータポイントのみで8%以下の誤差を達成し,他の手法を上回った。
カオス的予測におけるホライズン制約付きラショモン集合 [cs.LG, cs.AI, math.DS, nlin.CD]目的:カオスシステムにおける予測ホライズンに伴うモデルの多重性を特徴付ける理論的枠組み
- 予測の多様性とカオス的ダイナミクスは,機械学習における重要な課題である
- 静的予測とは異なり,カオスは初期状態が類似するモデル間の指数的な発散を引き起こす
- 予測の不確実性を考慮した意思決定の質向上を目指す
- ホライズン制約付きラショモン集合は,予測ホライズンに伴うモデル多重性の進化を特徴付ける。
- 最大リアプノフ指数によって決定される収縮率で,有効ラショモン集合は指数的に縮小する。
- 意思決定に基づいた選択アルゴリズムは,予測精度だけでなく,下流の有用性に基づいてモデルを選択し,意思決定の質を18-34%向上させる。
ハイブリッドおよび再帰型LLM提供のための疎プレフィックスキャッシュ [cs.LG, cs.AI]目的:自己回帰型LLM提供におけるレイテンシ最適化手法
- LLMの応答速度向上は,実用的な大規模言語モデルの普及に不可欠である。
- 既存のプレフィックスキャッシュは,トークン単位での完全な再利用を前提としている。
- 再帰型モデルにおける状態の疎なチェックポイント配置による効率的なキャッシュ手法の確立。
- 提案手法は,重なり深さの分布に基づいたチェックポイント配置の最適化問題を定式化し,効率的な動的計画法を開発した。
- 実世界データを用いた評価により,提案手法が既存のヒューリスティクスと比較して,より優れた性能を示すことが確認された。
- 特にチェックポイント予算が低い場合に,効果的な改善が見られ,非一様分布を持つ場合に最適であることが示された。
MidSteer:生成モデルの操舵のための最適アフィンフレームワーク [cs.LG, cs.AI]目的:生成モデルの操舵に関する理論的枠組みの構築
- 生成モデルの制御は,特に展開後の調整や安全性確保において重要性が増している。
- 既存のアプローチは経験的な成功は見られるものの,包括的な理論的根拠に乏しい。
- 概念の操舵における最適アフィン解を導き,より汎用的なアフィンフレームワークを提案する。
- 本研究では,操舵とアフィン概念消去の関連性を示し,既存手法が特殊なケースであることを証明した。
- 最適なアフィン解を提供する条件のもとで概念の切り替えフレームワークLEACE-Switchを定式化した。
- MidSteerは,これらの前提条件を緩和し,指向性のある最小限の擾乱による変換を可能にする。
データ駆動型変分基底学習:ニューラルネットワークを超えた適応的基底発見のための非ニューラルフレームワーク [cs.LG, cs.CL]目的:データから直接基底関数を学習すること
- 高次元データの構造解析において,解釈性と制御性が重要視されている
- 既存の基底表現はデータに適応性が低く,ニューラルネットワークは解釈性が課題
- データに適応し,かつ解釈可能な基底表現を構築すること
- 提案手法は,基底関数を最適化変数として直接学習する変分基底学習(DVBL)フレームワークである。
- DVBLは,明示的で解釈可能なデータ適応型基底表現を実現し,厳密な解析を可能にする。
- 古典的な辞書学習,スペクトル法,Koopman演算子法,深層表現学習との概念的な違いを明確にした。
Transformerにおける学習済みトークンルーティングを通じた適応的計算深さ [cs.LG, cs.AI]目的:Transformerにおけるトークンごとの計算深さの適応的な制御
- Transformerは自然言語処理の基盤であり,その効率化は重要な課題である。
- Transformerは全てのトークンに対して同じ層数を通すため,計算資源の無駄が生じることがある。
- トークンごとの難易度に応じて計算深さを調整することで,効率的な処理を目指す。
- 提案手法TSAは,Transformerブロック間の残差更新に学習済みゲートを導入する。
- TSAは,明示的な深さ圧力を与えなくても,難易度に応じたルーティングを学習できる。
- 実験結果から,Tiny-Shakespeareとenwik8において,14-23%のトークン層演算を削減しつつ,品質劣化を0.5%未満に抑えることができた。
特徴組成の構造的不安定性 [cs.LG, cs.AI]目的:特徴組成における不安定性の解析
- Transformerの性能向上には,潜在表現の制御が不可欠であり,そのための技術開発が重要である。
- 既存の線形表現仮説では,過完備辞書における非線形干渉の影響が十分に考慮されていない。
- 特徴の結合に伴う不安定性の閾値を導き,干渉の増大メカニズムを解明することを目指す。
- 活性化空間を疎な円錐多様体としてモデル化し,辞書モデル下での組成的崩壊閾値を導出した。
- ReLU整流は,微小な相関誘起分散変動を蓄積的なドリフトに変換し,干渉の増大を引き起こすことが示された。
- CLEVRデータセットを用いた実験により,階層的な相関が不安定化を加速させることが確認された。
チャネルレベルのセマンティック摂動:多様な学習パラダイムに対する学習不能な事例 [cs.LG, cs.AI, cs.CR]目的:モデル学習における個人データの不正利用に対するプライバシー保護
- 機械学習モデルの普及に伴い,学習データに含まれる個人情報の保護が重要になっている。
- 既存の学習不能な事例(UEs)は,事前学習-ファインチューニング(PF)パラダイム下では効果が低い。
- 事前学習済み重みを活用する環境下でも,データの学習不能性を維持すること。
- 既存のUEs手法は,事前学習済みの重みを読み込み固定することで効果が著しく低下することが判明した。
- この現象は,UEsがモデルに非セマンティックなノイズへの過学習を誘導する一方,事前学習済み層がセマンティック情報を保持しノイズを抑制するためと考えられる。
- 提案手法であるShallow Semantic Camouflage(SSC)は,セマンティックに有効な空間に生成を限定し,事前学習による抑制を回避することで,PFパラダイム下でもデータの学習不能性を維持する。
MACS:効率的な多Modal MoE推論のためのモダリティ認識キャパシティスケーリング [cs.LG, cs.AI]目的:MoE MLLMにおけるExpert Parallelism推論の効率化
- 近年,大規模な多Modal言語モデルの利用が拡大しており,効率的な推論手法が求められている。
- Expert Parallelism推論において,一部Expertの処理遅延が全体のボトルネックとなる「straggler effect」が課題である。
- 多Modalデータにおける情報量やモダリティ比の変動に対応し,リソース配分を最適化することを目的とする。
- MACSは,視覚トークンのセマンティックな価値を考慮したEntropy-Weighted Loadメカニズムを導入し,情報ヘテロジェニティに対処する。
- Dynamic Modality-Adaptive Capacityメカニズムにより,入力のリアルタイムなモダリティ構成に基づいたExpertリソースの割り当てを実現する。
- 様々な多Modalベンチマークにおいて,既存手法を大きく上回り,MoE MLLMの効率的なデプロイメントに貢献する。
推論のための強化学習における結果監督の過程監督への内包化:新たなパラダイム [cs.LG, cs.AI, cs.CL]目的:推論のための強化学習における過程レベルの学習信号の抽出と活用
- 推論を行う強化学習は,複雑な問題を解決する上で重要であり,AIの高度化に不可欠である。
- 強化学習では,結果に対する評価が遅延し,どの過程が成功に貢献したかの特定が困難である。
- 結果監督のみから過程レベルの学習信号を自動的に抽出し,より詳細な方策最適化を実現することを目指す。
- 本研究では,結果監督を過程監督として内包化する新たな手法を提案し,失敗した推論軌跡の特定,修正,再利用を通じて学習信号を抽出する。
- モデルは強化学習中に自ら過程監督を生成・改良し続けることで,外部からの過程監督に依存しない,きめ細やかな信用割り当てを可能にする。
- 実験結果から,提案手法が結果監督のみでも効果的な過程レベルの学習を促進し,推論性能の向上に寄与することが示された。
LLM学習におけるデータキュレーションの再考:オンライン再重み付けはオフライン手法よりも優れた汎化性能を提供する [cs.LG, cs.AI]目的:大規模言語モデル学習におけるデータキュレーションの最適化
- 大規模言語モデルの性能は,学習データの質に大きく依存するため,データキュレーションの重要性が増している。
- 従来のデータキュレーションはオフラインで行われるため,モデルやタスクの変化に追従できず,柔軟性に欠ける。
- 学習中に動的にデータ重要度を調整することで,柔軟性と汎化性能の両立を目指す。
- 提案手法ADAPTは,学習データのサンプル重要度を損失重み付けによって動的に調整するオンラインフレームワークである。
- ADAPTは,データの数を変更することなく,類似度に基づく品質信号によってサンプルごとの学習率を適応的に再重み付けする。
- 実験の結果,ADAPTはオフライン手法や既存のオンライン手法と比較して,より高い汎化性能を示すことが確認された。
量子化畳み込みベース深層学習モデルの進化的な微調整 [cs.LG, cs.AI, cs.NE]目的:量子化深層学習モデルの精度向上
- 深層学習は多くの機械学習タスクで高い性能を示すが,計算資源の制約がある環境での利用が課題。
- 既存の量子化手法は,近傍量化に基づいているため,必ずしも最適な精度が得られない場合がある。
- 進化戦略を用いて量子化されたモデルの精度を改善し,性能向上を目指す。
- 提案手法は,VGGやResNetといった画像分類・検出モデルにおいて,精度向上効果が確認された。
- また,オートエンコーダアーキテクチャにおいてもシミュレーションにより有効性が示された。
- 適切な演算子とパラメータ設定により,量子化モデルの精度を迅速に改善できることが示された。
トポロジー駆動によるソフトロボットの絡み防止制御 [cs.CE, cs.CE, math.OC, cs.RO, cs.AI]目的:ソフトロボットの絡み防止制御に関する研究
- 複雑な環境下での精密製造において,ソフトロボットの重要性が高まっている。
- 高密度な障害物や不安定な環境下では,分散型学習フレームワークの観測性に課題があり,学習結果が不良となる。
- 複雑な相互作用による学習の不安定性を解消し,絡みリスクを軽減すること。
- 本研究では,トポロジー駆動型マルチエージェント強化学習(TD-MARL)フレームワークを提案し,複数ロボットシステムの連携による絡み防止を実現した。
- 集中学習により,各ロボットが他者の戦略を認識し,通信資源を削減することでシステムの信頼性を向上させた。
- トポロジー不変量を用いたセキュリティ層により,絡みリスクを正確に評価・軽減し,局所最適解への陥入を防いだ。
類似度を考慮した注意グラフニューラルネットワークによる動的グラフを用いた推薦システム [cs.IR, cs.LG, cs.SI]目的:推薦システムの性能向上
- 現代のオンラインプラットフォームにおいて,パーソナライズされたコンテンツ提供は不可欠であり,推薦システムはその中核を担う。
- 従来の協調フィルタリングは静的なグラフと限定的な類似度指標に依存し,ユーザーの好みの変化を捉えきれない。
- 動的なグラフ構造と多種多様な類似度情報を活用し,推薦精度を向上させることを目指す。
- 提案手法DG-SA-GNNは,動的なユーザー類似度グラフの構築,多種多様な類似度伝播,および注意機構に基づく集約を統合している。
- MovieLens100Kデータセットでの実験により,DG-SA-GNNはRecall@20で0.162,NDCG@20で0.065を達成し,LightGCNのベースラインよりも高い性能を示した。
- これらの結果は,動的な多類似度グラフ構築と注意機構に基づく融合が推薦性能を向上させることを検証した。
DexSim2Real:汎用的な器用な操作のための基盤モデル誘導シミュレーションから現実世界への転移 [cs.RO, cs.LG]目的:器用な操作におけるシミュレーションから現実世界への転移
- ロボットの器用な操作は,自動化や多様なタスク遂行に不可欠であり,その実現には現実世界での応用が重要である。
- シミュレーション環境で学習した操作ポリシーを現実世界に適用する際,環境の違いによる性能劣化が課題となっている。
- 視覚言語基盤モデルを活用し,シミュレーション環境を最適化することで,現実世界での操作成功率向上を目指す。
- 提案手法DexSim2Realは,6つの操作タスクにおいて78.2%という高い現実世界での成功率を達成した。
- 既存手法であるDrEurekaやDeXtremeと比較して,性能が向上し,シミュレーションと現実世界の性能差を縮小した。
- 視覚言語基盤モデルによるドメインランダム化,触覚と視覚のクロスアテンションポリシー,およびプログレッシブスキルカリキュラムが,その性能に貢献している。
意味的類似性を超えて:直接コーパス相互作用によるエージェント型検索の再考 [cs.IR, cs.AI]目的:エージェント型検索のための直接コーパス相互作用の有効性
- 情報検索は,知識獲得や問題解決において不可欠な技術であり,その重要性は増している。
- 従来の検索システムは,コーパスへのアクセスが制限されており,複雑な検索要件に対応しにくい。
- エージェントが直接コーパスと相互作用することで,より柔軟で強力な検索を実現することを目指す。
- 直接コーパス相互作用(DCI)は,既存のスパース,デンズ,ランキングベースラインを大幅に上回る性能を示した。
- BRIGHTやBEIRデータセット,BrowseComp-Plus,マルチホップQAにおいて高い精度を達成し,従来の検索システムに依存しない。
- 言語エージェントの能力向上に伴い,検索品質は推論能力だけでなく,コーパスとのインタラクションの解像度にも依存する。
事実的確信度予測を用いた信頼性の高い検索拡張生成 [cs.IR, cs.AI]目的:検索拡張生成における事実の忠実性予測
- 大規模言語モデルの性能向上には,外部知識の活用が不可欠であり,検索拡張生成はその主要な手法である。
- 検索された情報が必ずしも正確ではなく,誤った情報に基づいて生成される可能性がある。
- 検索された情報の事実性を評価し,生成される回答の信頼性を高めることを目指す。
- 適合的予測を用いて,信頼性の高い情報源からのチャンクを選択することで,回答の品質を最大6%改善する。
- 注意機構に基づく事実性分類器を用いて,生成された回答と検索された文脈の一貫性を評価し,最大77%の確率で不整合を検出する。
- 本研究は,幅広い自然言語処理アプリケーションにおける,信頼性の高い検索拡張生成システムの構築に貢献する。
知能システムのための制御付きメタプログラミング:eval を制御された効果として再分類 [cs.PL, cs.AI]目的:知能システムにおける実行構造の動的合成
- AIの進化に伴い,実行時のプログラム合成が不可欠となり,安全性と信頼性が重要視されている。
- 従来の言語ではevalが制限なく実行され,権限の増幅を引き起こすリスクがある。
- evalを制御された効果として再分類し,プログラム実行の安全性を確保すること。
- 制御付きメタプログラミングにより,プログラム表現の操作を純粋な計算とし,実行への移行を制御可能とした。
- 提案システムはプログラムの能力要件,ポリシー遵守,リソース見積もりを分析し,実行を許可するかどうかを決定する。
- 形式的な証明により,形式操作の純粋性,迂回防止定理,境界保存が保証された。
会話型推薦システム評価のための意思決定を意識したユーザシミュレーションエージェント [cs.IR, cs.IR, cs.AI]目的:会話型推薦システムにおける自動評価のためのユーザシミュレータ
- 推薦システムの性能評価には,人間とのインタラクションを再現するユーザシミュレーションが不可欠である。
- 既存のシミュレータは人間の意思決定プロセスを明示的にモデル化せず,過剰な情報処理能力を持つ場合がある。
- 選択肢の多さによる意思決定への影響を考慮し,より現実的なユーザ行動を再現することを目指す。
- 提案手法Hesitatorは,選択肢の多さが人間の意思決定に与える影響をモデル化することで,過剰な推奨の受容率を抑制する。
- 複数のシミュレーションフレームワーク,ドメイン,販売モード,LLMバックボーンにおいて,Hesitatorの統合が効果を実証した。
- Hesitatorは心理経済学における確立された行動パターンを再現し,人間の意思決定行動のモデル化能力を示す。
スケーラブルな検索のための識別子不要なコード埋め込みモデル [cs.CR, cs.LG, cs.SE]目的:バイナリリバースエンジニアリングにおける関数関連付け
- ソフトウェアセキュリティにおいて,コードの挙動理解は不可欠であるため,効率的な関数関連付けが重要視される。
- 既存の検索ツールはAIの能力を十分に活用できておらず,ソースコードとデコンパイルコード間の双方向関連付けが困難である。
- ソースコードとデコンパイルコード間の双方向関連付けを可能にし,関数関連付けの性能向上を目指す。
- Qwen3-Embeddingモデルをコントラスト学習でファインチューニングすることで,関数関連付けにおいて既存モデルを大幅に上回る性能を達成した。
- 本モデルは,明示的に学習していない定数アルゴリズム関連付けタスクに対しても高い汎化能力を示すことが確認された。
- この研究は,AIを活用したリバースエンジニアリングの効率化に貢献する可能性を示すものである。
AIベース文書知能による人口規模の監査保証の自動化 [cs.SE, cs.AI]目的:AIベース文書知能を用いた大規模監査取引テストの自動化フレームワーク
- 顧客対応明細書の正確性確認は,企業の信頼性維持に不可欠である。
- 従来のPDF明細書の目視確認は,時間と労力がかかり,大規模取引には適さない。
- 本研究は,PDF明細書からのデータ抽出を自動化し,監査範囲を拡大することを目指す。
- Snowflake Document AIを活用し,少量のアノテーションデータでPDF明細書から構造化データを抽出することに成功した。
- 抽出されたデータと真実のデータソースを照合することで,大規模な取引における差異を特定できるようになった。
- インタラクティブなダッシュボードと自動レポートにより,リスクのリアルタイムな特定と継続的保証が可能となった。
履歴書ソース多様化による職務適性対応:出自追跡型生成による事例研究 [cs.IR, cs.IR, cs.AI, cs.CL]目的:職務適性に対応した履歴書調整
- 就職活動において,応募書類の質が選考に大きな影響を与えるため,効果的な履歴書作成支援が重要である。
- 既存の履歴書調整システムは,単一の履歴書に基づいており,過去の職務経験の活用や提案の妥当性検証が困難である。
- 本研究では,過去の職務記録を活用し,より的確な履歴書調整を可能にすることを目指す。
- 履歴書調整システム「Resume Tailor」を開発し,過去の職務履歴をベクトルデータベースに保存,多角的な情報検索によって職務内容に適合した履歴書を生成した。
- ソフトウェアエンジニア,データアナリスト,ビジネスアナリストの職種を対象としたパイロット評価では,関連する職務経験がある場合,ATS適合スコアが平均7.8ポイント向上した。
- 一方,過去の職務経験と関連性の低い職種では,スコアが平均8.0ポイント低下しており,検索精度の重要性が示唆された。
展開形バンディット問題における差分プライバシー [cs.CR, cs.LG]目的:展開形バンディット問題における差分プライバシーの実現
- 機械学習の利用拡大に伴い,プライバシー保護の重要性が増している。
- バンディット問題におけるプライバシー保護は未検討であり,課題である。
- 展開形バンディット問題において,プライバシーを保護しつつ効率的な学習を目指す。
- 提案アルゴリズムは,ε-局所差分プライバシーを満たし,$\tilde{O}(\sqrt{A\ln(S)T}/\epsilon)$のレグレットを達成する。
- アルゴリズムの計算量は,情報集合における最大行動数に応じて対数的に増加するが,サーバからユーザへの戦略伝送時間と同程度である。
- 局所差分プライバシーは差分プライバシーの最も強い形式であり,展開形バンディット問題への適用は初である。
世代と学習の架け橋:コード生成におけるLLMの品質問題に関する体系的レビュー [cs.SE, cs.AI]目的:コード生成用LLMの品質問題と学習データ品質問題の関連性
- コード生成AIの発展は,ソフトウェア開発の自動化を促進し,生産性向上に貢献する。
- 生成されたコードに潜在的なバグやセキュリティ脆弱性が含まれる可能性があり,信頼性が課題となる。
- 学習データ品質がコード生成品質に与える影響を明らかにし,信頼性の高いLLM開発を目指す。
- 本レビューでは,114の主要研究を分析し,生成コードの品質問題と学習データ品質問題の分類体系を確立した。
- 学習データにおける品質問題からコード生成時の品質問題への18種類の典型的な伝播メカニズムを特定した。
- データ,モデル,生成の各ライフサイクルにおける検出・緩和技術の動向を整理し,データ中心型品質保証への移行を示唆した。
エコーチェンバーの破壊:ピアレビューのAIによる乗っ取りに対する原稿に隠された安全策 [cs.CR, cs.AI]目的:AIによるピアレビューのアウトソーシング検出と防御
- 科学研究の質を保証する上で,ピアレビューの信頼性は不可欠である。
- LLMの進化により,ピアレビューがAIに委託されるリスクが高まっている。
- AIによるピアレビューのアウトソーシングを検出し,質の低いレビューを排除すること。
- 提案手法IntraGuardは,PDF構造を利用し,AIによるレビューを妨害する隠れた指示を埋め込む。
- 7つの商用チャットボットと12の学術誌を対象とした評価で,最高84%の防御成功率を示した。
- IntraGuardは軽量であり,通常のPCで原稿1件あたり平均1秒程度のオーバーヘッドで動作する。
有限エキスパートバンクによる通信効率的なMoEの専門家ルーティング [cs.LG, cs.IT, math.IT]目的:通信効率的なMoEにおける専門家ルーティングの最適化
- 機械学習において,計算資源の効率的な活用が重要であり,MoEはその有効な手段となる。
- MoEのゲート機構は学習とルーティングを担うが,そのルーティング情報の定量化が課題であった。
- 有限エキスパートバンクを用いてルーティング情報を解析し,効率的な専門家ルーティングの設計指針を提供する。
- 提案手法により,ルーティング情報と汎化性能のギャップが相関することを確認した。
- Xu-Raginsky boundの緩さや,一様和の限界との比較も行われた。
- 本フレームワークは,リソースを考慮したMoE推論システムの分析ツールとして利用可能である。
自動車産業におけるグリーンスキル需要予測:オンライン求人情報からの証拠 [cs.LG]目的:自動車産業におけるグリーンスキル需要の測定と予測
- 持続可能な経済への移行は労働市場を変化させているため,グリーンスキル需要の把握は重要である。
- グリーンスキルを特定・予測するための体系的な手法が不足している。
- グリーンスキル需要を予測するための計算フレームワークを構築し,データに基づいた労働力計画を支援する。
- オンライン求人情報を用いて,メキシコの自動車産業における274種類のグリーンスキルを特定した。
- Transformerベースの時系列予測モデル(FEDformer, Reformer, Informer)が最も高い予測精度を示した。
- 現在の需要はオペレーションの持続可能性に集中しているが,急速に成長しているスキルは再生可能エネルギー,リサイクル,水素技術に関連するものである。
ダーウィンの直接的な影響:進化の第一原理からの高度な最適化手法の導出 [cs.NE, cs.LG, q-bio.PE, q-bio.QM]目的:進化の第一原理に基づく高度な勾配ベースの最適化手法の導出
- 最適化は,機械学習を含む様々な分野で不可欠であり,効率的なアルゴリズム開発が求められている。
- 既存の最適化アルゴリズムは,進化の原理からの逸脱や,表面的な生物学的比喩に依存している場合がある。
- 進化の原理に忠実な最適化アルゴリズムを開発し,進化のシミュレーションとしての妥当性を示す。
- ダーウィンの系譜シミュレーション(DLS)を用いて,フィッシャーとライトの進化観が形式的に同等であることを証明した。
- 確率的勾配降下法,自然勾配降下法,制動ニュートン法など,既存の最適化アルゴリズムが進化ダイナミクスと互換性があることを示した。
- 最先端のAdamオプティマイザーでさえ,DLSノイズを加えることで進化に適合させることが可能であることを示した。
大規模言語モデルに対する帰属誘導型継続学習 [cs.LG]目的:大規模言語モデルにおける継続学習時の忘却軽減
- 自然言語処理の発展に伴い,大規模言語モデルの活用が不可欠となっている。
- 大規模言語モデルは,逐次的なタスク学習において,以前のタスクを忘れてしまう。
- モデルの重要なパラメータを保護し,更新頻度を調整することで忘却を抑制する。
- 提案手法では,Transformer層ごとのパラメータ重要度をタスクごとに推定し,勾配を調整する。
- 以前のタスクに重要なパラメータは更新を抑制し,重要でないパラメータは新しいタスクに適応させる。
- 継続学習のベンチマークにおいて,既存手法と比較して高い性能を達成した。
エージェントの保護:ベンダー中立型,マルチテナント企業向け検索とツール利用 [cs.CR, cs.AI, cs.IR, cs.SE]目的:企業における検索拡張生成(RAG)とエージェントAIシステムのセキュリティ確保
- 企業AIの導入が進む中,データ保護とアクセス制御の重要性が増している。
- 既存のRAGアーキテクチャでは,権限確認を怠り,テナント間のデータ漏洩リスクがある。
- マルチテナント環境におけるデータセキュリティを確保し,情報漏洩を防ぐことを目指す。
- 提案アーキテクチャは,ポリシーを意識したインジェスト,検索時のゲート処理,共有推論を組み合わせることで,層状の分離を実現する。
- セキュリティに関わる重要な操作をサーバー側に集中させることで,マルチテナント分離の自然な強制ポイントを設ける。
- OGXによる実装と実験により,ABACゲートがテナント間のデータ漏洩をなくし,オーバーヘッドがごくわずかであることが確認された。
解釈可能性によるアノテーターの安全性ポリシーの理解 [cs.AI, cs.LG]目的:アノテーターの安全性ポリシーの解明
- AIの安全性確保は重要であり,そのためにはアノテーターによる正確なデータラベリングが不可欠である。
- アノテーション結果の不一致が頻発しており,その原因特定が困難である。
- アノテーターの判断根拠を明確化し,安全性ポリシーの改善に貢献すること。
- アノテーターの内部安全性ポリシーを,ラベリング行動のみから学習する解釈可能なモデル(APM)を提案した。
- APMは,アノテーターの安全性ポリシーを高精度(80%以上)でモデル化し,反事実的な編集に対する応答を予測できることを実証した。
- APMを用いて,安全性指示の解釈の相違や,人口統計学的グループ間での安全性優先度の体系的な違いを明らかにすることができた。
グラフ正規化:微分可能なMWISのための高速二値化ダイナミクス [cs.LG, cs.AI, cs.DM, cs.NE]目的:最大重み独立集合問題に対する微分可能な近似手法の開発
- 組合せ最適化問題は,AI分野における重要な課題であり,様々な応用が存在する。
- 既存手法では,NP困難な問題に対する効率的な微分可能な近似が困難である。
- グラフ構造を持つ問題に対して,高速かつ正確な二値化ダイナミクスを確立すること。
- グラフ正規化(GN)は,最大独立集合問題の微分可能な近似エンジンとして機能する。
- GNは,準ニュートン降下法を高速に実現し,MWISの緩和された目的関数を系統的に改善する。
- 実世界のベンチマークにおいて,GNは最良の結果の1%以内の解をCPU上で数秒で特定した。
ViTok-v2:50億パラメータへのネイティブ解像度オートエンコーダの拡張 [cs.CV, cs.AI, cs.LG]目的:画像に対するViTオートエンコーダの性能向上
- 画像認識の性能向上に,より良い画像トークナイザーが不可欠である。
- 既存のViTトークナイザーは,訓練解像度外で性能が低下し,スケールアップが困難である。
- 解像度とアスペクト比への対応と,安定した大規模訓練を実現する。
- ViTok-v2は,NaFlexにより様々な解像度に対応し,DINOv3損失関数で安定した訓練を可能にした。
- 約20億枚の画像で訓練し,50億パラメータという最大規模の画像オートエンコーダを実現した。
- 256pで最先端の再構成性能を維持し,512p以上では既存のモデルを上回る性能を示した。
物理世界におけるVLMのプライバシー意識:実証研究 [cs.RO, cs.RO, math.OC, cs.CR, cs.AI]目的:物理環境におけるVLMのプライバシー意識の評価
- VLMは,身体を持つアシスタントの認知コアとして活用が広がる中で,プライバシー保護が重要となる。
- 既存の評価基準はテキストベースに限られ,現実世界の複雑な状況に対応できない。
- 現実的な物理環境を再現し,VLMのプライバシー意識を多角的に評価すること。
- 12種類の最先端モデルの評価により,複雑なシーンでは性能が低下し,状況の変化への対応も不十分であることが示された。
- 最も優れたgemini-3.1-proでさえ,タスク遂行とプライバシー保護のバランスが取れるのは51%のケースのみであった。
- 現在のVLMは,知覚的な脆弱性を抱え,プライバシーに関する知識が行動に反映されていないことが明らかになった。
スパースオートエンコーダにおける特徴消失と幾何学的不安定性 [cs.LG, cs.AI, math.OC, stat.ML]目的:大規模言語モデルの内部表現を解釈可能な概念に分解する手法の改善
- 大規模言語モデルの解釈性は,その能力を理解し,制御するために不可欠である。
- 従来のスパースオートエンコーダは,特徴消失や縮小バイアスに悩まされ,性能を阻害する。
- 幾何学的な不安定性を解消し,特徴消失を抑制する新しいアーキテクチャを提案する。
- 適応的弾性ネットスパースオートエンコーダ(AEN-SAE)は,微分可能な構造を持ち,従来の課題を克服する。
- AEN-SAEは,$\ell_2$正則化と適応的$\ell_1$重み付けを組み合わせることで,安定したスパースコーディングマップを実現する。
- 実験的に,AEN-SAEは,補助的なヒューリスティックなしに特徴消失を軽減し,競争力のある再構成能力を維持することが示された。
Open-SAT:LLMによるクエリ埋め込みの改良と衛星画像におけるオープンボキャブラリ物体検索 [cs.CV, cs.AI, cs.IR]目的:衛星画像におけるオープンボキャブラリ物体検索の精度向上
- 衛星画像解析は,地球規模の課題解決に不可欠であり,多様な応用分野で活用が期待されている。
- 既存の検索システムは,固定されたカテゴリに依存するため,多様な自然言語クエリに対応できないという課題がある。
- LLMを活用し,クエリ埋め込みを改良することで,未知の物体や概念に対する検索精度を向上させる。
- Open-SATは,追加の学習や教師データなしで,クエリ埋め込みを改良する推論時のアルゴリズムである。
- 実験の結果,Open-SATは3つの公開ベンチマークにおいて,F1スコアを最大16.04%向上させた。
- Open-SATは,LLMのガイダンスを活用することで,衛星画像検索の有効性を示すことができた。
AIドラフトの活用:音声解説における品質の閾値 [cs.HC, cs.AI]目的:音声解説の作業におけるAIドラフトの品質が編集プロセスに与える影響の解明
- 視覚障碍者向けに映像の視覚要素を説明する音声解説は,情報へのアクセスを可能にする重要な技術である。
- 初心者にとって,高品質な音声解説を作成するには時間と労力がかかるという課題がある。
- AIドラフトの品質が一定水準を超えることで,効率的な編集と認知負荷の軽減を目指す。
- AIドラフトを利用することで,音声解説の作成時間を半分以上に短縮し,認知負荷を大幅に軽減できることが示された。
- 単純なプロンプトで生成されたAIドラフトでは効果が限定的であったことから,AIドラフトには品質の閾値が存在することが示唆された。
- 視覚的な複雑さが増すほど,AIドラフトに求められる品質も高まるため,コンテンツに応じて適切な品質を設定する必要がある。
AIと人間による評価から見る批判的思考における反論の意義 [cs.CL, cs.AI]目的:学生の批判的思考力を育成するための反論の活用
- 現代社会において,複雑な問題解決には批判的思考が不可欠である。
- 生成AIの普及により,学生の思考力低下やカンニングのリスクが懸念される。
- 生成AI時代における批判的思考力の評価方法を確立することが求められる。
- 学生が作成した反論には,批判的思考の重要な要素である論理性が含まれていた。
- 明確な評価基準を用いることで,生成AIは学生の記述を大規模に評価できる。
- 生成AIによる評価は,人間の評価と一定の相関関係が認められた(AC2=0.33)。
データセンターにおけるSLA遵守監視のためのマルチヘッドアテンションアプローチ [cs.LG]目的:データセンターにおけるSLA遵守監視のフレームワーク
- データセンターの稼働において,SLAはサービスの質を保証する上で不可欠である。
- 従来の監視方法は事後対応であり,SLA違反による損失を未然に防ぐことが困難である。
- SLA違反を予測し,事前に対策を講じることで,金銭的損失を最小限に抑える。
- 本研究では,SLAルールを構造化JSONオブジェクトとして表現し,手動アノテーションなしで学習データを作成する。
- 顧客ごとのマルチヘッドTransformerモデルを学習させ,各アテンションヘッドがSLAルールに特化することで,違反の30分前に時間的依存性を学習する。
- モデルアーキテクチャを契約上の義務に直接対応させることで,SLA違反の予測,是正措置の優先順位付け,および金銭的ペナルティの最小化を可能にする。
逐次学習型早期終了ニューラルネットワークにおける安定性と可塑性のバランス [cs.LG, cs.CV]目的:逐次学習型早期終了ニューラルネットワークにおける性能維持と向上のための手法
- 計算資源の効率的な利用が求められる中,ニューラルネットワークの推論コスト削減が重要である。
- 逐次学習では,新たな出口の追加が既存の出口の性能を損なう干渉が課題となる。
- 既存の知識を保持しつつ,新たな出口の学習を可能にする手法を確立すること。
- 提案手法は,既存の出口の学習済みパラメータを保護し,学習の安定性を高める。
- また,早期終了の出力分布を維持することで,以前の出口の性能を保持する。
- 実験結果から,提案手法は既存手法と比較して精度と計算効率の両面で優れていることが示された。
グラフニューラルネットワークの所有権検証:COPYCOP [cs.LG, cs.AI]目的:グラフニューラルネットワークの模倣検出
- 近年,グラフニューラルネットワークの応用が拡大しており,その知的財産保護が重要となっている。
- モデルの盗用や模倣が横行しており,開発者の権利を守るための技術が求められている。
- 既存手法では検出が困難な,巧妙な模倣ネットワークの特定を目指す。
- 提案手法COPYCOPは,アーキテクチャや次元が異なるネットワーク間でも,模倣関係を高い精度で識別できる。
- COPYCOPは,既存の水印やフィンガープリンティング手法よりも堅牢であり,多様な攻撃に対抗可能である。
- 理論的な保証と実験結果から,COPYCOPの有効性が確認された。
ZAYA1-8B技術報告 [cs.AI, cs.CL]目的:推論に焦点を当てた混合エキスパート(MoE)モデルZAYA1-8Bの開発
- 大規模言語モデルは,多様なタスクで高い性能を示すため,急速に発展している。
- 既存の高性能モデルはパラメータ数が多く,計算資源を大量に消費する。
- 限られたパラメータ数で高性能な推論モデルを開発し,計算効率を向上させる。
- ZAYA1-8Bは,10億以下の有効パラメータ数で,複数の数学およびコーディングベンチマークにおいてDeepSeek-R1-0528と同等以上の性能を達成した。
- 推論データを含んだゼロからの学習と,4段階の強化学習カスケードによって,高度な推論能力を獲得した。
- テスト時の計算手法Markovian RSAを用いることで,AIME'25とHMMT'25においてそれぞれ91.9%と89.6%という高い正答率を記録し,より大規模なモデルとの性能差を縮小した。
タマットゥル3D:単眼ビデオからの高忠実度3Dサウジアラビア手話アバター [cs.CV, cs.AI]目的:サウジアラビア手話の高品質3Dパラメトリックアノテーションとアバター生成のための特殊な再構成手法
- アラビア語話者4億人以上が手話を使用しており,その文化継承とコミュニケーション支援が重要である。
- アラビア手話とその方言は高品質な3Dアノテーションやアバター生成手法が不足している。
- サウジアラビア手話に特化した高精度なアバター再構成フレームワークの確立を目指す。
- Ishara-500サウジアラビア手話データセットに対して高品質な3Dパラメトリックアノテーションを新たに作成した。
- 手話特有の関節パターンに適応した再構成パイプラインTamaththul3Dを開発し,既存手法を上回る精度を実現した。
- このフレームワークは,アラビア語圏の聴覚障碍者のためのアクセシビリティ向上と文化保存に貢献する。
SPADE:疎なデータからの学習による,より迅速な創薬 [cs.LG, cs.AI]目的:創薬における有望なリガンドの効率的な探索
- 創薬は,人々の健康に不可欠であり,効率化が強く求められている。
- 候補リガンドの多くが初期段階を通過できず,新規タンパク質への応用が困難である。
- 少ないテスト回数で,質の高いリガンドを発見することを目指す。
- 提案手法SPADEは,平均40回のテストで10個の高品質リガンドを発見できる。
- SPADEは,深層学習やベイズ最適化よりも多くのタンパク質で優れたサンプル効率を示す。
- SPADEは,競合手法と比較して10倍高速に候補薬をスコアリングできる。
2ステップで十分:一貫性モデルを用いた効率的な3D点群異常検知 [cs.CV, cs.AI]目的:3D点群データにおける異常検知の効率化
- 近年の製造業において,3Dセンシングは品質保証や工程管理に不可欠であり,信頼性の高い異常検知が求められている。
- 既存手法は計算コストが高いか,複雑な領域での信頼性が低い。拡散モデルは反復処理によるボトルネックが存在する。
- 計算資源の限られた環境でも低遅延で異常検知を実現するため,一貫性学習による効率的な手法を確立する。
- 本研究では,一貫性学習を用いて異常のない形状を直接予測する手法を提案し,推論コストを大幅に削減した。
- 最先端手法と比較して最大80倍の高速化を達成し,GPUアクセラレーションなしでも高い検知性能を維持した。
- Anomaly-ShapeNetで76.20%のI-AUROC,Real3DADで72.80%のI-AUROCを達成し,エッジデバイスへの応用を可能にした。
ニューラル共状態方策:再帰型強化学習における隠れ状態の構造化 [cs.LG]目的:部分観測環境下における強化学習における隠れ状態の構造化
- 知能エージェントは部分観測環境で行動する必要があり,その能力は重要である。
- 再帰型方策は履歴を隠れ状態に符号化するが,その内部ダイナミクスは解釈困難である。
- 隠れ状態をポンチャギン最小値原理(PMP)と連携させ,構造化を試みる。
- 隠れ状態がPMP共状態に直接対応することが示され,ハミルトニアン最小化として解釈可能になった。
- PMP由来の共状態損失を導入することで,内部ダイナミクスを明示的に構造化することに成功した。
- DMControlタスクにおいて,性能が向上し,分布外センサーマスキングに対する頑健性も確認された。
