arXiv雑要約
AI - 2026/03/24 公開
ベイジアン散乱:画像データにおける不確実性のための原理に基づいたベースライン [cs.CL, cs.LG, stat.ML]目的:画像データにおける不確実性定量
- 画像データ分析において,信頼性のある予測は不可欠であり,不確実性の評価が重要である。
- 既存手法は複雑な深層学習に依存しており,解釈可能性や数学的根拠に課題がある。
- 解釈可能で数学的に厳密なベースラインを提供し,不確実性定量における新たな基準を確立する。
- ベイジアン散乱は,画像データにおける不確実性定量のためのシンプルかつ堅牢なベースラインとして機能する。
- ウェーブレット散乱変換と確率的ヘッドを組み合わせることで,過学習を抑制し,分布シフトに対するロバスト性を実現する。
- 医療画像,富の分布マッピング,分子特性のベイズ最適化など,多様なタスクで有効性が確認された。
LLM-ODE:大規模言語モデルによる力学系のデータ駆動型発見 [cs.CY, cs.HC, cs.LG]目的:力学系の支配方程式の発見
- 科学的発見を加速するため,実験データの活用が重要視されている。
- 遺伝的プログラミングは柔軟性があるが,探索効率が悪く,最適解に到達しにくい。
- 大規模言語モデルを用いて探索を効率化し,より高次元の系への適用を目指す。
- LLM-ODEは,従来の遺伝的プログラミングよりも探索効率とパレートフロントの質で優れていた。
- 大規模言語モデルの生成能力を活用することで,より情報に基づいた探索経路を実現した。
- 線形モデルやTransformerのみを用いる手法と比較して,LLM-ODEは高い拡張性を示した。
LLM駆動エージェントは関与メカニズムを示すか:情報負荷,記述的規範,人気指標の統制実験 [cs.AI, cs.CY]目的:LLM駆動エージェントにおける情報関与メカニズムの検証
- ソーシャルメディアにおける情報拡散の理解は,社会現象の解明や効果的な情報伝達戦略の構築に不可欠である。
- シミュレーション研究において,LLMの流暢な出力が理論的な裏付けを伴わない場合,結果の解釈が困難になるという課題が存在する。
- 本研究は,LLM駆動シミュレーションにおける行動変化が,統制された条件変化に対し理論的に解釈可能な形で生じるかを確認する。
- 情報負荷と記述的規範の変化に対し,シミュレーションにおける関与度合いが系統的に変化することが確認された。
- 人気指標に対する感応度は状況によって異なり,LLMがプロンプトに単純に従うのではなく,条件に応じて行動を変えることが示された。
- 多条件ストレステストや明示的な規範なしのベースライン設定など,シミュレーション研究における方法論的含意が議論された。
ニューラル決定木を用いたLIMEの性能向上 [cs.LG, cs.AI]目的:複雑な機械学習モデルの解釈手法の改善
- 機械学習モデルの透明性は,特に表形式データにおいて重要であり,信頼性の高い意思決定に不可欠である。
- 従来のLIMEの代替モデルは,非線形な決定境界を捉えきれず,精度の高い局所的な説明が困難である。
- ニューラル決定木を用いることで,より正確で意味のある局所的な説明を提供し,解釈性と予測性能のバランスを取る。
- 提案手法NDT-LIMEは,従来のLIMEの代替モデルと比較して,説明の忠実度において一貫した改善を示す。
- ニューラル決定木の構造的な特徴を活用することで,複雑なモデルの局所的な挙動をより正確に捉えることが可能となる。
- 本研究は,高い予測性能と解釈可能性を両立させるための重要な一歩となる。
AIの民主化:深層学習の効率と計算処理の将来動向に関する比較研究 [cs.PF, cs.AI, cs.DC, cs.LG]目的:深層学習モデルの効率と計算処理の将来動向に関する比較
- データ量の指数関数的増加に伴い,大規模深層学習モデルの訓練に必要な計算能力への需要が高まっている。
- モデル規模の拡大と複雑化により,計算資源への公平なアクセスが課題となっている。
- 限られた計算予算の研究機関におけるAI研究の革新を可能とするGPU資源の民主化が重要である。
- GPUによる訓練は,CPUと比較して11倍から246倍の高速化を達成した。特に軽量モデル(Conv6)で最も高い加速効果(246倍)が見られた。
- TensorFlowのカーネルフュージョン最適化により,推論レイテンシが約15%削減された。
- GPUメモリ使用量の傾向を分析し,2025年までの要件を多項式回帰を用いて予測した。
臨床予測のための識別的表現学習 [cs.LG]目的:臨床予測における識別的表現
- 医療分野でのAI活用は,疾患の早期発見や個別化医療の実現に不可欠である。
- 既存手法は,大規模な事前学習に依存し,質の高い教師データが十分に活用されていない。
- 質の高い教師データを用いて,直接的に予測性能を最適化する表現学習を目指す。
- 本研究では,クラス間分離を最大化する表現学習フレームワークを提案した。
- 複数の電子カルテデータを用いた実験で,既存の事前学習手法を上回る性能を達成した。
- 提案手法は,識別能,キャリブレーション,サンプル効率を向上させ,学習パイプラインを簡素化する。
利益がレッドチーム:戦略的経済的相互作用におけるエージェントのストレステスト [cs.AI]目的:戦略的経済的相互作用におけるエージェントの脆弱性評価
- 現実世界へのエージェント導入が進む中で,外部からの影響に対する堅牢性が重要となる。
- 従来のプロンプト攻撃だけでは,敵対者による戦略的な操作に対応できない可能性が課題。
- 利益を最大化する敵対的エージェントを用いて,エージェントの脆弱性を効率的に発見する。
- 利益を目的としたレッドチームによるテストで,静的なベースラインに対して強いエージェントでも,戦略的な圧力下では脆弱性が露呈することが示された。
- 学習された敵対的エージェントは,明示的な指示なしに,探り,アンカリング,欺瞞的なコミットメントなどの戦略を自律的に発見した。
- 脆弱性事例から抽出された簡潔なプロンプトルールをエージェントに適用することで,パフォーマンスが大幅に向上し,以前の失敗が無効化された。
不安定な異種無線ネットワークにおける深層適応レート割り当て [cs.IT, cs.LG, math.IT]目的:深層適応レート割り当て(DARA)による,動的な輻輳制御とデータ分配の最適化
- 5G+ネットワークの普及に伴い,移動体通信の安定性・性能向上が重要視されている。
- 特に車両ネットワーク等の高速移動環境では,無線リンク品質の変動が大きく,既存のスケジューラでは対応が困難である。
- 本研究では,Transformerを用いた経路状態予測とDARAを統合し,リアルタイムな輻輳制御を目指す。
- DARAは,適応的な輻輳窓フラクションを計算し,経路間のデータ分配を最適化する。
- 中程度の変動性を持つ環境下では,既存の学習型スケジューラと比較してファイル転送時間の短縮に貢献する。
- バッファリング制約下のストリーミングにおいて,DARAは顕著な再バッファリングの改善を実現し,最新のスケジューラが連続的な停止を示すのに対し,安定した動画再生を可能にする。
因果誘導型拡散による安定特徴選択 [cs.LG, cs.AI, cs.IT, math.IT]目的:安定した特徴選択のための手法
- データ中心型AIにおいて,ロバストな性能を実現するには特徴選択が不可欠である。
- 既存手法は単一のデータ分布下での予測性能を最適化するため,分布シフトに弱い。
- 分布シフトに強い,安定した特徴選択手法を開発する。
- 提案手法CGDFSは,予測誤差と環境間分散の低減を目指し,特徴部分集合の事後推論として特徴選択を定式化する。
- 拡散モデルを学習事前分布として用いることで,特徴間の構造的依存性を捉え,大規模な探索を可能にする。
- 実データ実験の結果,CGDFSは既存手法と比較して,より安定かつ転移性の高い特徴部分集合を選択し,分布外性能を向上させる。
エージェントのためのアクセス制御:AC4A [cs.RO, cs.CR, cs.AI, cs.PL]目的:エージェントのアクセス制御に関するフレームワーク
- LLMエージェントの利用拡大に伴い,セキュリティ確保が重要となる。
- 既存システムでは,アクセス権限が粗く,過剰な権限付与のリスクがある。
- 必要なリソースへのアクセスのみを許可するフレームワークを確立する。
- AC4Aは,APIやWebページへのアクセス権限を細かく制御するフレームワークである。
- Unixファイルシステムのアクセス制御を参考に,リソースを階層構造で定義する。
- 実世界のAPIとWebページを用いたケーススタディで,AC4Aの有効性を実証した。
MOELIGA:局所改善を用いた多目的進化型特徴選択手法 [cs.NE, cs.LG]目的:特徴選択のための多目的最適化
- 機械学習の性能向上には,適切な特徴選択が不可欠である。データ解析の効率化にも繋がる。
- 特徴量の組み合わせが膨大であり,最適な部分集合を見つけるのは計算量的に困難である。
- 特徴量部分集合のサイズと分類精度を両立させる多目的最適化問題を解決すること。
- MOELIGAは,局所探索による改善戦略を取り入れた多目的遺伝的アルゴリズムである。
- 14の多様なデータセットで,既存の11手法と比較して,より小さい特徴量部分集合で同等以上の分類性能を示した。
- この結果は,MOELIGAが高次元かつ複雑な状況における多目的特徴選択に有効であることを示唆する。
対話型LLMエージェントのためのユーザー嗜好モデリング:検索拡張型インタラクションからの弱い報酬 [cs.CL, cs.AI, cs.HC, cs.IR, stat.ML]目的:ユーザー嗜好のモデリング
- LLMを個人アシスタントとして活用する上で,ユーザーの継続的な理解は不可欠である。
- 従来のLLMはユーザーモデルを持たないため,毎回嗜好を伝える必要があり,効率が悪い。
- ユーザーからの弱い報酬を用いてオンラインで嗜好を学習し,パーソナライズを実現する。
- 提案手法VARSは,長期・短期ベクトルの組み合わせにより,ユーザー嗜好を効率的に表現した。
- VARSは,タスク成功率を維持しつつ,タイムアウト率とユーザーの負担を軽減することに貢献した。
- 学習されたベクトルは,ユーザー間の嗜好の類似性やセッション固有の適応を反映しており,解釈性が高い。
gUFO:セマンティックWeb知識グラフのための穏やかな基礎オントロジー [cs.AI, cs.DB]目的:セマンティックWeb知識グラフのための基礎オントロジー
- 知識表現の標準化が,異種データ統合や推論の効率化に不可欠である。
- 既存のオントロジーは複雑性が高く,応用範囲が限定される場合がある。
- セマンティックWeb知識グラフにおける再発的な問題を解決するためのパターンを提供する。
- gUFOは,UFOを軽量に実装し,OWL 2 DLアプリケーションに適している。
- タイプ分類,内在的・関係的側面の再帰的パターン,状況と高次タイプをサポートする点が特徴である。
- コミュニティでの採用が進み,他の主要な基礎オントロジー実装との比較も行われた。
ツール利用前:自律型AIエージェントのための決定論的事前アクション認可 [cs.CR, cs.AI]目的:AIエージェントのツール利用における認可メカニズムの確立
- AIエージェントの利用拡大に伴い,セキュリティ確保が不可欠となっている。
- 既存システムでは,実行後の評価に依存し,事前認可の仕組みが不足している。
- ツール利用前の決定論的な認可により,不正なアクションを防止することを目指す。
- Open Agent Passport (OAP) は,ツール利用を同期的に遮断し,ポリシーに基づいて認可判断を行う。
- OAPは認可判断を平均53ミリ秒で行い,認可記録を暗号的に署名する。
- 敵対的テストの結果,OAPによる制限的なポリシーは,攻撃者の成功率を0%に抑えることが確認された。
表現類似性を超えて:コントラスト学習がタンパク質相互作用構造から機能的遺伝子関連性を回復する [cs.LG, cs.AI]目的:機能的遺伝子関連性の回復
- 生命現象の理解には,遺伝子間の関連性を明らかにすることが不可欠である。
- 従来の遺伝子関連性の予測は,遺伝子発現の類似性に依存することが多く,機能的な関連性を十分に捉えきれない場合がある。
- タンパク質相互作用構造を利用し,より機能的な遺伝子関連性を予測することを目指す。
- コントラスト学習(CAL)は,遺伝子発現の類似性よりも高い予測性能を示し,AUC値0.908を達成した。
- 異なる遺伝子データセットにおいても同様の結果が確認され,AUC値0.947に達した。
- CALスコアは相互作用次数と負の相関を示し,研究が少ない遺伝子において特に効果が認められた。
アライメント・ホイップアモール:大規模言語モデルにおけるファインチューニングが著作権で保護された書籍の逐語的想起を活性化する [cs.CL, cs.AI, cs.CY]目的:大規模言語モデルにおける著作権で保護された書籍の逐語的想起の活性化機構の解明
- 大規模言語モデルの発展は,情報アクセスやコンテンツ生成に革新をもたらしたが,著作権侵害のリスクが懸念される。
- 既存の安全対策(RLHF,システムプロンプト,出力フィルタ)は,著作権侵害の抑止に有効とされてきたが,その限界が指摘されている。
- ファインチューニングが,これらの安全対策を回避し,著作権で保護された書籍の記憶を活性化する可能性を検証する。
- ファインチューニングにより,GPT-4o,Gemini-2.5-Pro,DeepSeek-V3.1などのモデルが,著作権で保護された書籍の最大85-90%を再現することが示された。
- 特定の作家の作品でファインチューニングした場合,関連性の低い他の作家の著作権で保護された書籍も想起されることが確認された。
- モデルの重みが著作権で保護された作品のコピーを保持している証拠となり,既存のフェアユース判決の前提を揺るがす結果となった。
エリートレーン:現実的な小規模道路ネットワークの進化的な生成 [cs.NE]目的:現実的で冗長性のある小規模から中規模の道路ネットワーク生成手法の比較
- 自動運転やロボットナビゲーションにおいて,現実的な環境シミュレーションは不可欠である。
- 既存の道路ネットワーク生成手法は,現実の道路構造や冗長性を十分に再現できていない場合がある。
- 実世界のデータから得られたタイル定義を用いて,現実的な合成データセットを生成する手法を開発する。
- 提案手法である進化アルゴリズム(EA)は,接続性や冗長性の制約下で,Wave Function Collapse (WFC) や群知能アルゴリズム(PSO, GWO)と比較して,現実的な道路ネットワークを生成することが示された。
- EAの適応度関数設計の選択が,生成されるネットワークの構造特性に大きく影響することが明らかになった。
- 生成された道路ネットワークに対して,セマンティックセグメンテーションマスクのようなメタデータの幾何学的変換を適用することで,実用的な応用が可能であることが示された。
Transformerにおける文脈的回想:ファインチューニングが事前学習知識を文脈内推論に活用する方法 [cs.LG, cs.CL]目的:Transformerにおける文脈的回想のメカニズム解明
- 大規模言語モデルの性能向上は,様々な自然言語処理タスクにおいて重要である。
- 文脈学習において,事前学習のみでは文脈からの知識想起が不十分となる場合がある。
- 文脈的回想を促進するためには,文脈内推論能力を向上させるためのファインチューニングが不可欠である。
- 事前学習のみでは,文脈からの属性タイプの暗黙的な推論は行われなかった。
- 文脈内推論を必要とするタスクでのファインチューニングにより,文脈的回想が促進された。
- 共有属性タイプの低次元潜在エンコーディングの形成が,この転換を伴っていた。
DiscoUQ:LLMエージェント集団における不確実性定量のための構造化された意見不一致分析 [cs.SI, cs.CL, cs.LG]目的:LLMエージェント集団の不確実性定量
- 複雑な推論タスクにおいて,LLMエージェント集団の利用が広がっている。
- 既存手法は,エージェントの推論情報を十分に活用できていない。
- エージェント間の意見不一致の構造を利用し,信頼性の高い推定を目指す。
- DiscoUQは,意見不一致の言語的特徴と埋め込み表現の幾何学的構造を抽出・活用する。
- DiscoUQ-LLMは,4つのベンチマークで平均AUROC 0.802を達成し,既存手法を上回った。
- 特に曖昧な意見不一致のケースにおいて,性能向上が見られた。
LLMを用いた人間とAIの協働チームにおける敵対的意図の検出 [cs.LG, cs.AI, cs.HC]目的:人間とAIの協働チームにおける敵対的意図の検出
- AIの活用が進む中で,人間とAIが協働する場面が増加しており,その安全性確保が重要である。
- LLMは攻撃を受けやすく,悪意のある情報操作により,人間への有害な意思決定を誘導されるリスクがある。
- LLMを防御的監視者として活用し,人間とAIの協働チームを攻撃から保護することを試みる。
- LLMは,タスク固有の情報を用いずとも,リアルタイムで敵対的行動を識別できることが示された。
- 単純なヒューリスティックでは,対象となる敵対的行動を特定することは困難である。
- LLMを防御者として導入することで,人間とAIの協働チームの攻撃に対する堅牢性を高める可能性が示唆された。
ニューラル時系列データにおける因果発見から動的因果推論へ [cs.LG, cs.AI, stat.AP, stat.ML]目的:動的因果推論のための新たなフレームワーク
- 動的な科学システムを研究する上で,時間変化する因果モデルは重要な役割を果たす。
- 既存手法は,因果構造が事前に分かっていることを前提とする場合が多く,現実世界での応用が限定される。
- 不確実な,あるいは変化する因果構造のもとでも,動的な因果推論を可能にすることを目指す。
- 提案手法DCNARは,データ駆動型因果発見と時間変化する因果推論を統合した二段階のニューラル因果モデリングフレームワークである。
- DCNARは,既存手法と比較して,より安定した,行動学的に意味のある動的因果推論を実現する。
- 本研究は,構造的不確実性下における動的因果推論のためのAI活用という新たな展望を開く。
ミッション監視のためのハイパーゲーム理論に基づく深層強化学習によるサイバー欺瞞 [cs.CR, cs.AI, cs.GT, cs.MA]目的:ミッション監視におけるサイバー攻撃に対する防御戦略
- ドローンは監視,救助,配送などの重要なミッションに活用されており,その重要性は増している。
- ドローンはDoS攻撃を受けやすく,ミッション遂行能力を低下させる危険性がある。
- 欺瞞ドローンを用いて攻撃を誘い込み,ミッションシステムを保護することを試みる。
- 提案手法HT-DRLは,ハイパーゲーム理論の解を深層強化学習に組み込むことで,迅速な学習と最適な防御戦略の実現を可能にする。
- シミュレーション結果から,HT-DRLに基づく欺瞞ドローンは既存手法と比較して,ミッション性能を最大で2倍向上させ,低消費電力で運用できることが示された。
- 攻撃戦略が異なる状況下において,様々な防御メカニズムの性能を分析し,HT-DRLの有効性を検証した。
目的,制約,および感度を共同に代理学習する効率的なニューラル動的系の多目的最適化 [cs.LG]目的:ニューラル動的系の多目的最適化における目的,制約,感度の共同代理モデル
- 生物物理学的ニューラルシステムシミュレーションは計算コストが高く,最適化が困難である。
- 制約条件は二値化されるため,勾配情報が得られず,探索が困難である。
- 目的関数,制約条件,パラメータ感度の相互作用を捉えることで最適化を効率化する。
- DMOSOPTは,目的関数,制約条件,パラメータ感度を共同で学習するスケーラブルな最適化フレームワークである。
- 目的関数の勾配と実現可能性境界の滑らかな近似を学習することで,効率的な探索を可能にする。
- 単細胞ダイナミクスから集団レベルのネットワーク活動まで検証し,大規模な計算資源で制約された問題の最適化を効率的に行った。
AutoMOOSE:自律相場シミュレーションのためのエージェントAI [cs.AI, cond-mat.mes-hall]目的:相場シミュレーションのライフサイクルを自然言語による指示のみで自動的に実行すること。
- 多物理場シミュレーションは材料科学の発展に不可欠だが,専門知識が参入障壁となっている。
- MOOSE等のフレームワーク利用には,入力ファイルの作成やエラー診断など高度な専門知識が必要である。
- AutoMOOSEは,自然言語による指示からシミュレーションを自動実行し,そのハードルを低減する。
- AutoMOOSEは,MOOSE入力ファイルの構造ブロックの6/12が専門家と同等,4つが機能的に同等であった。
- シミュレーション実行速度は1.8倍向上し,物理的な整合性チェックも自動で行われた。
- 銅粒成長ベンチマークにおいて,R^2 = 0.90-0.95で粒粗化速度論を再現し,活性化エネルギーも専門家と同等であった。
同期ギャップの解釈:拡散Transformer内部の隠れたメカニズム [cs.LG, cond-mat.dis-nn, cond-mat.stat-mech]目的:拡散Transformerにおける同期ギャップのメカニズム解明
- 拡散モデルは画像生成などで高性能を示すが,その理論的基盤の理解は不十分である。
- 連続時間モデルの予測と,実際の離散的な深層学習アーキテクチャとの乖離が課題である。
- 拡散Transformerにおける同期ギャップの発生メカニズムを明らかにすることを目指す。
- 同期ギャップは,拡散Transformerのアーキテクチャ固有の性質であり,外部結合がオフの場合でも持続することが示された。
- 強い結合下では,空間的ルーティング境界で予測されたように,同期ギャップは完全に崩壊することが確認された。
- 同期ギャップは,Transformerの最終層でのみ明確に発生し,深さ方向に局所化されていることが明らかになった。
認知科学における科学的発見の自動化は可能か [cs.AI, q-bio.NC]目的:認知科学における科学的発見の自動化
- 認知科学は知性を理解する上で重要であり,その進展は人間の思考や行動の理解に不可欠である。
- 従来の発見プロセスは,研究者の先入観や直感に依存し,探索空間が限定されるという課題がある。
- 大規模言語モデルを用いて発見サイクル全体を自動化し,効率的な理論構築を目指す。
- 大規模言語モデルを活用することで,実験パラダイムの自動生成,行動データのシミュレーション,認知モデルの合成が可能となった。
- LLMによる「興味深さ」の評価に基づき,有益な実験やメカニズムを発見するループを構築した。
- 本研究は,人間の認知に関する新たな知見を得るための,高速かつスケーラブルなin-silico発見エンジンを提供する。
ECI:効果的なコントラスト情報による難事例負例の評価 [cs.IR, cs.AI]目的:難事例負例の質評価指標
- 高精度な情報検索システムの構築には,適切な負例の選択が不可欠である。
- 効果的な負例の特定には,多大な計算コストを伴う試行錯誤が必要となる。
- 負例の質を事前評価し,計算コストを削減することを目指す。
- ECIは,情報理論と情報検索の原理に基づいた,負例の質を評価する指標である。
- ECIは,情報容量と識別効率のバランスを最適化し,誤った負例を厳密に罰する。
- 実験の結果,ECIは下流の検索性能を正確に予測し,BM25とクロスエンコーダーのハイブリッド戦略が最適であることが示された。
圧縮Transformerにおける構造感受性:誤差伝播, Lyapunov安定性,および形式的に検証された境界 [cs.LG, cs.AI, cs.CL, cs.LO]目的:Transformer圧縮時の構造感受性の分析
- Transformerは自然言語処理の基盤技術であり,その効率化は重要である。
- Transformerの圧縮は性能低下を引き起こす可能性があり,その原因の特定が課題である。
- Transformerの圧縮に対する構造感受性を定量化し,安定性を高める方法を模索する。
- GPT-2 Smallにおいて,単一の行列の圧縮がperplexityを大きく悪化させることが示された。
- 早期のMLP up-projectionは特に感受性が高く,value projectionは圧縮に強いことが明らかになった。
- Lyapunov安定性理論により,残差結合が誤差を抑制するメカニズムが説明され,形式的な誤差境界が証明された。
外れ値スコアモデリングによる長期外れ値予測 [cs.RO, cs.LG, cs.AI]目的:時系列データにおける長期的な外れ値予測
- 異常検知は,様々な分野で重要な役割を担う。システム監視や不正検知など,応用範囲は広い。
- 既存手法は即時的な外れ値検出に偏っており,将来の外れ値を予測する能力が不足している。
- 将来の異常発生の可能性を予測し,より先見性のある異常検知を実現すること。
- 提案手法は,まず通常の外れ値検知を行い,次に過去の観察された外れ値の時系列構造に基づいて将来の外れ値スコアを予測する。
- 合成データセットでの実験により,提案手法は検出と予測の両タスクにおいて良好な性能を示すことが確認された。
- 本手法は,今後の外れ値検出と予測研究のための強力な基盤となりうる可能性が示唆された。
インテリジェントな不服従ゲーム:スタケルベルクゲームとマルコフ決定過程における不服従の定式化 [cs.AI, cs.GT, cs.LG]目的:インテリジェントな不服従の定式化
- 人とロボットの協調作業において,安全性の確保は不可欠である。
- ロボットが人間の指示に従うべきか,安全のために指示に反すべきかという判断が困難である。
- 安全性を考慮したロボットの自律的な判断と行動の理論的基盤を構築する。
- 本研究では,人間のリーダーと支援するフォロワー間の相互作用をモデル化する「インテリジェントな不服従ゲーム」を提案した。
- 最適な戦略を特定し,「安全の罠」と呼ばれる現象を明らかにした。これはシステムが危害を回避し続ける一方で,人間の目標を達成できない状況である。
- 提案手法は,安全な不服従を学習するエージェントの開発と,人間が不服従なAIをどのように認識し信頼するかを研究するための基礎となる。
コンテンツベースルーティングはいつ機能するか:ハイブリッド系列モデルにおける選択的注意のための表現要件 [cs.LG]目的:ハイブリッド系列モデルにおける選択的注意のための表現要件の特定
- 系列モデルの性能向上は,計算資源を効率的に配分するルーティングメカニズムに依存する。
- コンテンツベースルーティングは計算コストがかかるため,その効果が限定的である可能性が指摘されている。
- 注意機構が表現を構築する役割を解明し,効率的なルーティングのための条件を明らかにすること。
- ソフトマックス注意層が約34次元の潜在的空間を形成し,98.4%のルーティング精度を達成することが示された。
- 注意機構は,ペアごとのマッチング結果を表現に書き込むことで機能し,単なる計算メカニズムではないことが証明された。
- 学習されていないインデックス(ブルームフィルタやBM25など)が,ルーティングのボトルネックを回避し,高い性能を示すことが確認された。
AIシステムが教育をどのように考えるか:大規模言語モデルにおける潜在的嗜好パターンの分析 [cs.CY, cs.AI, cs.CL, cs.HC]目的:大規模言語モデルにおける教育的整合性の系統的な測定
- 教育は社会の発展に不可欠であり,質の高い教育の提供が求められている。
- AIの教育利用が進む中で,AIがどのような教育観を持つのかが不明であった。
- AIの教育的整合性を評価し,より適切なAIの教育利用を促進すること。
- GPT-5.1は,教育理論の8つの側面において,高い一貫性(99.78%の推移性,92.79%のモデル精度)を持つ嗜好パターンを示した。
- 専門家の意見が一致する領域では,人文主義的教育原則と概ね一致するが,意見が分かれる領域では,専門家の意見の不一致を反映した。
- AIは中立ではなく,感情的な反応性を優先し,誤った均衡を拒否するなど,一貫した立場を採用していることが示された。
ALL-FEM:有限要素法のための大規模言語モデルのファインチューニング [cs.CE, cs.AI, cs.LG, cs.MS, cs.NA, math.NA]目的:有限要素法シミュレーションの自動化
- 製造物の設計・検証に不可欠であり,工学シミュレーションの中核技術である。
- 数値解析,連続体力学,プログラミングの専門知識が必要であり,習得が困難である。
- 大規模言語モデルとエージェント技術を統合し,有限要素法ワークフローを自動化する。
- ファインチューニングされた大規模言語モデル (GPT OSS 120B) は,39のベンチマークにおいて71.79%のコードレベル成功率を達成した。
- エージェントフレームワークを活用することで,従来の非エージェント型モデル (GPT 5 Thinking) を上回る性能を示した。
- 比較的小規模なファインチューニングされたLLMでも,有限要素法ワークフローの自動化が可能であることが示された。
ペッパーロボットにおける低遅延LLM駆動マルチモーダルインタラクションのためのフレームワーク [cs.IR, cs.AI, cs.LG, cs.RO]目的:ペッパーロボット上での低遅延LLM駆動マルチモーダルインタラクションの実現
- 近年,LLMと社会性ロボットの統合が進む中で,より自然な人間とのコミュニケーションが求められている。
- 従来のシステムは,音声認識・LLM・音声合成の段階的処理により,遅延が大きく,非言語情報の損失を招いていた。
- LLMのマルチモーダル知覚と自律的な制御能力を最大限に活用し,ロボットの応答性を向上させる。
- 本フレームワークでは,エンドツーエンドの音声合成モデルにより低遅延化と非言語情報の保持を実現した。
- LLMのFunction Calling機能を実装し,ロボットの行動計画・制御,マルチモーダルフィードバックの統合を可能にした。
- このフレームワークは,Android上で動作し,ロボットハードウェアからの開発を切り離すことで,拡張性と汎用性を高めた。
CLT-Forge:クロスレイヤー・トランスコーダおよび帰属グラフのためのスケーラブルなライブラリ [cs.LG, cs.CL]目的:クロスレイヤー・トランスコーダと帰属グラフの効率的な学習と解釈
- 大規模言語モデルの内部動作理解は,AIの信頼性と制御可能性向上に不可欠である。
- 既存手法では,帰属グラフが大規模で冗長なため,解釈が困難であるという課題がある。
- 本研究は,スケーラブルなCLT学習・解釈基盤を提供し,その課題解決を目指す。
- CLT-Forgeは,分散学習,活性化キャッシュ圧縮,自動解釈パイプラインを統合したライブラリである。
- これにより,大規模モデルにおけるCLTベースのメカニズム解釈が現実的になった。
- 本ライブラリは,モデルの動作理解と説明可能性向上に貢献する。
大規模言語モデルにおける選択バイアス軽減:置換を考慮したGRPO [cs.CL, cs.AI, cs.LG]目的:大規模言語モデルの選択バイアス軽減手法
- 言語モデルの性能評価において,客観性と公平性が重要であるため,バイアスの軽減が不可欠である。
- 選択肢の順序やラベルといった非意味的な要素が,言語モデルの判断に影響を与える選択バイアスが存在する。
- 置換の一貫性を考慮することで,より公平で正確な言語モデルの評価と学習を実現する。
- 提案手法PA-GRPOは,既存の手法と比較して7つのベンチマークで優れた性能を示し,選択バイアスを大幅に軽減する。
- PA-GRPOは,置換グループの構築と,クロス置換優位および一貫性対応報酬の活用により,意味的な推論を強化する。
- 本研究は,言語モデルの評価と学習における公平性と信頼性を向上させるための新たなアプローチを提供する。
DSL-R1:強化学習を用いた構造化・非構造化データに対する検索エージェント訓練のためのSQLからDSLへの変換 [cs.RO, cs.IR, cs.AI, cs.DB, cs.LG]目的:複雑なドメインにおける効果的な検索手法
- 情報検索の分野は,構造化データと非構造化データの統合が重要課題となっている。
- 既存システムは,これらの能力を分離しており,両者の相互作用を捉えきれていない。
- DSL-R1は,論理的推論と意味的マッチングを統合し,そのギャップを埋めることを目指す。
- DSL-R1は,SQLスタイル演算子にベクトル表現を組み込むことで,構造化された正確性と意味的な網羅性を活用する。
- ルールベース実行のフィードバックと検索品質の報酬を組み合わせた強化学習により,DSL生成を最適化する。
- 大規模な産業用メールベンチマークにおいて,Hit@1/3で+12.3%の改善を示し,従来のシステムを上回った。
大規模言語モデルの知識境界の発見 [cs.AI, cs.CL, cs.LG]目的:大規模言語モデルの知識境界の検出
- 言語モデルの能力評価は重要であり,その限界を理解することで,より安全で信頼性の高い利用が可能となる。
- 既存の評価方法は,言語モデルの知識範囲を網羅的に把握できず,誤った情報生成(ハルシネーション)の問題がある。
- 言語モデルの知識境界を自動的に発見し,その能力と限界を明確にすることで,より適切な評価方法を確立する。
- 本研究では,強化学習を用いて大規模言語モデルの知識境界を探索する枠組みを提案した。
- 提案手法は,言語モデルが回答可能な質問と不可能な質問を自動的に生成し,知識境界を特定する。
- 実験の結果,本手法で生成された質問セットは,人間が作成したベンチマークデータセットと同等の性能を示すことが確認された。
知識グラフに基づく自律運転のための詳細な3Dシーン推論:KLDrive [cs.AI]目的:自律運転における詳細な3Dシーン事実の推論
- 自律運転の実現には,周囲環境を正確に理解し,適切な判断を下す能力が不可欠である。
- 既存のシステムは,シーンの事実の信頼性や,幻覚,推論の不透明性,タスク固有の学習への依存といった問題点を抱えている。
- 信頼性の高いシーン知識グラフと明示的な構造的制約による推論を通じて,これらの課題を克服することを目指す。
- KLDriveは,大規模な自律運転QAベンチマークにおいて,既存の最先端手法を上回り,NuScenes-QAで最高の全体精度65.04%,GVQAで最高のSPICEスコア42.45を達成した。
- 特に,最も困難な事実推論タスクであるカウントにおいて,最も強力なベースラインを46.01%ポイント上回り,幻覚の大幅な削減と信頼性の高いシーン事実構築の利点を示した。
- 本フレームワークは,構造化されたプロンプトと少数のインコンテキスト例を組み合わせることで,大量のタスク固有の微調整なしに多様な推論タスクに適応する。
介護施設におけるBLEを用いた屋内定位のための深層注意ベースの逐次アンサンブル学習 [cs.LG, cs.HC]目的:介護施設におけるBLEを用いた屋内定位の精度向上
- 高齢化社会において,介護施設の業務効率化と入居者の安全確保が重要課題である。
- 従来のBLE定位は,時間的な情報を独立した観測値として扱うため,精度に限界があった。
- 人間移動軌跡の特性を捉え,より高精度な屋内定位を実現すること。
- 提案手法DASELは,従来の最高性能ベースラインと比較して,マクロF1スコアで53.1%の改善を達成した。
- 周波数ベースの特徴量エンジニアリング,双方向GRUネットワーク,多方向スライディングウィンドウを活用している。
- 介護施設における職員配置,作業負荷管理,ケアの質向上への貢献が期待される。
解釈可能な地盤モデリングのためのTabPFN拡張 [cs.CE, cs.LG]目的:地盤モデリングにおける解釈可能性の向上
- 地盤調査は,エンジニアリング判断に不可欠であり,その信頼性が重要である。
- 地盤データの不確実性とモデルの解釈性の欠如が課題となっている。
- データ不足な状況下での,解釈可能で不確実性を考慮した地盤パラメータ推定を目指す。
- TabPFN埋め込み表現により,明示的な土質情報なしに粘土と砂が明確に分離された。
- 反復代入により,5つの目標パラメータのうち4つについて予測精度が向上し,不確実性が適切に反映された。
- SHAP分析により,地盤工学的な関係(スメクトン圧縮指数相関など)が再現され,パラメータ間の依存関係が明らかになった。
燃料消費量予測:機械学習パラダイムの比較分析 [cs.LG]目的:自動車の燃料消費量を決定する要因の特定
- 自動車産業は環境負荷低減を迫られており,持続可能な設計には正確な予測モデルが不可欠である。
- 既存研究では,パワートレイン特性間の多重共線性に対処する十分な検討がなされていない。
- 古典的な機械学習モデルの性能を検証し,持続可能性目標達成のための設計指針を提供する。
- SVM回帰は連続予測において最も高い精度を示し(R2=0.889, RMSE=0.326),車両重量と排気量の非線形関係を捉える上で有効である。
- ロジスティック回帰は分類において優れており,低効率車両の識別において高い再現率(0.957)を示した。
- 本研究は,静的な物理データセットにおいて,解釈可能な古典モデルがブラックボックス型の深層学習アーキテクチャと同等以上の性能を発揮することを実証した。
大気質データに対する科学的機械学習モデルのベンチマーク [cs.CL, cs.CL, cs.HC, cs.LG]目的:大気質指数(AQI)の予測モデルの評価と選定に関するベンチマーク
- 都市部における人口増加に伴い,大気汚染は公衆衛生への重要な脅威となっている。
- 地域特有の標準化されたデータセットを用いた,厳密なベンチマーク評価が不足している。
- ノーステキサスにおけるAQI予測の精度向上に貢献する最適なモデルの特定。
- 深層学習モデルは,より単純なベースラインモデルと比較して優れた予測性能を示した。
- 物理制約を組み込むことで,予測の安定性と物理的に整合性のある汚染物質とAQIの関係性が改善された。
- 特に短期予測やPM2.5,O3において,物理制約による効果が大きかった。
確信の凍結:初期の成功がメタ認知と行動の不安定な乖離を誘発する [cs.LG]目的:行動とメタ認知の乖離を誘発する「確信の凍結」という状態の解明
- 人は,探索と利用の間で柔軟に判断する必要があり,そのメカニズムの理解は重要である。
- 失敗している戦略を継続するなど,適応的でない固執が見られる点が課題である。
- 初期の成功が,メタ認知と行動の乖離を引き起こすメカニズムを特定する。
- 初期の成功率が高い人は,戦略がうまくいかなくなった後も行動を継続する傾向が強かった。
- 行動を継続している間,自身の確信度は低下していた。
- この現象は,個人の特性ではなく,動的な学習状態として捉えられる。
LPNSR:低解像度画像誘導ノイズ予測による事前知識強化型拡散超解像 [cs.CV, cs.AI]目的:拡散モデルを用いた超解像技術における性能向上
- 画像超解像は,限られた情報から高画質の画像を復元する上で重要な技術である。
- 拡散モデルの超解像は,推論効率と再構成品質のトレードオフが課題となっていた。
- 本研究は,拡散モデルの中間ノイズの最適化と初期バイアスの軽減を通して,この課題を解決する。
- 提案手法LPNSRは,低解像度画像の構造的情報を拡散過程に組み込むことで,効率的な推論を維持しつつ,再構成品質を大幅に向上させている。
- LPNSRは,4ステップというコンパクトな推論経路で,最先端の性能を達成し,大規模なテキスト画像事前知識に依存しない。
- 高品質な事前アップサンプリングネットワークにより,初期バイアスを軽減し,拡散開始点を最適化している。
SpatialFly:都市環境におけるUAVのビジョンと言語によるナビゲーションのための幾何学に基づく表現アラインメント [cs.CV, cs.AI]目的:UAVのビジョンと言語によるナビゲーションにおける幾何学に基づく表現アラインメント手法
- UAVは自律探索,災害対応,インフラ点検など様々な分野で重要な役割を担う。
- 複雑な3D環境におけるUAVのVLNは,2D視覚情報と3D軌道決定空間の構造的表現の不一致が課題。
- 2D表現に幾何学的情報を注入し,3D幾何学的特徴とのアラインメントを行うことで空間推論能力の向上を目指す。
- SpatialFlyは,明示的な3D再構成なしにRGB画像のみを用いて幾何学的なガイダンスを2Dセマンティック特徴に注入する。
- 実験結果から,SpatialFlyは未知環境を含む複数の環境で最先端のUAV VLN手法を安定して上回り,NEを4.03m削減し,SRを1.27%向上させた。
- 軌道分析により,SpatialFlyはより優れた経路追従性と滑らかで安定した運動軌跡を生み出すことが示された。
注意散漫運転行動の時間的局所化のための二段階Transformerフレームワーク [cs.CV, cs.AI]目的:注意散漫運転行動の時間的局所化手法
- 交通安全向上と交通違反検知に不可欠な研究分野であり,安全運転支援に繋がる。
- 既存手法は,精度と計算効率のバランスが課題であり,リアルタイム処理が難しい。
- 計算効率を維持しつつ,精度向上を目指す時間的局所化フレームワークを提案する。
- ViT-Giantバックボーンは88.09%のTop-1精度を達成する一方,ViTベースの変種は,大幅に低い計算コストで82.55%の精度を実現した。
- SPPFモジュールは,全ての構成で性能向上に貢献し,ViT-Giant + SPPFモデルはmAP 92.67%のピークを達成した。
- 軽量なViTベース構成も,頑健な結果を維持しており,実用的な代替手段となる。
誤情報の検出におけるマルチメディア環境下の有害な視覚コンテンツ操作の影響 [cs.RO, cs.LG, cs.AI, cs.MM]目的:マルチメディア環境下における誤情報の検出
- 社会における誤情報の拡散が深刻化しており,自動検出技術の重要性が増している。
- 既存の研究では,視覚コンテンツ内の操作が誤情報検出の重要な手がかりとして見過ごされがちである。
- 視覚コンテンツの操作の有無と,その意図(有害か無害か)を考慮した誤情報検出を目指す。
- 本研究で提案するHAVC-M4 Dは,既存の誤情報検出手法の性能を大幅かつ一貫して向上させる。
- 視覚コンテンツの操作と意図を識別するための弱教師あり学習フレームワークを導入した。
- 画像操作検出に焦点を当てた補足データセットを活用し,新しい分類タスクを定義した。
バランスの取れた深層表現分布を用いた半教師あり学習 [cs.LG]目的:半教師ありテキスト分類における深層表現分布のバランス化
- テキストデータの多くはラベルなしであり,ラベル付きデータのみでの学習は困難であるため,半教師あり学習が重要である。
- 半教師あり学習では,擬似ラベルの精度が重要だが,ラベル間の表現分布の大きな差により精度が低下することが課題となる。
- ラベル間の角度分散を均衡化することで,擬似ラベルの精度向上を図り,半教師あり学習の性能向上を目指す。
- 提案手法S2TC-BDDは,最先端の半教師あり学習手法と比較して,特にラベル付きデータが少ない場合に有効であることが実験的に示された。
- 角度マージン損失とガウス線形変換を用いることで,ラベル角度分散のバランス化を実現し,擬似ラベルの精度を向上させた。
- マルチクラス分類とマルチラベル分類の両方のバージョンを,擬似ラベル作成の工夫と正則化項を導入することで実装した。
LongCat-Flash-Prover:エージェントによるツール統合強化学習を通じたネイティブ形式推論の発展 [cs.AI, cs.CL]目的:ネイティブ形式推論における強化学習によるツール統合推論の進展
- 形式推論は,数学や論理学の自動化に不可欠であり,信頼性の高いAIシステムの構築に繋がる。
- 既存の手法では,複雑な問題を形式的に推論するための効率性と精度が十分でない。
- 本研究は,大規模言語モデルと強化学習を組み合わせることで,形式推論の性能向上を目指す。
- LongCat-Flash-Proverは,オープンウェイトモデルにおいて,自動形式化と定理証明の最先端性能を達成した。
- MiniF2F-Testにおいて,問題あたり72回の推論予算で97.1%の合格率を記録し,優れたサンプル効率を示した。
- ProverBenchとPutnamBenchにおいても,既存のオープンウェイトベースラインを大幅に上回る成果を上げた。
