arXiv雑要約
AI - 2026/03/09 公開
AIアプリケーション開発における人間中心のテーマ:実証的なテーマ分析 [cs.FL, math.OC, cs.HC, cs.HC, cs.AI, cs.CY]目的:AIアプリケーション開発における人間とAIの連携に関するテーマ
- AIの組織への導入は進むが,人間の役割定義が曖昧な場合が多い。
- HITL/HCAI原則は認識されても,具体的な運用方法が確立されていない。
- AI開発における人間とAIの連携構造の指針を提供する。
- 顧客サポートチャットボットとAI専門家へのインタビューから4つのテーマを抽出。
- AIガバナンスと人間の権限,反復的な改良,システムライフサイクルと制約が重要。
- 人間とAIのチーム連携と協調に関する知見を得て,HITLフレームワーク設計に貢献。
視覚的物語のための具現化された仲間 [cs.HC, cs.AI, cs.GR, cs.RO]目的:視覚的物語の共同創造
- AI技術の発展は,芸術分野における新たな表現の可能性を拓く。
- 従来のAIは自律性を重視する傾向があり,アーティストとの協調性が課題だった。
- AIと人間の相互作用による,より創造的な芸術表現の実現を目指す。
- 本システムは,大規模言語モデルと描画ロボットを統合し,双方向の対話を通じて視覚的物語の共同創造を可能にした。
- 芸術専門家による評価の結果,本システムが生み出す作品は独特な審美性を持ち,展示価値があることが確認された。
- AIが高度な芸術コラボレーターとして機能する可能性を示唆する。
労作から思考へ:系統的文献レビューにおける戦略的探求と責任あるAIのための設計 [cs.HC, cs.CY, cs.HC, cs.HC, cs.AI]目的:系統的文献レビューにおける戦略的探求と責任あるAIの設計
- 科学的進歩の基盤であり,研究の信頼性を高めるために重要である。
- ツールが分散しており,研究者の認知負荷を増大させている現状がある。
- 研究者の戦略的探求を支援し,AIの透明性と検証可能性を高めることを目指す。
- 複数のデータベースを統合し,検索プロセスの透明性を高めるARCを開発した。
- 比較ユーザー調査の結果,統合環境が戦略的探求を促進することが示された。
- 外部表現と透明なAI推論により,専門家の判断を支援し,知識の統合を促進する。
行動方針としてのトラバーサル:ログ蒸留されたゲート付き行動木を,安全で堅牢かつ効率的なエージェントのための外部化された検証可能な方針として [cs.HC, cs.HC, cs.LG, cs.AI, cs.CR, cs.SE]目的:LLMエージェントの長期的な方針を明示化し,安全性と効率性を向上させること
- 自律型LLMエージェントの性能向上は,AI研究における重要な課題である。
- 既存手法では,安全性の確保が後付けであり,長期的な方針がモデル内部に暗黙的に存在している。
- 実行ログから抽出した行動木を用いることで,安全性を保証しつつ,方針を明示的に表現すること。
- ゲート付き行動木(GBT)は,15以上のベンチマークにおいて成功率を向上させ,違反率をほぼゼロに近づけた。
- SWE-bench Verifiedにおいて,GBT-SEは成功率を34.6%から73.6%に向上させ,違反率を2.8%から0.2%に削減した。
- 8B実行器においても,SWE-bench VerifiedとWebArenaで成功率がそれぞれ2倍以上に向上した。
逐次マルチエージェントLLMシステムにおける情報理論的プライバシー制御 [cs.CL, cs.HC, cs.IR, cs.MA, cs.CR, cs.LG]目的:逐次LLMエージェントパイプラインにおける組成的プライバシー漏洩の抑制
- ヘルスケアや金融など,機密性の高い分野でLLMエージェントの利用が増加しており,プライバシー保護が重要である。
- 個々のエージェントがローカルなプライバシー制約を満たしても,逐次的な連携によって情報漏洩が拡大する可能性がある。
- エージェント出力と機密変数の情報フローを制約するプライバシー正則化学習フレームワークを提案し,漏洩抑制を目指す。
- 相互情報量を用いて漏洩を形式化し,逐次実行における漏洩の増幅に関する理論的限界を導出した。
- 提案手法は,様々な深さのパイプラインで安定した最適化と解釈可能なプライバシーとユーティリティのトレードオフを示した。
- エージェントシステムにおけるプライバシーは,ローカルな制約のみでは保証されず,システムレベルでの考慮が必要である。
RoboLayout:具現化されたエージェントのための微分可能な3Dシーン生成 [cs.AI, cs.CV, cs.LG, cs.RO]目的:具現化されたエージェントが相互作用可能な3Dシーンの生成
- 近年のVLMsの進歩により,空間推論や3Dシーンレイアウト生成が可能になった。
- 相互作用可能性を考慮した,物理制約のある屋内環境でのレイアウト生成が課題である。
- エージェントの到達可能性を考慮したレイアウト生成により,実用的な環境デザインを目指す。
- RoboLayoutは,LayoutVLMを拡張し,エージェントを考慮した推論と最適化の安定性を向上させた。
- 微分可能なレイアウト最適化プロセスに到達可能性制約を組み込み,ナビゲート可能で実行可能なレイアウトを生成する。
- 様々な物理能力を持つエージェントに対応可能であり,環境設計の汎用性が高い。
オムニC:異種モダリティを単一の密なエンコーダに圧縮 [cs.MM, cs.AI, cs.CL, cs.CV, cs.SD, eess.AS]目的:異種モダリティ間の共有表現の学習
- マルチモーダル学習は,多様な情報を統合し,より高度なAIシステムを実現する上で重要である。
- 従来のマルチモーダルシステムは,モダリティごとに専門エンコーダを用いるため,計算コストが増大する。
- パラメータ効率の良い単一エンコーダにより,スケーラブルなマルチモーダル学習を実現する。
- オムニCは,画像,音声,テキストといった異種モダリティ間で競争力のある共有表現を学習できる。
- MoEアーキテクチャのような専門家やルーティングを必要とせず,メモリ使用量を大幅に削減する。
- 単一エンコーダでありながら,様々なタスクにおいて専門家モデルと同等の性能を発揮する。
ニューラルグラフデータ管理への取り組み [cs.DB, cs.AI]目的:ニューラルグラフデータベースの能力評価のための統一的なベンチマーク
- AIの発展は目覚ましいが,データベースに格納されたグラフのような構造化データ活用の難しさが課題である。
- 既存のベンチマークは単純な論理演算に限定されており,複雑なクエリや現実的なノイズへの対応が不十分である。
- 複雑なクエリ処理,ノイズへの堅牢性,分析精度といった構造化データ処理における限界を明らかにする。
- NGDBenchは,金融,医療,AIエージェントツールを含む5つの多様なドメインに対応したベンチマークである。
- 最先端のLLMやRAG手法の評価から,構造化された推論,ノイズへの耐性,分析精度に有意な制限があることが示された。
- NGDBenchは,ニューラルグラフデータ管理の進歩を促進するための重要なテストベッドとして機能する。
JAWS:空間適応的ヤコビアン正則化によるニューラル演算子の長期ロールアウトの強化 [cs.LG, cs.AI, physics.comp-ph]目的:連続力学系のシミュレーション効率向上
- 複雑な物理現象のシミュレーションは重要だが,計算コストが高い。
- 既存手法では,不安定性やスペクトル爆発が長期ロールアウトの課題。
- 空間的に異質な不確実性を考慮し,安定性と高周波特徴の維持を両立。
- JAWSは,局所的な物理的複雑さに応じて正則化強度を動的に調整する。
- これにより,滑らかな領域でのノイズ抑制と,特異点付近での勾配維持が可能となる。
- 本手法は,高周波不安定性の処理負担を軽減し,長期的な安定性,ショックの忠実度,および外挿汎化性能を向上させる。
VDCook:DIYビデオデータでMLLMを調理する [cs.LG, cs.AI, cs.IR, cs.MM]目的:マルチモーダル大規模言語モデル(MLLM)向けビデオデータ構築の自動化
- MLLMの性能向上には,大量の高品質な学習データが不可欠である。
- 既存のビデオデータセットは構築にコストがかかり,特定のドメインに適応が困難である。
- 専門的なビデオデータセットを容易に構築し,継続的に拡張可能な環境を提供する。
- VDCookは,自然言語による要求に基づき,ビデオデータの検索と合成を自動化するシステムである。
- 検索と合成の比率や品質閾値などのパラメータを調整することで,柔軟なデータ構築が可能である。
- 構築されたデータセットは,完全なProvenanceとメタデータ付きで,再現性のあるNotebookと共に提供される。
アテンションと到達可能性:文法制約LLMデコーディングにおける構造的同値性と効率性 [cs.CL, cs.FL, cs.LG]目的:文法制約デコーディングにおける構造的同値性と効率性の関係
- 自然言語処理において,文法構造を考慮した言語モデルの制御は重要な課題である。
- 文法制約デコーディングでは,文法表現の違いが計算コストに影響する可能性がある。
- 文法表現の構造的同値性に着目し,効率的なデコーディング手法を確立することを目指す。
- 文法が言語的に同等であっても,コンパイルされた状態空間やオンラインの曖昧性コストが異なる場合があることが示された。
- 特定の文法形式(右再帰 vs 連接)において,構造的曖昧性コスト(SAC)がそれぞれ$O(1)$,$O(t^2)$となることが理論的に証明された。
- 正確かつ効率的なオンラインマスキングエンジンには,特定のCFGファミリーに対して$\Omega(t^2)$の計算量が必要であるという下限が示された。
AI時代の人間・データ相互作用,探索,可視化:課題と機会 [cs.DB, cs.AI, cs.ET, cs.GR, cs.MM]目的:AI時代における人間・データ相互作用の課題と機会
- AI技術の進化は,人間中心システムに大きな影響を与え,データ分析のあり方を変えつつある。
- 大規模,異種,マルチモーダルのデータの取り扱いの複雑化,AIモデルの不確実性が課題となっている。
- AI時代のデータ分析における人間と機械の役割を再定義し,人間中心のシステム構築を目指す。
- AIの進展は,データ分析における遅延,スケーラビリティ,既存の相互作用の限界といった課題を露呈させている。
- 従来の効率性やスケーラビリティの指標を超え,認知,知覚,デザイン原則を取り入れたアプローチが求められる。
- 本研究は,AI技術の進歩がユーザーのデータとの関わり方に及ぼす影響を調査し,今後の研究方向性を示す。
EigenData:関数呼び出しデータ合成,監査,および修復のための自己進化型マルチエージェントプラットフォーム [cs.RO, cs.SE, cs.AI, cs.CL]目的:関数呼び出しデータに関する合成,監査,修復を行うプラットフォーム
- LLMの機能活用には,API等のツールと連携する能力が不可欠であり,そのためには質の高い学習データが必要である。
- 既存の学習データは,実行環境,バックエンドデータベース,多様な対話経路において品質が十分でない場合がある。
- 高品質な学習データの自動生成,既存データの品質評価と修正,より適切な評価指標の導入を目指す。
- EigenDataは,データベース構築,実行環境生成,対話経路合成を自動化するマルチエージェントシステムである。
- BFCL-V3を監査・修復し,関数スキーマ,実装,参照軌跡の体系的なエラーを特定・修正した。
- 結果として,修復されたベンチマークと結果重視の評価指標により,モデルランキングと人間の判断との相関性が大幅に向上した。
IntSeqBERT:剰余スペクトル埋め込みによるOEISにおける算術構造の学習 [cs.LG]目的:OEISにおける整数列の算術構造学習手法
- OEISは数学の多様な数列を包含し,数理科学研究の重要なデータソースである。
- 従来のトークン化モデルでは,未知語や周期的な算術構造を扱えず,予測性能が制限される。
- IntSeqBERTは,OEIS数列の予測精度向上と,その算術構造の理解を目指す。
- IntSeqBERTは,規模91.5Mパラメータのモデルで,95.85%の大きさの精度と50.38%の平均剰余精度(MMA)を達成した。
- 剰余スペクトルを取り除いた実験では,MMAが15.2pt低下し,大きさの精度も6.2pt低下した。
- 確率的中国剰余定理(CRT)ソルバーを用いることで,次項予測精度はトークン化Transformerベースラインの7.4倍に向上した。
時系列を用いた意思決定における確率過程モデルの自己相関効果 [cs.LG, cs.ET, math.PR, physics.optics]目的:時系列に基づく意思決定の確率過程モデルにおける自己相関効果
- 意思決定は様々な分野で重要であり,その効率化が求められている。
- 従来の意思決定モデルでは,複雑な動的挙動を捉えることが困難であった。
- 光混沌ダイナミクスを利用した高速意思決定のメカニズム解明を試みる。
- 報酬が多い環境では負の自己相関が,少ない環境では正の自己相関が最適であることが示された。
- 勝率の合計が1の場合,自己相関はパフォーマンスに影響しないことが数学的に明らかになった。
- 本研究は,無線通信やロボティクスにおける強化学習の意思決定スキーム改善に貢献する。
効率的かつ安定な海洋状態予測に向けた連続時間クープマンアプローチ [cs.LG, cs.AI, physics.app-ph, physics.comp-ph, physics.geo-ph]目的:海洋状態の長期予測のための軽量な代替モデル
- 気候変動予測は地球規模課題であり,高精度な海洋状態予測が不可欠である。
- 従来の数値シミュレーションは計算コストが高く,長期予測が困難である。
- 計算コストを抑えつつ,長期的な安定性を保つ予測手法を開発する。
- 連続時間クープマンオートエンコーダー(CT-KAE)は,長期間の予測において誤差の増加が抑制され,大規模統計量も安定している。
- 一方,自己回帰型Transformerは,予測期間の経過とともに誤差が増大し,エネルギーが変動する。
- CT-KAEは数値ソルバーと比較して,大幅に高速な推論が可能であり,効率的かつ安定なハイブリッドモデルの基盤として期待される。
記述論理概念におけるモデル変更 [cs.LO, cs.AI]目的:記述論理概念に対するモデル修正の形式化
- 知識表現の基盤技術であり,意味論的推論や知識ベースシステムの構築に不可欠である。
- 既存の研究では,モデルの変更操作の組み合わせが単純であるとの誤解がある。
- モデル変更の種類(排除,受容,修正)の形式的定義と,それらの関係性の解明を目指す。
- モデル変更として,排除,受容,修正の3つの主要な変更様式を定義した。
- 修正が排除と受容の単純な組み合わせに還元されないことを示した。
- ELおよびALC記述論理概念における排除と受容の整合性,ALC概念における修正の整合性に関する結果を得た。
AIが実力均衡化をもたらすとき:技能の均質化,資産集中,そして不平等の二つの様相 [cs.LG, cs.AI]目的:生成AIによる技能差の縮小と,それに伴う経済的価値の集中する補完的資産へのシフトに関する分析
- AI技術の発展は労働市場に大きな影響を与え,経済格差の拡大・縮小に繋がる可能性があり,その構造的理解が重要である。
- 既存の研究では,AIが労働者のスキルを代替することで格差を拡大する可能性が指摘されているが,AIがスキルを均質化する効果は十分に考慮されていない。
- 本研究は,AIの技術構造と労働市場の制度が,格差に与える影響のメカニズムを明らかにすることを試みる。
- 生成AIは,タスク内の技能差を縮小すると同時に,経済的価値を特定の資産に集中させることで,不平等の二つの様相を生み出す。
- モデル分析の結果,AIの技術構造(独占的か普及型か)と労働市場の制度(賃金分配の弾力性,資産集中度)が,不平等の様相を決定する境界を左右することが示された。
- 本研究は,AIが格差に与える影響のメカニズムを提示するものであり,AIの普及が必ずしも格差拡大に繋がるわけではないことを示唆する。
真の意味の整合:制約付きデカップリングと分布サンプリングによるクロスモーダル整合 [cs.LG, cs.CL]目的:クロスモーダル整合における意味整合性の向上
- 視覚情報と言語情報を統合する上で,意味の一貫性は不可欠である。多様な応用展開が期待される。
- 従来のアルゴリズムは意味情報以外の要素も埋め込みに含み,真の意味整合性を損なう可能性がある。
- 意味情報とモダリティ情報を分離し,意味情報のみを整合させることで,より正確な整合を実現する。
- 提案手法CDDSは,デュアルパスUNetを用いて埋め込みを適応的に分離し,効果的な分離を保証する。
- 分布サンプリングを用いることでモダリティ間のギャップを埋め,整合プロセスの合理性を確保する。
- 様々なベンチマークとモデルでCDDSの優位性が確認され,最先端手法を6.6%~14.2%上回る性能を示した。
FuseDiff:二重ターゲット構造に基づく薬物設計のための対称性を維持するジョイント拡散 [cs.LG]目的:二重ターゲット構造に基づく薬物設計における配位子と,それぞれのターゲットポケットに対応する結合ポーズの同時生成
- 薬物設計において,複数のターゲットに同時に作用する薬物の開発は,効果向上や耐性問題の解決に繋がる重要な課題である。
- 既存の手法は,ターゲット間の関係性を十分に考慮できず,最適な結合ポーズを同時に生成することが困難である。
- FuseDiffは,ターゲットポケット間の対称性を維持しつつ,配位子と結合ポーズを同時に生成することで,この問題を解決することを目指す。
- FuseDiffは,拡散モデルを用いて配位子分子グラフと二つのポケット特異的な結合ポーズをエンドツーエンドで生成する。
- Dual-target Local Context Fusion(DLCF)により,各配位子原子の局所コンテキストを両方のポケットから融合し,表現力豊かな同時モデリングを実現する。
- ベンチマークデータセットと実世界の二重ターゲットシステムにおける実験で,FuseDiffは最先端のドッキング性能を示し,ドッキング前検索における二重ターゲットポーズ品質の体系的な評価を可能にする。
CBR-to-SQL:医療分野におけるケースベース推論を用いた検索ベースのテキストToSQLアプローチの再考 [cs.IR, cs.AI, cs.CL]目的:電子健康記録(EHR)データベースからの情報抽出におけるSQL変換
- 医療分野における意思決定や研究において,EHRデータの活用が不可欠である。
- SQLの専門知識が必要となり,医療従事者にとってボトルネックとなっている。
- 医療用語の多様性やノイズに対応し,効率的かつ堅牢なSQL変換を目指す。
- CBR-to-SQLは,ケースベース推論(CBR)に着想を得た新しいフレームワークである。
- MIMICSQLデータセットにおいて,論理形式の精度で最先端の結果を達成した。
- 特に,データ不足や検索の擾乱に対して,標準的なRAGアプローチよりも高いサンプル効率と堅牢性を示した。
並列化可能なシーケンスモデルにおける深さの重要性:リー代数の視点 [cs.LG]目的:シーケンスモデルの深さと表現力の関係性
- シーケンスモデルは自然言語処理の根幹であり,高性能化が求められている。
- 並列化可能なモデルは効率的な学習を可能にするが,表現力とのトレードオフが存在する。
- モデルの深さが表現力に与える影響を数学的に解明し,最適な深さを考察する。
- 深さとリー代数拡張のタワーとの間に対応関係が存在することが示された。
- 定数深さのシーケンスモデルの表現力限界が理論的に特徴付けられた。
- 深さが増すにつれて誤差が指数関数的に減少することが導かれ,実験によって検証された。
PRISM:人間指示による操作のための模倣スキルの個別化洗練 [cs.RO, cs.AI]目的:ロボット操作における模倣ポリシーの洗練方法
- ロボットの自律的なタスク遂行には,効率的な学習が不可欠であり,模倣学習はその有効な手段の一つである。
- 模倣学習は,汎化性能が課題であり,未知の状況や制約への対応が困難である。
- 人間からのフィードバックを活用し,模倣ポリシーを洗練することで,汎化性能とデータ効率の向上を目指す。
- 提案手法PRISMは,模倣学習と強化学習を統合し,人間指示とフィードバックに基づいてポリシーを洗練する。
- シミュレーション実験の結果,人間のフィードバックを用いることで,よりロバストなポリシーが得られ,計算負荷も軽減されることが示された。
- PRISMは,既存のポリシーよりも優れた性能を示し,展開時の信頼性を高める。
コープマン正則化深層音声分離による話者検証 [cs.RO, cs.SD, cs.LG]目的:話者検証のための音声内容と話者特性の分離
- 話者検証は,個人認証が重要な応用において不可欠な技術であるため,その重要性が増している。
- 既存手法はラベル付きデータや大規模な事前学習モデルに依存し,拡張性や実用性に課題がある。
- コープマン演算子とインスタンス正規化を組み合わせ,効率的かつ原理的な話者表現学習を目指す。
- 提案手法DKSD-AEは,複数のデータセットで最先端のベースラインと同等以上の話者検証性能を達成した。
- 同時に,高い内容EERを維持し,効果的な分離が確認された。
- DKSD-AEは,パラメータ数を大幅に削減し,テキストによる教師なしで安定した性能を発揮する。
ツール創成:自己進化型言語エージェントのためのタスク駆動型ツール作成ベンチマーク [cs.SE, cs.AI]目的:自己進化型言語エージェントのツール作成能力の定量化
- 言語エージェントの自己進化研究は進んでおり,タスクに応じたツール作成・適応能力が重要視されている。
- 既存のベンチマークは事前定義された仕様に依存し,拡張性や自律的な進化を阻害している。
- 抽象的な要件のみからツールを作成し,現実の問題解決に活用できるかを評価することで,課題解決を目指す。
- 最先端モデルであっても,初回試行で正確なツールインターフェースや実行可能なロジックを生成するのは困難である。
- わずかな初期の欠陥がパイプライン上で増幅され,下流の指標が著しく低下する。
- 本ベンチマークは,実世界の問題に対応できる汎用的なツールの合成に向けた研究を促進することを期待する。
貨車入れ替え問題に対する新規ハイブリッドヒューリスティック強化学習最適化アプローチ [cs.LG, math.OC]目的:貨車入れ替え問題に対する最適化手法の開発
- 貨物列車の効率的な運行には,貨車入れ替え計画が不可欠である。
- 複雑な貨車入れ替え問題の最適解を効率的に求めることは困難である。
- 両側アクセス可能な留置線での複数列車編成を効率的に解決することを目指す。
- 本研究では,鉄道に特化したヒューリスティックと強化学習(Q学習)を組み合わせたHHRLフレームワークを提案する。
- HHRLフレームワークは,状態行動空間の削減と強化学習における探索の誘導に有効である。
- 数値実験の結果,HHRLアルゴリズムは単側アクセス,単機問題と両側アクセス,二機問題の両方で高い効率と品質を示す。
AI駆動による交通流パターンと土地利用の相互作用の時空間的異質性:GeoAIに基づく多imodal都市交通の分析 [cs.LG, cs.AI, eess.SP]目的:AI駆動による交通流パターンと土地利用の相互作用の時空間的異質性のモデル化
- 都市交通は,土地利用と移動需要の複雑な相互作用によって規定されるため,効率的な都市計画に不可欠である。
- 従来の回帰モデルや時系列モデルでは,多規模なダイナミクスと複数の移動モードを同時に捉えることが困難である。
- 本研究は,土地利用との相互作用を考慮した交通流パターンの時空間的異質性をより正確に捉えることを目指す。
- 提案するGeoAIハイブリッドモデルは,RMSEが0.119,R^2が0.891と,既存モデルを23-62%上回る高い性能を示した。
- SHAP分析の結果,自動車交通量には土地利用の多様性が,公共交通機関にはバス停の密度が最も強く影響することが示された。
- DBSCANクラスタリングにより,5つの機能的に異なる都市交通タイプが特定され,GeoAIハイブリッドモデルの残差は有意な空間的自己相関を示した。
バイアスを伴わないサブネットワークの発見:バニラモデルにおけるバイアスの問題 [cs.LG, cs.CV]目的:既存のバニラモデルから,公平でバイアスに依存しないサブネットワークの抽出
- 深層学習におけるアルゴリズムのバイアス問題は重要であり,公平性の確保が求められる。
- 従来のバイアス軽減手法は複雑な学習やデータ操作を必要とし,コストが高いという課題がある。
- 追加データや再学習なしに,既存モデル内に潜むバイアスフリーなサブネットワークを抽出する。
- 提案手法BISEにより,事前学習済みのバニラモデルからバイアスに依存しないサブネットワークを抽出可能。
- 抽出されたサブネットワークは,パラメータの変更なしに,バイアスに影響されにくい特徴量のみで高い性能を維持する。
- BISEは,データや再学習に依存する高コストな戦略とは異なり,構造的な適応による効率的なバイアス軽減を実現する。
物理基礎モデルにおけるトークナイザー事前学習の価値 [cs.LG, astro-ph.IM, cs.AI, physics.comp-ph]目的:物理エミュレーションの精度と効率に対するトークナイザー事前学習の影響
- 大規模シミュレーションデータから複雑な物理現象をモデル化する上で,基礎モデルの活用が重要になっている。
- 基礎モデルの同時学習は,個々のプロセスの効率を阻害する可能性がある。
- トークナイザーの事前学習により,物理基礎モデルの計算効率を改善すること。
- トークナイザーを自己符号化の目的で事前学習することで,下流タスクの計算効率が向上する。
- 特に,下流タスクと同じ物理システムで事前学習を行うと,最も効果が高かった。
- 同一ドメインでの事前学習は,64%のVRMSE削減を実現し,効率的な物理エミュレーターのトレーニングに貢献する。
デカップリングからカップリングへ:学習ベースのキーポイント検出に対するロバスト性検証と共同仕様 [cs.CV, cs.LG, cs.RO]目的:学習ベースのキーポイント検出におけるロバスト性
- キーポイント検出は,姿勢推定や3D再構成など多くのビジョンタスクの基盤技術である。
- ニューラルモデルは入力の微小な摂動に対して脆弱であり,形式的なロバスト性検証が不足している。
- キーポイント間の依存関係を考慮した,より正確なロバスト性検証手法を確立すること。
- 本研究では,ヒートマップに基づくキーポイント検出器に対し,全てのキーポイントにわたる偏差を束縛する初のカップリングされたロバスト性検証フレームワークを提案した。
- 提案手法は,各キーポイントを独立して検証するデカップリング手法と比較して,より高い検証率を達成し,厳しい誤差閾値下でも有効である。
- 検証をMILP問題として定式化し,モデルがロバストと認定された場合,その保証の正当性を証明した。
DreamCAD:微分可能なパラメトリックサーフェスを用いたマルチモーダルCAD生成のスケーリング [cs.CV, cs.AI]目的:マルチモーダルCAD生成の規模拡大
- CADは設計において不可欠であり,その自動化は生産性向上に繋がる。
- 既存の生成手法は,注釈付きデータセットの少なさやCAD特有のラベルの必要性に課題がある。
- 大規模な3Dデータセットを活用し,編集可能なCADモデルを生成することを目指す。
- DreamCADは,CAD固有の注釈なしに,点レベルの指示から編集可能なBRepsを直接生成する。
- DreamCADはパラメトリックパッチでBRepsを表現し,微分可能なテッセレーションを用いて大規模な学習を可能にする。
- ABCとObjaverseのベンチマークで最先端の性能を示し,ユーザの75%以上から好まれる結果を得た。
リアルタイムAIサービス経済:連続領域におけるエージェントコンピューティングのためのフレームワーク [cs.AI]目的:リアルタイムAIサービスにおける分散型資源配分メカニズムの実現可能性と効率性
- AIサービスがデバイス,エッジ,クラウドを跨いで発展し,資源配分の重要性が増している。
- 複雑な依存関係を持つAI処理パイプラインでは,分散型資源配分が不安定になり,管理が困難である。
- 依存関係グラフの構造を考慮したハイブリッド管理アーキテクチャによって,資源配分の安定化を図る。
- サービス依存グラフのトポロジーが,価格の安定性とスケーラビリティの主要な決定要因であることが確認された。
- ハイブリッドアーキテクチャは,スループットを犠牲にすることなく,価格変動を最大70~75%削減できることが示された。
- 分散型市場は,誠実な入札の下で,集中型の最適価値ベースラインに匹敵し,分散型協調が集中型の割り当て品質を再現できることが確認された。
RACAS:単一のエージェントシステムによる多様なロボットの制御 [cs.CL, cs.CL, cs.RO, cs.AI, cs.CL, cs.LG, cs.MA]目的:多様なロボットプラットフォームを制御するための単一のエージェントシステム
- ロボット技術の発展は,産業界や日常生活に大きな変革をもたらす可能性を秘めている。
- ロボットの制御には専門知識が必要であり,異なるロボットへの対応が困難である。
- 様々なロボットプラットフォームにおいて,容易に自律制御を実現することを目指す。
- RACASは,自然言語のみを用いてロボットを制御する協調エージェントアーキテクチャである。
- ロボットの説明,利用可能な行動の定義,タスクの仕様のみで,プラットフォーム間の変更は不要である。
- 車輪型ロボット,ロボットアーム,水中車両など,多様なロボットでタスクを確実に遂行できることを示した。
ハイスループットセルスクリーニングにおけるバッチ効果補正のための敵対的バッチ表現拡張 [cs.CV, cs.AI]目的:ハイスループットセルスクリーニングにおけるバッチ効果の軽減
- ハイスループットセルスクリーニングは,細胞の表現型プロファイリングに不可欠である。大規模データが生み出されるため,その品質管理が重要となる。
- 実験条件のばらつきがバッチ効果を引き起こし,機械学習モデルの汎化性能を低下させるという課題がある。
- 未知のバッチに対しても効果を発揮する,バッチ効果を抑制する新たな手法の開発が求められている。
- 敵対的バッチ表現拡張(ABRA)は,バッチ間の統計的変動を構造化された不確実性としてモデル化する。
- 表現空間における最悪のバッチ擾乱を生成することで,微細なクラス識別能力を維持しつつ,バッチ効果を軽減する。
- RxRx1およびRxRx1-WILDSベンチマークにおいて,ABRAはsiRNA擾乱分類において最先端の性能を達成した。
ロバストなマルチモーダル3D検出のための後処理段階での鳥瞰図特徴安定化 [cs.CV, cs.AI]目的:マルチモーダル3D検出におけるロバスト性の向上
- 自動運転技術において,正確な3D物体検出は重要な要素である。
- 鳥瞰図融合検出器は,ドメインシフトやセンサー故障に弱く,実用性に課題がある。
- 既存の検出器に組み込みやすく,ロバスト性を高めるモジュールの開発。
- 提案手法PFSは,既存の検出器の中間表現に作用し,特徴マップを改善することでロバスト性を実現する。
- PFSは,ドメインシフト下での特徴統計量の安定化,センサー故障領域の抑制,残差補正による弱体化キューの復元を行う。
- nuScenesベンチマークにおいて,カメラドロップアウトに対するロバスト性を+1.2%,低照度環境下での性能を+4.4% mAP向上させた。
観測された攻撃から敵対者の特徴を特定する [cs.LG]目的:観測された攻撃からの敵対者特徴特定フレームワーク
- 機械学習モデルは自動意思決定システムで利用されるため,その安全性確保は重要である。
- データ操作攻撃に対する防御は存在するが,攻撃者自体に着目した防御は少ない。
- 攻撃者の特徴を特定することで,より効果的な防御戦略を立案することを目指す。
- 攻撃者単独では特定不可能であることを理論的に証明した。
- 攻撃者の特徴を特定するためのドメインに依存しないフレームワークを提案した。
- 攻撃者に関する知識は,外的な緩和策や学習プロセスへの直接的な防御法の性能向上に役立つ。
拡散生成FID予測のための再構成FIDの改良 [cs.CV, cs.LG]目的:拡散生成モデルのFID(generation FID)との相関性向上
- 生成モデルの評価は重要であり,FIDはその主要指標の一つである。
- VAEの再構成FID(rFID)は拡散生成FID(gFID)との相関が低いという問題がある。
- rFIDの改良により,拡散生成モデルの評価精度向上を目指す。
- 提案手法iFIDは,rFIDの改良版であり,gFIDとの強い相関を示すことが確認された。
- rFIDは拡散モデルの改良段階のサンプル品質と相関し,iFIDはナビゲーション段階のサンプル品質と相関する。
- iFIDがgFIDと高い相関を示す理由を,拡散モデルの汎化と幻覚に関連付けて説明した。
3Dシーングラフにおける関係性意味推論による,オープンワールド対話型オブジェクト検索 [cs.RO, cs.RO, cs.HC, cs.RO, cs.AI]目的:オープンワールド対話型オブジェクト検索のための手法
- 家庭環境における効率的な探索には,オブジェクト間の意味関係の理解が不可欠である。
- 既存手法は,意味関係を捉えきれないか,リアルタイム処理が困難である。
- 3Dシーングラフを用いて,効率的かつ汎用的なオブジェクト検索を実現する。
- SCOUTは,シーングラフに基づいて探索を行い,部屋,フロンティア,オブジェクトにユーティリティスコアを付与する。
- LLMから抽出した構造化された関係知識を軽量モデルに蒸留し,オンロボット推論を可能にする。
- SymSearchというスケーラブルなベンチマークを提案し,対話型オブジェクト検索における意味推論を評価した。
大規模言語モデルにおける道徳的判断の脆弱性 [cs.CL, cs.AI, cs.HC]目的:大規模言語モデルの道徳的判断の安定性と操作可能性の検証
- 現代社会において,道徳的判断は個人や社会の行動指針として重要であり,その根拠を理解する必要がある。
- 大規模言語モデルは道徳的助言に利用されつつあるが,その判断の信頼性や一貫性には課題が残されている。
- 本研究は,大規模言語モデルの道徳的判断が,文脈や提示方法によっていかに変化するかを明らかにすることを目指す。
- 表面的な編集では判断の変動は少ない一方,視点の変更は不安定性を高めることが示された。
- 道徳的に曖昧な事例は特に影響を受けやすく,物語の語り口や課題の提示方法が判断に強く影響する。
- プロトコルの選択が最も大きな影響を与え,再現性や公平性の問題が示唆された。
DSAの盲点:TikTokにおける広告と未成年者プロファイリングのアルゴリズム監査 [cs.CY, cs.AI, cs.IR, cs.SI]目的:TikTokにおける広告と未成年者プロファイリングの実態解明
- デジタル環境における未成年者の増加に伴い,商業的影響を受けやすい脆弱性が問題となっている。
- DSA(デジタルサービス法)の定義が狭く,インフルエンサーマーケティング等の広告形態が規制対象外となっている。
- 未成年者保護のため,広告の定義を拡大し,DSAの規制範囲を拡張する必要がある。
- TikTokは,正式な広告に関してはDSAの規制を遵守しているように見える。
- しかし,開示済みまたは未開示の広告では,ユーザーの興味に基づいたプロファイリングが顕著に認められた。
- 特に,未開示の広告コンテンツにおけるプロファイリングが最も強く,未成年者へのパーソナライズ配信が行われている。
評価基準が機能しない場合:参照なし強化学習の後学習におけるエラー列挙を報酬として [cs.CV, cs.AI, cs.LG]目的:参照なし強化学習における報酬メカニズムの改善
- 強化学習は,現実世界の複雑なタスクへの応用が期待されるが,報酬設計が困難である。
- 従来の評価基準に基づく報酬設定は,理想的な正解が存在しない場合に有効性を発揮しない。
- 複数の有効な出力が存在するタスクにおいて,エラーの列挙を通じて報酬を生成することを目指す。
- 提案手法であるImplicit Error Counting (IEC) は,タスクに関連する軸に沿ってエラーを列挙し,重み付けスコアを適用することで報酬を生成する。
- 仮想試着(VTO)の事例研究では,IECは既存のRubrics as Rewards(RaR)を上回り,より細かい服装のエラーを捉えることが示された。
- 新たな評価指標であるCascaded Error Counting (CEC)と,属性ミスマッチを最大化するベンチマークMDressBenchを導入し,IECの有効性を検証した。
NBA選手の年俸予測におけるグラフベースのエンコーディングの価値 [cs.DC, cs.RO, cs.LG]目的:NBA選手の年俸予測
- スポーツ選手の市場価値評価は,年々変動する成績や所属地により困難である。
- ベテラン選手や高額な年俸選手の予測は,単純な表形式データでは課題が残る。
- オンコート・オフコートデータを知識グラフ化し,年俸予測モデルに組み込むことで,予測精度向上を目指す。
- 知識グラフの埋め込み表現を既存の表形式データに加えることで,年俸に影響を与える要因の理解が深まる。
- 複数のグラフ埋め込みアルゴリズムを比較検討した結果,この手法がNBA選手の年俸予測に不可欠であることが示された。
- 特に,経験豊富な選手や高額選手の年俸予測において,効果が認められた。
電力潮流ネットワーク解析のための強化学習 [cs.LG, cs.SC, math.AG]目的:電力潮流方程式の解の数に関するネットワークパラメータの探索
- 電力系統の安定運用には,電力潮流計算が不可欠であり,その効率的な解析手法が求められている。
- 大規模な電力系統ネットワークにおける解の数の算出は,計算代数的手法では困難である。
- 強化学習を用いて,電力潮流方程式の解が多いネットワークパラメータを効率的に探索する。
- 強化学習エージェントは,平均的なベースラインよりも多くの解を持つ電力潮流方程式のインスタンスを発見した。
- この結果は,電力潮流ネットワークの設計と解析における強化学習の可能性を示唆する。
- 複雑な非線形代数や幾何学の問題に対して,強化学習が貢献できる可能性を示した。
SecureRAG-RTL:検索拡張型,マルチエージェント,ゼロショットLLM駆動ハードウェア脆弱性検出フレームワーク [cs.RO, cs.CR, cs.AI]目的:ハードウェア記述言語における脆弱性検出の精度向上
- ハードウェアセキュリティは,現代社会の基盤であり,その重要性は増している。脆弱性の早期発見が不可欠である。
- ハードウェア記述言語のデータセットが不足しており,LLMのハードウェアセキュリティ検証への応用が制限されている。
- LLMのドメイン知識の不足を補い,ハードウェアセキュリティ検証の精度を向上させることを目指す。
- 提案手法SecureRAG-RTLは,多様なLLMアーキテクチャにおいて,ハードウェアセキュリティ検証の精度を大幅に向上させる。
- 平均して,検出精度を約30%向上させ,ドメイン知識のギャップを埋める有効性を示した。
- 14のHDLデザインから構成されるベンチマークデータセットを構築・アノテーションし,公開することで,今後の研究を支援する。
ランダム特徴リッジ回帰における弱から強への汎化によるスケーリング則の改善 [cs.CL, cs.LG, stat.ML]目的:弱から強への汎化によるスケーリング則の改善
- 機械学習において,モデルの性能向上にはラベル付きデータの重要性が増している。
- 教師モデルのラベルが不完全な場合,生徒モデルの性能が教師を超えられない場合がある。
- 教師モデルのラベルを利用して生徒モデルのスケーリング則を改善し,性能向上を目指す。
- 本研究では,弱から強への汎化がテスト誤差のスケーリング則に影響を与えることを示した。
- ランダム特徴リッジ回帰(RFRR)において,生徒モデルは教師モデルのスケーリング則を改善する可能性を明らかにした。
- バイアス優勢および分散優勢な設定の双方において,生徒モデルは教師モデルよりも優れた性能を示す。
大規模言語モデルの効率的な並列化戦略:アプリケーション固有のトレードオフとボトルネックの克服 [cs.DC, cs.LG, cs.PF]目的:大規模言語モデルのデプロイメントにおける並列化戦略の調査
- 生成AIの発展により大規模言語モデルの応用が拡大しており,高性能な推論システムの構築が重要となっている。
- モデルのパラメータがデバイスメモリを超える場合,並列化が必須となるが,遅延とスループットのトレードオフが存在する。
- 入力特性,バッチ処理,並列化戦略が遅延とスループットに与える影響を分析し,ボトルネックを特定することでSLAを満たす設計を目指す。
- Tensor Parallelism(TP)は遅延の改善に有効であり,Pipeline Parallelism(PP)はスループットの向上に適していることが示された。
- TPとPPのハイブリッド利用により,遅延とスループットのバランスを調整できることが明らかになった。
- 大規模言語モデルの推論性能を最適化するための設計指針が提示された。
オートマトン学習による状態空間モデルのウォームスタート [cs.LG, cs.FL]目的:オートマトンと状態空間モデルの関係性
- 機械学習におけるモデルの効率的な学習が重要視されている。
- 状態空間モデルの学習には大量のデータが必要となる場合がある。
- オートマトン学習の知識を状態空間モデルの初期化に活用する。
- ムーアマシンは状態空間モデルとして正確に実現可能であることが示された。
- 状態空間モデルは,オートマトン学習と比較して多くのデータを必要とする。
- オートマトン学習で学習した近似値で初期化することで,状態空間モデルの学習が高速化され,精度も向上した。
回折断層撮影のための進化LLM推論による自律的アルゴリズム発見 [cs.CE, cs.AI, cs.CL, cs.NA, math.NA]目的:回折断層撮影における新規正則化アルゴリズムの発見と進化
- 高解像度材料特性評価に不可欠な手法であり,その重要性は増している。
- 高品質な再構成には手動設計された正則化関数が不可欠だが,その設計は困難である。
- LLMを活用し,正則化アルゴリズムを自律的に発見・進化させることで,その課題を解決する。
- 提案手法Ptychi-Evolveは,従来の再構成手法と比較して,SSIMが最大0.26,PSNRが8.3dB向上した。
- LLMによるコード生成と進化機構を組み合わせることで,新規正則化アルゴリズムを自律的に発見した。
- 発見されたアルゴリズムの系統と進化メタデータを記録し,解釈性と再現性を確保した。
思考の連鎖の制御において,推論モデルは苦戦する [cs.CL, cs.DB, cs.AI]目的:推論モデルにおける思考の連鎖の制御可能性の評価
- 大規模言語モデルの推論能力が向上する中で,その振る舞いを監視する重要性が増している
- 思考の連鎖(CoT)を監視することでモデルの挙動を把握できるが,モデルがCoT自体を制御できてしまう可能性
- モデルがCoTを意図的に操作し,監視を回避する能力(CoT制御可能性)を測定し,その課題を明らかにすること
- CoT制御可能性は出力制御可能性よりも著しく低いことが示された。例えば,Claude Sonnet 4.5はCoTの2.7%しか制御できない
- モデルの規模が大きいほど,強化学習の訓練が進んでいるほど,CoT制御可能性は高くなる傾向がある
- モデルに監視されていることを伝えても,CoT制御可能性はわずかにしか向上せず,プロンプト最適化も効果は限定的であった
ガンマ線分光法における放射性同位体識別に対する教師なしドメイン適応 [cs.RO, cs.SY, eess.SY, cs.LG]目的:ガンマ線分光法を用いた放射性同位体識別におけるドメイン適応手法の有効性
- 放射性同位体識別は,環境モニタリングや核セキュリティにおいて重要な役割を担う。
- 実環境データの収集・ラベル付けは困難であり,モデルの汎化性能が課題となる。
- シミュレーションデータと実環境データの間のドメインギャップを解消し,識別精度を向上させる。
- 教師なしドメイン適応(UDA)により,シミュレーションデータで訓練したモデルの汎化性能を向上させることが示された。
- 最大平均不一致(MMD)を最小化する手法が,最も安定した性能向上をもたらした。
- 実験的なLaBr$_3$テストセットにおいて,MMD適用後の識別精度は0.904±0.022と,適用前の0.754±0.014を上回った。
