arXiv雑要約
AI - 2025/12/19 公開
リアルタイム複合現実アプリケーションのための安全なAI駆動型超解像 [cs.CY, cs.CR, cs.LG, cs.MM, eess.IV]目的:360度および6DoF点群ビデオの帯域幅削減と暗号化/復号化遅延の低減
- 没入型コンテンツの普及に伴い,高帯域幅と低遅延の重要性が増している。
- AR/VRストリーミングにおいて,帯域幅と暗号化/復号化遅延が大きな課題となっている。
- 点群コンテンツのダウンサンプリングとAI超解像による低遅延ストリーミングを実現する。
- サーバーでのダウンサンプリングと部分暗号化により,帯域幅と遅延をほぼ線形に削減できた。
- クライアント側では,AI超解像モデルがオリジナル点群を高い精度で復元し,推論時間も抑制された。
- 低解像度でのダウンサンプリングは,暗号化/復号化のオーバーヘッドを軽減する効果が認められた。
循環経済トリアージのための状態拡張グラフ [cs.AI]目的:循環経済における製品の最適な持続可能な経路の選定
- 資源枯渇や環境負荷増大への対策として,循環経済の実現が重要視されている。
- 使用済み製品の最適な処理方法の決定は複雑であり,効率的なトリアージ手法が求められている。
- 製品の解体履歴を考慮した状態拡張グラフにより,効率的なトリアージ判断を可能にする。
- 本研究では,状態拡張Disassembly Sequencing Planning (DSP) グラフを用いた新たな意思決定フレームワークを提案した。
- 状態をエンコードすることでマルコフ性を保証し,最適な再帰的評価を実現する。
- 電気自動車バッテリーの階層的トリアージ事例を通して,提案手法の柔軟性と適用可能性を示した。
人工的な内在可塑性ニューロンによる人間らしいワーキングメモリ [cs.CY, cs.AR, cs.ET, cs.AI, cs.CV, cs.NE]目的:人間らしいワーキングメモリの実現
- 脳のワーキングメモリは迅速な意思決定に不可欠であり,AIへの応用が期待される。
- 従来のAIは,高コストとノイズに弱いため,ワーキングメモリの効率的な実装が課題である。
- 本研究は,内在可塑性ニューロンを用いた,低消費電力でロバストなワーキングメモリの実現を目指す。
- 提案アーキテクチャIPNetは,MTJニューロンを用いて生物学的な記憶の揮発性を物理的にエミュレートする。
- n-backや自由想起などのタスクにおいて,人間の記憶特性と類似した挙動を示した。
- 様々なデータセットで,RNN,LSTM,2+1D CNNなどの既存手法を上回る性能と,大幅な省電力化を達成した。
推測型ツール呼び出しによるエージェント言語モデル推論の最適化 [cs.PL, cs.AI, cs.DC, cs.PF, cs.SE]目的:エージェント言語モデル推論の性能向上
- 言語モデルは外部ツールへの依存度が高まっており,その活用は重要である。
- ツール利用は性能ボトルネックとなり,推論速度を低下させる問題がある。
- ツール呼び出しの推測とキャッシュ活用により,推論の高速化を目指す。
- 推測型ツール呼び出しとキャッシュ最適化により,推論スループットが大幅に向上した。
- 数百トークン/秒の性能改善が確認され,エージェント言語モデルの効率的な運用に貢献する。
- 推測設定に関する理論的分析を行い,最適な性能を引き出すための指針を提示した。
言葉を超えて見る:マルチモーダル大規模言語モデルのための自己教師あり視覚学習 [cs.CV, cs.AI, cs.CL, cs.MM]目的:マルチモーダル大規模言語モデルにおける視覚理解の向上
- 視覚と言語の連携は重要であり,多様な応用が期待されている。
- 既存モデルはテキスト記述に依存し,視覚的詳細の理解が不十分である。
- 言語の事前知識への過学習を防ぎ,視覚的理解を深めることを目指す。
- JARVISは,言語指示の微調整規模が小さいことによる過学習を防ぐ。
- I-JEPA学習パラダイムを組み込むことで,視覚的特徴の学習を促進する。
- 標準的なベンチマークにおいて,JARVISは視覚中心のタスクにおいて性能を向上させた。
VET: 検証可能な実行履歴によるホスト非依存型自律性の追求 [cs.CR, cs.AI]目的:ホスト非依存型自律性の実現に向けた,検証可能な実行履歴のフレームワーク
- 近年,LLMを活用した自律エージェントが重要視されている。金融,紛争解決,ガバナンス等,高い信頼性が求められる分野での応用が期待される。
- 既存のエージェントはホストのインフラ上で動作するため,モデルや入出力の改ざんリスクがあり,真の自律性を損なう可能性がある。
- 本研究は,ホストに依存しない認証を可能にし,自律性の信頼性を高めることを目指す。
- VETフレームワークを提案し,エージェントの構成と検証に必要な証明システムをAID(Agent Identity Document)として定義した。
- APIベースLLMエージェントにVETを実装し,現実的なワークロードで評価した結果,Web Proofsが最も実用的であることが示された。
- 検証可能なトレーディングエージェントを開発し,Web ProofsとTEE Proxyの組み合わせでホスト非依存の認証が実現可能であることを実証した。
小児の不安ベンチ:小児相談における親の不安とプレッシャー下での大規模言語モデルの安全性評価 [cs.AI]目的:小児医療相談における大規模言語モデルの安全性
- 小児医療はデリケートであり,誤った情報が深刻な影響を及ぼす可能性があるため,安全性の確保が重要である。
- 大規模言語モデルの安全性評価は十分ではなく,特に現実世界のプレッシャー下での挙動は未知数である。
- 親の不安やプレッシャーが言語モデルの安全性に及ぼす影響を明らかにし,より安全なシステムを開発することを目指す。
- 大規模言語モデルを評価するための小児の不安ベンチマークを新たに構築し,300件の質の高いクエリを用いて評価を行った。
- 70Bモデルは8Bモデルよりも高い安全性を示したが,いずれのモデルも現実的な親のプレッシャーに対して脆弱性が見られた。
- 緊急性の高いクエリは安全性を低下させ,特にけいれんやワクチン接種後の質問において不適切な診断が頻発した。
配列データのためのt-SNE効率向上:カーネル選択からの知見 [cs.LG]目的:分子配列に対するt-SNEにおけるカーネル関数の評価と最適なカーネルの特定
- 高次元な生物学的配列データの可視化と解析には次元削減が不可欠である。
- t-SNEの伝統的なガウスカーネルは,データ依存性が低く,計算コストが高いという課題がある。
- 配列データに適したカーネルを選択し,t-SNEの効率と精度を向上させる。
- コサイン類似度カーネルが,ガウスカーネルやアイソレーションカーネルを含む他のカーネルよりも優れた性能を示す。
- コサイン類似度カーネルは,計算時間効率に優れ,低次元空間でのペアワイズ距離の保存にも優れている。
- 多様な生物学的データセットを用いた分類・クラスタリング実験で,コサイン類似度カーネルの頑健性が確認された。
大規模言語モデルの質問による知識グラフ生成のためのオープンソースシステム:Darth Vecdor [cs.AI]目的:大規模言語モデルからの知識抽出と構造化
- 医療分野を含む様々な領域で,知識グラフの利用が期待されている。
- LLMの直接的なクエリには,費用,速度,安全性,信頼性といった課題が存在する。
- LLMから事前に知識を抽出し,データベースでクエリ可能にすることで,上記課題の解決を目指す。
- Darth Vecdor (DV) は,LLMから知識を抽出し,SQLデータベースに構造化して保存するシステムである。
- DVは,誤った情報,的外れな回答,曖昧な表現などのLLMの応答の問題点を軽減する機能を提供する。
- DVは,ドメイン専門家が技術的な知識が少なくてもプロンプトエンジニアリングを容易に行えるよう,GUIを備えている。
物理科学における記号回帰の入門 [cs.LG, astro-ph.IM, cs.NE, physics.comp-ph, physics.data-an]目的:物理科学における記号回帰の応用と進展
- 物理現象の理解とモデル化において,解釈可能な数理関係の発見が重要である。
- 従来の回帰手法では,解釈性や物理的制約の組み込みが難しい場合がある。
- データから数理関係を自動的に発見し,効率的な物理モデルを構築すること。
- 記号回帰は,物理科学における効率的な経験モデリングと科学的発見への新たな道を提供する強力な手法として注目されている。
- 本特集では,有効理論の導出,経験的関数形の発見,計算コストの高いシミュレーションの代替モデル構築など,多様な応用事例が紹介されている。
- 今後の展望として,対称性制約や漸近的振る舞いなど,理論的情報を組み込むことが重要である。
知識グラフベースのRAGシステムにおける拡散活性化の活用 [cs.AI]目的:複雑な推論タスクに必要な多段階の証拠の検索と接続の改善
- 知識獲得と推論において,情報間の関係性を明示的に捉える重要性が増している。
- 既存のRAGシステムは,検索された情報の信頼性や関連性を適切に評価できていない。
- 自動構築された知識グラフを用いて拡散活性化アルゴリズムを適用し,RAGシステムの性能向上を目指す。
- 提案手法は,既存の反復RAG手法と同等以上の性能を達成し,様々なRAGアプローチに容易に組み込むことができる。
- Chain-of-thought反復検索と組み合わせることで,単純なRAGと比較して最大39%の正答率向上を実現した。
- 小規模なオープンウェイト言語モデルでも高い効果を示し,リソース制約下での有効性を実証した。
離散,ガウス,単体拡散の統一 [cs.LG]目的:離散,ガウス,単体拡散の理論的統合
- DNA,タンパク質,言語等の離散系列を拡散モデルで扱う重要性が高まっている。
- 既存モデルはアルゴリズム,理論構造,トレードオフが異なり,安定性に課題がある。
- 各モデルを同一のフレームワークで捉え,安定性と汎用性を向上させることを目指す。
- 本研究は,離散,ガウス,単体拡散をWright-Fisher集団遺伝モデルの異なるパラメータ化として統一的に記述した。
- 単体拡散の数値的不安定性を解消し,安定した拡散プロセスを実現した。
- 単一のモデルで複数のドメインに対応可能な拡散モデルを構築し,DNA生成において良好な性能を示した。
物語の枠組み:物語の意図と受容に関する文脈的推論 [cs.CL, cs.AI, cs.LG, cs.SI]目的:読者の反応に関する妥当な推論の抽出
- 物語は解釈,感情,評価を引き起こす。物語理解のメカニズム解明は重要である。
- 読者の反応をモデル化する計算機モデルは未発達であり,詳細な分析が困難である。
- 物語の文脈と理論に基づき,読者の反応を予測・説明する枠組みを構築する。
- SocialStoryFrames(SSF)という形式主義を提案し,読者の反応に関する推論を抽出可能にした。
- SSF-GeneratorとSSF-Classifierという二つのモデルを開発し,人間による調査と専門家による注釈で検証した。
- SSF-Corpusを用いて分析を行った結果,物語の意図の頻度とコミュニティ間での違いを特徴付けた。
DSO:バイアス軽減のための直接操作最適化 [cs.LG, cs.CL, cs.CY]目的:バイアス軽減とモデル性能のバランス制御
- 生成モデルは社会に浸透しつつあり,公平性が重要課題となっている。
- 生成モデルの判断は,入力データの属性に影響を受け,バイアスを生じやすい。
- 推論時のバイアス軽減制御とモデル性能維持を両立する手法の確立。
- DSOは,強化学習を用いて活性化関数に線形変換を施し,バイアスを軽減しつつモデル性能を維持する。
- VLMとLLMの両方において,公平性と能力のトレードオフを最適化する最先端の結果を達成した。
- DSOは,推論時にこのトレードオフを制御する機能を実務家にもたらす。
BarcodeMamba+: キノコ多様性研究のための状態空間モデルの進歩 [cs.LG]目的:キノコのDNAバーコードからの正確な分類
- 地球規模の生物多様性のモニタリングにおいて,DNAバーコードによる正確な分類は不可欠である。
- キノコはラベル付けが不十分で,分布が長尾型であるため,分類が困難である。
- 本研究は,キノコの分類におけるこれらの課題を解決することを目的とする。
- BarcodeMamba+は,キノコのDNAバーコード分類のための強力で効率的な状態空間モデルである。
- 従来の教師あり学習法と比較して,ラベル付けされたデータが少ない環境で優れた性能を示す。
- 階層的ラベル平滑化や重み付き損失関数などの改良により,分類精度が大幅に向上する。
文脈内半教師あり学習 [cs.LG]目的:文脈内半教師あり学習におけるTransformerの性能向上
- Transformerは文脈内学習で高い能力を示すが,理論的理解は限定的である。
- ラベルが少ない場合や存在しない場合でも性能が維持される点が課題である。
- ラベルなし文脈を利用し,よりロバストな表現学習を目指す。
- Transformerはラベルなし文脈を活用し,文脈依存の表現を学習できることが示された。
- この表現は正確な予測を可能にし,少ないラベル数でも性能が大幅に向上する。
- Transformerがラベルなし文脈を表現学習に利用する方法についての基礎的な洞察が得られた。
SALVE:ニューラルネットワークのメカニズム制御のためのスパースオートエンコーダ潜在ベクトル編集 [cs.LG, cs.AI, cs.CV]目的:ニューラルネットワークのメカニズム解釈とモデル編集を統合するフレームワーク
- 深層学習は高い性能を達成するが,解釈性と制御が課題である
- ニューラルネットワークの内部動作の理解が不十分であり,意図した制御が困難である
- モデルの内部特徴を特定し,それらの特徴を操作することで,モデルの振る舞いを制御する
- スパースオートエンコーダを用いてモデル固有の特徴基底を教師なしで学習することに成功した。
- Grad-FAMを用いて潜在特徴と入力データの関係を可視化し,特徴の妥当性を検証した。
- オートエンコーダの構造を利用した重み空間介入により,モデルの振る舞いを精密かつ永続的に調整することが可能になった。
効率的なエージェント型ツール呼び出しのための小型言語モデル:ターゲットを絞ったファインチューニングで大規模モデルを上回る [cs.HC, cs.AI]目的:エージェント型ツール呼び出しにおける費用対効果と運用効率の向上
- 生成AIの導入拡大に伴い,費用対効果と運用効率が持続可能性とアクセシビリティを左右する重要性が増している。
- 大規模言語モデルは計算資源を多く必要とし,日常的な企業利用には費用がかさむという課題がある。
- 特定の用途に最適化された小型言語モデルが,大規模モデルに匹敵する性能を発揮し,コストを削減できるか検証する。
- ファインチューニングされた小型言語モデルは,ToolBench評価で77.55%の正答率を達成し,ChatGPT-CoTやToolLLaMAなどのベースラインモデルを大きく上回った。
- ターゲットを絞った学習により,小型言語モデルでも費用対効果の高い生成AIの導入が可能になることが示された。
- 設計と学習方法の工夫により,生成AIの普及を促進し,大規模な実運用システムへの統合を容易にすると期待される。
AIE4ML:次世代AMD AIエンジン向けニューラルネットワークコンパイルのためのエンドツーエンドフレームワーク [cs.HC, cs.CY, cs.LG, cs.AR]目的:AMD AIエンジンにおける効率的なAI推論の実現
- AI処理需要の増加に伴い,高性能かつ低遅延なAIアクセラレータが不可欠となっている。
- AMD AIエンジンのVLIW実行,明示的なデータパス,ローカルメモリ管理が複雑であり,効率的な推論が困難である。
- ニューラルネットワーク全体を効率的にAIEに実装するための自動化されたフレームワークの構築。
- AIE4MLは,AIモデルを最適化されたファームウェアに自動変換する初の包括的なフレームワークである。
- 単一カーネルレベルでは,アーキテクチャのピークに近い性能を達成し,グラフレベルでは,2次元AIE-MLファブリック全体でスケーリング可能な並列化手法を提供する。
- 実世界モデルの評価において,マイクロ秒以下の遅延でGPU同等のスループットを実現し,トリガーシステムなど,超低遅延環境での利用を可能にする。
主観的関数 [cs.AI, q-bio.NC]目的:目的関数の創出と選択
- 知能の根幹をなす目標設定のメカニズム解明が重要である。
- 人工知能における自律的な目標設定の欠如が課題である。
- 主観的関数の概念を通して,目標設定能力の獲得を目指す。
- 本研究では,主観的関数という概念を提案し,その有用性を示した。
- 予測誤差を主観的関数の具体例として検討し,理論的基盤を構築した。
- 心理学,神経科学,機械学習との関連性を示唆し,学際的な展望を開いた。
エビデンスに基づくガバナンス:決定木モデルにおける規制対象予測変数 [cs.LG]目的:決定木モデルにおける規制対象予測変数の特定と法的根拠の関連付け
- 機械学習の利用拡大に伴い,データのプライバシー保護が重要課題となっている。
- 既存の研究では,規制対象となる可能性のあるデータが利用されている実態が明らかになっていない。
- 機械学習の実践において,プライバシー保護に配慮した方法論を確立するための基礎情報を提供する。
- 発表されている決定木モデルの研究から予測変数を抽出し,それらがどの規制カテゴリーに該当するかを特定した。
- 多くの予測変数が,医療データや個人識別情報など,規制対象のカテゴリーに該当することが分かった。
- 業界や時期によって規制対象変数の構成に差が見られ,プライバシー保護の重要性が高まっていることが示唆された。
低コストRFIDとガウス過程モデルによる山火事資材の追跡 [cs.LG]目的:山火事対応における資材追跡のための,低コストで拡張性のある手法
- 山火事の被害軽減には,迅速かつ的確な資材の配置が不可欠である。
- 森林環境下では,電波減衰や多重反射により,RFIDタグの正確な位置特定が困難である。
- 事前位置情報が不明な状況下でも,RFIDタグを高精度に位置特定することを目指す。
- ガウス過程モデルを用いることで,既知のGPSに匹敵する精度での位置特定が可能となった。
- 本手法は,事前の位置情報設定を必要とせず,低コストなRFIDタグを用いた資材追跡を実現する。
- 可動式リーダー近傍において,多数の資材を同時に追跡できる可能性が示された。
視覚こそが信頼を生み,予測を可能にする:Vision Language Modelを用いた文脈を考慮した複数人物行動予測 [cs.CV, cs.AI]目的:複数人物の行動予測
- 人が存在する環境で活動するロボットにとって,正確な行動予測は不可欠である。
- 既存研究は単独人物の行動予測に偏っており,第三者視点での複数人物の理解が課題である。
- 第三者視点における複数人物行動予測の精度向上を目指す。
- 提案手法CAMP-VLMは,視覚情報とシーングラフを活用し,人間とシーンの相互作用予測を強化する。
- フォトリアリスティックなシミュレーターで生成した合成データを用いてファインチューニングを行い,汎化性能を評価した。
- Supervised Fine-TuningとDirect Preference Optimizationにより,ベースラインを最大66.9%上回る予測精度を達成した。
BRAID:自律的な推論と意思決定のための有界推論 [cs.CL, cs.AI]目的:大規模言語モデルにおける構造化プロンプティングの定量的な研究
- LLMは,性能,コスト,トークン使用量の間に関係があり,自律エージェントの効率化が重要。
- LLMはトークン数を増やすことで性能向上するが,コストと効率が課題。
- 有界推論フレームワークにより,コスト効率と推論精度を向上させる。
- BRAIDはMermaidベースの命令グラフを使用し,モデルが構造的に推論可能にする。
- 複数のGPTモデルで,AdvancedIF,GSM-Hard,SCALEのベンチマークデータセットで評価。
- 構造化された機械可読のプロンプトが,推論精度とコスト効率を大幅に向上させる。
大規模言語モデルにおける適応型低ランク多頭自己注意のための動的ランク強化学習 [cs.LG, cs.CL]目的:大規模言語モデルにおける多頭自己注意の低ランク分解の適応的最適化
- 大規模言語モデルの性能向上には,計算効率とメモリ使用量の最適化が不可欠である。
- 従来の低ランク近似は静的なランクに依存するため,多様な入力に対応する柔軟性に欠ける。
- 入力の状況に応じてランクを動的に調整し,計算コストを削減しつつ精度を維持すること。
- 動的ランク強化学習(DR-RL)は,フルランクの注意機構と同等の精度を維持しながら,浮動小数点演算回数(FLOPs)を大幅に削減する。
- DR-RLは,リアルタイムの系列ダイナミクス,層ごとの感度,ハードウェア制約に基づいてランクを動的に選択する。
- オンライン行列摂動の理論に基づき,推論時の完全分解のコストを回避し,スケーラブルな展開を実現する。
実証ソフトウェア工学における堅牢なLLMベースのアノテーションフレームワーク:OLAF [cs.SE, cs.AI]目的:LLMベースのアノテーションにおける信頼性,較正,ドリフト,合意,集約,透明性のための主要な構成要素
- 実証ソフトウェア工学は,ソフトウェア開発の改善に不可欠であり,その質を客観的に評価する必要がある。
- LLMを用いたアノテーションの信頼性や再現性が検証されておらず,標準化された評価指標が不足している。
- LLMベースのアノテーションを測定プロセスとして捉え,透明性と再現性を高めるための議論を促す。
- 本研究では,LLMベースのアノテーションフレームワークOLAFを提案し,主要な構成要素を整理した。
- OLAFは,信頼性,較正,ドリフトなどの評価指標を明確化し,LLMアノテーションの品質向上を目指す。
- 本研究は,ソフトウェア工学におけるLLMベースのアノテーションに関する今後の研究の方向性を示す。
ソフトウェアの意図を埋め込む:軽量なJavaモジュール復元 [cs.SE, cs.AI]目的:Javaシステムのモジュール復元
- ソフトウェア規模の拡大に伴い,コードレベルの抽象化だけでは管理が困難になっている。
- 既存のアーキテクチャ復元技術では,Java9のJPMSモジュールへの効果的な移行が難しい。
- JPMSモジュールへの移行を容易にするための,軽量かつ効率的なモジュール復元手法を提案する。
- 提案手法ClassLARは,パッケージ名とクラス名から意味情報を抽出し,構造と機能の両方の意図を捉える。
- 20のJavaプロジェクトの評価において,ClassLARは既存手法よりもアーキテクチャレベルの類似度が高く,実行時間も速かった。
- ClassLARは,最先端の手法と比較して,3.99〜10.50倍の速度で処理を完了した。
3Dメッシュ圧縮のための階層ニューラルサーフェス [cs.CG, cs.GR, cs.LG]目的:3Dメッシュのコンパクトな表現
- 3Dデータの取り扱いにおいて,効率的な圧縮技術は重要である。データサイズ削減と高速処理を両立する必要がある。
- 従来のメッシュ表現は汎用性が高い一方,データサイズが大きくなる傾向がある。
- 本研究では,ニューラル表現を用いて,高効率な3Dメッシュ圧縮を実現することを目指す。
- 提案手法では,3Dメッシュを単位球面上のパラメータ表現に変換し,変位ベクトル場をニューラルネットワークで表現する。
- 階層構造を持つニューラル表現を用いることで,粗い構造から高周波な詳細まで段階的に形状を再構成する。
- 本手法は,再構成品質と圧縮サイズのトレードオフにおいて,既存手法を上回る性能を達成する。
一般重ね合わせからの特徴量の確実な抽出 [cs.LG, cs.AI, cs.DS, stat.ML]目的:重ね合わせられた特徴量の抽出
- 機械学習モデルの解釈可能性向上は重要であり,その鍵はモデルがどのように特徴量を表現しているかの理解である。
- 複雑なモデルでは特徴量が重ね合わされ表現されるため,個々の特徴量を特定することが困難である。
- 本研究は,特徴量の重ね合わせから,特徴方向と関数を効率的に復元することを目的とする。
- 提案アルゴリズムは,ノイズを含む関数へのクエリアクセスから,非退化的な応答を持つすべての特徴方向を特定する。
- 既存研究よりも一般的な設定で機能し,ほぼ任意の特徴量の重ね合わせを扱うことができる。
- フーリエ空間における探索により,隠れた特徴方向を反復的に絞り込むことで実現している。
ニューラルネットワークの時間周波数解析 [math.NA, cs.IT, cs.LG, cs.NA, math.IT]目的:ニューラルネットワークの近似理論
- 機械学習の性能向上には,ニューラルネットワークの理論的理解が不可欠である。
- 標準的なニューラルネットワークの近似能力には限界があり,より効率的なネットワーク構造が求められている。
- 時間周波数解析のツールを用いて,ニューラルネットワークの近似性能を定量的に評価し改善を目指す。
- 重み付き変調空間における近似率が,Sobolevノルム上で次元に依存しない形で証明された。
- 変調ベースのネットワークは,ReLUネットワークよりもSobolev近似において優れた性能を示すことが数値実験で確認された。
- Feichtinger代数やFourier-Lebesgue空間など,様々な関数空間における近似定理が導かれた。
高階LaSDI:多重時間微分によるモデル次数の削減 [cs.RO, eess.SY, cs.SY, cs.LG]目的:複雑な偏微分方程式の高速近似
- 物理科学において,偏微分方程式の解法は不可欠であり,高性能な計算資源が求められる。
- 従来のモデル次数の削減手法では,長時間の予測精度が低下するという課題が存在する。
- 本研究は,長時間の予測精度を向上させることを目指し,新たな手法を提案する。
- 高階で安価な有限差分スキームとRollout損失関数を導入することで,モデル次数の削減を可能にした。
- 2次元Burgers方程式への適用により,提案手法の有効性を検証した。
- 提案手法は,従来のモデル次数の削減手法と比較して,長時間の予測精度が向上することが示された。
代理ニューラルアーキテクチャ共同設計パッケージ (SNAC-Pack) [cs.LG, cs.AI, hep-ex]目的:FPGA展開を焦点としたニューラルネットワークの探索と最適化
- AI利用の拡大に伴い,ハードウェア資源効率が重要課題となっている。
- 既存手法は,ビット演算等のプロキシ指標に依存し,実ハードウェア性能の最適化が困難である。
- ハードウェアを考慮したニューラルアーキテクチャ探索による効率的なモデル設計を目指す。
- SNAC-Packは,高エネルギー物理ジェット分類タスクにおいて63.84%の精度を達成した。
- Xilinx Virtex UltraScale+ VU13P FPGA上での合成結果は,ベースラインの精度を維持しつつ,従来のBOPs指標で最適化されたモデルと同等のリソース利用率を示した。
- 本研究は,リソース制約のある環境におけるハードウェア対応ニューラルアーキテクチャ探索の可能性を示す。
情報理論と識別的サンプリングによるモデル発見 [cs.IT, cs.LG, math.AP, math.DS, math.IT]目的:モデル発見のための情報理論的アプローチ
- 複雑な動力学系の理解と解析には,情報理論が不可欠である。
- データ駆動型モデル発見では,効率的なデータサンプリングが課題となる。
- 情報量に基づいたサンプリングにより,効率的なモデル学習を目指す。
- フィッシャー情報行列とシャノンエントロピーの分析を通じて,情報パターンを可視化した。
- 情報に基づいたサンプリングは,単一または複数の初期条件において,モデル性能を向上させた。
- 統計的バギングの利点が,フィッシャー情報行列のスペクトル分析によって明らかにされた。
知識誘導機械学習のためのファインチューニングに基づくサイト較正:結果の要約 [cs.HC, cs.RO, cs.LG, cs.AI]目的:知識誘導機械学習におけるサイト較正のためのファインチューニング手法
- 気候変動緩和と持続可能な農業にとって,農生態系の炭素循環の正確かつ費用対効果の高い定量化は不可欠である。
- 異質データと複雑なスケール間依存性のため,転移学習と空間的変動の活用は困難である。
- 転移学習と空間的異質性を活用し,変動の大きい地域での適用可能性を向上させることを目指す。
- FTBSC-KGMLは,リモートセンシングデータ,気候データ,土壌データを用いて土地からの排出量を推定し,転移学習と空間的異質性を活用する。
- 空間的異質性を考慮した転移学習スキームにより,限られたデータ下でも高い局所精度を実現し,解釈性を維持する。
- FTBSC-KGMLは,グローバルモデルと比較して,検証誤差が低く,説明力の整合性が高く,空間的変動をより適切に捉えることが示された。
ソーシャルナビゲーションにおけるロボットの性能に対する人間の認識の少数ショット推論 [cs.RO, cs.AI]目的:ロボットの性能に対する人間の認識予測の精度向上
- 人間とロボットの協調が重要視される中で,ロボットの社会的受容性が課題となっている。
- 従来のユーザー調査はコストがかかるため,大規模なデータセットを用いた機械学習が求められている。
- 大規模言語モデルの少数ショット学習能力を用いて,データ量の制約を克服することを試みる。
- 大規模言語モデルは,従来の教師あり学習モデルと同等以上の性能を発揮し,必要なラベル付きインスタンス数を大幅に削減した。
- 文脈内事例数が増加することで予測性能が向上し,本手法のスケーラビリティが確認された。
- 入力特徴量のアブレーションスタディにより,LLMが性能予測に用いるセンサー情報の種類が明らかになった。
会話型時系列基盤モデル:説明可能で効果的な予測に向けて [cs.AI]目的:時系列予測における最適なアンサンブルの編成
- 時系列データ分析は,経済,気象,医療など幅広い分野で不可欠であり,高精度な予測が求められている。
- 既存の時系列基盤モデルは,一貫して優れた性能を示すものがなく,最適なモデル選択が困難である。
- 大規模言語モデルを活用し,アンサンブルの評価と調整を通じて,予測精度と解釈可能性の両立を目指す。
- 提案手法は,GIFT-Evalベンチマークにおいて,CRPSおよびMASE指標で既存の時系列基盤モデルを大きく上回り,最新技術を確立した。
- 大規模言語モデルを,時系列予測アンサンブルの賢明な判断者として再配置し,因果関係に基づいた説明を可能にした。
- SHAP値に基づいた忠実度スコアを用いたR1スタイルのファインチューニングにより,モデルが時系列の動的な解釈を学習した。
大規模言語モデルにおけるクロスリンガルバイアス検証 [cs.RO, cs.RO, cs.CY, cs.AI, cs.CL]目的:大規模言語モデルにおけるバイアスの多言語評価
- 言語の多様性が増す中,AIの公平性が重要となる。
- 言語によってバイアスの現れ方が異なり,評価が困難である。
- 多言語におけるバイアスの違いを定量的に明らかにすること。
- 大規模言語モデルは言語によってバイアスの程度が大きく異なる。
- アラビア語やスペイン語はステレオタイプバイアスが高い傾向が見られた。
- 年齢に関するバイアスは明示的な評価では低いが,暗黙的な評価では高いことが示された。
大規模言語モデルは知らないことを知っているか?:予測市場による認識的校正の評価のための新しいベンチマーク KalshiBench [cs.AI]目的:認識的校正の評価
- 言語モデルの信頼性は,その応用において不可欠であり,誤った判断を避けるために重要である。
- 大規模言語モデルは高性能だが,将来予測における不確実性の定量化が課題となっている。
- 未知の事象に対する不確実性を適切に評価できるか否かを検証し,校正能力の向上を目指す。
- 大規模言語モデルは,全体的に過信傾向にあることが明らかになった。
- 最も校正されたモデル(Claude Opus 4.5)であっても,依然として大きな校正誤差が見られた。
- スケーリングや推論能力の向上だけでは,認識的校正の向上が保証されないことが示唆された。
熱管マイクロリアクターの技術経済的最適化,第I部:理論とコスト最適化 [cs.LG, cs.CE]目的:熱管マイクロリアクターの経済性と性能を向上させるための設計最適化
- 遠隔地におけるエネルギー供給において,輸送性と自己制御性が求められるため,マイクロリアクターが注目されている。
- マイクロリアクターは規模の経済性が低く,経済的妥当性が課題となっていた。
- 経済性と物理的制約を考慮した設計最適化により,マイクロリアクターのコスト削減を目指す。
- ガウス過程や多層パーセプトロンを用いた代替モデルと強化学習を組み合わせた設計最適化アプローチを提案した。
- 特に軸方向反射材のコストが高い場合と低い場合を検討し,設計パラメータの最適化により均等化発電原価(LCOE)を57%以上削減できることを示した。
- 運用維持費や初期投資費用がLCOEに大きく影響し,特に軸方向反射材や制御ドラム材料のコストが重要であることがわかった。
高等教育における責任ある生成AI適応のためのトピック発見と分類 [cs.IR, cs.CL, cs.AI]目的:生成AI関連ポリシーの発見と分類
- 教育現場における生成AI利用が急速に拡大しており,その影響を理解し適切に活用する必要がある。
- 各教育機関の生成AIに関するポリシーはばらつきが大きく,学生は期待される行動やベストプラクティスを理解しにくい。
- 本研究は,コースシラバスやポリシー文書から生成AI関連ポリシーを自動的に発見・分類し,学生への情報提供を支援する。
- コースシラバスやポリシーウェブサイトからAI関連ポリシーを自動的に発見・分類するシステムを開発した。
- トピック発見のコヒーレンススコアは0.73を達成し,GPT-4.0によるポリシー分類では,精度0.92~0.97,再現率0.85~0.97を示した。
- 本ツールは,生成AIの安全かつ効果的な教育利用を促進し,学生が関連ガイドラインを理解し遵守するのに役立つ。
ビッグデータにおける不正検知のための説明可能なAI [cs.LG]目的:ビッグデータ不正検知のための説明可能なAIの統合
- 金融,保険,サイバーセキュリティ等,現代アプリケーションにおいてビッグデータは不可欠であり,リスク評価や不正検知に利用されている。
- 自動化された分析への依存度が高まるにつれ,透明性,規制遵守,信頼性に関する懸念が生じている。
- ビッグデータ環境下での説明可能なAIのスケーラビリティ,リアルタイム処理,グラフ・時系列モデルへの適用という課題の解決を目指す。
- 本研究では,分散ストレージシステム,ストリーミングプラットフォーム,異常検知,グラフベースのアプローチ,アンサンブル分類器を含む主要な分析ツールを概観した。
- LIME,SHAP,反事実的説明,注意メカニズムなどの一般的なXAI手法を検討し,大規模展開時の強みと限界を分析した。
- スケーラブルなビッグデータインフラストラクチャと文脈を考慮した説明メカニズム,そして人間のフィードバックを統合する概念的フレームワークを提案した。
LLMを裁判官として評価する上で,私たちは正しい道を進んでいるのだろうか? [cs.DC, cs.CL, cs.AI]目的:LLMを裁判官として評価するための新規評価スイートの開発と,その信頼性評価
- LLMの能力評価は,その発展と応用において不可欠であり,客観的かつ効率的な評価手法の確立が求められている。
- 既存のLLM評価は,人間のアノテーションに依存しており,人間のバイアスやスケーラビリティの制約といった課題が存在する。
- 人間のアノテーションを必要とせず,LLM裁判官の品質を客観的に評価できる手法を確立し,LLMの信頼性を検証すること。
- 本研究では,合理的な選択理論に基づき,LLM裁判官の品質を評価する新しい指標として,局所的な自己整合性と全体的な論理整合性を提案した。
- 開発した評価スイートSageを用いて実験を行った結果,提案指標は既存の評価指標と高い相関を示し,SageがLLM裁判官の評価において信頼できることを確認した。
- 現在の最先端LLMは,裁判官として機能する際に,約4分の1の難しいケースで一貫性のない判断を示すことが明らかになり,状況依存的な選好がその原因である可能性が示唆された。
CauStream:河川流量予測のための因果時空間表現学習 [cs.AR, cs.LG, cs.AI, cs.CE, stat.ML]目的:河川流量予測のための因果時空間表現学習
- 水資源管理や災害軽減において,河川流量予測は不可欠である。
- 深層学習モデルは予測性能が高い一方,解釈性や汎化性能に課題がある。
- データに適応可能な因果グラフ構造を学習し,予測精度と解釈性を向上させる。
- CauStreamは,気象強制因子の間のランオフ因果グラフと,観測局間の動的依存性を捉えるルーティンググラフを同時に学習する。
- 3つの主要な米国河川流域での評価において,既存最先端手法を凌駕し,予測期間が長くなるにつれて性能差が拡大した。
- 学習された因果グラフ構造は,確立された水文学的知識と一致しており,流域の動態に関する解釈可能な洞察を提供する。
自動定性的分析のためのマルチエージェント大規模言語モデルフレームワーク [cs.HC, cs.AI]目的:患者の体験理解に基づく患者中心型ケアの推進
- 患者の体験を理解することは,特に継続的なコミュニケーションが求められる慢性疾患において,患者中心型ケアを進める上で重要である。
- 定性的テーマ分析は,労働集約的で主観的であり,規模を拡大することが困難である。
- 本研究は,定性的テーマ分析の自動化を目指す。
- CoTIは,心不全患者のインタビュー分析において,上級研究者と類似したキーフレーズ,テーマ,コードブックを特定した。
- CoTIを搭載したアプリケーションは,定性的分析におけるAIと人間のインタラクションを可能にした。
- CoTIと初級研究者の共同作業ではわずかな改善しか見られず,初級研究者がCoTIに過度に依存する可能性が示唆された。
土壌中の鉛汚染検知における無線周波数に基づくセンシングの実現可能性 [cs.ET, cs.AI, eess.SP]目的:土壌中の鉛汚染の検知
- 都市部の土壌汚染は食の安全や健康に影響し,都市緑化の妨げとなるため,対策が重要である。
- 既存の鉛測定技術は,労力とコストがかかるという課題がある。
- 無線技術に基づいた,携帯可能で安価な鉛検知デバイスの開発を目指す。
- 提案システムSoilScannerは,土壌中の塩類の違いが無線信号の伝搬に与える影響を利用し,鉛を検知する。
- 実験の結果,SoilScannerは土壌サンプルを低鉛と高鉛に72%の精度で分類できた(閾値200ppm)。
- 500ppmを超える高濃度の鉛サンプルは誤分類されなかったことから,実用性が見込まれる。
深層集合を用いた文脈内多演算子学習 [cs.LG]目的:文脈内学習における多演算子回復能力
- 偏微分方程式の解法は科学技術の根幹であり,高精度な予測が求められる。
- 従来の数値解析手法は,問題ごとにモデルを構築する必要があり,汎用性に課題がある。
- 訓練データに含まれない未知の偏微分方程式に対して,例から解演算子を学習する手法を確立すること。
- 深層集合(DeepOSets)は,重み更新なしにプロンプト内の例から未知の偏微分方程式の解演算子を回復できることを示した。
- 深層集合は,特定の連続演算子クラスに対する普遍的な一様近似器であることが示された。
- ポアソン方程式や反応拡散問題を対象とした実験で,訓練中に見られなかった偏微分方程式の解を高い精度で予測できることが確認された。
FOD-Diff:線維方向分布推定のための3次元多チャンネルパッチ拡散モデル [cs.CV, cs.LG]目的:線維方向分布の推定
- 白質構造の評価において,拡散テンソル画像(dMRI)による線維方向分布の推定が不可欠である。
- 低分解能dMRIからの推定精度が課題であり,高分解能dMRIはスキャン時間が長くなる。
- 低分解能データから高分解能データを効率的に生成する手法の開発が求められている。
- 提案手法は,線維方向分布の高分解能化において,最先端の手法を上回る性能を達成した。
- 脳解剖学的情報を活用するパッチアダプターと,ボクセルレベルの協調モジュールを導入した点が有効である。
- 球面調和係数の複雑な相関を学習するSHアテンションモジュールも,性能向上に貢献している。
VR環境における感情的な3Dアニメーション生成モデルの評価 [cs.HC, cs.AI, cs.MA]目的:感情的な3Dアニメーション生成モデルの評価
- 社会的交流において,感情表現は言葉と共に重要な役割を担う。
- 従来の2D評価指標では,人間の感情認識を十分に捉えきれない。
- VR環境下でのユーザー主観評価により,モデルの有効性を検証する。
- 感情を明示的にモデル化した手法は,単なる音声同期に注力した手法よりも高い感情認識精度を示した。
- 幸福感を示すアニメーションは,中立的なアニメーションよりもリアリティと自然さの評価が高かった。
- 生成モデルは,再構成ベースの手法と比較して表情の質において劣り,楽しさやインタラクションの質も低かった。
LLM効率的な関数従属性グラフ再ランクによるスキーマフィルタリングを用いたText2SQLのスケーリング [cs.CC, cs.DB, cs.AI, cs.HC, cs.LG]目的:大規模言語モデル(LLM)を用いたText2SQLシステムの効率的なスキーマフィルタリング手法
- 自然言語による質問からSQLを生成するText2SQL技術は,データベース操作の自動化に不可欠である。
- 大規模データベースのスキーマはLLMのコンテキスト長を超えることが多く,性能低下の原因となる。
- スキーマフィルタリングによりLLMへの入力サイズを削減し,大規模スキーマへの対応を目指す。
- 提案手法は,クエリを意識したLLMエンコーダと関数従属性グラフ変換器を組み合わせ,効率的にスキーマをフィルタリングする。
- 実データセット実験の結果,既存手法よりも高い再現率と精度を達成し,23,000以上のカラムを持つスキーマにも対応可能である。
- 提案手法は,サブ秒単位の低遅延を維持しつつ,大規模スキーマへのスケーラビリティを示す。
プライバシーの曖昧さ:画像データ公開におけるプライバシーと有用性の定量化 [cs.LG]目的:画像データ公開時のプライバシーと有用性の定量化
- 画像データは機械学習に不可欠だが,個人情報を含む場合が多く,その取り扱いが重要である。
- 従来のぼかし処理はプライバシー保護に不十分であり,情報漏洩のリスクがある。
- プライバシーを保護しつつ,画像データの有用性を維持する方法を確立すること。
- ガウシアンぼかしは実装上の制約により,実際にはプライバシー保護が脆弱であることが示された。
- ピクセレーションやノイズ付加ピクセレーションは,適切な設定によりプライバシーと有用性の両立が可能であることが示された。
- 提案手法とパラメータをまとめたソフトウェアパッケージ「Privacy Blur」が公開されている。
