arXiv雑要約
AI - 2026/04/30 公開
選択肢の順序のランダム化が,プロンプトによるサンドバッギングにおける位置的引力を明らかにする [cs.RO, cs.CL, cs.AI]目的:プロンプトによるサンドバッギングにおける応答位置分布の特性
- 大規模言語モデルの挙動理解は,その能力を最大限に引き出す上で不可欠である。
- サンドバッギングという現象は,モデルの意図的なパフォーマンス低下を引き起こすため,そのメカニズム解明が求められる。
- 応答位置分布がサンドバッギングに影響を与えるかを検証し,その特徴を明らかにすること。
- 選択肢の順序をランダム化しても,サンドバッギング時の応答位置分布は安定しており,特定の位置(E/F/G)に集中する傾向が確認された。
- 正解が好みの位置(E)に一致した場合の正答率は72.1%と高く,位置Aでは4.3%と低い値を示した。
- この結果は,応答位置のエントロピーが,サンドバッギングのブラックボックス的な行動特徴となる可能性を示唆している。
自己回帰的連鎖を断ち切る:効率的なLLMベースの属性値抽出のためのハイパー並列デコーディング [cs.CL, cs.AI]目的:属性値抽出における効率化
- 大規模言語モデルの応用範囲拡大のため,推論速度の改善が重要である。
- 自己回帰的デコーディングは逐次処理のため,並列処理が困難である。
- 属性値抽出における独立性を利用し,並列デコーディングを実現する。
- 提案手法であるハイパー並列デコーディングは,バッチ処理における共有メモリと計算を活用し,オフラインデコーディングを高速化する。
- 属性値ペアの条件付き独立性を利用し,各プロンプト内で値生成を並列化し,一度のプロンプトで最大96トークンを並行してデコード可能である。
- 実験により,推論コストと推論時間を最大13.8倍削減しつつ,出力品質を維持できることが示された。
OMEGA:生成されたアルゴリズムの評価による機械学習の最適化 [cs.AI, cs.LG]目的:機械学習アルゴリズム生成と実行可能コードの自動化
- AI研究の自動化は,効率的な進歩に不可欠であり,新たな発見を加速させる。
- 既存の機械学習アルゴリズムは,特定のデータセットに最適化されている場合が多く,汎用性に欠ける。
- 本研究は,新しい機械学習アルゴリズムを自動生成し,既存の手法を超える性能を実現することを目指す。
- OMEGAフレームワークを用いて,新規機械学習分類器を生成することに成功した。
- 生成されたアルゴリズムは,20のベンチマークデータセットにおいて,scikit-learnのベースラインを上回る性能を示した。
- 本研究は,AI研究の自動化に向けた重要な一歩であり,新たなアルゴリズム発見の可能性を広げる。
会計科目関連における異常検知のための教師なしグラフモデリング [cs.RO, cs.HC, cs.LG]目的:会計科目関連構造における異常検知
- 会計監査の効率化や不正検知において,会計データの構造的分析が不可欠である。
- 従来の異常検知手法では,ラベル付きデータの必要性や,複雑な会計構造への対応が課題となっていた。
- 会計データの構造的特徴を捉え,ラベルなしでも異常を検知する手法を確立すること。
- グラフニューラルネットワークを用いた構造化モデリングと教師なし識別フレームワークを提案した。
- 提案手法は,会計科目の共起情報や借対貸対応をグラフ構造で表現し,異常な構造的偏りを検出する。
- 実験により,提案手法が安定した識別能力と高いランキング精度を示すことが確認された。
eDySec:PyPIエコシステムにおける悪意のあるパッケージ検出のための深層学習ベースの説明可能な動的解析フレームワーク [cs.CR, cs.LG]目的:PyPIエコシステムにおける悪意のあるパッケージの検出
- オープンソースソフトウェアの利用拡大に伴い,サプライチェーン攻撃の脅威が増大している。
- 従来の機械学習は,動的振る舞いデータの高次元性や疎性により,高精度な検出が困難である。
- 深層学習を活用することで,動的振る舞いデータから複雑なパターンを学習し,悪意のあるパッケージを効率的に検出する。
- eDySecは,既存のフレームワークと比較して,特徴量の次元数を半分に削減し,偽陽性を82%,偽陰性を79%低減することに成功した。
- また,精度を3%向上させ,ほぼ完璧な安定性を実現しつつ,パッケージ1つあたり170msの低遅延な推論を可能にした。
- 特徴量とモデルの選択が性能に大きく影響することが明らかになり,動的解析の強みと限界の理解を深めた。
コンセンサス探索:オープンボキャブラリリモートセンシングセマンティックセグメンテーションのための動的再調整 [cs.MA, econ.GN, q-fin.EC, cs.CV, cs.AI]目的:オープンボキャブラリセマンティックセグメンテーションの性能向上
- リモートセンシング画像解析は,土地利用状況の把握や環境変化の監視に不可欠である。
- 既存手法は静的な推論に依存し,多様なシーンにおけるセマンティックな曖昧さや前景活性化の不完全さの問題がある。
- シーンごとにセマンティック・幾何学的整合性を動的に再調整し,セグメンテーション精度を向上させる。
- 提案手法SeeCoは,幾何学的コンセンサス学習とセマンティックコンセンサス学習により,既存のOVSSモデルをオンラインで再調整する。
- SeeCoは特定の訓練を必要とせず,推論時に各シーンの特性に応じてセマンティック・幾何学的整合性を調整する。
- 8つのリモートセンシングOVSSベンチマークにおいて,一貫した性能向上を確認した。
DepthPilot:結腸内視鏡ビデオ生成における制御可能性から解釈可能性へ [cs.CL, cs.CL, stat.ME, cs.IR, cs.CV, cs.AI]目的:結腸内視鏡ビデオ生成のための解釈可能性の確立
- 医療分野における映像生成技術は,診断や治療の支援に不可欠であり,その重要性は増している。
- 既存の制御可能な医療ビデオ生成技術は,臨床的妥当性や物理的整合性の検証が不十分である。
- DepthPilotは,生成された映像の解釈可能性を高め,臨床現場での信頼性を向上させることを目指す。
- DepthPilotは,深度制約を拡散バックボーンに注入することで,解剖学的忠実性を確保する。
- 適応スプラインノイズ除去モジュールにより,幾何学的制約下での複雑な空間的・時間的ダイナミクスのモデル化を実現した。
- 複数のデータセットと臨床データでの評価で,DepthPilotが物理的に整合性の取れたビデオを生成することが確認された。
説得可能性とLLM:法的意思決定ツールとしての可能性 [cs.AI, cs.CY]目的:LLMにおける法的議論への応答性と説得可能性
- 法的手続きの効率化やアクセス向上に貢献し,公正な判断を支援する可能性が期待される。
- LLMが弁護士のスキルに影響され,客観的な根拠よりも弁護士の説得力によって判断が左右されるリスクがある。
- LLMの法的議論への応答性と,弁護士の質が判断に与える影響を検証し,法的利用の可否を検討する。
- オープンソースおよびクローズドソースのLLM実験により,弁護士の質がLLMの判断に影響を与えることが示された。
- 弁護士の質が高いほど,LLMが特定の法的見解に同意する可能性が高くなる傾向が見られた。
- この結果は,法的・行政設定におけるLLMの採用可能性に重要な示唆を与える。
LATTICE:暗号資産エージェントの意思決定支援有用性の評価 [cs.CR, cs.AI, cs.CL]目的:暗号資産エージェントの意思決定支援能力の評価基準
- 暗号資産市場は複雑であり,ユーザーは適切な意思決定を行う上で支援を必要とする。
- 既存の評価基準は,推論や結果に焦点を当てており,ユーザーの意思決定支援能力を評価していない。
- LATTICEは,ユーザーの意思決定を支援するエージェントの質を定量的に評価することを目指す。
- LATTICEは,意思決定支援の主要な側面を捉える6つの評価次元と,16種類のタスクを定義した。
- 評価は,専門家のアノテーションや外部データソースに依存せず,LLMジャッジを用いて大規模に自動化できる。
- 実運用中の6つの暗号資産コパイロットを1200件の多様なクエリで評価した結果,次元レベルやタスクレベルで性能差が見られた。
数学個別指導における学習性無力感のApriori分析:レベル,介入,結果による行動パターン [cs.DL, cs.AI, cs.CY, cs.ET, cs.LG]目的:数学個別指導システムのログデータにおける学習性無力感に関連する行動パターン
- 教育効果を高めるため,学習者の行動特性を把握することが重要である。
- 学習性無力感は,学習意欲を低下させ,学習成果を阻害する大きな要因である。
- 学習性無力感の程度に応じた効果的な介入方法を特定し,学習支援に役立てること。
- 問題解決が不可能な場合に,ヒントを使わずに問題をスキップする行動が最も頻繁に見られた。
- 学習性無力感の低い学生は,問題解決とスキップしない行動の関連性が高く,ヒントの使用と問題解決の関連も高かった。
- 学習性無力感の高い学生は,回避行動が多く,スキップと問題解決の失敗の関連が強かった。
会話音声からのうつ病検出のための,再帰に基づく非線形発声ダイナミクスをデジタルバイオマーカーとして [cs.SD, cs.LG, eess.AS]目的:会話音声における発声ダイナミクスの再帰構造
- 精神疾患の早期発見や客観的評価は,医療現場において重要な課題である。
- 既存のうつ病検出手法は,静的な音響特徴量に依存しており,時間的な変化を捉えきれない。
- 会話音声の発声ダイナミクスにおける非線形な時間的構造を解析し,うつ病のバイオマーカーを特定すること。
- 再帰に基づくバイオマーカーは,平均交差検証AUC 0.689を達成し,静的音響特徴量や他の特徴量を用いた手法を上回った。
- 統計的有意差検定の結果,p=0.004であり,この結果は統計的に有意であると示された。
- 本研究は,うつ病が会話音声の発声ダイナミクスの再帰構造の変化を伴う可能性を示唆している。
StratMem-Bench:仮想キャラクター対話における戦略的記憶利用の評価 [cs.CL, cs.AI]目的:仮想キャラクター対話における戦略的記憶利用の評価
- 人間らしい自然な対話を実現するためには,記憶の利用が不可欠である。
- 既存の評価指標は記憶を静的な事実の貯蔵庫と捉え,戦略的な利用を評価していない。
- 対話における記憶の戦略的利用能力を評価する新しいベンチマークの提供。
- StratMem-Benchは,必要な記憶,支援的な記憶,無関係な記憶を含む異質な記憶プールをナビゲートする仮想キャラクターのインスタンスで構成される。
- 提案された評価フレームワークは,厳密な記憶遵守,記憶統合の質,積極的な強化スコア,条件付き無関係率を含む指標を用いる。
- 最先端のLLMは必要な記憶と無関係な記憶の区別はできるが,支援的な記憶の導入により判断が難しくなることが示された。
メタSR:生成型超解像のためのコンテンツ適応型メタデータオーケストレーション [cs.CV, cs.AI]目的:生成型超解像におけるコンテンツおよび劣化の変動に対応するためのメタデータオーケストレーション
- 現実世界の画像・映像処理において,多様なコンテンツと劣化に対応できる超解像技術は重要である。
- 既存のメタデータ活用型超解像は固定的な設計であり,コンテンツ依存のメタデータ活用が不十分である。
- コンテンツに応じた最適なメタデータ選択と注入による,効率的な超解像を実現することを目指す。
- MetaSRは,Diffusion Transformer(DiT)を基盤とし,タスクに応じたメタデータを効率的に選択・注入する。
- 多様なコンテンツと劣化条件下で,既存手法と比較して最大1.0dBのPSNR改善と,50%のビットレート削減を達成した。
- レート歪み最適化フレームワークによる評価で,送受信側のビットレートと受信品質のバランスが向上することが示された。
TimeMM:動的マルチモーダル推薦のための時間を通算する演算子を用いたスペクトルフィルタリング [cs.SI, cs.IR, cs.AI]目的:動的マルチモーダル推薦のための時間依存スペクトルフィルタリングフレームワーク
- 協調フィルタリングとアイテムコンテンツを統合することで,ユーザーモデリングの精度向上が期待される。
- 既存手法は静的なグラフや粗い時間的ヒューリスティックに頼っており,継続的な嗜好の変化への適応が不十分である。
- 時間経過に伴う嗜好の非定常性を捉え,マルチモーダルデータの時間的感受性を考慮した推薦を目指す。
- TimeMMは,相互作用の鮮度を時間的カーネルにマッピングすることで,ユーザーアイテムグラフのエッジを再重み付けする。
- 適応的スペクトルフィルタリングにより,時間的コンテキストに応じて演算子バンクを混合し,予測に特化したスペクトル応答を得る。
- スペクトル多様性正則化により,補完的な専門家行動を促し,フィルターバンクの崩壊を防ぐ。
3D遅延ガドリニウム強調MRIを用いたV-Net系モデルによる多段階両心房セグメンテーションフレームワーク [cs.CV, cs.AI, cs.LG]目的:3D遅延ガドリニウム強調MRIからの両心房多クラスセグメンテーション
- 心臓疾患の診断・治療において,心臓構造の正確な把握は不可欠である。
- 心臓MRI画像のセグメンテーションは,手作業に頼る部分が多く,時間と労力を要する。
- 心臓MRI画像の自動セグメンテーションの精度向上と効率化を目指す。
- 本研究では,多段階のフレームワークとV-Net系モデルを用いることで,両心房のセグメンテーション精度を向上させた。
- 前処理にMCLAHE,粗分割にV-Net系モデル,精分割にもV-Net系モデルを用いることで,段階的にセグメンテーションを行う。
- 非対称損失関数を採用することで,モデルの最適化を図った。
DORA:言語モデル訓練のためのスケーラブルな非同期強化学習システム [cs.LG, cs.DC]目的:言語モデル訓練における強化学習の効率化
- 大規模言語モデルの性能向上には,訓練後の強化学習が不可欠である。
- ロールアウト段階で生成される軌跡の偏りがボトルネックとなり,訓練速度を著しく低下させている。
- 非同期訓練による効率化とアルゴリズムの収束性を両立する手法の開発。
- DORAは,マルチバージョンストリーミングロールアウトにより,ロールアウト段階のボトルネックを解消し,訓練効率を大幅に向上させる。
- オープンソースベンチマークにおいて,最先端のシステムと比較して,スループットが2~3倍に向上した。
- 大規模産業アプリケーションでは,同期訓練と比較して,訓練速度が2~4倍に加速された。
FlowBot:二重最適化とテキスト勾配によるLLMワークフローの誘導 [cs.CL, cs.LG]目的:LLMワークフローの自動誘導
- LLMの能力拡張と多様なタスクへの対応が期待されており,複雑な課題解決の鍵となる。
- 既存手法は人間の手作業によるパイプライン構築に依存しており,実用的な展開のボトルネックとなっている。
- データ駆動型アプローチで,LLMワークフローを自動的に誘導・最適化することを目指す。
- 本研究で開発したFlowBotは,二重最適化とテキスト勾配を用いることで,競争力のあるLLMワークフローを自動的に発見する。
- FlowBotは,人間の設計や自動生成によるワークフローと同等以上の性能を示す。
- 各LLM呼び出しをモジュール的に最適化するテキスト勾配によるバックプロパゲーションが有効であることが示された。
調整された驚き:創造的品質の情報理論的考察 [cs.IR, cs.CL, cs.AI, cs.LG]目的:創造的な文章の質を,情報理論に基づいて評価するための枠組み
- 創造性は,人間の知的活動の根幹であり,文化や技術の発展に不可欠である。
- 創造性の評価は主観的であり,客観的な指標が確立されていない。
- 創造的な文章の品質を,情報理論を用いて客観的に測定することを試みる。
- 質の高い文章は,制約条件が適切に作用し,予測不能でありながらも必然性を持つ。
- 制約条件から得られる相互情報量は,創造性の程度を示す指標となりうる。
- この枠組みは,創造的品質アライメント(CQA)や評価ベンチマークの理論的基盤となる。
良性軌道の強制:構造化ワークフローAIエージェントのための行動ファイアウォール [cs.CR, cs.AI]目的:構造化ワークフローAIエージェントに対する,行動異常検知によるセキュリティ確保
- AIエージェントの活用拡大に伴い,外部環境へのアクセス制御の重要性が高まっている。
- 大規模言語モデル駆動型エージェントは,潜在的な脆弱性を抱え,悪意のある攻撃を受けやすい。
- 本研究は,AIエージェントの行動を監視し,異常なツールコールを防御するファイアウォールを提案する。
- 提案手法は,過去の良性トラジェクトリからpDFAを構築し,実行時のツールコールを高速に検証する。
- Agent Security Bench(ASB)での評価では,既存手法Aegisと比較して高い防御性能を示した。
- パラメータの厳密な一致によるホワイトリスト化が,最終的な防御策として有効であることが示唆された。
MedSynapse-V:潜在的記憶進化による視覚知覚と臨床的直観の架け橋 [cs.CV, cs.AI]目的:医療画像における診断能力の向上
- 医療診断の精度向上は,人々の健康と生活の質に直結する重要な課題である。
- 既存の医療画像解析モデルは,静的な特徴に依存し,専門家の暗黙的な診断記憶を活用できていない。
- モデルが診断に必要な知識を内包し,経験豊富な医師のように推論することを可能にする。
- 本研究では,潜在的診断記憶進化フレームワークを提案し,モデル内に暗黙的な診断記憶を動的に生成・進化させる。
- Meta Query for Prior MemorizationとCausal Counterfactual Refinementにより,臨床的妥当性を確保し,不要な情報を削減する。
- Intrinsic Memory Transitionにより,教師モデルの知識を生徒モデルに効果的に転移し,診断精度を大幅に向上させた。
CheXthought:胸部X線画像解釈のための臨床的な思考連鎖と視線注意のグローバルなマルチモーダルデータセット [cs.CV, cs.AI]目的:臨床的な思考連鎖と視線注意に関するグローバルなマルチモーダルデータセット
- 胸部X線画像解釈は医療における頻繁な診断であり,AI開発の主要なターゲットである。
- 既存のビジョン言語モデルは,画像とレポートのペアで学習されることが多く,臨床推論の基盤となる認知プロセスや視線注意が考慮されていない。
- 専門家の推論プロセスをモデル化し,より透明で解釈可能なビジョン言語モデルの開発を促進すること。
- CheXthoughtの思考連鎖は,最先端のビジョン言語モデルの思考連鎖よりも,事実の正確性と空間的な根拠において著しく性能が向上した。
- 推論時のヒントとして視線注意データを用いることで,見逃された所見が発見され,幻覚が大幅に減少した。
- CheXthoughtデータで訓練されたモデルは,病理分類,視覚的な忠実性,時間的推論,不確実性の伝達において,有意に高い性能を発揮した。
NeuroPlastic:生物学的学習ダイナミクスを考慮した可塑性変調最適化手法 [cs.CL, cs.DC, cs.LG]目的:深層学習における最適化
- 深層学習の性能向上には,効率的な最適化アルゴリズムが不可欠である。
- 従来の最適化手法は,局所的な勾配情報に大きく依存している。
- 多要素シナプス可塑性に着想を得た手法で,勾配に基づいた学習を改善する。
- NeuroPlasticは,勾配更新を活動や記憶といった多角的な統計量で動的に調整する。
- 画像分類ベンチマークにおいて,勾配のみの学習と比較して一貫した性能向上を示した。
- 特にFashion-MNISTやデータが少ない環境で効果が顕著であり,転移学習においても安定した結果が得られた。
グラフ構造のロバストな表現学習のためのCheeger-Hodge対照学習 [cs.LG]目的:グラフ構造のロバストな表現学習
- グラフデータは複雑な関係性を表現可能であり,様々な応用分野で重要性が増している。
- 既存のグラフ表現学習は,データに微小な構造変化が生じると性能が低下しやすい。
- 構造変化に強いグラフ表現を学習し,ロバスト性を向上させることを目指す。
- 提案手法Cheeger-Hodge対照学習(CHCL)は,グラフの構造変化に対し安定な特徴量を学習する。
- CHCLは,グラフの連結性情報と高次の構造情報を組み合わせた特徴量を用いることで,ロバスト性を実現している。
- 標準的なベンチマークや転移学習実験において,CHCLが性能,ロバスト性,汎化性能を向上させることが示された。
DreamProver:ウェイク・スリープ定理証明エージェントによる転移可能な補題ライブラリの進化 [cs.HC, cs.HC, cs.CL, cs.AI]目的:再利用可能な補題の発見
- 形式定理証明は,ソフトウェアやハードウェアの検証において不可欠であり,その信頼性向上に寄与する。
- 既存手法では,固定された補題ライブラリや特定定理に特化した補題しか生成できず,汎用性に課題がある。
- 汎用性が高く,未知の定理にも適用可能な補題ライブラリを自動的に進化させることを目指す。
- DreamProverは,ウェイク・スリープパラダイムを用いて,コンパクトで高水準な補題ライブラリを反復的に進化させる。
- 実験結果から,多様な数学的ベンチマークにおいて証明成功率が大幅に向上することが示された。
- また,より簡潔な証明を生成し,計算コストを削減できることも明らかになった。
VulStyle:コード様式計測を活用した脆弱性検出のためのマルチモーダル事前学習 [cs.CL, cs.CR, cs.LG]目的:コード様式計測特徴,関数レベルのソースコード,非終端抽象構文木構造の同時エンコーディングによるソフトウェア脆弱性検出モデル
- ソフトウェアの安全性が重要視される現代において,脆弱性の早期発見は不可欠である。
- 従来のコード表現は,リスクのあるプログラミング慣行を示す様式的な手がかりや構造的オーバーヘッドに課題があった。
- 非終端ASTノードの選択と様式特徴の統合により,効率的かつ高精度な脆弱性検出を目指す。
- VulStyleは,7つのプログラミング言語における490万個の関数でMasked Language Modelingを用いて事前学習され,5つのベンチマークデータセットで微調整された。
- BigVulとVulDeePeckerにおいて最先端の性能を達成し,F1スコアを強力なTransformerベースラインと比較して4-48%改善した。
- コード様式計測とAST構造の影響を分離する消去研究,エラーケース分析,および攻撃者視点での脅威モデルを提供した。
LLMの強化学習における性能飽和への対処:精密なエントロピー曲線制御による [cs.LG, cs.CL, stat.ML]目的:LLM強化学習における性能飽和の解消
- 大規模言語モデルの能力向上には強化学習が不可欠であり,複雑な推論能力を獲得できる。
- 強化学習アルゴリズムは性能飽和を起こしやすく,学習規模拡大に伴い改善が見込めなくなる。
- エントロピー崩壊を抑制し,安定した学習を実現することで性能飽和を打破することを目指す。
- Entrocraftは,ユーザー定義のエントロピースケジュールを実現するシンプルな手法であり,正則化を必要としない。
- 実験的に,Entrocraftは性能飽和に対処し,汎化性能,出力の多様性,長期的な学習を著しく改善した。
- 40億パラメータのモデルが80億パラメータのベースラインを上回り,改善がより長く持続し,pass@Kを50%向上させた。
DSIPA:感情不変パターン分散分析によるLLM生成テキストの検出 [cs.CL, cs.AI]目的:LLM生成テキストの検出
- LLMの急速な発展は新たなセキュリティ課題をもたらす。誤情報,なりすまし,コンテンツ偽造への対策が急務である。
- 既存の検出手法は,敵対的摂動,言い換え攻撃,ドメインシフトに対して脆弱である場合が多い。
- DSIPAは,モデルパラメータへの制限や大規模ラベルデータセットを必要とせず,LLM生成テキストを検出する。
- DSIPAは,制御されたスタイル変更下での感情分布の安定性を定量化することで,LLM生成テキストを検出する。
- 実験の結果,DSIPAは既存手法と比較してF1スコアを最大49.89%向上させ,多様なドメインや敵対的条件下で優れた汎化性能を示した。
- LLMの進化する状況において,安全なコンテンツ識別に有用な堅牢かつ解釈可能な行動シグナルを提供する。
クライアントにおける効率的なVRAM制約下でのxLM推論 [cs.FL, cs.DC, cs.AR, cs.LG]目的:クライアントシステムにおける高性能な大規模言語モデル(LLM)およびビジョン言語モデル(VLM)の効率的かつ損失のない推論
- クライアントAIの新たな革新を促進するため,高性能なモデルをクライアント環境で動作させる必要性が高まっている。
- クライアントデバイスの限られたVRAM容量が,高性能モデルの推論におけるボトルネックとなっている。
- VRAM制約下で効率的な推論を実現し,クライアントAIの性能向上を目指す。
- 提案手法であるパイプライン化されたシャーディングにより,LLMのTTFTが最大6.7倍,TPSが最大30倍に向上した。
- ビジョン言語モデルにおいては,VRAM使用量が10分の1に削減され,推論効率が大幅に改善された。
- バッチ処理においては,スループットが最大8.2倍に向上し,高い処理能力が示された。
AlphaJet:解きほぐされた生成事前分布とトポロジー保存進化探索による自動概念航空機合成 [cs.LG]目的:概念航空機設計の自動化パイプライン
- 航空機設計は,性能とコストに大きく影響する初期段階が重要である。
- 従来の設計プロセスは専門家依存度が高く,時間と労力を要する。
- 設計空間の効率的な探索と,最適な形状の自動生成を目指す。
- AlphaJetは,テキストによるミッション仕様からリアルタイムで実行可能な3D航空機を生成する。
- 解きほぐされた変分オートエンコーダとトポロジーエリート遺伝的アルゴリズムにより,多様性を保ちつつ最適化を行う。
- エンジンと構造物の干渉を考慮した幾何学的スコアリングにより,現実的な形状を生成する。
効率的なLoRA-MoEファインチューニングのための適応的・詳細なモジュールごとのエキスパートプルーニング [cs.LG]目的:LoRA-MoEファインチューニングにおけるパラメータ効率と学習効率の向上
- 大規模言語モデルのファインチューニングは計算コストが高い。パラメータ効率の良い手法が求められている。
- 既存のLoRA-MoEは,Transformerモジュール間で固定されたエキスパート構成を採用し,無駄が生じている。
- モジュールごとにエキスパートの数を動的にプルーニングすることで,効率性と専門性を高める。
- 提案手法DMEPは,学習中にエキスパートの利用状況を追跡し,モジュールごとに低利用率のエキスパートを物理的に削除する。
- DMEPは,学習可能なパラメータを35%~43%削減し,学習スループットを約10%向上させる。
- 推論ベンチマークにおいて,DMEPは従来のLoRA-MoEと同等またはそれ以上の精度を維持する。
アンカー制約を用いた知覚的最適化:参照なし品質ガイダンスによる拡散モデル [cs.CV, cs.AI]目的:拡散モデルにおける知覚的品質の向上
- 画像生成の分野で,拡散モデルの性能向上が期待されている。
- 従来の学習は画素レベルの類似性を重視し,主観的な知覚品質が不十分な場合がある。
- 参照なし知覚的品質評価を活用し,安定した学習と品質向上を目指す。
- アンカー制約最適化フレームワークにより,知覚品質と生成の忠実性を両立した。
- 参照なし知覚的品質評価モデルをガイダンス信号として活用することで,学習の安定性を確保した。
- 実験により,生成多様性を維持しつつ,知覚品質が顕著に向上することが示された。
先着順FIFOバッファ管理のための漸近的にロバストな学習拡張アルゴリズム [cs.DS, cs.LG]目的:先着順FIFOバッファ管理問題に対する学習拡張オンラインアルゴリズム
- ネットワークトラフィックの増加に伴い,効率的なバッファ管理が重要になっている。
- 従来のオンラインアルゴリズムは,予測精度の低い場合に性能が著しく低下する。
- 予測誤差に対するロバスト性を保ちつつ,最適な性能を達成することを目指す。
- 提案アルゴリズムは,1-一貫性,η-滑らかさ,漸近的な√3-ロバスト性を同時に達成する。
- 完璧な予測下では最適な競争比1を,予測誤差が増加しても滑らかな性能劣化を示す。
- 予測精度が任意に低い場合でも,最悪の場合の保証である√3の漸近的な競争比を維持する。
報酬ハッキングの緩和に向けた不確実性考慮型報酬割引 [cs.CL, cs.DB, cs.LG, cs.AI]目的:報酬ハッキングの緩和
- 強化学習は,実世界の問題解決に有用だが,報酬関数の設計が難しい。
- 人間の選好に基づく報酬は不確実性を伴い,過剰最適化やハッキングを招く。
- 報酬の不確実性を考慮し,安全かつ信頼性の高い強化学習を目指す。
- 提案手法は,価値推定の不確実性と人間の選好の不確実性を明示的にモデル化する。
- 実験の結果,報酬の曖昧さ下での行動が安定し,報酬ハッキングが93.7%減少した。
- ある程度の報酬の低下はあるものの,30%までの教師信号ノイズに対してもロバストであることが示された。
グラフィックデザインのための機械翻訳を用いたテキストスタイル変換 [cs.CL, cs.AI]目的:グラフィックデザインにおけるテキストスタイルの変換
- グローバル化が進む中で,多様な読者層への効果的なコミュニケーションが重要となる。
- 翻訳後のテキストスタイルを維持するためには,原文と翻訳文間の高精度な単語アラインメントが課題となる。
- 商用翻訳技術を活用し,テキストスタイルの変換における単語アラインメントの精度向上を目指す。
- 注意機構によるベースラインが,LLMやNMTアプローチよりも高い精度を示した。
- NMTとLLMを組み合わせたハイブリッド手法は,注意機構ベースラインと同程度の精度であった。
- 提案手法の有効性は,グラフィックデザインへの応用を考慮し,アラインメント結果を用いて評価された。
CO-EVO:連合学習における意味的アンカーとスタイル多様性の共進化によるドメイン汎化ReID [cs.CV, cs.LG]目的:分散環境下での人物再識別モデルのドメイン汎化性能向上
- プライバシー保護が重要視される中,分散データを用いた学習が求められている。
- 分散データはカメラの特性に依存した偏りを含み,汎化性能を阻害する要因となる。
- 意味的特徴とスタイル多様性を同時に最適化し,汎化性能の向上を目指す。
- 提案手法CO-EVOは,意味的アンカーとスタイル多様化を共進化させることで,ドメイン固有の偏りを抑制する。
- カメラ不変な意味的アンカーにより,ドメインに依存しない人物特徴を学習する。
- グローバルカメラスタイルバンクを活用し,多様な視覚的摂動を生成することで,モデルのロバスト性を向上させる。
固定公式を超えて:効率的な拡散モデルのためのデータ駆動型線形予測子 [cs.CV, cs.LG]目的:拡散モデルにおける効率的な推論のための線形予測子の開発
- 拡散モデルは高性能だが,計算コストが高いことが課題である。
- 既存の高速化手法は,スキップ数が多い場合に性能が低下する。
- 学習可能な線形予測子を用いて,推論コストを削減することを目指す。
- 提案手法L2Pは,わずか20秒の学習で過去の軌跡から現在の特徴量を正確に再構築する。
- FLUX.1-devにおいて,FLOPsを4.55倍,処理時間を4.15倍削減する性能を示した。
- Qwen-Imageモデルでは,最大7.18倍の加速下でも高い画質を維持し,既存手法よりも優れた結果を得た。
トポロジーを考慮した表現アラインメントによる半教師あり視覚言語学習 [cs.CV, cs.LG, math.AT]目的:半教師あり視覚言語学習における表現アラインメント手法
- 視覚言語モデルは強力だが,専門領域への汎化性能が課題。
- 既存手法はペアワイズなアプローチであり,多次元表現の全体構造を捉えきれていない。
- トポロジーに着目し,より安定した表現アラインメントを実現する。
- 提案手法ToMAは,持続ホモロジーを用いてトポロジー的に重要なエッジを特定し,クロスモーダル対応を通じてアラインメントする。
- ToMAは,H_0-deathエッジと軽量なH_1-birthエッジを活用することで,接続性とサイクル構造を捉える。
- リモートセンシングおよびファッション検索の実験で,ToMAが安定した性能向上を示すことが確認された。
SemEval-2026タスク6におけるSG-UniBuc-NLP:長文回避検出のためのチャンキングを用いたMulti-Head RoBERTa [cs.RO, cs.MA, cs.CL, cs.AI, cs.LG]目的:政治的なインタビュー応答における明瞭度と回避戦略の分類
- 政治的発言の透明性確保は,民主主義社会において不可欠である。
- 政治家の発言は曖昧で,質問を回避する戦略が用いられる場合がある。
- 長文の応答に対応し,質問回避戦略を高精度に検出すること。
- 本システムは,Subtask 1でMacro-F1 0.80,Subtask 2で0.51を達成した。
- チャンキング戦略とMulti-Head RoBERTaを組み合わせることで,長文の応答に対応した。
- 7分割層化クロスバリデーションによるアンサンブル学習が,性能向上に貢献した。
CoQuant:混合精度LLMのための結合重み-活性化部分空間射影 [cs.CE, cs.ET, cs.LG]目的:大規模言語モデルの低ビット量子化における最適な高精度部分空間の選択
- 大規模言語モデルの推論コスト削減は,実用的な応用を促進する上で不可欠である。
- 既存の混合精度量子化手法は活性化統計量のみに依存し,重みと活性化の相関を考慮していない。
- 重みと活性化の両方の共分散を考慮した理論的なモデルに基づく,より効果的な量子化手法を開発する。
- CoQuantは,活性化と重みの共分散をバランスさせる閉形式の重み付きPCA解を導出することで,出力誤差を最小化する。
- Llama-3.2およびQwen2.5モデルを用いた実験により,CoQuantがWikiTextのパープレキシティと常識推論の精度において,既存のPTQ手法を上回ることが示された。
- 重みと活性化の結合部分空間モデリングは,低ビットLLM量子化のための原理的かつ効果的なアプローチである。
複雑なマルチモーダルドキュメント処理パイプラインのベンチマーク:エンタープライズAI向け統一評価フレームワーク [cs.CL, cs.AI, cs.IR]目的:エンタープライズAIにおけるドキュメント処理パイプラインの総合的な評価
- 企業の業務効率化にドキュメントAIの活用が不可欠であり,その性能評価が重要である。
- ドキュメントAIパイプライン全体としての評価方法が確立されておらず,各ステージの性能評価に偏っている。
- ドキュメントAIパイプライン全体の性能を客観的に評価できるフレームワークを構築し,改善に貢献する。
- ハイブリッド検索方式がBM25方式をわずかに上回り,両方式とも分散埋め込み方式を上回った(nDCG@5: 0.92 vs. 0.91 vs. 0.83)。
- ドキュメントの長さと幻覚(ハルシネーション)の関係は単調ではなく,短い文書と非常に長い文書で幻覚の発生率が高かった。
- 各ステージ間の相関は弱く,従来の想定とは異なり,品質が連鎖的に影響しているとは考えられない。回答の正確性は高いが,完全性は低いという結果が得られた。
SplitFT:LLMのファインチューニングのための適応型連合分割学習システム [cs.DC, cs.LG]目的:LLMのファインチューニングのための適応型連合分割学習システムの提案
- 分散環境での大規模言語モデルの学習は計算資源を必要とするため,効率的な学習手法が求められている。
- 連合分割学習はデータプライバシーを保護しつつ計算資源の制約を克服できるが,LLMへの適用には課題が残る。
- クライアントの異質性に対応し,通信オーバーヘッドを削減することで,LLMの効率的なファインチューニングを実現する。
- 提案手法SplitFTは,クライアントの計算資源やモデル性能に応じてカットレイヤーを動的に設定する。
- カットレイヤーにおけるLoRAランクを削減することで,通信オーバーヘッドを効率的に軽減する。
- 実験結果から,提案手法が最新手法と比較してファインチューニングの効率とモデル性能において優れていることが示された。
メタ学習と標的型差分プライバシーによるレコメンデーションの精度とプライバシーのトレードオフ改善 [cs.IR, cs.LG]目的:レコメンデーションにおける精度とプライバシーのトレードオフの改善
- プライバシー保護は重要であり,個人情報の漏洩を防ぐことは社会的な要請である。
- 差分プライバシーの導入は精度低下を招くため,両立が困難である。
- 標的型差分プライバシーとメタ学習を用いて,このトレードオフを効果的に改善すること。
- 標的型差分プライバシーは,個人情報漏洩リスクの高いデータのみに適用することで,不要な摂動を減らす。
- メタ学習は,残存する差分プライバシーノイズに対するロバスト性を向上させ,精度改善に貢献する。
- 標的型差分プライバシーとメタ学習の組み合わせは,従来の差分プライバシー手法よりも優れたトレードオフを実現する。
SecMate:トリプルコンテキスト個別化による適応型サイバーセキュリティトラブルシューティングマルチエージェントシステム [cs.CR, cs.AI]目的:サイバーセキュリティトラブルシューティングのための適応型マルチエージェントVCA
- サイバー攻撃の増加と複雑化により,迅速かつ的確なセキュリティ対応が不可欠となっている。
- 従来のサポート体制では,専門知識を持つ人材の不足や対応の遅延が課題となっている。
- 会話およびデバイスからの情報を活用し,個別化されたトラブルシューティングを実現する。
- デバイスレベルの情報を加えることで,正答率がLLM単体と比較して約50%から90%以上に向上した。
- 段階的なガイダンスにより,ユーザーの満足度が高まり,負担が軽減された。
- レコメンダーは高い関連性を示し(MRR@1=0.75),参加者の多くがSecMateを人間によるITサポートの代替として検討した。
安全重要機械学習のためのランタイム監視手法の統合:視覚に基づく着陸への応用 [cs.LG]目的:安全重要機械学習におけるランタイム監視手法の分類と評価
- 安全重要システムにおける機械学習の利用拡大に伴い,その安全性の確保が不可欠となっている。
- ランタイム監視の研究は分散しており,異なる分野で独自の手法が開発されている点が課題である。
- 異なる監視手法を統合的に捉え,安全性を評価するための共通基盤を確立することを目指す。
- ランタイム監視手法を,ODD監視,OOD監視,OMS監視の3つのカテゴリに分類するフレームワークを提案した。
- 航空機の着陸における滑走路検出を実験的に検証し,提案フレームワークの有効性を示した。
- このフレームワークは,監視活動の設計や異なる監視手法の比較・評価を容易にすることを可能にする。
大規模視覚言語モデルの正直性を高めるための知識境界の明確化 [cs.CV, cs.AI]目的:大規模視覚言語モデルにおける知識境界の明確化
- 視覚と言語を統合したAIモデルの性能向上は,様々な応用分野での発展に不可欠である。
- 既存モデルは,特に専門分野や希少な情報において,事実に基づかない誤った情報を生成しやすいという課題がある。
- モデルが自身の知識範囲を超えた質問に対して,正直に回答を拒否する能力を高めることを目指す。
- 提案手法により,モデルの「真実を述べる割合」が57.9%から67.3%に向上した。
- 内部調査の結果,モデルが単なる拒否パターンを記憶するのではなく,自身の知識境界を認識していることが示された。
- 本フレームワークは,医療や知覚といった異なる分野にも適用可能であり,より信頼性の高い視覚アシスタントの実現に貢献する。
STLGT:マイクロサービスにおけるテールレイテンシ予測のためのスケーラブルなトレースベース線形グラフTransformer [cs.LG, cs.AI]目的:マイクロサービスにおけるテールレイテンシ予測
- マイクロサービスシステムにおいて,SLO管理はサービス品質を維持する上で不可欠である。
- 長距離依存性のモデリングと変動するワークロードへの対応が,スケーラビリティとの両立が困難である。
- トレースをグラフ構造で表現し,効率的な予測モデルを構築することで,高精度かつ高速な予測を実現する。
- STLGTは,既存手法(PERT-GNN)と比較して平均8.5% MAPEで予測精度を向上させた。
- CPU推論速度は最大12倍向上し,大規模なトレースデータセットに対しても効率的に処理可能である。
- 各コンポーネントの効果を検証した結果,特にバーストトラフィック下での有効性が確認された。
量子に着想を得たチャネル混合による軽量な物体検出:QYOLO [eess.SY, cs.SY, cs.IR, cs.CV, cs.AI, cs.ET]目的:物体検出におけるパラメータ削減と計算量の低減
- リアルタイムな画像認識において,物体検出技術は不可欠であり,その効率化が求められている。
- 既存の物体検出モデルのバックボーン層はパラメータ数が多く,計算コストが高いという課題がある。
- バックボーン層のチャネル混合に量子的なアプローチを導入し,パラメータ数と計算量を削減することを目指す。
- QYOLOは,バックボーン層の特定のモジュールを量子に着想を得たQMixBlockに置き換えることで,モデルのパラメータ数を20.2%削減した。
- QYOLOは,GFLOPsを12.3%削減し,mAP@50のわずかな低下(0.4pp)を伴う。
- 知識蒸留を用いることで,圧縮を維持しつつ,精度の低下を解消することが可能となった。
階層的リプシッツ積制御による,合成構造化関数に対する深層Kolmogorov-Arnoldネットワーク表現 [cs.LG]目的:合成構造化関数の深層Kolmogorov-Arnoldネットワーク表現
- 深層学習モデルの汎化性能向上には,複雑な関数を効率的に表現する能力が不可欠である。
- 深層KANスタックにおけるリプシッツ制御の欠如は,モデルの安定性と解釈性を損なう課題となっていた。
- 本研究は,深層KANスタックにおけるリプシッツ制御のギャップを埋めることを目指す。
- 任意の連続関数に対し,有限の計算木構造を持つ場合に,深層KAN表現が可能であることを証明した。
- 層ごとのリプシッツ積は,入力次元に依存しない主要なドメイン感受性境界を満たす。
- 標準演算に対するKANのリプシッツ定数は1以下となり,実験的にもP(KAN)=1.0が確認された。
ガウス周辺下における斉次半空間学習のほぼ最適な暗号学的困難性 [cs.LG]目的:ガウス分布を周辺分布とする斉次半空間の識別に関する計算困難性
- 機械学習の安全性評価において,計算困難性の保証は不可欠である。
- ガウス分布下での斉次半空間学習の困難性に関する既存研究は限定的である。
- ガウス周辺下での斉次半空間学習の計算困難性の厳密な下界を示す。
- 本研究では,学習とエラー(LWE)問題の困難性を仮定のもと,これらの問題に対するほぼ最適な計算困難性を示すことができた。
- 先行研究における下界を厳密に一般化し,ガウス周辺下での斉次半空間学習の上界と下界のギャップを縮小した。
- アグノスティック学習,信頼性のある一方的な学習,公平性監査という3つの問題において,困難性を示すことができた。
Naamah:DBpediaシードとLLM生成による大規模なサンスクリット固有表現認識コーパス [cs.CL, cs.AI]目的:サンスクリット語固有表現認識のための高品質なコーパス
- 古典サンスクリット文学のデジタル化は進むが,アノテーション付きリソースの不足が課題。
- 汎用LLMによるデータ拡張はエラーが多く,古典文法の深い理解が求められる。
- DBpediaとLLMを組み合わせ,文法的に自然で多様な学習データを作成し,コーパス不足を解消する。
- Naamahは102,942文を含む高品質な銀標準サンスクリットNERデータセットである。
- 大規模多言語モデルXLM RoBERTaとパラメータ効率の良いIndicBERTv2を用いてベンチマークを実施した。
- 本手法により,文法的に自然で多様な学習データ生成が可能となった。
