arXiv雑要約
AI - 2026/05/19 公開
デュアルバンド大規模MIMOシステムにおける深層学習に基づくチャネル外挿 [eess.SP, cs.LG]目的:デュアルバンド大規模MIMOシステムにおけるmmWave帯域のCSI取得のためのパイロットオーバーヘッド削減
- 次世代無線通信では,高速データ伝送と広範囲なカバレッジのために,ミリ波とsub-6GHz帯の統合が不可欠である。
- mmWave帯域のチャネル推定は,高いCSI次元と低いSNRにより,大きなパイロットオーバーヘッドが課題となる。
- 本研究では,sub-6GHz帯域のCSIからmmWave帯域のCSIを外挿することで,パイロットオーバーヘッドを削減することを目指す。
- 提案手法MDFCEは,sub-6GHz帯域のCSIの特徴を多領域で融合し,mmWave帯域への効率的なマッピングを実現する。
- シミュレーション結果から,MDFCEは既存手法と比較して,少ない訓練パイロットで優れた性能を発揮することが示された。
- また,MDFCEは高い計算効率を示し,様々なアンテナアレイ規模やSNRレベルで有効であることが確認された。
フォトニック結晶におけるアクティブラーニング [physics.optics, cond-mat.mtrl-sci, cs.LG, physics.app-ph]目的:フォトニックバンドギャップ予測の加速
- フォトニック結晶は,光制御デバイスの高性能化に不可欠であり,その設計最適化が重要である。
- 従来の設計手法は計算コストが高く,特に3次元構造の最適化は困難である。
- アクティブラーニングを用いて,効率的にバンドギャップ予測モデルを構築し,計算コストを削減する。
- 解析的近似ベイズ最終層ニューラルネットワーク(LL-BNN)と不確実性に基づいたサンプル選択を統合することで,フォトニックバンドギャップ予測を加速できることが示された。
- 提案手法は,ランダムサンプリングと比較して,平均で2.7倍のトレーニングデータ削減を達成しつつ,予測精度を維持した。
- 計算資源を不確実性の高い領域に集中させることで,効率的なサロゲートモデリングが可能となり,トポロジー最適化や逆設計のワークフローを加速することが期待される。
潜在IMH:近似演算子を持つ逆問題に対する効率的なベイズ推論 [stat.ML, cs.LG, math.ST, stat.CO, stat.TH]目的:ベイズ線形逆問題における事後分布からのサンプリング
- 逆問題は,画像再構成やパラメータ推定など,科学技術の多くの分野で不可欠である。
- 演算子Aの計算コストが高い場合,従来のベイズ推論は現実的でない場合が多い。
- 近似演算子を用いることで計算コストを削減し,効率的な推論を実現すること。
- 潜在IMHは,近似演算子と正確な演算子を組み合わせることで,計算効率を向上させる。
- 理論的解析により,潜在IMHの性能がKL divergenceと混合時間で評価されている。
- 数値実験の結果,潜在IMHは最先端手法であるNUTSよりも計算効率に優れる場合がある。
ST-BCP:非適合性スコア変換による後方確証予測の信頼区間収束 [stat.ML, cs.LG]目的:後方確証予測における信頼区間と実測カバレッジの乖離縮小
- 不確実性の定量化は,機械学習モデルの信頼性向上に不可欠であり,幅広い応用が期待される。
- 確証予測は保証されたカバレッジを提供するが,予測集合のサイズが大きくなる傾向がある。
- 本研究は,後方確証予測の信頼区間をより厳密にし,実測カバレッジとの差を小さくすることを目指す。
- 提案手法ST-BCPは,非適合性スコアのデータ依存変換を導入することで,既存手法よりも信頼区間を狭める。
- 理論的に,ST-BCPがベースラインの恒等変換よりも優れていることが証明されている。
- 実験結果から,ST-BCPは平均カバレッジギャップを4.20%から1.12%に大幅に削減できることが示された。
多層クロスアテンションは,マルチモーダルインコンテキスト学習において証明的に最適である [stat.ML, cs.AI, cs.LG]目的:マルチモーダルインコンテキスト学習における最適性
- 近年の深層学習の発展は目覚ましい。特に,アテンション機構は重要な役割を果たしている。
- マルチモーダルデータのインコンテキスト学習に関する理論的理解は十分ではない。
- マルチモーダルデータに対する最適なアテンション機構を理論的に解明することを目指す。
- 単層の線形自己アテンションでは,ベイジアン最適予測子をタスク分布全体で一様に再現できないことを証明した。
- 深層化された線形クロスアテンション機構が,勾配降下法による最適化においてベイジアン最適であることを証明した。
- インコンテキスト学習において深層化が有効であり,クロスアテンションがマルチモーダル分布に適していることを示した。
正則化されたスタイン変分勾配降下法の有限粒子レート [stat.ML, cs.LG, math.ST, stat.TH]目的:正則化されたスタイン変分勾配降下法(R-SVGD)の有限粒子レート
- ベイズ推論や生成モデルにおいて,複雑な事後分布の近似が重要である。
- 従来のSVGDはバイアスを持つため,精度と安定性に課題があった。
- カーネル化されたWasserstein勾配に対する事前条件子を用いることで,このバイアスを修正し,より精度の高い近似を目指す。
- 提案手法は,真のFisher情報における収束を理論的に保証する非漸近的な境界値を提供する。
- ターゲット分布が特定の条件を満たす場合,Wasserstein距離における収束も証明された。
- 正則化パラメータ,ステップサイズ,平均化期間の適切な調整則が導出された。
非定常加重リスク最小化における高速収束性 [stat.ML, cs.LG, math.ST, stat.TH]目的:分布ドリフト下での予測誤差の分析
- 予測モデルの精度向上が重要であり,現実世界のデータは時間とともに変化する。
- 分布ドリフトを考慮した学習理論が十分には確立されていない。
- 加重リスク最小化における過剰リスクの分解と,最適な学習レートの導出を目指す。
- 過剰リスクは学習項と分布ドリフト項に分解できることが示された。
- 混合条件の下で学習誤差に関するオラクル不等式が証明された。
- 線形モデル,基底近似,ニューラルネットワークにおける結果の適用性と鋭さが確認された。
QuantaAlpha:LLM駆動アルファマイニングのための進化的フレームワーク [q-fin.ST, cs.AI, q-fin.CP]目的:LLMを活用したアルファマイニングの進化的フレームワーク
- 金融市場は変動が激しく,安定したアルファの抽出は投資戦略において重要である。
- 従来のアルファマイニングはバックテストのノイズや市場の変化に弱く,安定的な成果を得ることが困難である。
- 本研究は,LLMと進化戦略を組み合わせ,よりロバストで効率的なアルファマイニング手法を確立することを目指す。
- QuantaAlphaは,各マイニング実行を軌跡として扱い,軌跡レベルでの突然変異と交叉によりファクターを改善する。
- CSI 300を用いた実験では,既存のベースラインやエージェントシステムと比較して,一貫した収益向上効果が確認された。
- CSI 300でマイニングされたファクターは,CSI 500やS&P 500にも有効であり,市場変動に対するロバスト性が示された。
生成拡散におけるFöllmerプロセスの変分最適性 [math.ST, cs.IT, cs.LG, math.IT, math.PR, stat.ML, stat.TH]目的:有限時間ホライズンにおける点質量から所定のターゲット分布への輸送
- 生成モデルは,複雑なデータ分布を学習し,新たなサンプルを生成する上で重要な役割を担う。
- 拡散モデルの性能は,推定誤差の影響を受けやすく,その軽減が課題である。
- 推定誤差が経路空間のカルバック・ライブラー情報量に与える影響を最小化する拡散係数を求める。
- Föllmerプロセスは,経路測度が参照プロセスに対する相対エントロピーを最小化する拡散として,閉形式で導出される。
- 最適な拡散係数を用いることで,経路空間のカルバック・ライブラー情報量が補間スケジュールに依存しなくなる。
- 確率的予測やデータ同化といった応用において,Föllmerプロセスの経路空間における変分最適性の影響が示された。
大規模言語モデルはクレジットリスクモデルの事後説明ツールとして機能するか [q-fin.RM, cs.LG]目的:クレジットリスクモデルの説明可能性評価
- 金融モデルの透明性確保が,規制遵守と信頼性向上に不可欠である。
- 既存の説明手法は,専門知識が必要で一般ユーザーには理解しにくい場合がある。
- 大規模言語モデルを用いた,より人間が理解しやすい説明の自動生成を目指す。
- 大規模言語モデルは,制御されたプロンプト下では特徴量の重要度ランキングを再現できることが示された。
- 自律的な説明生成においては,形式的な帰属方法との整合性が限られることが示された。
- クレジットリスクガバナンスにおいては,形式的な帰属方法の代替ではなく,ナラティブインターフェースとしての活用が望ましい。
任意の畳み込み辞書に対する空間適応的なスパース度マップ学習 [eess.IV, cs.CV, cs.LG, math.OC]目的:畳み込み辞書に対する空間適応的なスパース度マップ
- 画像処理において,高画質化やノイズ除去は重要な課題であり,効率的な表現方法が求められている。
- 従来の学習に基づく再構成法は,解釈性やロバスト性に課題があり,ブラックボックス化しやすい。
- データ駆動型情報をモデルベースの畳み込み辞書正則化に組み込むことで,解釈性とロバスト性の向上を目指す。
- 提案手法は,フィルタ置換に対する不変性を獲得し,推論時に畳み込み辞書を変更可能となった。
- 低磁場MRIへの応用実験において,他の深層学習法と比較して良好な結果が得られた。
- 分布外データに対するテストでは,学習データへの依存が少ないため,他の学習法よりもロバストであることが示された。
因果性の隠蔽と条件付き依存 [stat.ML, cs.AI, cs.GT, cs.LG, cs.SI]目的:禁止変数による意思決定への影響の許容可能な経路の特定
- 公平性,情報管理,不正取引防止など,規制と分析において重要な課題である。
- 層ごとの要件と平均的な制約との間に乖離が生じ,規制の有効性が損なわれる可能性がある。
- 平均的な制約による規制の限界を明らかにし,意思決定ルール自体の制御の必要性を示す。
- 平均制約による最適化は,層ごとの要件を満たさずに平均制約を正確に満たす政策を生み出すことが多い。
- 隠蔽による利益は交絡や結果の異質性とともに増加し,検出には条件付き独立性テストが不可欠となる。
- 隠蔽されたポリシーは制約なしの活用とほぼ同等の報酬を得ながら,検出が困難である。
RIE-Greedy:正則化誘導探索による文脈的バンディット [stat.ML, cs.LG]目的:文脈的バンディット問題における探索戦略
- 実世界の複雑な報酬モデルの文脈的バンディット問題は重要であり,その解決が求められている。
- 既存手法は,複雑な仮定や実装困難な手続きに依存し,実用性に課題がある。
- モデル適合過程における正則化のランダム性を利用した探索手法を提案し,その有効性を検証する。
- 提案手法は,二腕バンディット問題において,トンプソンサンプリングと同等の理論的性質を持つことが示された。
- 大規模な実環境において,ε-greedyや他の最先端手法と比較して,安定した探索性能を示すことが確認された。
- 正則化された推定器の学習自体が効果的な探索を誘導しうるという知見が得られた。
周辺分布が一致しても構造が破綻する場合:生成モデルにおける共分散の忠実度 [stat.ML, cs.AI, cs.LG, stat.ME]目的:生成モデルにおける共分散レベルの依存構造の忠実度評価基準の提案
- 科学的ワークフローにおいて,現実のデータに代わる生成モデルの利用が増加しているため,その評価は重要である。
- 従来の評価基準は周辺分布の一致に焦点を当てており,データ全体の構造的信頼性を評価できていない。
- 周辺分布が一致しても構造が破綻する生成モデルを検出し,構造を適切に再現するモデルを評価する。
- 共分散レベルの依存構造の忠実度指標D_Sigmaを導入し,モデルがデータの共分散構造を保持しているかを評価可能にした。
- 周辺分布の一致は依存構造に制約を与えず,D_Sigmaは大きく変動し得ることを示した。
- D_Sigmaを抑制することで,PCAなどの依存構造に敏感な手法の安定性が保証されることを理論的に証明し,実験的に検証した。
Transformerにおける文脈関係の表現力について [stat.ML, cs.LG]目的:Transformerにおける文脈関係の表現力の理論的解明
- 自然言語処理において,文脈を考慮したモデルは性能向上に不可欠である。
- Transformerの文脈関係の表現力は経験的に示されているが,その理論的基盤は未解明である。
- 文脈関係を確率的対象として捉え,Transformerの表現力の限界を明らかにすること。
- 標準的なSoftmax Attentionとエントロピー正則化された最適輸送との間に自然な関係があることが示された。
- Softmax AttentionとSinkhorn正規化を用いることで,任意の文脈関係規則を近似できることが証明された。
- 正規化手法の選択が,文脈関係の表現方法を決定することが明らかになった。
ボルツマン事前分布を持つ生成表現学習のためのマルチモード量子アニーリング [quant-ph, cond-mat.stat-mech, cs.LG]目的:生成表現学習のための量子アニーリングに基づくフレームワークの開発
- エネルギーベースモデルは,統計物理学と機械学習を橋渡しし,データ表現の新しい可能性を拓く。
- 従来のボルツマン機械は,汎用的なボルツマン分布からのサンプリングの古典的な困難さにより,生成学習への応用が制限されてきた。
- 量子アニーリングを用いて,ボルツマン事前分布を持つ変分オートエンコーダを実現し,生成能力と異常検知性能を向上させる。
- 本研究では,D-Wave Advantage2プロセッサを用いて,MNIST,Fashion-MNIST,CelebAデータセットで安定した学習と高品質な生成を実証した。
- 従来のガウス事前分布を持つVAEと比較して,収束が速く,再構成損失が低いことが示された。
- 学習されたエネルギー関数は,再構成損失だけでは捉えきれない,分布外検出のための識別能力を提供することが確認された。
ニューラルネットワーク海洋クロージャーの較正:平均状態と変動性の改善 [physics.soc-ph, cs.SI, stat.ME, cs.CY, stat.AP, physics.ao-ph, cs.LG, physics.comp-ph]目的:粗解像度海洋モデルにおける平均状態と変動性のバイアス低減
- 地球温暖化や気候変動予測において,海洋の役割は重要であり,高精度な海洋モデルが不可欠である。
- 粗解像度モデルでは,中尺度渦が解像できず,平均状態や変動性にバイアスが生じるという課題がある。
- アンサンブルカルマン逆法を用いて,中尺度渦をパラメータ化するニューラルネットワークのパラメータを体系的に較正する。
- 較正されたパラメータ化により,平均流界面やその変動性における誤差が1.7~3.3倍低減された。
- カルマン逆法は,カオス的な海洋力学に起因する時間平均統計量のノイズに対して頑健であることが示された。
- 統計的平衡に達するまでの積分を回避する効率的な較正プロトコルが提案された。
標準テレコム非線形モジュールを用いた小規模光子コモロフ・アルノルド・ネットワーク [physics.optics, cs.AI]目的:小規模光子コモロフ・アルノルド・ネットワークの実現
- 光コンピューティングは高速推論を可能にするが,従来の構成は電気的な非線形性によりボトルネックが生じる。
- 光と電気間の変換を繰り返すことで,高速化のメリットが薄れてしまうという課題がある。
- 標準的なテレコム部品のみで,光学的ネットワークの非線形推論性能向上を目指す。
- 標準的なテレコム部品を用いた小規模光子コモロフ・アルノルド・ネットワーク(SSP-KAN)が実現された。
- 分類,回帰,画像認識タスクにおいて,ソフトウェアのベースラインに匹敵する性能を示した。
- 4モジュールネットワークは非線形分類ベンチマークで94.3%の精度,7モジュールネットワークは回帰でR^2 = 0.986を達成した。
パーキンソン病分類における配列ベースのタンパク質表現の限界:リークフリーなベンチマーク [q-bio.QM, cs.AI, cs.LG]目的:パーキンソン病分類のためのタンパク質一次構造に基づく表現の識別能力の評価
- タンパク質配列は基本的な生物学的情報源であり,疾患研究への応用に期待が集まっている。
- 複雑な疾患分類において,タンパク質配列のみから十分な識別能力を得ることが困難である。
- タンパク質配列情報のみでパーキンソン病を分類する際の限界を明確にすること。
- 最も性能の良い構成(ProtBERT + MLP)は,F1スコア0.704±0.028,ROC-AUC 0.748±0.047を示し,中程度の識別性能に留まった。
- 古典的な表現であるk-merも同程度のF1値(約0.667)を示したが,再現率が高く,適合率が低いという偏りが見られた。
- 表現方法間の性能差は狭く,教師なし解析ではクラスラベルと整合する内在構造は見られず,統計的有意差も認められなかった。
有限自由情報不等式とp-Stam相転移におけるスペクトル構造 [math.PR, cs.LG, math.CO]目的:有限自由加法畳み込みにおける実根多項式に対する$\ell^p$一般化された有限自由Stam不等式の極値構造
- 自由確率論は,量子力学やランダム行列理論など,多様な分野に応用されており重要な研究領域である。
- 極値問題の解析は数学的に困難であり,既存の手法では十分な情報が得られない場合が多い。
- FlowBoostを用いて極値構造を効率的に探索し,p-Stam不等式の臨界指数を決定することを試みる。
- FlowBoostによって,Hermite対が唯一の等式ケースであることが確認され,線形化された畳み込み写像のスペクトル構造が明らかになった。
- Doubly stochastic coupling行列$E_n$の特異値が${2^{-k/2}:k=1,\ldots,n-1}$であるという予想が立てられ,仮定の下で鋭い局所安定定数と有限自由CLT収束率が得られた。
- p>2の場合,Hermite対はp-Stam不等式を満たさず,$p<2$の場合には二峰性を示す根構造を持つ非一致対への分岐が確認された。
SMARTファクター拡張ニューラルLasso [stat.ML, cs.LG, stat.ME]目的:高次元非パラメトリック設定における変数選択を伴う事前学習モデルのファインチューニング手法の開発
- 事前学習モデルの活用は機械学習の性能向上に不可欠であり,様々なタスクへの適応が求められている。
- 高次元データにおけるファインチューニングの理論的性質や変数選択のメカニズムは未だ解明されていない。
- 共変量シフトや事後分布シフトを考慮しつつ,高次元非パラメトリック回帰における統計的加速を実現する。
- 提案手法SMART-FAN-Lassoは,従来のファインチューニング手法と比較して,多様なシナリオで一貫して優れた性能を示す。
- 特に,ターゲットタスクのサンプルサイズが限られている状況下でも,ほぼオラクル性能に匹敵する結果が得られた。
- サンプルサイズと関数複雑さに関する条件のもとで,ファインチューニングが単一タスク学習よりも統計的に優位であることが理論的に示された。
異質な目的と制約下における決定志向型連合学習 [math.OC, cs.LG, stat.ML]目的:異質な目的と制約を持つクライアント間での決定志向型連合学習における協力的な予測モデルの訓練
- 連合学習は,プライバシー保護を重視しつつ,分散データを活用する重要な技術である。
- クライアント間の目的関数や実行可能領域の異質性が,連合学習の性能低下を招く課題である。
- 目的関数のずれと実行可能領域のずれを分離し,連合学習の安定性と効率性を改善することを目指す。
- 目的関数のわずかな変化でも決定志向型の損失に大きな差が生じることが示された。
- 実行可能領域が強凸な場合,より厳密な安定性に基づく限界が導き出された。
- プーリングの統計的利点がクライアント固有の異質性ペナルティを上回る場合に,連合学習が有益であることが示された。
知覚的注意ネットワークを用いたリアルな臨床的低線量肝臓CTの教師なしノイズ除去 [math.OC, cs.SY, eess.SY, eess.IV, cs.AI, cs.CV]目的:低線量CT画像のノイズ除去
- 医療画像処理は臨床研究を支援する重要な技術であり,診断精度向上に貢献する。
- 低線量CTは被ばく量を減らせるが,ノイズが増加し,医師の診断を妨げる可能性がある。
- 臨床データを用いた教師なし学習で,低線量CT画像の高品質化を目指す。
- 提案手法は,U-Net,注意機構,残差ネットワークを組み合わせたフレームワークである。
- 知覚的損失を用いることで,医療画像の特徴を考慮したノイズ除去を実現した。
- 実際の臨床データを用いた実験で,従来の古典的手法を上回る性能を実証した。
脳波に基づく認知負荷評価のためのOne-Block Transformer (1BT) [eess.SP, cs.AI, cs.HC, cs.LG]目的:脳波に基づく認知負荷評価の効率化
- 適応的な人間機械システムの構築には,正確な認知負荷の評価が不可欠である。
- 表現能力と計算効率の両立が難しく,実用的な展開が課題となっていた。
- 計算資源が限られた環境下でのリアルタイムな認知負荷モニタリングを実現する。
- 提案手法1BTは,最小限の潜在的ボトルネックと単一のクロスアテンションモジュールにより,コンパクトかつ効率的なモデルを実現した。
- アーキテクチャ分析の結果,高い性能を維持しつつ,パラメータ数を0.5百万以下,計算量を0.02 GFLOPs以下に抑えることができた。
- 本研究は,リソース制約のある環境下での認知負荷モニタリングに向けた設計指針を提供する。
証明理論的意味論を通じた情報に関する推論主義的考察 [math.LO, cs.AI]目的:情報の推論主義的意味論理論の構築に向けた第一歩
- 現代社会において情報は不可欠であり,その論理的・数学的基盤の確立が急務である。
- 既存の情報理論は,厳密な論理的・数学的基礎を欠き,複雑なシステム理解を妨げている。
- 推論と推論規則に基づいた,情報および情報処理システムの厳密な理論的枠組みを提示する。
- 情報概念を真理から推論可能性に置き換えることで,新たな情報概念「インフェロン」を定義した。
- 証明理論的意味論(P-tS)を用いて,情報-as-相関の数学的・論理的モデルを構築した。
- P-tSのツールを応用し,分散システムのモデル化における情報フローの推論に基づく理論を提案した。
非コヒーレント無線集合学習における資源要素エネルギー差 [eess.SP, cs.AI, cs.DC, cs.LG, stat.ML]目的:非コヒーレント物理層プライミティブREEDを用いた連続的な符号付き集約
- 無線通信における分散学習は,通信遅延を削減し,プライバシー保護を実現する重要な技術である。
- コヒーレントな集約は,同期やチャネル状態情報が必要であり,複雑性が高いという課題がある。
- REEDを用いることで,コヒーレントな処理なしで符号付き集約を可能にし,効率的な分散学習を実現する。
- 提案手法REEDは,正負の更新値を対応する直交資源要素の送信エネルギーにマッピングし,差分によって符号付き和を推定する。
- レイリーフェージング環境下において,REEDの一次および二次モーメントを導出し,分散と資源のトレードオフを明らかにした。
- チャネルインバージョンや受信側CSIを必要とせず,平均チャネルパワーの遅い時間スケールでの較正のみで動作する。
デフレートされたQ値反復の切り替え幾何学解析 [eess.SP, cs.CY, quant-ph, cs.CC, math.OC, cs.AI]目的:割引マルコフ決定過程制御におけるランク1デフレートされたQ値反復(Q-VI)の解析
- 強化学習は,複雑な意思決定問題を解決するための重要な手法であり,その効率的なアルゴリズムの開発が求められている。
- Q値反復は,その収束性保証が厳密な解析困難であり,特に大規模問題では収束速度の改善が課題となっている。
- デフレートされたQ値反復の収束性を,切り替えシステムの幾何学を通して解析し,より厳密な収束率を導く。
- 本研究では,デフレートされたQ-VIの収束性を解析するため,ジョイントスペクトル半径(JSR)フレームワークを適用した。
- 標準的なQ-VIの切り替えシステムモデルのJSRは割引率$\gamma$と等しいのに対し,デフレートされたQ-VIでは,冗長な成分を除去することで,JSRが$\gamma$よりも小さくなる可能性があることが示された。
- デフレートは意思決定問題自体を変更するのではなく,冗長成分を除去することで,収束幾何学をより正確に記述することを可能にする。
アトラクタ・血管結合理論:スマートフォン型光プトレトグラフィーによるカフレス血圧推定の形式的根拠と経験的検証 [physics.med-ph, cs.AI, cs.LG]目的:カフレス血圧推定のための数学的枠組みと検証
- 高血圧は,心血管疾患の主要なリスク因子であり,早期発見と管理が重要である。
- 従来の血圧測定はカフが必要であり,装着が煩雑で,頻繁な測定が困難である。
- スマートフォン等のウェアラブルデバイスを用いた,簡便かつ正確な血圧推定法の確立。
- 本研究で提案するアトラクタ・血管結合理論(AVCT)に基づき,心臓アトラクタの幾何学的特徴が血圧情報を含んでいることが示された。
- 単一点較正下で,パルストランジットタイム(PTT)と心臓安定性指数(CSI)アトラクタ特徴量を用いたLightGBMモデルは,厳格なleave-one-subject-out交差検証で収縮期血圧(SBP)の平均絶対誤差(MAE)2.05mmHg,拡張期血圧(DBP)のMAE 1.67mmHgを達成した。
- スマートフォンカメラのみを用いた血圧トラッキングが可能であり,既存研究よりも高い精度を実現した。AVCTの全予測が定量的に確認され,較正により誤差が91.5%減少した。
支払異質性指数:高頻度調達の監視と意思決定支援のための統合的な教師なしフレームワーク [econ.EM, cs.LG, q-fin.ST, stat.AP]目的:高頻度調達における異常検知と監査優先順位付けのための指標
- 公共調達は不正リスクが高く,監視が不可欠である。
- 入札段階の異常に焦点が当たり,事後支払いの監視は不十分である。
- ラベル付きデータが不足する状況で,解釈可能な監視フレームワークを提供する。
- 支払異質性指数(PHI)は,支払構造と潜在的パターンを特徴付ける複合統計量である。
- 英国の自治体調達データへの適用により,特徴的な支払いパターンを持つ業者群を特定した。
- PHIは,変動係数では見過ごされるパターンを明らかにし,透明性の高い監査を可能にする。
分散の説明を超えて:主成分分析に関する注意点 [cond-mat.stat-mech, cs.LG]目的:高次元データの可視化における主成分分析の限界
- データの可視化は,高次元データの理解に不可欠であり,特に複雑な構造の把握に重要である。
- 主成分分析は次元削減手法として広く用いられるが,非線形多様体上のデータに対しては誤った解釈を招く可能性がある。
- 本研究は,主成分分析の解釈における注意点を示し,より適切な分析手法の可能性を探る。
- 化石の歯データを用いた分析により,主成分分析で示されたクラスタリングは存在せず,環状構造を持つことが示された。
- t-SNEや持続ホモロジー分析の結果も環状構造を支持し,主成分分析の結果とは異なる見解を示した。
- データの生成モデルを提案し,ペアワイズコサイン距離の分布が観測されたU字型分布と一致することからモデルの妥当性が裏付けられた。
近赤外分光法における前処理選択の再検討:モデル内部キャリブレーションとしての演算子適応PLSとRidgeモデルの大規模ベンチマーク [stat.ML, cs.LG, eess.SP]目的:近赤外分光法における前処理選択の効率化と,その精度維持
- 近赤外分光法は,迅速かつ非破壊的な分析手法であり,幅広い分野で活用されている。
- 最適な前処理方法の探索は計算コストが高く,効率的な手法が求められている。
- モデル内部での演算子適応キャリブレーションにより,前処理探索の時間を大幅に短縮することを目指す。
- 演算子適応PLSモデルは,従来のPLSモデルと同等の予測精度を,大幅に短い計算時間で実現した。
- 演算子適応Ridgeモデルは,特に高性能なRidgeモデルと比較して,高い予測性能を維持しながら計算時間を短縮した。
- 分類タスクにおいても,演算子適応PLSモデルは,分類精度を向上させ,計算効率を高めることが示された。
