arXiv雑要約

画像・音声 - 2025/12/16 公開

  • CIC:円環型画像圧縮 [eess.SP, cs.SY, eess.SY, eess.IV, cs.CV, cs.LG]目的:画像圧縮性能の向上
    • 画像圧縮はデータ伝送や保存において重要な役割を担う技術である。
    • 学習済みの画像圧縮モデルは,未知の画像に対する性能劣化が課題となる。
    • テスト画像と訓練画像のギャップを最小化し,汎化性能を高めることを目指す。
    • 提案手法である円環型画像圧縮(CIC)は,閉ループ構造により,従来の画像圧縮手法よりも高い性能を発揮する。
    • テイラー展開による解析から,再構成画像と元の画像の間の定常状態誤差がほぼゼロになることが示された。
    • 5つの公開画像データセットを用いた実験により,CICが最先端の画像圧縮アルゴリズムを上回る性能を示すことが確認された。

    Link: https://arxiv.org/abs/2407.15870

  • スライスごとの学習された生成拡散事前分布を用いたロバストな同時マルチスライスMRI再構成 [eess.IV, cs.AI, cs.CV, eess.SP, physics.med-ph]目的:同時マルチスライスMRI再構成のロバスト性向上
    • MRI検査時間の短縮が望まれる中で,同時マルチスライス法は高速化に貢献する重要な技術である。
    • スライス間の複雑な信号干渉により,同時マルチスライスMRIの再構成は依然として困難な課題である。
    • 本研究は,データ整合性を保ちつつ,学習された拡散事前分布を用いてロバストな再構成を実現する。
    • 提案手法ROGERは,ノイズから徐々に画像を復元する逆拡散過程と,測定されたk空間データの一貫性を組み合わせる。
    • ROGERは,シングルスライス画像で学習した拡散モデルをそのまま同時マルチスライス再構成に適用可能である。
    • 実験結果から,ROGERは既存手法と比較して優れた性能を示し,解剖学的および機能的イメージングの品質を向上させることが確認された。

    Link: https://arxiv.org/abs/2407.21600

  • 複数の対象物におけるスクリーニングなしがより効率的である [econ.TH, cs.AI, cs.GT, cs.LG]目的:複数の異質な対象物の割り当てに関する効率的なメカニズム設計
    • 資源配分において,効率的なメカニズム設計は,社会全体の厚生水準を向上させる上で重要である。
    • 対象物の種類が増加するにつれて,最適なメカニズム設計が困難になるという課題が存在する。
    • 対象物の多様性が増す状況下で,スクリーニングを伴わないメカニズムの効率性を検証し,改善を目指す。
    • 対象物の種類が増えるにつれて,スクリーニングを伴わないメカニズムがより良い結果をもたらす傾向が確認された。
    • この傾向は,簡略化された環境下における漸近的に効率的なメカニズムの特性付けと,数値的な検証によって裏付けられた。
    • パンデミックに対するワクチン接種スケジューリングシステムとして,登録・招待・予約システム (RIB) が提案された。

    Link: https://arxiv.org/abs/2408.10077

  • MAISI:合成画像のための医療AI [eess.IV, cs.AI, cs.CV]目的:医療画像生成によるデータ不足,アノテーションコスト,プライバシー問題の緩和
    • 医療画像解析は,病状診断や治療計画において不可欠であり,その重要性は増している。
    • 十分な学習データ確保が困難であり,アノテーション作業に多大なコストと時間がかかる。
    • 拡散モデルを用いた合成画像生成により,データ不足やプライバシー問題を解決する。
    • MAISIは,高解像度(512x512x768)の3D CT画像を柔軟な寸法とボクセル間隔で生成可能である。
    • ControlNetを活用し,127種類の解剖学的構造を含む臓器セグメンテーションを条件として,正確なアノテーション付きの合成画像を生成する。
    • 生成された画像はリアリティと解剖学的精度が高く,合成データ利用による課題解決に貢献する可能性を示す。

    Link: https://arxiv.org/abs/2409.11169

  • WALINET:1H MRスペクトルイメージングにおけるノイズ除去のための水と脂質を識別する畳み込みニューラルネットワーク [eess.IV, cs.CV, cs.LG]目的:1H MRスペクトルイメージングにおける水と脂質の除去
    • 脳代謝を非侵襲的に評価できる1H-MRSIは,疾患の診断や治療効果の評価に重要である。
    • 頭皮からの脂質信号や水信号が大きく,代謝物質のスペクトルと重なり,正確な分析を妨げている。
    • 高分解能1H-MRSIにおける脂質と水信号の効率的かつ正確な除去を可能にすること。
    • WALINETは,従来のHLSVD+L2法と比較して,処理時間が大幅に短縮され,高分解能脳全体のMRSIを8秒で完了する。
    • 定量評価により,WALINETは脂質除去性能が向上し,シミュレーションデータおよびin-vivoデータにおいて代謝物質の保存も優れていることが示された。
    • WALINETを用いて得られた代謝マップは,健康な被験者および患者において,より鮮明な灰白質/白質対比と構造の詳細を示す。

    Link: https://arxiv.org/abs/2410.00746

  • 取扱可能性の限界におけるΦ-均衡の学習と計算 [stat.ML, cs.GT, cs.LG]目的:Φ-均衡の計算とオンライン学習における平均Φ-リグレトの最小化
    • オンライン学習とゲーム理論は,現代社会における意思決定の最適化に不可欠な分野である。
    • 多人数ゲームにおける均衡の計算は,計算量的に困難であり,実用的なアルゴリズムが求められている。
    • 多項式次元を持つΦ-均衡を効率的に計算し,学習可能なΦ-リグレトを達成することを目指す。
    • 本研究では,多項式次元を持つΦ-均衡を,近似精度εで計算する多項式時間アルゴリズムを提案した。
    • また,平均Φ-リグレトがε以下となるオンライン学習アルゴリズムを開発し,その計算量を評価した。
    • オンライン学習設定において,ほぼ最適な下限を導出し,Φ-リグレトの学習可能性を明らかにした。

    Link: https://arxiv.org/abs/2502.18582

  • マルチスペクトル画像セグメンテーションのための説明可能な量子機械学習:ケーススタディ [quant-ph, cs.CV, cs.LG]目的:マルチスペクトル画像セグメンテーションにおける説明可能な量子機械学習の応用可能性の検証
    • リモートセンシング技術の発展により大量のデータが得られるようになり,その処理が重要課題となっている。
    • 古典的な手法では,データ処理に時間がかかりすぎる,または処理自体が困難な場合がある。
    • ノイズ中間規模量子(NISQ)デバイスを用いたハイブリッド量子古典モデルの性能低下要因を説明可能にする指標を提案する。
    • 提案された説明可能性指標により,量子デバイスの挙動がモデルの性能に影響を与えることが明らかになった。
    • 実際の量子デバイス上でのハイブリッド量子古典モデルの実行が抱える課題を定量的に評価することができた。
    • 同様の実験を行う際の費用を,現在の市場価格に基づいて分析し,経済的な側面も考慮した。

    Link: https://arxiv.org/abs/2503.08962

  • 学習されたアトラス座標による脳解剖スラブの参照なし3D再構成 [eess.IV, cs.CV]目的:脳解剖スラブの写真からの3D再構成
    • 病理学的所見とMRIの相関は,病理の顕微鏡的特徴を生体内のスキャンに転送する可能性を秘めている。
    • 既存の方法は,参照となる3Dデータまたは完全なスラブスタックを必要とし,適用が制限される。
    • 参照なしで脳解剖スラブの写真を3D再構成し,部分的なスタックや単一のスラブにも対応する。
    • RefFreeは,デジタルスライスされたMRIデータを用いて生成された合成写真に基づき,アトラス空間における3D座標を予測する。
    • 完全なスラブスタックがある場合,RefFreeは既存の方法と同等の性能をより高速に達成する。
    • 部分的なスタックや単一のスラブに対しても正確な再構成と登録が可能であり,アトラスからの情報を単一の写真に伝播できる。

    Link: https://arxiv.org/abs/2503.09963

  • スコアベースのターボメッセージパッシングによるプラグアンドプレイ圧縮画像復元 [eess.IV, cs.CV, eess.SP]目的:圧縮画像復元のためのスコアベースのMMSE(最小二乗誤差)デノイザの統合
    • 画像処理において,圧縮センシングはサンプリング数を削減し,効率的な復元が求められている。
    • 既存手法では,汎用的なデノイザが使用され,真の画像事前分布を捉えきれない場合がある。
    • スコアベース生成モデルを利用し,より正確な画像分布を考慮した復元を目指す。
    • 提案手法は,従来のメッセージパッシング,正則化線形回帰,スコアベース事後サンプリングよりも優れた性能を示す。
    • 特に,高いアンダーサンプリング率の条件下で,従来の技術よりも優れた結果が得られる。
    • 本手法は,20回のニューラル関数評価(NFE)未満で収束することが確認された。

    Link: https://arxiv.org/abs/2503.22140

  • 組織画像に対するマーカーごとの条件付き拡散モデルを用いたバーチャル多重染色 [eess.IV, cs.CV]目的:組織画像からのバーチャル多重染色生成
    • 病理学において,多重イメージングは分子レベルの知見をもたらす革新的な技術である。
    • 多重イメージングの取得は複雑かつ高コストであり,普及が妨げられている。
    • 既存のH&E画像から,バーチャルな多重染色画像を生成することで,この課題を解決する。
    • 本研究では,H&E画像から最大18種類のマーカーを生成可能であり,従来の2〜3種類から大幅な改善がみられた。
    • 事前学習済みの拡散モデルを活用することで,マーカーごとに条件付けた画像生成を可能にした。
    • 単一ステップサンプリングによる高速化と,ピクセルレベル損失関数による色コントラストの忠実性向上を実現した。

    Link: https://arxiv.org/abs/2508.14681

  • アルゴリズム共謀はアルゴリズム調整である [econ.TH, cs.GT]目的:アルゴリズム共謀におけるメタゲーム
    • 価格競争におけるアルゴリズムの利用拡大に伴い,共謀の可能性が重要視されている。
    • アルゴリズムが共謀的な価格設定を学習することが,暗黙の共謀と解釈されてきた。
    • アルゴリズム調整という観点から,共謀のメカニズム解明を目指す。
    • アルゴリズム共謀には,アルゴリズム設計者による明示的な調整が不可欠であると主張する。
    • 設計者はアルゴリズムのパラメータ化を通じてメタゲームをプレイし,その結果,新たな均衡と共謀現象が明らかになる。
    • 本モデルは,アルゴリズム共謀をより戦略的な視点から分析することを可能にする。

    Link: https://arxiv.org/abs/2508.14766

  • パッチに基づく拡散法:データ効率が高く,放射線科医が好むMRI再構成 [eess.IV, cs.CV]目的:データ効率の良いMRI再構成手法の開発
    • MRIは医療診断に不可欠だが,長時間の撮像時間と高コストが課題となっている。
    • 従来の拡散モデルは大量の学習データが必要であり,臨床現場での利用が困難である。
    • 少量のデータで高精度なMRI再構成を可能にし,臨床現場での診断精度向上を目指す。
    • PaDIS-MRIは,FastMRI-EDMと比較して,画像品質指標(PSNR,SSIM,NRMSE)で優れていた。
    • わずか25枚のk空間画像で学習したPaDIS-MRIは,様々な条件下で優れた再構成性能を示した。
    • 盲検試験の結果,放射線科医は91.7%の症例でPaDIS-MRIの再構成画像を診断的に優れていると評価した。

    Link: https://arxiv.org/abs/2509.21531

  • SAC:意味・音響二重ストリーム量子化を用いたニューラル音声コーデック [eess.AS, cs.SD]目的:意味と音響を分離した二重ストリーム量子化によるニューラル音声コーデックの開発
    • 音声言語モデルの発展に不可欠であり,高品質な音声表現が求められている。
    • 既存のコーデックは,高音質と意味的な豊かさのバランスに課題がある。
    • 音響と意味を分離し,それぞれの最適化を図ることで,より高品質な音声表現を目指す。
    • SACは,多様なビットレートと環境下で優れた再構成性能を発揮し,UTMOSとWERで高いスコアを達成した。
    • SACは,従来のコーデックよりも優れた意味表現能力を示し,連続自己教師あり学習による埋め込み表現に匹敵するレベルに達した。
    • SACをLLMベースのTTSのトークナイザーとして使用することで,最先端のAR TTSモデルを凌駕する性能を実現した。

    Link: https://arxiv.org/abs/2510.16841

  • マルチステージVision Transformerフレームワークを用いたヒルシュスプルング病の自動病理学的評価 [q-bio.QM, cs.CV, eess.IV]目的:ヒルシュスプルング病の病理学的評価の自動化
    • ヒルシュスプルング病は,腸神経節細胞の欠如を特徴とする疾患であり,正確な診断が重要である。
    • 病理医による診断には熟練と経験が必要であり,観察者間のばらつきが生じやすい。
    • 病理学的評価の効率化と客観性向上を目指し,AIによる支援技術の開発が求められている。
    • 提案手法は,筋肉層,神経叢,神経節細胞の順にセグメンテーションを行う3段階分析フレームワークを採用した。
    • 筋肉層のセグメンテーションではDice係数89.9%,神経叢包含率100%を達成した。
    • 神経節細胞の検出では,高い確信度で注釈された細胞に対して適合率62.1%,再現率89.1%を達成し,全体としても良好な結果を示した。

    Link: https://arxiv.org/abs/2511.20734