arXiv雑要約

画像・音声 - 2026/05/15 公開

  • RAM-W600:関節リウマチのためのマルチタスク手関節データセットとベンチマーク [eess.IV, cs.CV]目的:関節リウマチにおける手関節の骨インスタンスセグメンテーションとSharp/van der Heijde骨びらんスコアリングのためのデータセット
    • 関節リウマチは頻度の高い自己免疫疾患であり,コンピュータ支援診断や病状モニタリングの重要性が認識されている。
    • 手関節は関節リウマチの診断において重要な部位だが,高品質なインスタンスレベルのアノテーションの取得が困難であった。
    • 本研究は,手関節の骨インスタンスセグメンテーションの公開データセットを提供し,関連研究のハードルを下げることを目指す。
    • 本データセットは,6つの医療機関から収集された388人の患者の手関節X線画像1048枚で構成されている。
    • 画像618枚に対してピクセルレベルの骨インスタンスセグメンテーションアノテーション,800枚に対してSvdH骨びらんスコアが付与されている。
    • このデータセットは,関節裂隙狭窄の定量化,骨びらん検出,骨変形の評価など,関節リウマチ関連研究の進展に貢献すると期待される。

    Link: https://arxiv.org/abs/2507.05193

  • Spheresデータセット:音楽ソース分離と情報検索のための多トラックオーケストラ録音 [eess.AS, cs.LG, cs.SD]目的:音楽ソース分離と関連する音楽情報検索タスクにおける機械学習研究の進展
    • オーケストラ音楽は複雑な音響構造を持ち,自動処理技術の進歩が求められている。
    • 既存のデータセットでは,オーケストラ演奏の多角的・高精度な録音データが不足していた。
    • オーケストラ音楽における楽器分離や空間音響処理のためのベンチマークデータセットを提供する。
    • Spheresデータセットは,コブリ・アンサンブルによるオーケストラ録音約1時間以上で構成される。
    • 23個のマイクを用いて録音し,楽器間のブリーディングを制御したリアルなステレオミックスと分離ステムを提供。
    • 各楽器の位置におけるルームインパルス応答も推定され,録音空間の音響特性に関する情報も提供する。

    Link: https://arxiv.org/abs/2511.21247

  • 形式憲法における中央集権性と安定性 [econ.TH, cs.GT]目的:形式システムにおける投票決定メカニズムの自己維持性に関する研究
    • 社会選択理論は,集団意思決定の公平性や効率性を追求する上で不可欠な分野である。
    • 既存の社会選択メカニズムは,しばしば操作可能性や循環投票といった問題に直面する。
    • 本研究は,自己維持性という観点から,中央集権化の度合いと安定性の関係を解明する。
    • 自己維持性を持つ社会選択メカニズムは,他メカニズムへの移行を防ぐ性質を持つ。
    • 無作為信念に基づく場合,自己維持可能なメカニズムは独裁のみであり,他のメカニズムは独裁へと移行する。
    • 悲観的信念と現状維持を優先する同点打破ルール下では,最小勝者連合サイズが2以下のゲームが自己維持可能となる。

    Link: https://arxiv.org/abs/2512.22051

  • パルス系列の瞬間スペクトル解析 -- 異常肺音への応用 [physics.soc-ph, cs.SD]目的:パルス系列の瞬間スペクトル解析における時間周波数構造の可視化
    • 呼吸音解析は,呼吸器疾患の診断や重症度評価において重要な役割を担う。
    • 従来のフーリエ変換では,時間分解能と周波数分解能の限界が存在した。
    • 周期境界条件の代替手法を用いて,時間分解能を向上させ,より詳細な解析を可能とする。
    • フーリエ変換の数値実装における周期境界条件が,時間周波数分解能の限界を生じさせていることが示唆された。
    • 提案手法である線形外挿条件(LXC)を用いることで,瞬間スペクトル解析が可能となり,短時間フーリエ変換(STFT)に代わる手法となる。
    • 異常肺音(断続音と喘鳴)および正常な肺音に対し,瞬間スペクトル解析を適用することで,時間周波数構造を可視化することに成功した。

    Link: https://arxiv.org/abs/2602.03680

  • 時間周波数相関に基づく非対称エンコーダ・デコーダによる音声分離 [eess.AS, cs.SD]目的:音声分離における性能向上
    • 現実環境下での音声分離は,混響や雑音の影響を考慮する必要があり,重要な課題である。
    • 従来の音声分離モデルは,最終段階で分離を行うため,情報がボトルネックとなり,悪条件下では性能が低下する。
    • 時間周波数相関を利用し,段階的な分離・再構成を行うことで,分離性能の改善を目指す。
    • SR-CorrNetと呼ばれる非対称エンコーダ・デコーダフレームワークを提案し,分離・再構成戦略を導入した。
    • 時間周波数相関を特徴量とし,それに対応するフィルタを推定することで,音声分離を構造化された問題として定式化した。
    • WSJ0-{2,3,4,5}Mix,WHAMR!,LibriCSSでの実験により,様々な条件下で一貫した性能向上が確認された。

    Link: https://arxiv.org/abs/2603.29097

  • 分散型予測市場の解剖:Polymarketオーダーブックからのミクロ構造的証拠 [q-fin.TR, cs.GT, q-fin.GN]目的:分散型予測市場Polymarketのミクロ構造の分析
    • 予測市場は,将来の出来事に関する情報の集約と効率的な価格形成を可能にする重要なメカニズムである。
    • 既存の予測市場では,情報の非対称性や市場操作といった問題が存在する可能性がある。
    • Polymarketのような分散型予測市場における市場のミクロ構造を明らかにすることで,その健全性と効率性を評価する。
    • Polymarketのオーダーブックデータ分析により,スプレッド,深さ,ウォレットの多様性など,8つの特徴的な事実が明らかになった。
    • オーダーブックから推測される取引方向とオンチェーンの実際の取引方向との一致率は約59%であり,Nasdaqの約80%を下回る。
    • ミクロ構造分析においては,取引方向の特定にオンチェーンのOrderFilledイベントを利用する必要があることが示唆された。

    Link: https://arxiv.org/abs/2604.24366

  • XTinyU-Net:初期化時の感度に基づくU-Netのスケーリング [eess.IV, cs.CV]目的:リソース制約環境下における医療画像セグメンテーションのための,軽量なU-Net構成の自動選択
    • 医療画像セグメンテーションは,疾患の診断や治療において不可欠であり,高精度が求められる。
    • 計算資源が限られた環境では,モデルの圧縮が課題となるが,最適な構成を見つけるには膨大な計算コストが必要。
    • 初期化時の感度に基づいて最適な構成を効率的に特定し,軽量かつ高性能なモデルを構築すること。
    • 提案手法XTinyU-Netは,従来のnnU-Netと同等のセグメンテーション精度を,400倍〜1600倍少ないパラメータで達成した。
    • XTinyU-Netは,他の軽量アーキテクチャと比較しても,5倍〜72倍少ないパラメータでより高い性能を示した。
    • 初期化時のヤコビアンに基づく感度指標を用いることで,トレーニング不要で安定した最小構成を特定できる。

    Link: https://arxiv.org/abs/2605.09639