arXiv雑要約

プログラム - 2026/01/30 公開

  • コーディング面接パズルの問題解決に認知能力と性格がどのように影響するか [cs.SE]目的:コーディング面接パズルの問題解決における認知能力と性格の関連性
    • ソフトウェア開発は,個人の認知特性に左右される高度な認知活動を伴うため,人材育成が重要である。
    • 認知能力と性格特性が問題解決能力に与える影響について,十分な理解が得られていない。
    • ソフトウェアエンジニアの採用や役割分担において,認知能力と性格特性を考慮することの有用性を示す。
    • 文法推論テストの正答率と問題解決の正答率は正の相関関係が認められ,高い推論能力を持つほど応用問題の解決能力が高い傾向にある。
    • 誠実性(Conscientiousness)は,文法推論テストと問題解決の正答率の両方と正の相関関係が最も強く,重要な性格特性である。
    • 経験への開放性(Openness to experience)も,文法推論と問題解決の正答率と正の相関を示し,神経症傾向(Neuroticism)は両者に弱い負の相関を示した。

    Link: https://arxiv.org/abs/2511.14367

  • 安定モデルへの変換によるサポートモデルの計算 [cs.LO]目的:サポートモデルの計算手法
    • 知識表現と推論において,安定モデル意味論は非常に有効である。
    • 安定モデルの最小性要件は,論理的に整合性のある解空間の探索を制限することがある。
    • サポートモデルの計算を可能にし,安定モデルでは得られない推論能力を提供する。
    • 本研究では,既存のASPソルバーを用いてサポートモデルを計算するための,変換に基づく新規手法を提案する。
    • 提案手法は,元のプログラムのサポートモデルと正確に対応する安定モデルを持つ同等のプログラムに論理プログラムを変換する。
    • ソフトウェア検証,医療診断,計画立案への応用事例を示し,実用的な有用性を実証する。

    Link: https://arxiv.org/abs/2512.05437

  • 期待値伝播における期待値 [cs.IT, eess.SP, math.IT, stat.CO]目的:期待値伝播アルゴリズムにおける期待値の解析
    • 大規模な推論問題において,効率的な近似推論を実現するための重要な手法である。
    • 期待値伝播では,メッセージの積分値が無限大になることがあり,アルゴリズムの進行を妨げる場合がある。
    • 無限大の積分値を持つメッセージを回避し,アルゴリズムの安定性を向上させることを目指す。
    • 線形モデルにおける期待値伝播を解析し,信念間の関係性を明らかにした。
    • 積分値が無限大になるメッセージを防止するための,一時的なアプローチと永続的なアプローチを提案した。
    • 線形モデルにおける期待値伝播メッセージの関係性を利用し,無限大の積分値を持つメッセージの発生を回避する追加のアプローチを開発した。

    Link: https://arxiv.org/abs/2512.08034

  • ソフトウェア工学研究におけるオープンサイエンスの現状:ICSE成果物に関する事例研究 [cs.SE]目的:ソフトウェア工学研究におけるオープンサイエンスの実態把握
    • ソフトウェア工学研究の信頼性向上には,研究成果の透明性,検証可能性,再利用性が不可欠である。
    • ICSE等の主要な会議で成果物の共有は標準的になっているが,実用性は十分に検証されていない。
    • ICSEの過去10年間の成果物を評価し,実行可能性と再現性の課題を明らかにする。
    • 評価した100個の成果物うち,実行可能なものは40%に留まった。
    • 実行可能な成果物でも,変更なしで実行できたのは32.5% (13/40) だけで,多くは中〜高程度の労力を要した。
    • 実行可能な成果物で,元の結果を再現できたものは35% (14/40) であり,成果物の可用性,実行可能性,再現性のギャップが示唆された。

    Link: https://arxiv.org/abs/2601.02066

  • 遠距離Bang計算における近似理論 [cs.LO]目的:遠距離Bang計算の近似意味論
    • 計算機科学において,プログラムの挙動を形式的に理解するための基礎研究であり,安全性や正当性の検証に不可欠である。
    • 従来の近似意味論は,コール・バイ・ネームとコール・バイ・バリューの評価戦略ごとに異なる理論が必要であり,統合的な枠組みが欠けていた。
    • Bang計算を基盤とした統一的な近似意味論を構築し,異なる評価戦略を統一的に扱えるようにすること。
    • 遠距離Bang計算(dBang)におけるB\"ohm木とテイラー展開を定義し,その基本的な性質を確立した。
    • 本研究の結果は,コール・バイ・ネームおよびコール・バイ・バリューをBang計算への変換を通して包含し,一般化する。
    • 無限計算やリソースに敏感な意味論を,評価戦略に関わらず一貫した枠組みで捉えることを可能にする。

    Link: https://arxiv.org/abs/2601.05199

  • 任意のモノイド上の書き換え系 [cs.FL, cs.LO, math.CT]目的:モノイド的書き換え系
    • 書き換え系は,計算の基礎理論として重要であり,プログラムの検証や最適化に応用される。
    • 従来の文字列書き換えは自由モノイドに限定され,一階論理による内部的な扱いに制約があった。
    • 任意のモノイド上で書き換え系を定義し,一階論理による分析を可能にすることを目指す。
    • モノイド的書き換え系(MRS)を定義し,Noetherian Confluent MRSの2-圏 $\mathbf{NCRS_2}$ を導入した。
    • $\mathbf{NCRS_2}$ と $\mathbf{Mon}$ の間にcanonical biadjunctionが存在することを証明した。
    • 与えられた固定モノイドを表現するNoetherian Confluent MRSを分類するため,Generalized Elementary Tietze Transformations (GETTs) を導入し,完全な特徴付けを示した。

    Link: https://arxiv.org/abs/2601.10564

  • 航空宇宙ソフトウェアにおける時系列異常検知のための大規模言語モデルの評価 [cs.SE]目的:航空宇宙ソフトウェアにおける時系列異常検知のための大規模言語モデルの有効性評価
    • 航空宇宙ソフトウェアの安全性と信頼性は極めて重要であり,異常検知はその不可欠な要素である。
    • 既存の異常検知手法は,複雑なテレメトリデータや評価指標の不整合により,航空宇宙分野への適用が困難である。
    • 本研究は,航空宇宙分野に特化した時系列異常検知のためのベンチマークを提供し,LLMの性能評価を可能にする。
    • LLMは,単変量タスクでは良好な性能を示す一方,多変量テレメトリデータにおいては苦戦する。
    • 多変量タスクにおけるLLMの異常検知精度と連続性は,ランダム推測に近い水準にとどまる。
    • Few-shot学習はわずかな改善をもたらすが,RAGは有意な改善を示さなかった。また,LLMは異常発生を検知できるものの,誤報のリスクも存在する。

    Link: https://arxiv.org/abs/2601.12448

  • ARISE -- 適応的洗練と反復シナリオエンジニアリング [cs.SE]目的:衝突回避軌道計画の性能向上
    • 自動運転システムの安全性確保には,多様なシナリオでの検証が不可欠である。
    • 現実的かつ多様な交通シナリオの生成は,手動での記述や一括生成では困難である。
    • 自然言語によるシナリオ記述の自動化と,実行可能性の保証を目指す。
    • ARISEは,自然言語のプロンプトを反復的に洗練し,実行可能なScenicスクリプトを生成する。
    • 生成されたスクリプトはシミュレーションソフトウェアで実行され,診断結果がLLMにフィードバックされる。
    • その結果,既存手法と比較して,ARISEはより正確で実行可能な交通シナリオを高い信頼性で生成できる。

    Link: https://arxiv.org/abs/2601.14743

  • ローカルに思考し,グローバルに説明する:グラフ誘導LLM調査:ローカル推論と信念伝播 [cs.AI, cs.LG, cs.LO]目的:大規模で多様な運用データからの証拠を反復的にマイニングすることで説明を構築する,オープンエンドな調査におけるLLMの能力向上
    • LLMは知識発見において重要な役割を果たすが,その能力は環境の複雑さとデータの規模に左右される。
    • LLMはコンテキストウィンドウの制限から,重要な証拠を廃棄するリスクがあり,説明の信頼性に課題がある。
    • 依存グラフを用いて,LLMによる局所的な証拠マイニングとラベル付け,そして信念伝播を組み合わせることで,この問題を解決する。
    • EoGは,ITBench診断タスクにおいて,ReActベースラインと比較して,精度と実行の一貫性を向上させた。
    • 平均的にMajority-at-kエンティティF1スコアで7倍の改善が見られた。
    • EoGは,LLMの局所的な証拠マイニングとラベル付けと,決定論的なコントローラーによるグラフ探索を分離した。

    Link: https://arxiv.org/abs/2601.17915

  • LLMと停止問題:プログラム終了予測の再検討 [cs.CL, cs.AI, cs.PL]目的:プログラムの終了予測の性能評価
    • プログラムの正当性確認は,ソフトウェア開発において不可欠であり,その自動化が求められている。
    • 停止問題は原理的に解決不可能であり,実用的な検証ツールは近似解に頼らざるを得ない。
    • LLMがプログラムの終了予測において,既存のツールに匹敵する性能を発揮するか検証する。
    • LLMは,Cプログラムの終了予測において高い性能を示し,GPT-5やClaude Sonnet-4.5は既存のツールに次ぐランキングとなった。
    • LLMは終了予測は可能だが,その根拠となる証明を提示することは難しい。
    • プログラムの長さが増加すると,LLMの性能は低下する傾向が見られた。

    Link: https://arxiv.org/abs/2601.18987

  • 機械学習コンパイラのための単純な統一レイアウト抽象化Axe [cs.DC, cs.AI, cs.LG, cs.PL]目的:機械学習ワークロードのスケーリングのためのデータと計算の配置
    • 深層学習の発展により,デバイス間の効率的なデータ配置が不可欠となっている。
    • 異なるハードウェア構成への対応が難しく,最適化に手間がかかる。
    • ハードウェアを意識した抽象化による,統一的なレイアウト管理を実現する。
    • Axe Layoutは,論理テンソル座標を名前付き軸を介して物理空間にマッピングする。
    • Axeは,デバイス間分布とオンデバイスレイアウトを統一し,スケーラブルな深層学習を可能にする。
    • 最新のGPUデバイスやマルチデバイス環境において,手動調整されたカーネルに近い性能を実現する。

    Link: https://arxiv.org/abs/2601.19092

  • AACR-Bench:包括的なリポジトリレベルのコンテキストを用いた自動コードレビューの評価 [cs.IR, cs.SE, cs.AI]目的:自動コードレビューの評価基準
    • LLMを活用した自動コードレビューの品質向上は,ソフトウェア開発効率の改善に不可欠である。
    • 既存の評価基準は,多言語対応や正確な欠陥情報の不足により,モデルの性能を正しく評価できない場合がある。
    • より厳密で信頼性の高い評価基準を確立し,LLMによる自動コードレビューの性能を正確に測定すること。
    • AACR-Benchは,複数言語に対応し,リポジトリ全体を考慮した包括的な評価基準である。
    • 「AI支援,専門家検証」という注釈パイプラインにより,従来の基準よりも285%多くの欠陥を検出できた。
    • LLMの性能評価において,コンテキストの粒度や検索方法が重要な影響を与えることが示された。

    Link: https://arxiv.org/abs/2601.19494

  • 検索拡張コード生成におけるコンテキストポイズニングによる隠蔽的なエネルギー消費攻撃:DRAINCODE [cs.SE]目的:検索拡張コード生成システムの計算効率に対する敵対的攻撃
    • LLMはコード生成能力が高いが,セキュリティ面での計算コスト(遅延,消費電力)は十分には考慮されていない。
    • LLMの推論コストは高く,リソース制約のある環境では,その影響は無視できない。
    • コンテキストポイズニングによってLLMの出力長を増加させ,計算負荷を高める攻撃手法を提案する。
    • DrainCodeは,ベースラインと比較して最大85%の遅延増加,49%のエネルギー消費増加,3倍以上の出力長増加を達成した。
    • この攻撃は,様々なプロンプティング戦略や防御策に対しても有効であることが示された。
    • DrainCodeは,LLMのセキュリティ評価において,リソース制約のある環境での計算負荷増加の可能性を示す。

    Link: https://arxiv.org/abs/2601.20615

  • ProfInfer:eBPFベースのLLM推論プロファイラ [cs.SE]目的:大規模言語モデルの推論時の挙動可視化
    • LLMは研究から実運用へ移行しており,リアルタイムな動作理解が不可欠である。
    • 既存のLLM推論システムは,演算子レベルの可視性が低く,ボトルネック特定が困難である。
    • LLM推論システムのボトルネックを特定し,最適化とリソース管理を可能にすること。
    • eBPF技術を用いた非侵襲的なプロファイリングフレームワークProfInferを開発した。
    • ProfInferは,llama-cpp等のLLM推論エンジンに動的にプローブをアタッチし,詳細なトレースを収集する。
    • 収集したトレースを可視化することで,演算子の動作やリソース使用状況を分析できる。

    Link: https://arxiv.org/abs/2601.20755

  • 量子アクセス可能情報と古典エントロピー不等式 [quant-ph, cs.IT, math-ph, math.IT, math.MP]目的:量子状態集合のアクセス可能情報の計算
    • 量子情報理論の基礎をなす研究であり,量子通信や量子計算の効率化に貢献する。
    • 量子状態集合に対する情報量評価は難しく,最適な測定方法の決定が課題である。
    • 情報最適測定の仮説を検証し,量子ピラミッドに対する新たなエントロピー不等式を提案する。
    • 最近得られた最適性基準を適用することで,離散的な対数ソボレフ不等式の類似である,新たなエントロピー不等式が得られた。
    • 等角等確率状態集合(量子ピラミッド)に対する情報最適測定の仮説を再検討し,対応するエントロピー不等式を提案した。
    • 最適性基準を通して,量子ピラミッドに対する情報最適観測量の証明へのアプローチを示唆する。

    Link: https://arxiv.org/abs/2506.06700

  • 動的治療レジメンのための悲観的モデルベースの方策学習アルゴリズムPOLAR [stat.ML, cs.IT, cs.LG, math.IT, stat.ME]目的:動的治療レジメン最適化における新しい悲観的モデルベースの方策学習アルゴリズム
    • 医療,教育,デジタル介入など,時間経過に伴い個別軌跡に応じた意思決定が求められる分野で重要。
    • 既存手法は強いポジティビティの仮定に依存し,データ不足に弱いという課題があった。
    • オフラインデータのみで,統計的保証と計算効率を両立した最適化手法を開発する。
    • POLARは,オフラインデータから遷移ダイナミクスを推定し,各履歴-行動ペアの不確実性を定量化する。
    • 報酬関数に悲観的なペナルティを組み込み,不確実性の高い行動を抑制することで,方策の最適化を目指す。
    • 合成データとMIMIC-IIIデータセットにおいて,最先端の手法を凌駕し,ほぼ最適な履歴認識型治療戦略を実現した。

    Link: https://arxiv.org/abs/2506.20406

  • 無線ネットワークにおける有用領域解析のための統一的枠組み:セル内,セル外,そしてその中間 [eess.SP, cs.IT, math.IT]目的:無線ネットワークの有用領域の解析
    • 無線通信の性能向上は,現代社会における情報伝達の基盤であり,その重要性は増している。
    • 大規模MIMOやセルレスネットワークなど,複雑化するネットワーク構成下での干渉特性の把握が課題である。
    • 非線形写像のスペクトル半径を用いて,有用領域を簡潔に表現し,無線システム設計を支援する。
    • 本研究で提案する枠組みは,既存の弱パレート境界の表現を簡潔な記法で一般化することを可能にする。
    • 有用領域が凸であるための十分条件を導出し,時間分割(またはユーザーグループ化)による全ユーザーの利得向上を保証する。
    • この条件は,和レート最大化問題を効率的に解くための凸最適化アルゴリズム開発を促進し,SINRではなく達成レートに基づいた問題定式化を正当化する。

    Link: https://arxiv.org/abs/2507.23707

  • 統計的Max-Min電力制御のための固定点アルゴリズム:Use-and-then-Forgetの限界を超える [eess.SP, cs.IT, math.IT]目的:セルラーおよびセルレス大規模MIMOシステムにおける最適な統計的Max-Min電力制御
    • 無線通信における効率的な電力制御は,システム容量の向上と干渉の低減に不可欠である。
    • 従来のUse-and-then-Forget法は,厳密なレート計算の代替として利用されるが,過度に保守的な結果になる場合がある。
    • 本研究は,Use-and-then-Forget法の欠点を克服し,より正確な電力制御を実現するための固定点アルゴリズムを提案する。
    • 提案手法は,Shannon達成可能レートの下限として,Use-and-then-Forget法以外の代替的な境界に対応可能である。
    • 特に,完全または不完全なチャネル状態情報(CSI)を復号器で考慮した境界を明示的に扱うことができる。
    • 瞬時CSIを利用した標準的な境界を考慮したMax-Min電力制御問題を解くことで,フレームワークの有効性を示す。

    Link: https://arxiv.org/abs/2510.11582

  • 移動性と遅延拡散を持つ無線チャネルにおける整形によるデータレートの向上 [eess.SP, cs.IT, math.IT]目的:無線通信におけるデータレート向上策の検討
    • 無線通信は現代社会の基盤であり,高速化・大容量化が常に求められている。
    • セルエッジにおける通信品質の悪化が,システム全体の性能低下を招く。
    • 整形符号化によりセルエッジでのデータレートを向上させ,通信性能改善を目指す。
    • 提案手法では,4-QAM変調に整形符号化を組み合わせることで,データレートを向上させている。
    • Veh-Aチャネルを用いたシミュレーションの結果,BERが10⁻³のとき,約4dBの性能向上を確認した。
    • LDPCコードのレートを上げるよりも,整形符号化によるレート向上のほうが効果的であることが示唆された。

    Link: https://arxiv.org/abs/2512.06494

  • ねじれG-コードと傾ねられたねじれG-コードに関する3つの結果 [math.AG, cs.CR, cs.IT, math.IT]目的:ねじれG-コードの検証可能性に関する未解決問題の解決,次元3のねじれ群代数上のイデアルがアーベル群コードとなることの証明,ねじれ群コードの次元と距離に関する上限の導出
    • 符号理論は,情報伝送の信頼性を確保する上で不可欠であり,誤り訂正符号は重要な役割を果たす。
    • ねじれ群コードは,従来の群コードに比べて構造が複雑であり,検証可能性の判定が困難である。
    • ねじれ群コードの構造を理解し,検証可能性の判定基準を確立することで,より効率的な誤り訂正符号の設計が可能となる。
    • ねじれ歪み群コードが検証可能であるための条件が決定され,未解決の問題が解決された。
    • 次元3のねじれ群代数上のすべてのイデアルがアーベル群コードであることが証明され,既存の結果が一般化された。
    • ねじれ群コードの次元と距離に関する上限が導出され,その上限が達成される条件が特定された。

    Link: https://arxiv.org/abs/2601.00752