Deep Signal

Paper Review

Paper Review articles

HIVE:LLMが「仮説を立て検証する」マルチモーダルRAG——29技術領域で+14.1ポイント、検索精度の新地平へ
論文解説Apr 9arXiv

HIVE:LLMが「仮説を立て検証する」マルチモーダルRAG——29技術領域で+14.1ポイント、検索精度の新地平へ

HIVEは「仮説生成→検証→リランキング」の4ステージパイプラインでマルチモーダル推論集約型検索の精度を飛躍的に改善するLLMフレームワーク。MM-BRIGHTベンチマーク(29技術領域・2,803クエリ)で最高モデル比+14.1ポイントのnDCG@10=41.7を達成。ゲーム分野68.2、サステナビリティ49.4という突出したスコアを記録し、RAGインフラ設計に新しい視点をもたらす。

#RAG#マルチモーダル#ベクトル検索
MegaTrain:ホストメモリを武器にH200単機で120Bモデルをフル精度学習——DeepSpeed比1.84倍の革新的トレーニングエンジン
論文解説Apr 9arXiv

MegaTrain:ホストメモリを武器にH200単機で120Bモデルをフル精度学習——DeepSpeed比1.84倍の革新的トレーニングエンジン

MegaTrainはGPUを「一時的な計算エンジン」として扱い、パラメータとオプティマイザ状態をホストメモリ(CPU DRAM)に保存することで、H200単一GPU+1.5TBホストメモリで120Bパラメータのフル精度学習を実現。DeepSpeed ZeRO-3比で14Bモデルのトレーニングスループットが1.84倍に向上し、7Bモデルでは512kトークンコンテキストでの単一GPU学習も達成した。

#LLMトレーニング#MegaTrain#GPU効率化
「AIエージェントのセキュリティ設計」——間接プロンプトインジェクションに対するシステムレベル防御の3原則
論文解説Apr 1arXiv

「AIエージェントのセキュリティ設計」——間接プロンプトインジェクションに対するシステムレベル防御の3原則

arXiv:2603.30016。LLMベースAIエージェントの間接プロンプトインジェクション攻撃に対して、モデルの堅牢性ではなくシステムアーキテクチャで防御する3つの原則を提示。

#security#prompt-injection#ai-agents
Learning to Commit:AIコーディングエージェントのPRが却下される本当の理由——arXiv新論文
論文解説Mar 30arXiv

Learning to Commit:AIコーディングエージェントのPRが却下される本当の理由——arXiv新論文

arXiv:2603.26664に掲載された論文「Learning to Commit」は、LLMベースのコーディングエージェントが生成するPRが実際のメンテナーに却下される根本原因を分析。機能的な正確さではなく、プロジェクト固有の慣習を学習できないことが問題であると指摘し、オンラインリポジトリ記憶による解決策を提案する。「有機性の欠如」という概念で問題を定義し、スタイルプロファイラー・コンテキストリトリーバー・有機性バリデーターの三コンポーネントで解決する。Qodo(コード検証・エッジケース評価)とSecure AI Agents(プロンプトインジェクション防御)を加えた生成・検証・セキュリティの三層が揃うことで、AIエージェントはソフトウェア開発の本当の意味での生産的参加者となる。WriteBack-RAGと並ぶ「静的な事前学習から動的なオンライン学習へ」という研究トレンドの体現でもある。

#LLM#coding agents#pull requests
HeiSD(arXiv:2603.17573)——ロボット制御VLAモデルを運動学的推測デコードで2.8倍高速化
論文解説Mar 30arXiv

HeiSD(arXiv:2603.17573)——ロボット制御VLAモデルを運動学的推測デコードで2.8倍高速化

VLAモデルのリアルタイムロボット制御における推論遅延をハイブリッド推測デコードと運動学的知識の組み合わせで解決。350ms→138msのレイテンシ改善と2.8倍の推論高速化を達成しながら制御精度を維持した。推測デコードへの物理制約組み込みというアーキテクチャは、S2D2(純テキストLLMへの自己推測デコード)と補完的な研究として位置づけられる。R-C2が正確さを、HeiSDが速さを向上させ、具身AI商用化の両輪が同時進行することで実用化タイムラインが圧縮される。Physical IntelligenceのπOのような大型VLAへのプラグイン的適用が可能であり、具身AI産業全体の展開コスト効率を改善する可能性がある。「ドメイン固有の制約を推測プロセスに取り込む」設計思想は医療AI・材料設計AIなど他領域にも波及しうる。

#VLA#推測デコード#ロボット
WriteBack-RAG:知識ベースを「訓練可能なコンポーネント」として扱う新手法——全設定で平均+2.14%の精度改善
論文解説Mar 28arXiv

WriteBack-RAG:知識ベースを「訓練可能なコンポーネント」として扱う新手法——全設定で平均+2.14%の精度改善

北京大学などの研究チームが提案したWriteBack-RAGは、成功した検索事例を「エビデンス蒸留」して元のコーパスに追記することでナレッジベース自体の品質を向上させる手法。4種類のRAGベースライン・6ベンチマーク・2LLMバックボーンの全設定で平均+2.14%の改善を達成。Learning to Commitが指摘したプロジェクト固有慣習の学習不足問題と同根の「静的ナレッジベース問題」へのコーパスサイドの解答。HyperAgentsの「エージェントを書き換える」アプローチと相補的で、MCPの普及と組み合わせることでエージェントエコシステム全体のベースライン向上が期待される。

#RAG#知識ベース#arXiv
HyperAgents:自己改善の仕組み自体を書き換えるMetaの新フレームワーク——arXiv:2603.19461
論文解説Mar 28arXiv / Meta AI Research / MarkTechPost

HyperAgents:自己改善の仕組み自体を書き換えるMetaの新フレームワーク——arXiv:2603.19461

Metaの研究チームが2026年3月19日にarXivで公開したHyperAgents(arXiv:2603.19461)。タスクを解くエージェントと、そのエージェントの改善メカニズム自体を修正するメタエージェントを統合することで、自己加速的な能力向上を実現する再帰的フレームワーク。MCP(接続基盤の標準化)・NemoCLAW(エンタープライズ制御機構)・Learning to Commit論文(コーディングエージェントのプロジェクト慣習学習問題)と並べると、HyperAgentsの「どう学ぶかを学ぶ」能力がコーディングエージェントの実用性を高める鍵になりうること、そして高自律エージェントを企業環境に持ち込む際の制御問題の重要性が浮かび上がる。

#Meta#HyperAgents#自己改善
DirMoE:エキスパート選択を完全微分可能にした新MoEルーターがILCR 2026採択
論文解説Mar 28ICLR 2026

DirMoE:エキスパート選択を完全微分可能にした新MoEルーターがILCR 2026採択

ICLR 2026に採択されたDirMoEは、Mixture-of-Experts(MoE)モデルにおけるルーティングを完全微分可能にした新手法。Bernoulli分布とDirichlet分布を組み合わせ、どのエキスパートを選ぶかと各エキスパートの重みを独立して最適化する。同時期に登場したS2D2の自己推測デコードやHeiSDの推測デコード高速化、PrismMLの1-bit LLM(Bonsaiシリーズ)と並べると、2026年のLLM効率化研究が「アーキテクチャ内の知性分配最適化」と「重みの抜本的な軽量化」という二軸で競争していることが見えてくる。

#Mixture-of-Experts#MoE#LLM最適化
S2D2:拡散LLMを高速化する「自己推測デコード」——論文が切り拓く新世代推論
論文解説Mar 27arXiv

S2D2:拡散LLMを高速化する「自己推測デコード」——論文が切り拓く新世代推論

S2D2は拡散LLMの推論速度を大幅に改善するTraining-Free手法。同一モデル内で少ないデノイジングステップの粗い推測を多いステップの精密な検証が補正する「自己推測デコード」を実現。HeiSD(VLAモデルの推論2.8倍高速化、Deep Signal既報)と同じ推測デコードの思想をLLM領域に適用しており、R-C2(Deep Signal既報)と並び、2026年の「追加学習なしにAIの能力を引き出す」研究トレンドを代表する論文。

#拡散LLM#推論最適化#高速デコード
R-C2:サイクル一貫強化学習でマルチモーダル推論を改善——arXiv論文解説
論文解説Mar 27arXiv

R-C2:サイクル一貫強化学習でマルチモーダル推論を改善——arXiv論文解説

R-C2はサイクル一貫強化学習を用いてVLMのマルチモーダル推論を改善するフレームワーク。追加の正解データなしに「回答→問題の再構成」という自己検証メカニズムを報酬シグナルとして活用。S2D2のTraining-Free高速化(Deep Signal既報)と同様、既存モデルを外部データなしに改善する2026年の研究トレンドに位置づけられる。MetaのHyperAgentsが示す再帰的自己改善の思想とも共鳴する。

#強化学習#マルチモーダルAI#推論
音声エージェント時代のASR再考:「基本に戻れ」が示す深い教訓——論文解説
論文解説Mar 27arXiv

音声エージェント時代のASR再考:「基本に戻れ」が示す深い教訓——論文解説

音声エージェント時代のASR再考を提唱する論文の解説。WERという従来の評価指標の限界を指摘し、ターンテイキング精度・発話意図保存・音響ロバストネスという新評価軸を提示。CohereのオープンソースASRモデル公開(Deep Signal既報)に見られるように、業界もエンタープライズ向け用途特化型評価へとシフトしつつある。WER競争からUX指標競争へのパラダイムシフトを示す重要な論文。

#音声認識#ASR#音声エージェント
Vega:自然言語命令で自動運転を学習する新アーキテクチャ——arXiv論文解説
論文解説Mar 27arXiv

Vega:自然言語命令で自動運転を学習する新アーキテクチャ——arXiv論文解説

arXiv論文VegaはVLA(Vision-Language-Action)アーキテクチャで自然言語指示を直接自動運転学習に活用。走行スタイルを「穏やかに」「急いでいるが法令遵守」と自然言語で指定でき、個人の嗜好プロファイルをゼロショットで適応。具身AI(Physical Intelligence等)のVLAモデルと同じ問題構造を持ち、HeiSD論文の推論高速化(350ms→138ms)は自動運転への応用でも重要。自然言語エージェント設計の曖昧性問題を高リスクドメインで解こうとする先駆的研究。CARLA実験でスタイル適合度の大幅向上を示した。

#自動運転#自然言語処理#強化学習