● ガイド
ガイドカテゴリの記事一覧

1-bit LLMが商用段階に——PrismML Bonsaiシリーズが示す「ビット当たりの知能密度」革命
Caltechの研究を基盤にKhosla Ventures・Google出資のPrismMLが、1-bitで実用性能を達成したBonsaiシリーズを公開。8Bモデルがわずか1.15GBで動作。

科学研究にLLMを使うなら「どこまでオープン」であるべきか——再現性と信頼性のための実践ガイド
arXiv論文「How Open Must Language Models be to Enable Reliable Scientific Inference?」を起点に、科学研究でLLMを使う際のオープン性水準を体系化。モデル重みの公開・学習データの透明性・推論プロセスの可視性・バージョン安定性という4次元でオープン性を定義し、クローズドAPIの「バージョンドリフト」が再現性を根本から脅かすリスクを実証事例で示す。WikipediaのAI生成コンテンツ禁止決定やQuinnipiac調査が示すAI信頼の逆説と並べると、「信頼できないAIを使わない/使い方を限定する」という選択がWikipediaから科学研究者まで広がりつつあることがわかる。Cohereのオープンソースオンプレミス音声認識モデルは、プライバシーと透明性を設計で担保するアプローチの産業界版として機能している。研究者への実践チェックリスト(モデル重みのコミットID固定、Appendix開示等)が最も実用的な貢献。

NVIDIA NemoCLAWが示す企業向けAIエージェント本番運用の要点——GTC 2026から読み解く実践知
NVIDIA GTC 2026でのNemoCLAWとNeMo Agent Toolkitの発表は、AIエージェントが「試験運用」から「本番稼働」に移行する段階で企業が直面する三つの壁(ガバナンス・コスト予測・フォールバック設計)を正面から解こうとするフレームワークとして位置づけられる。HyperAgents(#29)の自己改善エージェントや、エージェントハーネス論文(#20)が整理したシリアル/パラレル/ヒエラルキカルパターン、MCPの9700万DL突破(#28)という文脈と重ねると、NemoCLAWは「標準化されたプロトコルの上に企業向けガバナンスレイヤーを乗せる」という2026年のエンタープライズAIアーキテクチャの主流を体現している。

Gemini 3.1 Flash Live完全ガイド——90言語対応リアルタイム音声AIエージェントの構築入門
2026年3月26日にGoogleが公開したGemini 3.1 Flash Liveは、90言語以上のリアルタイム音声・映像処理とツール呼び出しを低レイテンシで実現。このガイドではAPIの基本から音声エージェント構築のアーキテクチャパターンまでを解説する。CohereのオープンソースASR・MistralのOSS音声生成・AppleのSiriモジュール化方針と合わせて読むと、2026年3月に音声AIスタックの入力・処理・出力が同時に揃ったことが見えてくる。統合型モデルとコンポーネント型OSSの競争がエンタープライズ市場で本格化する。

自然言語エージェントハーネスの設計パターン——AIエージェント構築の実践ガイド
エージェントハーネス——AIエージェントの実行・制御・評価のための体系的フレームワーク——を提唱するarXiv論文の解説。シリアル・パラレル・ヒエラルキカルの設計パターンと、タスク完了率・効率性・安全性・一貫性の4評価軸を整理。MetaのHyperAgents(Deep Signal既報)はヒエラルキカルハーネスの実装例として位置づけられ、セキュリティ設計論文(arXiv:2603.30016、Deep Signal既報)とNVIDIA NemoCLAW(Deep Signal既報)と組み合わせることで、企業向けエージェント本番運用の全体像が見えてくる。

Claude Code作者が公開した開発ワークフロー——AIコーディングの最前線
Claude Code開発者Boris Cherny氏が公開した開発ワークフローの解説。AIへの権限委譲の設計思想、効果的なプロンプト設計(文脈・制約・成果物の明示)、段階的フィードバックサイクルの3点が核心。Anthropicの急成長(有料ユーザー3000万人超、Deep Signal既報)を牽引するClaude Codeを、その開発者自身が解説した貴重な一次資料。「激動の3月」(Deep Signal既報)のインシデント後も情報共有を続けた透明性の実例でもある。