DeepSeek V4公開 — 1兆パラメータ・100万トークンコンテキストのオープンウェイトモデル

Read in other languages: 한국어English
LLM Feb 23, 2026 By Insights AI 1 min read Source

DeepSeekの最も野心的なリリース

中国AI企業DeepSeekが旧正月の2月17日にDeepSeek V4を公開した。1兆パラメータ100万トークンコンテキスト、そして3つのアーキテクチャ革新——mHC(Manifold-Constrained Hyper-Connections)、Engramメモリ、Sparse Attention——を搭載したオープンウェイトモデルだ。

技術的ハイライト

  • mHCアーキテクチャ: Transformerの根本的な安定性問題を解決し、大規模学習を改善
  • Engramメモリ: 長文コンテキストをセッションを超えて効率管理
  • Sparse Attention: 推論コストを削減しながら長いコンテキストを処理
  • 100万トークン: コードベース全体を1パスで処理可能

ベンチマーク主張

DeepSeek社内ベンチマークによると、V4はコーディングタスクでClaude 3.5 SonnetとGPT-4oを上回り、SWE-benchで80%超のスコアを記録したという。推論コストは欧米の競合フロンティアモデルと比べて10〜40倍低いと主張する。

コンシューマーハードウェアで動作

オープンウェイトとして公開されたV4はNVIDIA RTX 4090デュアル、または単体RTX 5090での動作を想定して設計されており、クラウドインフラなしで最先端のコーディングAIを利用できる。世界中の開発者がすぐにダウンロードして活用可能だ。

Source: Introl, Vertu

Share:

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.