شرکت چینی دیپسیک که همواره با ورودیهای غافلگیرکننده به جمع بازیگران اصلی هوش مصنوعی در سیلیکونولی میپیوندد، این بار با نسخه پیشنمایشی مورد انتظار خود، یعنی V4، وارد میدان شد. این شرکت مستقر در هانگژو، جدیدترین مدل هوش مصنوعی خود را منتشر کرده که در برخی زمینهها بر مدلهای محبوب آمریکایی پیروز شده است. دیپسیک دو مدل جدید را معرفی کرده است: V4-Pro (حالت کارشناسی) و V4-Flash (حالت فوری).
مدل اول یک مدل عظیم با 1.6 تریلیون پارامتر است، در حالی که مدل دوم با 284 میلیارد پارامتر، مدیریتپذیرتر است. با این حال، هر دو مدل دارای پنجره زمینه (Context Window) یک میلیون توکنی هستند. نکتهای که اهمیت بیشتری دارد، متنباز (Open Source) بودن هر دو مدل است؛ به این معنی که کاربران میتوانند آنها را از پلتفرم Hugging Face دانلود کرده و به صورت محلی روی سختافزار خود اجرا کنند. البته مقیاس عظیم مدل V4-Pro نیازمند مقدار قابل توجهی حافظه گرافیکی (VRAM) برای اجرای محلی است.
یکی از جذابترین بخشهای این اعلامیه، مقایسه این مدل با رقبای سرشناسی مانند Gemini، ChatGPT و Claude است. برای مثال، V4-Pro در حوزه کدنویسی عملکردی خیرهکننده دارد و در امتیازدهی Codeforces نمره 3206 کسب کرده که بالاتر از نمره 3168 مدل GPT-5.4 و 3052 مدل Gemini 3.1 است. این موضوع آن را به قدرتمندترین مدل متنباز برای وظایف برنامهنویسی رقابتی تبدیل میکند.
در آزمون LiveCodeBench، V4-Pro نمره 93.5 را ثبت کرد که جلوتر از نمره 88.8 مدل Claude Opus 4.6 و 91.7 مدل Gemini است. همچنین در وظایف عاملمحور (Agentic tasks)، این مدل در آزمون Toolathlon با نمره 51.8، هم Claude (47.2) و هم Gemini (48.8) را پشت سر گذاشت. مدل سریعتر و کارآمدتر V4-Flash نیز در وظایف عاملی ساده، عملکردی مشابه V4-Pro دارد، اما با هزینه محاسباتی بسیار ناچیزتر.
| بنچمارک | DeepSeek V4-Pro | Claude Opus 4.6 | GPT-5.4 | Gemini 3.1 Pro |
| Codeforces (Rating) | 3,206 | — | 3,168 | 3,052 |
| LiveCodeBench (Pass@1) | 93.5 | 88.8 | — | 91.7 |
| Apex Shortlist (Pass@1) | 90.2 | 85.9 | 78.1 | 89.1 |
| SWE Verified (Resolved) | 80.6 | 80.8 | — | 80.6 |
| Toolathlon (Pass@1) | 51.8 | 47.2 | 54.6 | 48.8 |
| Terminal Bench 2.0 (Acc) | 67.9 | 65.4 | 75.1 | 68.5 |
| MRCR 1M Long Context | 83.5 | 92.9 | — | 76.3 |
| HMMT 2026 Math | 95.2 | 96.2 | 97.7 | 94.7 |
| IMOAnswerBench | 89.8 | 75.3 | 91.4 | 81.0 |
با این حال، مدل جدید دیپسیک در برخی زمینهها از رقبا عقبتر است. برای مثال، مدل Claude Opus 4.6 در بازیابی زمینههای طولانی (Long-context retrieval) پیشرو است و در آزمون MRCR 1M نمره 92.9 را کسب کرده در حالی که V4-Pro نمره 83.5 را ثبت کرده است. همچنین مدل GPT-5.4 همچنان در آزمون Terminal Bench 2.0 با نمره 75.1 برتر از V4-Pro (با نمره 67.9) است.
اما جایی که دیپسیک واقعاً بازار را به لرزه درمیآورد، قیمتگذاری آن است. هزینه مدل V4-Pro تنها 3.48 دلار به ازای هر میلیون توکن خروجی است. این در حالی است که برای بارگذاریهای مشابه، OpenAI معادل 30 دلار و Anthropic معادل 25 دلار هزینه دریافت میکند. این شکاف عظیم قیمتی، برای توسعهدهندگان روزمرهای که در حال ساخت اپلیکیشنهای هوشمند هستند، بسیار جذاب و انقلابی به نظر میرسد.