فهرست سایت
فناوری نوشته شده در تاریخ ۵ اردیبهشت ۱۴۰۵ توسط ادمین

نسخه جدید DeepSeek V4 منتشر شد

نسخه جدید DeepSeek V4 منتشر شد

شرکت چینی دیپ‌سیک که همواره با ورودی‌های غافلگیرکننده به جمع بازیگران اصلی هوش مصنوعی در سیلیکون‌ولی می‌پیوندد، این بار با نسخه پیش‌نمایشی مورد انتظار خود، یعنی V4، وارد میدان شد. این شرکت مستقر در هانگ‌ژو، جدیدترین مدل هوش مصنوعی خود را منتشر کرده که در برخی زمینه‌ها بر مدل‌های محبوب آمریکایی پیروز شده است. دیپ‌سیک دو مدل جدید را معرفی کرده است: V4-Pro (حالت کارشناسی) و V4-Flash (حالت فوری).

مدل اول یک مدل عظیم با 1.6 تریلیون پارامتر است، در حالی که مدل دوم با 284 میلیارد پارامتر، مدیریت‌پذیرتر است. با این حال، هر دو مدل دارای پنجره زمینه (Context Window) یک میلیون توکنی هستند. نکته‌ای که اهمیت بیشتری دارد، متن‌باز (Open Source) بودن هر دو مدل است؛ به این معنی که کاربران می‌توانند آنها را از پلتفرم Hugging Face دانلود کرده و به صورت محلی روی سخت‌افزار خود اجرا کنند. البته مقیاس عظیم مدل V4-Pro نیازمند مقدار قابل توجهی حافظه گرافیکی (VRAM) برای اجرای محلی است.

یکی از جذاب‌ترین بخش‌های این اعلامیه، مقایسه این مدل با رقبای سرشناسی مانند Gemini، ChatGPT و Claude است. برای مثال، V4-Pro در حوزه کدنویسی عملکردی خیره‌کننده دارد و در امتیازدهی Codeforces نمره 3206 کسب کرده که بالاتر از نمره 3168 مدل GPT-5.4 و 3052 مدل Gemini 3.1 است. این موضوع آن را به قدرتمندترین مدل متن‌باز برای وظایف برنامه‌نویسی رقابتی تبدیل می‌کند.

در آزمون LiveCodeBench، V4-Pro نمره 93.5 را ثبت کرد که جلوتر از نمره 88.8 مدل Claude Opus 4.6 و 91.7 مدل Gemini است. همچنین در وظایف عامل‌محور (Agentic tasks)، این مدل در آزمون Toolathlon با نمره 51.8، هم Claude (47.2) و هم Gemini (48.8) را پشت سر گذاشت. مدل سریع‌تر و کارآمدتر V4-Flash نیز در وظایف عاملی ساده، عملکردی مشابه V4-Pro دارد، اما با هزینه محاسباتی بسیار ناچیزتر.

بنچمارک DeepSeek V4-Pro Claude Opus 4.6 GPT-5.4 Gemini 3.1 Pro
Codeforces (Rating) 3,206 3,168 3,052
LiveCodeBench (Pass@1) 93.5 88.8 91.7
Apex Shortlist (Pass@1) 90.2 85.9 78.1 89.1
SWE Verified (Resolved) 80.6 80.8 80.6
Toolathlon (Pass@1) 51.8 47.2 54.6 48.8
Terminal Bench 2.0 (Acc) 67.9 65.4 75.1 68.5
MRCR 1M Long Context 83.5 92.9 76.3
HMMT 2026 Math 95.2 96.2 97.7 94.7
IMOAnswerBench 89.8 75.3 91.4 81.0

با این حال، مدل جدید دیپ‌سیک در برخی زمینه‌ها از رقبا عقب‌تر است. برای مثال، مدل Claude Opus 4.6 در بازیابی زمینه‌های طولانی (Long-context retrieval) پیشرو است و در آزمون MRCR 1M نمره 92.9 را کسب کرده در حالی که V4-Pro نمره 83.5 را ثبت کرده است. همچنین مدل GPT-5.4 همچنان در آزمون Terminal Bench 2.0 با نمره 75.1 برتر از V4-Pro (با نمره 67.9) است.

اما جایی که دیپ‌سیک واقعاً بازار را به لرزه درمی‌آورد، قیمت‌گذاری آن است. هزینه مدل V4-Pro تنها 3.48 دلار به ازای هر میلیون توکن خروجی است. این در حالی است که برای بارگذاری‌های مشابه، OpenAI معادل 30 دلار و Anthropic معادل 25 دلار هزینه دریافت می‌کند. این شکاف عظیم قیمتی، برای توسعه‌دهندگان روزمره‌ای که در حال ساخت اپلیکیشن‌های هوشمند هستند، بسیار جذاب و انقلابی به نظر می‌رسد.

لینک کوتاه

ارسال دیدگاه

پاسخ به (لغو پاسخ)