شرکت DeepSeek در اوایل سال 2025 با معرفی یکی از نخستین مدلهای تفکر رایگان، توجه زیادی را جلب کرد. اکنون این شرکت چینی نسخهی جدیدی به نام DeepSeekMath-V2 عرضه کرده که هدف آن دستیابی به استدلال ریاضی خودتأییدگر و استنتاج گامبهگام دقیق، با تمرکز بر اثبات قضایا است (رویکردی فراتر از اتکا به پاسخهای عددی نهایی صحیح). این شرکت اعلام کرده که مدل جدید از یک چرخهی “تولید–تأیید” استفاده میکند.
یک تأییدگر مبتنی بر LLM برای اثبات قضایا آموزش داده شده و سپس یک مولد اثبات با استفاده از همین تأییدگر بهعنوان مدل پاداش آموزش دیده است. مولد اثبات تشویق میشود تا مشکلات موجود در اثباتهای خود را شناسایی و رفع کند. همچنین از مقیاسبندی تأیید برای برچسبگذاری خودکار اثباتهای دشوار و غیرقابلتأیید استفاده میشود تا دادههای آموزشی بیشتری برای بهبود مستمر تأییدگر فراهم گردد. DeepSeekMath-V2 تواناییهای قدرتمند خود در اثبات قضایا را در رقابتهای ریاضی اخیر نشان داده است.

این مدل موفق به کسب رتبهی طلایی در IMO 2025 و CMO 2024 شد و در آزمون Putnam 2024 با استفاده از محاسبات مقیاسیافته در زمان اجرا، امتیاز تقریباً کامل 118 از 120 را به دست آورد. این مدل بر پایهی DeepSeek-V3.2-Exp-Base ساخته شده و در HuggingFace در دسترس است. برای پشتیبانی از استنتاج، DeepSeek توصیه کرده به مخزن DeepSeek-V3.2-Exp در GitHub مراجعه شود.
عرضه این مدل بسیار جالب توجه است و میتواند به درک بهتر ریاضیات کمک کند، درکی که شاید به کشفیات علمی جدید برای بهبود سلامت و فناوری منجر شود. شرکتهای هوش مصنوعی در اینجا متوقف نخواهند شد و به دنبال روشهای تازه برای افزایش فهم ریاضی خواهند بود. دسترسی آزاد به این مدل نیز به تسریع این پیشرفتها کمک خواهد کرد. هرچند نباید انتظار داشت که مسائل هزاره بهزودی حل شوند، اما تلاش برای کمک به پژوهشگران در این مسیر اهمیت زیادی دارد. برای اطلاعات بیشتر میتوانید به صفحه اختصاصی این مدل در GitHub مراجعه کنید.