فهرست سایت
هوش مصنوعی نوشته شده در تاریخ ۱۹ تیر ۱۴۰۴ توسط ادمین

ایلان ماسک مدل Grok 4 را معرفی کرد

ایلان ماسک مدل Grok 4 را معرفی کرد

شرکت xAI امروز از Grok 4، جدیدترین مدل پرچمدار چندوجهی هوش مصنوعی این شرکت رونمایی کرد؛ xAI ادعا می‌کند که Grok 4 مدلی سطح‌بالا با عملکردی پیشرفته در آزمون‌های دانشگاهی، ریاضی و استدلال است. نسخه Grok 4 Heavy با ابزارهای چندعاملی، دستاوردهای چشمگیرتری در بنچ‌مارک‌های پرطرفدار هوش مصنوعی به دست آورده است.

آزمون‌های دانشگاهی و استدلالی:
  • آزمون آخر بشریت (HLE): مدل Grok 4 (بدون ابزار) به امتیاز 25.4 درصد دست یافت و عملکرد بهتری نسبت به Gemini 2.5 Pro گوگل (21.6 درصد) و o3-high شرکت OpenAI (21 درصد) داشت. نسخه Grok 4 Heavy (با چند عامل + ابزار) به امتیاز 44.4 درصد رسید، در حالی که Gemini 2.5 Pro مجهز به ابزارها فقط 26.9 درصد کسب کرد.
  • ARC-AGI-2: مدل Grok 4 با کسب امتیاز 16.2 درصد تقریباً دو برابر مدل بعدی یعنی Claude Opus 4 عمل کرد.
  • ارزیابی‌های سبک MMLU: این مدل امتیاز 0.866 (86.6 درصد) را در MMLU و شاخص هوش کلی 73را کسب کرد و پیشتاز صنعت شد.
آزمون‌های علمی و کدنویسی:
  • GPQA: مدل Grok 4 امتیاز 87.5 درصد و نسخه قدرتمندتر Grok 4 Heavy امتیاز 88.9 درصد را کسب کرد.
  • AIME: نسخه Grok 4 Heavy به امتیاز کامل 100 درصد رسید، در حالی که نسخه معمولی Grok 4 امتیاز 98.8 درصد را کسب کرد.
  • SWE-Bench: نسخه خاص Grok 4 Code که قرار است در آگوست 2025 عرضه شود، امتیازی بین 72 تا 75 درصد در SWE-bench به دست آورده است.

بر اساس گزارش Artificial Analysis، مدل Grok 4 موفق به کسب شاخص هوش مصنوعی 73 شده است؛ بالاتر از مدل‌های OpenAI o3 و Google Gemini 2.5 Pro که هر دو امتیاز 70 را کسب کرده‌اند. Grok 4 به سطحی رسیده است که در سوالات امتحانی ریاضی یا فیزیک تقریباً هرگز اشتباه نمی‌کند، مگر اینکه سوالات به شکل ماهرانه‌ای گمراه‌کننده طراحی شده باشند. این مدل می‌تواند خطاها یا ابهامات در سوالات را تشخیص داده و سپس خطای موجود را اصلاح کرده یا هر نسخه از یک سوال مبهم را پاسخ دهد.

هزینه دسترسی به API مدل Grok 4 مشابه نسخه قبلی Grok 3 است:

  • 3 دلار/15 دلار برای هر یک میلیون توکن ورودی/خروجی
  • 0.75 دلار برای هر یک میلیون توکن ورودی ذخیره‌شده

طرح‌های اشتراک مصرف‌کنندگان:

  • طرح رایگان پایه: فقط دسترسی محدود به Grok 3 خواهد داشت.
  • طرح SuperGrok: با هزینه ماهانه 30 دلار امکان دسترسی بیشتر به مدل‌های Grok 4 و Grok 3 را فراهم می‌کند.
  • طرح SuperGrok Heavy: با هزینه ماهانه 300 دلار امکان استفاده از Grok 4 Heavy، Grok 4 و Grok 3 را فراهم می‌سازد.
لینک کوتاه

ارسال دیدگاه

پاسخ به (لغو پاسخ)