مدل GPT-5.5-Cyber در معیار ارزیابی آسیب‌پذیری‌ها از Claude Mythos 5 پیشی گرفت

شرکت OpenAI امروز از توسعه‌ی قابل‌توجهی در ابتکار عمل سایبری Daybreak خبر داد که به‌منظور کمک به متخصصان دفاع سایبری برای یافتن، اعتبارسنجی و رفع آسیب‌پذیری‌های نرم‌افزاری در مراحل اولیه‌ی فرآیند توسعه طراحی شده است. دسترسی به مدل‌های قدرتمند هوش مصنوعی، بدون‌تردید چشم‌انداز امنیت سایبری را با تسریع چشمگیر فرآیند کشف آسیب‌پذیری‌ها دگرگون کرده است. با این حال، گلوگاه بزرگ‌تر صنعت در حال حاضر، رفع این آسیب‌پذیری‌ها است. تیم‌های نرم‌افزاری متأثر، نیاز به اعتبارسنجی مسائل کشف‌شده، درک تأثیر آنها، توسعه‌ی راه‌حل‌ها، انجام آزمون‌ها و در نهایت، پیاده‌سازی وصله‌های امنیتی دارند.

در ماه مارس (اسفند)، OpenAI نسخه‌ پیش‌نمایشی از Codex Security را عرضه کرد که از استدلال ایجنت محور همراه با اعتبارسنجی خودکار برای کشف مسائل با تأثیر بالا و راه‌حل‌های عملی و مختص مخزن کد استفاده می‌کند. از آن زمان تاکنون، این ابزار بیش از 30 میلیون کامیت (commit) را در بیش از 30.000 مخزن کد اسکن کرده است؛ بیش از 70.000 مورد یافت‌شده توسط بازبین‌های انسانی به‌عنوان برطرف‌شده علامت‌گذاری شده و بیش از 500.000 مورد دیگر نیز به‌طور خودکار برطرف‌شده تشخیص داده شده‌اند.

اکنون، OpenAI نسخه‌ به‌روز شده‌ای از افزونه‌ Codex Security را منتشر کرده که قادر به انجام اسکن‌های عمیق، بررسی تغییرات اخیر کد، تولید گزارش‌های امنیتی، ردیابی مسیرهای حمله، اعتبارسنجی یافته‌ها و ایجاد وصله‌های مختص مخزن کد برای بررسی انسانی است. این افزونه همچنین می‌تواند یافته‌های حاصل از اسکنرهای موجود، گزارش‌های مشاوره‌ای، گزارش‌های باگ بانتی و سیستم‌های ثبت درخواست را دسته‌بندی (triage) کند.

به گفته‌ی OpenAI، این افزونه قابلیت خروجی‌دهی نتایج به سیستم‌های مدیریت آسیب‌پذیری و ادغام با گردش‌های کاری را با استفاده از فایل‌های SARIF، پرس‌وجوهای CodeQL، خط فرمان Codex (CLI) و برنامه‌ی Codex دارد. پیش‌تر در ماه مه (اردیبهشت)، OpenAI از نسخه‌ی پیش‌نمایش مدل GPT-5.5-Cyber رونمایی کرده بود؛ مدلی جدید که بر روی مدل تازه‌منتشرشده‌ GPT-5.5 بنا شده و برای کارهای تخصصی امنیت سایبری طراحی شده است.

امروز، OpenAI نسخه‌ی کامل GPT-5.5-Cyber را از طریق انتشار محدود برای متخصصان دفاع سایبری تأییدشده در دسترس قرار داد. در ارزیابی CyberGym، مدل GPT-5.5-Cyber امتیاز 85.6 درصد را کسب کرد، در حالی که این امتیاز برای GPT-5.5 معادل 81.8 درصد و برای Claude Mythos 5 برابر با 83.8 درصد بود. همچنین این مدل در ارزیابی ExploitGym به امتیاز 39.5 درصد در مقایسه با 25.95 درصد برای GPT-5.5 دست یافت و در ارزیابی SEC-bench Pro نیز امتیاز 69.8 درصد را در برابر 63.1 درصد کسب کرد.

علاوه بر این، OpenAI از برنامه‌ جدید Daybreak Cyber Partner Program رونمایی کرد که به فروشندگان و ارائه‌دهندگان خدمات امنیتی امکان می‌دهد تا از GPT-5.5 با قابلیت «Trusted Access for Cyber» در محصولات و خدمات خود استفاده کنند. شرکت‌هایی نظیر Accenture، Akamai، Cisco، Cloudflare، CrowdStrike، IBM، Palo Alto Networks، Proofpoint، SentinelOne، Wiz، Zscaler و دیگران به‌عنوان شرکای اولیه‌ی این برنامه معرفی شدند.

شرکت OpenAI همچنین ابتکار عملی تحت عنوان Patch the Planet را با همکاری Trail of Bits، HackerOne، Calif، محققان و نگهدارندگان پروژه‌های نرم‌افزاری آغاز کرده است. بیش از 30 پروژه‌ متن‌باز متعهد به مشارکت در این برنامه شده‌اند که از آن جمله می‌توان به پروژه‌های cURL، Go، Python، Sigstore و pyca/cryptography اشاره کرد.

فهرست سایت

مدل GPT-5.5-Cyber در معیار ارزیابی آسیب‌پذیری‌ها از Claude Mythos 5 پیشی گرفت

مطالب مرتبط

ارسال دیدگاه

مدل GPT-5.5-Cyber در معیار ارزیابی آسیب‌پذیری‌ها از Claude Mythos 5 پیشی گرفت

مطالب مرتبط

ارسال دیدگاه

برای صرف‌نظر کردن از پاسخ‌گویی اینجا را کلیک نمایید.