شرکت OpenAI اخیرا از Daybreak رونمایی کرده که مدلهای خود را با Codex ترکیب میکند تا به مدافعان در بازبینی امن کد، مدلسازی تهدید، اعتبارسنجی وصله، تحلیل ریسک وابستگیها و راهنمایی برای رفع آسیبپذیری کمک کند. آنتروپیک نیز ابتکار مشابهی را با Claude Security و Project Glasswing ارائه کرده بود که بر اسکن پایگاههای کد، اعتبارسنجی یافتهها و پیشنهاد وصله برای بررسی انسانی تمرکز دارند.
مایکروسافت امروز در پاسخ به رقابت فزاینده از سوی آزمایشگاههای هوش مصنوعی، یک سیستم امنیتی عاملمحور (agentic) چندمدلی جدید را اعلام کرد که به محققان آن کمک کرد 16 آسیبپذیری جدید را در کامپوننت های شبکه و احراز هویت ویندوز از جمله چهار نقص بحرانی اجرای کد از راه دور پیدا کنند. این سیستم با نام رمز MDASH (مخفف Multi-Model Agentic Scanning Harness) نامگذاری شده و توسط تیم امنیت کد خودکار (Autonomous Code Security) مایکروسافت توسعه یافته است.
این سیستم جدید به جای اتکا به یک مدل هوش مصنوعی واحد برای اسکن آسیبپذیری، از بیش از 100 عامل هوش مصنوعی تخصصی در میان مدلهای مختلف پیشرفته (فرانتیر) و تقطیرشده (distilled) استفاده میکند. این عاملها در مراحل مختلفی مانند آمادهسازی کد، اسکن، اعتبارسنجی، حذف تکراریها، تولید اثبات و اعتبارسنجی وصله کار میکنند. این سیستم از مدلهای سنگینتر برای استدلال و از مدلهای تقطیرشده کوچکتر برای وظایف بحث و اعتبارسنجی با حجم بالا استفاده میکند.
مایکروسافت تأکید کرد که این سیستم جدید بهتر از سیستمهای تکمدلی که هماکنون وجود دارند، عمل میکند. در یک درایور تست خصوصی حاوی 21 آسیبپذیری عمداً کاشته شده، MDASH هر 21 آسیبپذیری را با نرخ مثبت کاذب صفر پیدا کرد. در آزمایش گذشتهنگر (Retrospective testing)، این سیستم روی پنج سال پروندههای تأییدشده MSRC در clfs.sys به نرخ بازیابی (recall) 96 درصد و روی پروندههای tcpip.sys به نرخ بازیابی 100 درصد دست یافت.
مایکروسافت میگوید در معیار عمومی CyberGym که شامل 1507 وظیفه بازتولید آسیبپذیری در دنیای واقعی است، MDASH امتیاز 88.45 درصد کسب کرد و در صدر جدول رتبهبندی قرار گرفت و حتی از مدل Mythos آنتروپیک و GPT-5.5 اوپنایآی پیشی گرفت. سیستم جدید MDASH هماکنون به تیمهای مهندسی داخلی مایکروسافت در بهبود وضعیت امنیتی چندین محصول و خدمات کمک میکند. مایکروسافت همچنین تأکید کرد که این سیستم در چارچوب یک پیشنمایش خصوصی محدود توسط مشتریان در حال آزمایش است.