مایکروسافت با رونمایی از دو مدل هوش مصنوعی جدید که بهطور کامل توسط تیمهای داخلی این شرکت آموزش داده شدهاند، دامنه فعالیت خود در حوزه هوش مصنوعی را گسترش داده است. مدل MAI-Voice-1 نخستین مدل تولید گفتار طبیعی مایکروسافت محسوب میشود، در حالی که MAI-1-preview یک مدل متنی است و نخستین مدل پایهای این شرکت است که از ابتدا تا انتها بهصورت مستقل آموزش دیده است.
در حال حاضر، MAI-Voice-1 در قابلیتهای Copilot Daily و پادکستهای تولیدشده توسط مایکروسافت مورد استفاده قرار گرفته است. مدل MAI-1-preview نیز برای آزمایش عمومی در پلتفرم LMArena در دسترس قرار دارد و قرار است طی هفتههای آینده در برخی از قابلیتهای Copilot بهصورت آزمایشی بهکار گرفته شود. مصطفی سلیمان، مدیر بخش هوش مصنوعی مایکروسافت، در گفتوگویی با رسانه Semafor اظهار داشت که این دو مدل با تمرکز بر بهرهوری و کاهش هزینهها توسعه یافتهاند.
به گفته او، MAI-Voice-1 تنها با استفاده از یک واحد پردازش گرافیکی (GPU) اجرا میشود، در حالی که MAI-1-preview با بهرهگیری از حدود 15 هزار واحد Nvidia H-100 آموزش دیده است. برای مقایسه، مدلهایی مانند Grok متعلق به شرکت xAI برای آموزش به بیش از 100 هزار واحد مشابه نیاز داشتهاند. سلیمان در ادامه افزود:
هنر واقعی در آموزش مدلها، انتخاب دقیق دادهها و پرهیز از هدر دادن توان پردازشی برای توکنهایی است که ارزش آموزشی چندانی ندارند.
اگرچه Copilot همچنان عمدتاً بر پایه فناوری GPT شرکت OpenAI ساخته شده است، تصمیم مایکروسافت برای توسعه مدلهای اختصاصی نشاندهنده تمایل این شرکت به تبدیلشدن به رقیبی مستقل در عرصه هوش مصنوعی است. سلیمان همچنین اشاره کرد که مایکروسافت در حال سرمایهگذاری بر یک نقشه راه پنجساله گسترده است که بهصورت فصلی دنبال میشود. با توجه به برخی نگرانیها درباره احتمال ایجاد حباب در بازار هوش مصنوعی، مایکروسافت باید با سرعت و دقت بالا مسیر استقلال خود را ادامه دهد تا این سرمایهگذاری بلندمدت به نتیجه مطلوب برسد.