اپل مدل زبانی برنامه‌نویسی جالب خود را معرفی کرد

در اقدامی غیرمنتظره، اپل مدلی زبانی به‌نام OpenELM را معرفی کرده که به‌طور خاص برای کاربردهای مرتبط با کدنویسی طراحی شده است. برخلاف مدل‌های بزرگ زبان که تمرکز آن‌ها روی پاسخ‌گویی عمومی و مکالمات طبیعی است، این مدل با هدف درک دقیق کد و تولید خروجی‌های فنی توسعه یافته است. این مدل که “Efficient Language Model” یا به اختصار OpenELM نام دارد، بخشی از تلاش اپل برای حضور فعال‌تر در عرصه‌ هوش مصنوعی محسوب می‌شود.

آنچه این مدل را خاص می‌کند، ساختار سبک و بهره‌وری بالای آن است. با اندازه‌ای بسیار کوچک‌تر نسبت به مدل‌های رقیب و استفاده از تکنیک‌هایی برای کاهش تعداد پارامترها بدون افت کیفیت خروجی، اپل توانسته مدلی ارائه دهد که قابلیت اجرا روی دستگاه‌های محلی را نیز دارد. OpenELM در چهار نسخه‌ی مختلف منتشر شده که دو نسخه به‌صورت آموزش‌دیده و دو نسخه بدون آموزش اولیه (pretrained) هستند.

این مدل‌ها از داده‌های منبع‌باز برای آموزش بهره گرفته‌اند و اپل نیز آن‌ها را در GitHub به‌اشتراک گذاشته است؛ حرکتی غیرمعمول از شرکتی که معمولاً در مورد فناوری‌های خود رویکردی بسته دارد. نکته‌ جالب این است که اپل در کنار انتشار کد و مدل، مستندات دقیقی درباره‌ی متدولوژی آموزش، معماری مدل و تحلیل عملکرد منتشر کرده است. این شفافیت، برخلاف روند سنتی اپل، از تمایل این شرکت برای جلب اعتماد جامعه‌ی توسعه‌دهندگان و محققان حکایت دارد. در نهایت، به نظر می‌رسد اپل با OpenELM قصد دارد قدم‌های ابتدایی در مسیر رقابت با مدل‌هایی چون Code Llama (متا) و Phi (مایکروسافت) را بردارد؛ البته با رویکردی متفاوت و سبک‌وزن‌تر.

لینک کوتاه

فهرست سایت

اپل مدل زبانی برنامه‌نویسی جالب خود را معرفی کرد

مطالب مرتبط

ارسال دیدگاه

اپل مدل زبانی برنامه‌نویسی جالب خود را معرفی کرد

مطالب مرتبط

ارسال دیدگاه

برای صرف‌نظر کردن از پاسخ‌گویی اینجا را کلیک نمایید.