در اقدامی غیرمنتظره، اپل مدلی زبانی بهنام OpenELM را معرفی کرده که بهطور خاص برای کاربردهای مرتبط با کدنویسی طراحی شده است. برخلاف مدلهای بزرگ زبان که تمرکز آنها روی پاسخگویی عمومی و مکالمات طبیعی است، این مدل با هدف درک دقیق کد و تولید خروجیهای فنی توسعه یافته است. این مدل که “Efficient Language Model” یا به اختصار OpenELM نام دارد، بخشی از تلاش اپل برای حضور فعالتر در عرصه هوش مصنوعی محسوب میشود.
آنچه این مدل را خاص میکند، ساختار سبک و بهرهوری بالای آن است. با اندازهای بسیار کوچکتر نسبت به مدلهای رقیب و استفاده از تکنیکهایی برای کاهش تعداد پارامترها بدون افت کیفیت خروجی، اپل توانسته مدلی ارائه دهد که قابلیت اجرا روی دستگاههای محلی را نیز دارد. OpenELM در چهار نسخهی مختلف منتشر شده که دو نسخه بهصورت آموزشدیده و دو نسخه بدون آموزش اولیه (pretrained) هستند.
این مدلها از دادههای منبعباز برای آموزش بهره گرفتهاند و اپل نیز آنها را در GitHub بهاشتراک گذاشته است؛ حرکتی غیرمعمول از شرکتی که معمولاً در مورد فناوریهای خود رویکردی بسته دارد. نکته جالب این است که اپل در کنار انتشار کد و مدل، مستندات دقیقی دربارهی متدولوژی آموزش، معماری مدل و تحلیل عملکرد منتشر کرده است. این شفافیت، برخلاف روند سنتی اپل، از تمایل این شرکت برای جلب اعتماد جامعهی توسعهدهندگان و محققان حکایت دارد. در نهایت، به نظر میرسد اپل با OpenELM قصد دارد قدمهای ابتدایی در مسیر رقابت با مدلهایی چون Code Llama (متا) و Phi (مایکروسافت) را بردارد؛ البته با رویکردی متفاوت و سبکوزنتر.