OpenAI سرانجام به روز رسانی مورد انتظار GPT خود را با نام GPT-4 راه اندازی کرد. مدل زبان بزرگ (LLM) با برخی ویژگی‌ها و قابلیت‌های قدرتمند جدید ارائه می‌شود که کاربران را در سراسر جهان شوکه کرده است.

علاوه بر اینکه GPT-4 به طور قابل توجهی بهتر از GPT-3.5 است، LLM موجود که ربات چت ویروسی OpenAI ChatGPT را تقویت می کند، GPT-4 می تواند ورودی های پیچیده تری را درک کند، دارای محدودیت ورودی کاراکتر به مراتب بزرگتر است، از قابلیت های چندوجهی بهره می برد، و طبق گزارش ها استفاده از آن ایمن تر است.

1. GPT-4 می تواند ورودی های پیچیده تری را درک کند

یکی از بزرگترین ویژگی های جدید GPT-4 توانایی آن در درک اعلان های پیچیده تر و ظریف تر است. طبق گفته OpenAI، GPT-4 “عملکرد در سطح انسانی را در معیارهای مختلف حرفه ای و آکادمیک نشان می دهد.” این امر با قرار دادن GPT-4 از طریق چندین آزمون در سطح انسانی و تست های استاندارد شده، مانند SAT، BAR، و GRE، بدون آموزش خاص، نشان داده شد. GTP-4 نه تنها این تست‌ها را با نمره نسبتاً بالا در سراسر تخته درک و حل کرد، بلکه هر بار نسخه قبلی خود یعنی GPT-3.5 را شکست داد.

توانایی درک اعلان‌های ورودی ظریف‌تر نیز با این واقعیت کمک می‌کند که GPT-4 دارای محدودیت کلمات بسیار بزرگ‌تری است. مدل جدید می‌تواند اعلان‌های ورودی تا 25000 کلمه را مدیریت کند (برای زمینه، GPT-3.5 به 8000 کلمه محدود شده بود). این به طور مستقیم بر جزئیاتی که کاربران می‌توانند در اعلان‌های خود فشار دهند، تأثیر می‌گذارد، از این رو به مدل اطلاعات بسیار بیشتری برای کار کردن و تولید خروجی‌های طولانی‌تر می‌دهد.

GPT-4 همچنین از بیش از 26 زبان از جمله زبان های کم منبع مانند لتونی، ولزی و سواحیلی پشتیبانی می کند. هنگامی که در معیار MMLU بر روی دقت three-shot محک زده شد، GPT-4 از نظر عملکرد انگلیسی زبان در 24 زبان، GPT-3.5 و همچنین سایر LLM های پیشرو مانند PaLM و Chinchilla را شکست داد.

2. قابلیت های چندوجهی

نسخه قبلی ChatGPT فقط به پیام های متنی محدود می شد. در مقابل، یکی از جدیدترین ویژگی های GPT-4 قابلیت های چند وجهی آن است. مدل می تواند هر دو درخواست متن و تصویر را بپذیرد. این بدان معنی است که هوش مصنوعی می تواند یک تصویر را به عنوان ورودی بپذیرد و آن را درست مانند یک پیام متنی تفسیر و درک کند. این قابلیت شامل تمام اندازه ها و انواع تصاویر و متن، از جمله اسناد ترکیبی از این دو، طرح های طراحی شده با دست، و حتی اسکرین شات ها می شود.

با این حال، قابلیت‌های خواندن تصویر GPT-4 فراتر از تفسیر ساده آنهاست. OpenAI این را در جریان توسعه دهندگان خود به نمایش گذاشت، جایی که آنها GPT-4 را با یک مدل طراحی دستی از یک وب سایت جوک ارائه کردند. این مدل وظیفه داشت کدهای HTML و جاوا اسکریپت را بنویسد تا موکاپ را به یک وب سایت تبدیل کند و در عین حال جوک ها را با جوک های واقعی جایگزین کند.

GPT-4 هنگام استفاده از طرح بندی مشخص شده در ماکت، کد را نوشت. پس از آزمایش، کد یک سایت کاری با، همانطور که می توانید حدس بزنید، جوک های واقعی را تولید کرد. آیا این بدان معناست که پیشرفت های هوش مصنوعی به معنای پایان برنامه نویسی است؟ نه کاملاً، اما همچنان یک ویژگی است که در کمک به برنامه نویسان مفید خواهد بود.

همانطور که این ویژگی امیدوارکننده به نظر می رسد، هنوز در پیش نمایش تحقیقاتی است و به صورت عمومی در دسترس نیست. علاوه بر این، این مدل برای پردازش ورودی‌های بصری زمان زیادی را صرف می‌کند، با خود OpenAI بیان می‌کند که برای سریع‌تر شدن ممکن است کار و زمان صرف شود.

3. فرمان پذیری بیشتر

OpenAI همچنین ادعا می کند که GPT-4 دارای درجه بالایی از فرمان پذیری است. همچنین شکستن کاراکترها را برای هوش مصنوعی سخت‌تر کرده است، به این معنی که هنگام اجرای یک برنامه برای بازی یک شخصیت خاص، احتمال شکست آن کمتر است. توسعه دهندگان می توانند سبک و وظیفه هوش مصنوعی خود را با توصیف جهت در پیام “سیستم” تجویز کنند.

این پیام‌ها به کاربران API اجازه می‌دهند تا تجربه کاربر را در محدوده‌های خاصی به شدت سفارشی کنند. از آنجایی که این پیام‌ها ساده‌ترین راه برای “جیلبریک” مدل هستند، آنها همچنین در حال کار روی امن‌تر کردن آن‌ها هستند. نسخه نمایشی GPT-4 این نکته را با واداشتن کاربر به تلاش برای متوقف کردن GPT-4 از معلم سقراطی و پاسخ دادن به درخواست آنها به پایان رساند. با این حال، این مدل از شکستن شخصیت خودداری کرد.

4. ایمن بودن

OpenAI شش ماه را صرف ساخت GPT-4 ایمن تر و هماهنگ تر کرد. این شرکت ادعا می‌کند که 82 درصد کمتر به درخواست‌های محتوای نامناسب یا غیرمجاز پاسخ می‌دهد، 29 درصد بیشتر احتمال دارد که مطابق با سیاست‌های OpenAI به درخواست‌های حساس پاسخ دهد و 40 درصد بیشتر احتمال دارد که پاسخ‌های واقعی را در مقایسه با GPT-3.5 ارائه کند.

این کامل نیست، و شما هنوز هم می توانید انتظار داشته باشید که هر از گاهی “توهم” بزند و ممکن است در پیش بینی های خود اشتباه کند. مطمئناً GPT-4 ادراک و قدرت پیش‌بینی بهتری دارد، اما همچنان نباید کورکورانه به هوش مصنوعی اعتماد کنید.

5. بهبود عملکرد

خارج از ارزیابی عملکرد مدل در امتحانات انسانی، OpenAI همچنین ربات را بر اساس معیارهای سنتی طراحی شده برای مدل‌های یادگیری ماشین ارزیابی کرد. ادعا می‌کند که GPT-4 «به‌طور قابل‌توجهی بهتر از LLM‌های موجود و «بیش‌ترین مدل‌های پیشرفته» عمل می‌کند. این معیارها عبارتند از MMLU، AI2 Reasoning Challenge (ARC)، WinoGrande، HumanEval و Drop فوق الذکر که همگی قابلیت های فردی را آزمایش می کنند.

هنگام مقایسه عملکرد در معیارهای بینایی تحصیلی، نتایج مشابهی خواهید یافت. تست‌های اجرا شده شامل VQAv2، TextVQA، ChartQA، AI2 Diagram (AI2D)، DocVQA، Infographic VQA، TVQA و LSMDC هستند که همگی GPT-4 در صدر هستند. با این حال، OpenAI بیان کرده است که نتایج GPT-4 در این آزمایش‌ها “به طور کامل میزان توانایی‌های آن را نشان نمی‌دهد” زیرا محققان به یافتن چیزهای جدید و چالش‌برانگیزتری ادامه می‌دهند که این مدل می‌تواند با آنها مقابله کند.

سهام:

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *