شرکت X.ai که متعلق به ایلان ماسک است نسخه جدید چتبات Grok را با نام Grok-1.5 معرفی کرد، در این بروزرسانی شاهد بهبود استدلال و عملکرد به ویژه در وظایف مربوط به برنامهنویسی و ریاضیات نسبت به مدل پیشین خود گروک-1 هستیم که به زودی در X برای آزمایش کنندگان اولیه در دسترس خواهد بود و ویژگی های جدیدی نیز همراه با آن معرفی خواهد شد، توجه داشته باشید تاثیر این بهبود ها در تعاملات واقعی کاربران با این چتبات هنوز مشخص نیست و نمیتوان صرفا با مشخصات و بنچمارک هایی که X.ai منتشر کرده نتیجه گیری کرد.
یکی دیگر از ویژگی هایی که در چتبات Grok مورد توجه قرار گرفته و خود ایلان ماسک نیز آن را برجسته کرده رویکرد این چتبات در پاسخ به سوالات و موضوعات بحت برانگیز و ارائه پاسخ های نامتعارف است، که باید دید آیا در این رویکرد تغییر ایجاد خواهد شد یا خیر ، دیگر بهبود قابل توجه در گروک-1.5، پشتیبانی از یک زمینه 128,000 توکنی است، که بسیار بزرگتر از مدل قبلی است.
در ادامه به بررسی بنچمارک های ارائه شده توسط X.ai میپردازیم:
1 – بهبود عملکرد در وظایف کدنویسی و ریاضی
یکی از قابل توجه ترین پیشرفت ها در Grok-1.5 عملکرد آن در کدنویسی و کارهای مرتبط با ریاضی است. در تست های X.ai چتبات Grok-1.5 امتیاز 50.6% در معیار MATH و 90% امتیاز در معیار GSM8K به دست آورد، این دو معیار ریاضی طیف وسیعی از مشکلات کلاسی تا مقطع دبیرستان را پوشش میدهد. علاوه بر این، در معیار HumanEval که تولید کد و توانایی های حل مسئله را ارزیابی می کند، امتیاز 74.1% را کسب کرد که شاهد افزایش 11 درصدی آن نسبت به مدل قبلی آن هستیم.
با توجه به تصویر پایین میتوانید مشاهده کنید که چتبات Grok-1.5 با پیشرفت هایی که داشته بسیار به رقیبان خود یعنی Gemini pro 1.5 و GPT-4 نزدیک شده است و ایلان ماسک قصد عقب نشینی در حوزه مدل های زبانی بزرگ (LLM) ها را ندارد.

2 – پشتیبانی از تعداد توکن بیشتر
Grok-1.5 قادر است متنهای با طول تا 128,000 توکن را پردازش کند. این طول متن ۱۶ برابر طول متن پشتیبانی شده در Grok-1 است.. این زمینه گستردهتر به مدل امکان میدهد تا اطلاعات بیشتری از تعاملات قبلی را حفظ کند، که به داشتن درک عمیقتری از گفتگوهای جاری و توانایی تولید پاسخهای منسجم و دقیق تر برای پرسشهای پیچیده کمک میکند.

Grok-1.5 به زودی در دسترس آزمایش کنندگان اولیه قرار خواهد گرفت و طبق گفته ایلان ماسک ویژگی های جدید دیگری نظیر خلاصه کردن متن و ارائه پیشنهاد برای تولید محتوا را نیز خواهد داشت ، همچنین ممکن است در نحوه برخورد با موضوعات جنجالی و مسائل حساس و بحثبرانگیز نغییراتی ایجاد شود زیرا طبق اخبار این LLM بر خلاف سایر رقبا دارای بیان آزاد تری است و پاسخ های جنجالی ارائه مینماید.




