آپدیت Grok-1.5V اینجاست: درک تصاویر و پردازش اسناد
استارتاپ هوش مصنوعی xAI از اولین مدل زبانی چندوجهی خود بهنام Grok-1.5V رونمایی کرد. این مدل زبانی پیشرفته بهزودی در دسترس کاربران آزمایشی و فعلی چتبات هوش مصنوعی Grok قرار خواهد گرفت و براساس ادعای کمپانی ایلان ماسک، این مدل جدید توانایی فوقالعادهای در پردازش تصاویر و درک اسناد دارد.
به گزارش واحد ترجمه ایراندکونومی، استارتاپ هوش مصنوعی xAI ایلان ماسک از جدیدترین آپدیت Grok با قابلیت پردازش تصاویر رونمایی کرده است. مدل زبانی Grok-1.5V، نسل اول مدلهای هوش مصنوعی چندجانبه این کمپانی محسوب میشود.
Grok-1.5V، اولین مدل چندوجهی کمپانی xAI
استارتاپ xAI، رقیب کمپانی OpenAI سم آلتمن در حال پیشروی به سمت توسعه ابزارهای هوش مصنوعی خود میباشد و برای اولین بار از آپدیت مدل زبانی خود رونمایی کرده که توانایی درک تصاویر و پردازش اسناد را دارد.
براساس جدیدترین گزارشات، مدل زبانی Grok-1.5V اولین مدل هوش مصنوعی چندجانبه این کمپانی میباشد. به این معنی که این مدل نهتنها قابلیت درک و پردازش دادههای ورودی را دارد؛ بلکه “اسناد، جداول، نمودارها و تصاویر” نیز از این پس بهسادگی توسط Grok پردازش خواهند شد.
این کمپانی در بیانیه خود درباره روشهای استفاده از مدل Grok-1.5V توضیحاتی داده و مثالهایی از کاربرد آن در دنیای پیرامون ما زده است. به گفته xAI، کاربران میتوانند با ارسال یک فلوچارت به این چتبات از آن بخواهند تا آن را به کد پایتون ترجمه کنند. یا از این هوش مصنوعی بخواهند براساس یک نقاشی داستانی نوشته و یا موضوعاتی که قادر به فهم آن نیستند را برایشان توضیح دهد.
ماسک حدود یک ماه پیش با عملی کردن وعدههای پیشین خود هوش مصنوعی Grok را بهصورت متنباز در اختیار توسعهدهندگان و کاربران قرار داده بود و همچنین آپدیت نسخه Grok-1.5 نیز همین چند هفته پیش منتشر شده بود.
به ادعای کمپانی xAI مدل زبانی بهبودیافته این چتبات هوش مصنوعی توانایی بهتری در کدنویسی و مسائل ریاضی نسبت به نسخههای پیشین خواهد داشت. همچنین این مدل در پردازش و آنالیز متون طولانیتر عملکرد بهتری دارد و در همین راستا قادر است منابع مدنظر کاربران را برای تأیید صحتوسقم موضوعات مطرحشده بررسی کند.
استارتاپ xAI اعلام کرده که کاربران آزمایشی و فعلی این هوش مصنوعی بهزودی به آپدیت مدل Grok-1.5V دسترسی خواهند داشت و میتوانند از قابلیتهای آن استفاده کنند. اما هنوز زمان دقیقی برای این ارائه دسترسی مشخص نشده است.
علاوهبر ارتقای مدل زبانی چتبات هوش مصنوعی خود، کمپانی هوش مصنوعی ایلان ماسک از یک دیتاست بنچمارک بهنام “RealWorldQA” نیز رونمایی کرده است. کاربران میتوانند با استفاده از 700 عکس موجود در این دیتاست برای بهبود کارایی و بهرهوری هر مدل هوش مصنوعیای استفاده کنند. هر آیتم شامل سؤالات و پاسخهایی میباشد که کاربران انسانی بهسادگی قابل روبرو شدن و ارزیابی کردن آن را دارند. اما مدلهای چندوجهیای مانند Grok در مواجهه با این مسائل به چالش برخواهند خورد.
کمپانی ایلان ماسک ادعا کرده در مقایسه تکنولوژی خود با دیتاست دیگر رقبا مانند مدل زبانی GPT-4V کمپانی OpenAI، مدل زبانی Claude 3 کمپانی Anthropic و مدل زبانی Gemini Pro 1.5 کمپانی گوگل بیشترین امتیاز را بهدست آورده است!
منبع: Engadget