به گزارش واحد ترجمه ایران‌دکونومی، استارتاپ هوش مصنوعی xAI ایلان ماسک از جدیدترین آپدیت Grok با قابلیت پردازش تصاویر رونمایی کرده است. مدل زبانی Grok-1.5V، نسل اول مدل‌‌های هوش مصنوعی چندجانبه این کمپانی محسوب می‌شود.

Grok-1.5V

Grok-1.5V، اولین مدل چندوجهی کمپانی xAI

استارتاپ xAI، رقیب کمپانی OpenAI سم آلتمن در حال پیشروی به سمت توسعه ابزارهای هوش مصنوعی خود می‌باشد و برای اولین بار از آپدیت مدل زبانی خود رونمایی کرده که توانایی درک تصاویر و پردازش اسناد را دارد.
براساس جدیدترین گزارشات، مدل زبانی Grok-1.5V اولین مدل هوش مصنوعی چندجانبه این کمپانی می‌باشد. به این معنی که این مدل نه‌تنها قابلیت درک و پردازش داده‌های ورودی را دارد؛ بلکه “اسناد، جداول، نمودارها و تصاویر” نیز از این پس به‌سادگی توسط Grok پردازش خواهند شد.

این کمپانی در بیانیه خود درباره روش‌های استفاده از مدل Grok-1.5V توضیحاتی داده و مثال‌هایی از کاربرد آن در دنیای پیرامون ما زده است. به گفته xAI، کاربران می‌توانند با ارسال یک فلوچارت به این چت‌بات از آن بخواهند تا آن را به کد پایتون ترجمه کنند. یا از این هوش مصنوعی بخواهند براساس یک نقاشی داستانی نوشته و یا موضوعاتی که قادر به فهم آن نیستند را برایشان توضیح دهد.

ماسک حدود یک ماه پیش با عملی کردن وعده‌های پیشین خود هوش مصنوعی Grok را به‌صورت متن‌باز در اختیار توسعه‌دهندگان و کاربران قرار داده بود و همچنین آپدیت نسخه Grok-1.5 نیز همین چند هفته پیش منتشر شده بود.
به ادعای کمپانی xAI مدل زبانی بهبودیافته این چت‌بات هوش مصنوعی توانایی بهتری در کدنویسی و مسائل ریاضی نسبت به نسخه‌های پیشین خواهد داشت. همچنین این مدل در پردازش و آنالیز متون طولانی‌تر عملکرد بهتری دارد و در همین راستا قادر است منابع مدنظر کاربران را برای تأیید صحت‌وسقم موضوعات مطرح‌شده بررسی کند.

استارتاپ xAI اعلام کرده که کاربران آزمایشی و فعلی این هوش مصنوعی به‌زودی به آپدیت مدل Grok-1.5V دسترسی خواهند داشت و می‌توانند از قابلیت‌های آن استفاده کنند. اما هنوز زمان دقیقی برای این ارائه دسترسی مشخص نشده است.

Grok AI
مقایسه عملکرد هوش مصنوعی xAI با دیگر رقبا

علاوه‌بر ارتقای مدل زبانی چت‌بات هوش مصنوعی خود، کمپانی هوش مصنوعی ایلان ماسک از یک دیتاست بنچمارک به‌نام “RealWorldQA” نیز رونمایی کرده است. کاربران می‌توانند با استفاده از 700 عکس موجود در این دیتاست برای بهبود کارایی و بهره‌وری هر مدل هوش مصنوعی‌ای استفاده کنند. هر آیتم شامل سؤالات و پاسخ‌هایی می‌باشد که کاربران انسانی به‌سادگی قابل روبرو شدن و ارزیابی کردن آن را دارند. اما مدل‌های چندوجهی‌ای مانند Grok در مواجهه با این مسائل به چالش برخواهند خورد.

کمپانی ایلان ماسک ادعا کرده در مقایسه تکنولوژی خود با دیتاست دیگر رقبا مانند مدل زبانی GPT-4V کمپانی OpenAI، مدل زبانی Claude 3 کمپانی Anthropic و مدل زبانی Gemini Pro 1.5 کمپانی گوگل بیشترین امتیاز را به‌دست آورده است!

منبع: Engadget

لینک کوتاه :
اشتراک گذاری : Array