به گزارش واحد ترجمه ایران‌دکونومی، مدت‌هاست که مدل‌های زبانی کمپانی OpenAI، تا این لحظه پیشرو و پرچمدار دنیای هوش مصنوعی بوده‌اند؛ اما ممکن است به‌زودی Gemini ورق را برگرداند!
البته که رونمایی و عرضه زودهنگام دستاوردهای OpenAI نسبت به دیگر رقبا و پشتوانه عظیم داده‌های تحت مالکیت کمپانی مایکروسافت نیز در شکل دادن این زیرساخت‌ها بی‌تأثیر نبوده‌اند.

اما با درنظر گرفتن اینکه به‌صورت ماهانه از ابزار هوش مصنوعی پیشرفته‌تر و جدیدتری رونمایی می‌شود؛ ممکن است سلطه ChatGPT بر بازار و مخاطبان همیشگی نباشد.
یکی از این پروژه‌های جدید ممکن است نسبت به دیگر رقبا شانس بیشتری برای به‌دست گرفتن اوضاع داشته باشد: هوش مصنوعی Gemini، محصولی از کمپانی گوگل.

براساس گزارش اخیر رسانه The Information، قرار است در پاییز پیش‌رو، جدیدترین پروژه مدل زبانی بزرگ (LLM) و هوش مصنوعی گوگل به بازار عرضه شود.
یکی از اهداف ایجاد این هوش مصنوعی، بهره‌گیری از آن در هوش مصنوعی Bard، و اپلیکیشن‌های جانبی و کاربردی گوگل مانند Google Docs و Slides می‌باشد.

Gemini

هوش مصنوعی Gemini، یک قدم جلوتر از رقبا

نکته‌ای که هوش مصنوعی Gemini را از دیگر رقبای خود متمایز کرده و آن را به یک رقیب قدرتمند تبدیل می‌کند، منابع تقریباً نامحدودی است که در اختیار کمپانی گوگل قرار دارد.
خصوصاً حجم انبوهی از داده‌ها که می‌توان از آنها برای تعلیم دادن مدل‌های زبانی پیشرفته استفاده کرد.

کمپانی گوگل به ویدیوهای به‌اشتراک گذاشته شده در یوتیوب، کتاب‌های بخش Google books، لیست داده‌های بی‌شمار موتور جستجوی گوگل و داده‌های علمی بخش Google Scholar دسترسی دارد.
البته که اکثر این داده‌ها منحصراً متعلق به کمپانی گوگل هستند و همین مسئله منجر به تعلیم دادن مدل‌ زبانی‌ای خواهد شد که نسبت به دیگر هوش مصنوعی‌های موجود در این حوزه، هوشمندتر و پیشرفته‌تر هستند.

براساس شنیده‌ها، هوش مصنوعی Gemini اولین مدل زبانی چندجانبه‌ای خواهد بود که علاوه بر دستورات متنی و تصویری، امکان پشتیبانی از داده‌های ویدیویی را نیز دارد! برخلاف رقیب خود GPT-4 که چنین قابلیتی هنوز در آن توسعه داده نشده است.

علاوه بر مبحث منابع بی‌نهایت، کمپانی گوگل دارای افراد مستعد و خلاق و تجربه کاری طولانی در زمینه توسعه و تعلیم مدل‌های زبانی بزرگ می‌باشد.
براساس شنیده‌ها، انتظار می‌رود این کمپانی در پاییز پیش‌رو از هوش مصنوعی Gemini و چت‌باتی قدرت‌گرفته از آن و یا حتی چت‌بات Bard برمنبای Gemini رونمایی کند.

این عرضه و رونمایی تأثیر به‌سزایی را در بخش ابری کمپانی گوگل (Google’s Cloud) خواهد گذاشت؛ بخشی که پیش‌بینی می‌شود اصلی‌ترین راه دسترسی مشتریان سازمانی به خدمات و ابزار مبتنی بر این مدل زبانی باشد.

هوش مصنوعی Gemini برای اولین بار در رویداد سالانه Google I/O امسال به حضار و علاقه‌مندان معرفی شده بود، رویدادی که علاوه‌بر Gemini، از چندین پروژه هوش مصنوعی دیگر نیز رونمایی شده بود.
در توسعه این پروژه، از سیستم هوش مصنوعی پیشرفته Alphago استفاده شده است. سیستم قدرتمندی که توانسته برای اولین بار در جهان، یک بازیکن انسان را در بازی رومیزی Go شکست دهد. به‌همین منظور، احتمالاً Gemini نیز مهارت بسیار خوبی در حل‌مسئله داشته باشد.

Gemini

آیا این پایان سلطه ChatGPT خواهد بود؟

هنگام رونمایی از هوش مصنوعی محبوب ChatGPT در زمستان سال گذشته، زنگ‌خطری در کمپانی گوگل به‌صدا در آمد و این کمپانی از همان زمان تمام تلاش خود را برای جا نماندن از رقبای خود به‌کار گرفت.
گوگل، به‌همراه شرکت زیرمجموعه DeepMind (متخصص در حوزه هوش مصنوعی) روابط همکاری مستحکمی را شکل دادند تا درنهایت با پروژه Gemini پاسخی در خور به کمپانی OpenAI داده باشند.

گزارشات اخیر حاکی از آن هستند که کمپانی گوگل دستاوردهای بسیار چشمگیری در جدیدترین نسخه Gemini داشته است و قابلیت‌های چندجانبه آن به‌طرز قابل‌توجهی نسبت به نسخه‌های قبلی بهبود یافته‌اند.
تمرکز اصلی این مدل، بر پشتیبانی از مدل‌های مختلف محتوا اعم از متن، تصویر و ویدیوست. این مدل توانایی پردازش و تحلیل فرم‌های مختلفی از داده‌ها را دارد.

این آپدیت مهم به این معناست که هوش مصنوعی Gemini نه‌تنها در بحث مکالمه متنی با کاربران، بلکه در زمینه رویارویی با داده‌های ورودی‌ متفاوت (متن/تصاویر/ویدیوها) نیز عملکرد بسیار خوبی خواهد داشت.
همچنین براساس شنیده‌ها، توکن‌های مورد استفاده برای تعلیم این مدل زبانی تقریباً دو برابر GPT-4 است و به همین دلیل Gemini بسیار باهوش‌تر از ChatGPT خواهد بود!

منبع: indianexpress

لینک کوتاه :
اشتراک گذاری : Array