مرضیه مظاهری 3 دقیقه 26 اردیبهشت 1403

ویژگی‌های هیجان‌انگیز هوش مصنوعی گوگل در رویداد I/O 2024

گوگل مراسم I/O امسال را به طور کلی به معرفی قابلیت‌های هوش مصنوعی و به ویژه مدل هوش مصنوعی Gemini اختصاص داد و از چندین ویژگی جدید در این زمینه رونمایی کرد.

به گزارش واحد ترجمه ایران دکونومی، مراسم I/O 2024 گوگل به پایان رسید و این شرکت همانطور که انتظار می‌رفت، بیشتر وقت خود را به صحبت کردن در مورد هوش مصنوعی اختصاص داد. به طوری که طبق آمار رسمی منتشر شده توسط خود شرکت، در جریان این مراسم 121 مرتبه به هوش مصنوعی اشاره شده است. گوگل در سخنرانی اصلی خود توضیح داد که چگونه هوش مصنوعی، همگام با اندروید رو به جلو در حرکت است و هوش مصنوعی جمینای (Gemini)، به عنوان ستاره مراسم امسال، با همان نقش دستیار مجازی گوگل (Google Assistant)، اما به شیوه‌ای یکپارچه و متنی با آنها هم‌قدم شده است.

فهرست محتوا

ادغام مستقیم هوش مصنوعی Gemini در اندروید

گوگل قصد دارد عملکرد سیستم عامل اندروید را با کمک مدل هوش‌مصنوعی Gemini Nano ارتقا ببخشد. این شرکت به تازگی گفته است که قابلیت اپلیکیشن اندرویدی Gemini در درک مطالب روی نمایشگر و برنامه‌هایی که استفاده می‌کنید، به میزان قابل توجهی بهبود یافته است. همانطور که اشاره کردیم، به‌زودی رابط کاربری Gemini به‌جای پر کردن یک صفحه کامل، روی مطالب ظاهر خواهد شد.

علاوه بر اندروید، گوگل مدل هوش مصنوعی خود را در موتور جستجوی خود نیز ادغام کرده ست. با این ویژگی زمانی که یک سوال در بخش جستجوی گوگل وارد شود، یک جواب نسبتا مفصل بر اساس آن، در اختیار کاربر قرار می‌گیرد.

هوش مصنوعی Gemini Live با قابلیت مکالمه زنده

گوگل در مراسم دیروز از نسخه جذابی از هوش مصنوعی خود با نام Gemini Live رونمایی کرد. این ابزار به کاربران اجازه می‌دهد ازطریق گوشی‌های هوشمند خود با Gemini مکالمه‌ صوتی داشته باشند. این هوش‌مصنوعی می‌تواند محیط اطراف کاربر را از طریق عکس یا فیلم گرفته شده با دوربین گوشی‌، بررسی کرده و بر این اساس به سوالات او پاسخ دهد.

این هوش مصنوعی فوق پیشرفته قادر است به سوالاتی پاسخ دهد که در مورد اشیایی پرسیده می‌شود که اکنون در دامنه دید دوربین هستند یا قبلاً قرار داشته‌اند. مثلا می‌تواند بگوید که عینک گم شده‌ کاربر ممکن است کجا باشد یا اینکه آخرین‌بار عینک را کجا دیده است. این نسخه‌ از Gemini با بهره‌مندی از معماری مدل زیربنایی Gemini 1.5 Pro، قابلیت به‌خاطرسپاری فوق‌العاده‌ای دارد.

هوش مصنوعی Gemma 2 با ۲۷ میلیارد پارامتر

در ادامه رویداد Google I/O 2024، گوگل علاوه بر معرفی پردازنده‌ هوش مصنوعی تریلیوم (Trillium) و مدل Gemini 1.5 Flash ، از چند نمونه جدید از سری ابزارهای متن‌باز جما (Gemma) نیز رونمایی کرد. به گفته گوگل، قرار است مدل هوش مصنوعی Gemma 2 با ۲۷ میلیارد پارامتر در ماه ژوئن امسال دردسترس توسعه‌دهندگان قرار بگیرد.

گوگل مدعی است که PaliGemma اولین مدل زبانی تصویری در خانواده‌ جما است که به منظور کپشن‌نویسی و برچسب‌زنی تصاویر و پرسش ‌و پاسخ تصویری مورد استفاده قرار می‌گیرد.

عینک هوشمند گوگل

گوگل در ویدئوی معرفی پروژه آسترا (Astra) فردی را نشان ‌داد که عینکی هوشمند به چشم زده است. پس از آن، چت‌بات Gemini به سؤالات مربوط به آنچه کاربر دیده بود، جواب داد. گوگل این عینک را یک «نمونه‌ اولیه» نامیده است و به نظر می‌رسد قصد دارد با استفاده از نسخه‌ اولیه‌ی پلتفرم micro-XR، به توسعه‌ نرم‌افزار AR مشغول شود.

ادغام Gemini Nano در گوگل کروم

این غول فناوری روز گذشته اعلام کرد که قصد دارد مدل هوش مصنوعی Gemini Nano را به مرورگر کروم ۱۲۶ اضافه کند تا از این طریق امکان استفاده از قابلیت‌های هوش مصنوعی را برای کاربران این مرورگر محبوب فراهم سازد.

مدل هوش مصنوعی Gemini Nano یک مدل زبانی سبک و در عین حال قدرتمند است که سال گذشته برای گوشی‌های سری پیکسل ۸ معرفی شد. ادغام Gemini Nano در مرورگر کروم، به کاربران اجازه می‌دهد تا ازطریق مرورگر، کارهایی مثل تولید متن، پست گذاشتن در شبکه‌های اجتماعی و ارائه نظرات درباره‌ محصولات را به سهولت انجام دهند.

تجهیز سرویس TalkBack به هوش مصنوعی

قرار است سرویس TalkBack گوگل که در اصل ابزاری برای کمک به افراد توان‌یاب برای استفاده راحت‌تر از سیستم‌عامل اندروید است، همراه با هوش مصنوعی Gemini ، توضیحات شنیداری از اشیاء را برای افراد نابینا و کم‌بینا ارائه کند. گفته می‌شود این سرویس در به‌روزرسانی جدید خود از مدل زبانی Gemini Nano برای ارائه توضیحات متنی از اشیا داخل نمایشگر دستگاه اندرویدی استفاده می‌کند و افراد نابینا با کمک این توضیحات می‌توانند جزئیات آنچه در صفحه نمایش گوشی نمایش داده می‌شود را تجسم کنند. گفتنی است که هوش مصنوعی استفاده شده در TalkBack برای پردازش تصاویر به اتصال اینترنت نیاز ندارد، بلکه برای انجام این کار از پارامترهای پردازشی مبتنی‌بر دستگاه استفاده می‌کند.

منبع: zdnet

دیدگاه کاربران