آپدیت هوش مصنوعی Imagen 2.0: تبدیل متن به تصاویر زنده!
کمپانی گوگل در رویداد Cloud Next 2024 اعلام کرد از این پس کاربران میتوانند با استفاده از دستورات متنی ساده، تصاویر زنده و متحرک 4 ثانیهای را در هوش مصنوعی Imagen بسازند! جدیدترین آپدیت Imagen 2.0 علاوهبر ساخت این تصاویر واقعگرایانه شامل ابزارهای پیشرفته ویرایشی نیز میشود.
به گزارش واحد ترجمه ایراندکونومی، کمپانی گوگل روز گذشته در رویداد Cloud Next از نسخه بهبود و ارتقایافته هوش مصنوعی Imagen 2.0 در پلتفرم Vertex AI رونمایی کرده است. این ابزار هوش مصنوعی حالا میتواند با دریافت دادههای متنی ساده آنها را به تصاویر زنده تبدیل کند.
کنفرانس Cloud Next 2024 از روز 9 آپریل تا 11 آپریل امسال برگزار خواهد شد. کمپانی گوگل در این کنفرانس از پروژههای هوش مصنوعی و آپدیتهای ابزارها و سرویسهای مختلف خود خصوصاً در محیط پلتفرم Vertex AI رونمایی کرده است.
یکی از این رونماییها مربوط به تجهیز اندروید استودیو به چتبات هوش مصنوعی Gemini Pro بود که قرار است در مسیر کدنویسی و عیبیابی همراه توسعهدهندگان باشد.
ابزار هوش مصنوعی Imagen برای اولین بار در سال گذشته (2023) رونمایی شده بود و محصولی از آزمایشگاههای هوش مصنوعی DeepMind (زیرنظر کمپانی گوگل) میباشد. این ابزار قادر است تصاویر واقعگرایانه و با کیفیت بالایی را تولید کند که از لحاظ بصری بسیار چشمنواز هستند. Imagen با ابزارهای هوش مصنوعی ساخت تصاویر دیگری از جمله DALL-E (محصولی از OpenAI) و MidJourney رقابت میکند.
با قابلیتهای جدید Imagen 2.0 آشنا شوید
یکی دیگر از رونماییهای هیجانانگیز گوگل نیز مربوط به جدیدترین نسخه از ابزار هوش مصنوعی خلق تصاویر Imagen 2.0 میباشد. به گفته این کمپانی این ابزار بهصورت گسترده ارتقا یافته و به قابلیتهای بسیاری مجهز شده است.
با توجه به اطلاعات منتشر شده در این مراسم، ابزار هوش مصنوعی Imagen 2.0 هماکنون قادر است با دریافت و پردازش دادههای متنی ساده آنها را به تصاویر زنده کوتاه 4 ثانیهای تبدیل کند! همچنین علاوهبر این قابلیت، کاربران از این پس به قابلیتهای پیشرفته ویرایش تصویر مانند الصاق واترمارک دیجیتالی نیز دسترسی خواهند داشت.
قابلیتهای تبدیل دستورات متنی به تصاویر زنده هماکنون بهصورت پیشنمایش در ابزار هوش مصنوعی Imagen 2.0 در دسترس هستند و این مدل را در پلتفرم Vertex AI از گذشته هم قدرتمندتر خواهند کرد. براساس آپدیت بلاگ رسمی گوگل، کاربران قادرند با دستورات متنی مدنظر خود، مدلهای مختلفی از تصاویر زنده 4 ثانیهای از جمله گیفهایی با 24 فریم بر ثانیه با رزولوشن 360×640 پیکسل را ایجاد کنند.
به گفته این غول تکنولوژی، این ابزار قادر است با زاویهها و حرکات گوناگون دوربین، تصاویر متحرک و زندهای را براساس دستورات متنی اولیه ایجاد کرده و درعینحال پیوستگی و یکپارچی کل صحنه را حفظ کند.
البته این قابلیت جدید پایان راه Imagen نخواهد بود و گوگل قصد دارد بهزودی این دسترسی جدید را گسترش داده و از قبل توانمندتر سازد. همچنین شایان ذکر است که برای توسعه این قابلیت تمام تهمیدات امنیتی از پیش اندیشیده شدهاند و تصاویر زنده ساخته شده از فیلترهای ایمنی گذر کرده و سپس به واترمارکهای دیجیتالی مجهز خواهند شد.
همانطور که بالاتر اشاره کردیم، یکی دیگر از آپدیتهای هیجانانگیز ابزار هوش مصنوعی Imagen 2.0 معرفی قابلیتهای ویرایش تصاویر جدید است. برخی از تغییراتی که میتوان به کمک این ابزارها ایجاد کرد شامل حذف اشیای موردنظر از عکس، خلق و افزودن عناصر جدید به عکس و گسترش مرزهای تصویر بزای ایجاد یک زاویه دید بازتر میباشد.
فارغ از این ابزارهای ویرایش، کاربران Imagen به ابزارهای لازم برای الصاق واترمارکهای نامرئی و احراز هویت تصاویر زنده ساخته شده با مدلهای هوش مصنوعی گوگل نیز دسترسی خواهند داشت.
منبع: MSPowerUser