به گزارش واحد ترجمه ایران دکونومی، روز شنبه در انجمن Zhongguancun 2024 پکن، شرکت چینی فعال در حوزه هوش مصنوعی  Shengshu Technolog از اولین مدل تبدیل متن به ویدئو خود با نام ویدو (Vidu) رونمایی کرد. این ابزار جدید که با همکاری محققان دانشگاه Tsinghua چین توسعه داده شده است، قادر است تنها با یک کلیک ویدیویی با کیفیت بالا به مدت 16 ثانیه و وضوح 1080p ایجاد کند.

این شرکت مدعی است که ویدو (Vidu) به عنوان اولین مدل بزرگ تبدیل متن به ویدئوی چینی، قرار است با ابزار مشهور سورا (Sora) که توسط OpenAI ارائه شده است، رقابت کند. سورا (Sora) یک مدل هوش مصنوعی مولد است که اوایل سال جاری توسط OpenAI ایالات متحده توسعه یافت. این مدل با توانایی کم‌نظیر خود در ساخت صحنه‌های واقعی و تخیلی با استناد به دستورالعمل‌های متنی، در دنیای فناوری طوفان به پا کرد.

ویدو تبدیل متن به ویدئو

عملکرد هوش مصنوعی ویدو (Vidu)

ابزار ویدو (Vidu) قادر است محیط و اجسام را به شکلی واقعی شبیه‌سازی کند و تصاویری با جزئیات دقیق و منطبق با قوانین فیزیکی و با افکت‌های نور و سایه عالی تولید نماید. دقت این ابزار در نشان دادن حالات چهره نیز بسیار مورد توجه قرار گرفته است.

نقطه تمایز ویدو (Vidu) نسبت به رقیب اصلی آن یعنی سورا (Sora) این است که این ابزار جدید قادر به درک و تولید عناصر اصلی فرهنگ چینی مانند پاندا و اژدها است. شرکت Shengshu  مدعی شده است که معماری اصلی این مدل بزرگ در سپتامبر 2022 یعنی زودتر از زمان پذیرش معماری Sora پذیرفته شده است. این درحالی است که مدل هوش مصنوعی تبدیل متن به ویدئوی ویدو (Vidu) دو ماه پس از انتشار مدل سورا (Sora) معرفی شده است.

منبع: chinadaily

لینک کوتاه :
اشتراک گذاری : Array