ویدو (Vidu)، هوش مصنوعی چینی تبدیل متن به ویدئو
شرکت چینی شنگشو از ابزار قدرتمند جدیدی با نام ویدو (Vidu) رونمایی کرده که قادر است با کمک هوش مصنوعی، طبق دستورالعمل متنی وارد شده، ویدئوهای 16 ثانیهای بسازد.
به گزارش واحد ترجمه ایران دکونومی، روز شنبه در انجمن Zhongguancun 2024 پکن، شرکت چینی فعال در حوزه هوش مصنوعی Shengshu Technolog از اولین مدل تبدیل متن به ویدئو خود با نام ویدو (Vidu) رونمایی کرد. این ابزار جدید که با همکاری محققان دانشگاه Tsinghua چین توسعه داده شده است، قادر است تنها با یک کلیک ویدیویی با کیفیت بالا به مدت 16 ثانیه و وضوح 1080p ایجاد کند.
این شرکت مدعی است که ویدو (Vidu) به عنوان اولین مدل بزرگ تبدیل متن به ویدئوی چینی، قرار است با ابزار مشهور سورا (Sora) که توسط OpenAI ارائه شده است، رقابت کند. سورا (Sora) یک مدل هوش مصنوعی مولد است که اوایل سال جاری توسط OpenAI ایالات متحده توسعه یافت. این مدل با توانایی کمنظیر خود در ساخت صحنههای واقعی و تخیلی با استناد به دستورالعملهای متنی، در دنیای فناوری طوفان به پا کرد.
عملکرد هوش مصنوعی ویدو (Vidu)
ابزار ویدو (Vidu) قادر است محیط و اجسام را به شکلی واقعی شبیهسازی کند و تصاویری با جزئیات دقیق و منطبق با قوانین فیزیکی و با افکتهای نور و سایه عالی تولید نماید. دقت این ابزار در نشان دادن حالات چهره نیز بسیار مورد توجه قرار گرفته است.
نقطه تمایز ویدو (Vidu) نسبت به رقیب اصلی آن یعنی سورا (Sora) این است که این ابزار جدید قادر به درک و تولید عناصر اصلی فرهنگ چینی مانند پاندا و اژدها است. شرکت Shengshu مدعی شده است که معماری اصلی این مدل بزرگ در سپتامبر 2022 یعنی زودتر از زمان پذیرش معماری Sora پذیرفته شده است. این درحالی است که مدل هوش مصنوعی تبدیل متن به ویدئوی ویدو (Vidu) دو ماه پس از انتشار مدل سورا (Sora) معرفی شده است.
منبع: chinadaily