به گزارش واحد ترجمه ایران‌دکونومی، کمپانی متا در مسیر اقدامات خود برای ایجاد هوش مصنوعی‌های کاربردی، یک مدل زبانی جدید را توسعه داده که توانایی ترجمه و نگارش متون به بیش از 100 زبان زنده دنیا را دارد.
مدل هوش مصنوعی SeamlessM4T؛ قادر است ورودی متنی و ورودی صوتی را دریافت و پردازش کرده و نتیجه نهایی دلخواه کاربران را به آنها تحویل دهد.

به گفته کمپانی متا، مدل زبانی متن‌باز SeamlessM4T که در محیط دیتاست SeamlessAlign در دسترس قرار گرفته است؛ “انقلاب عظیمی” را در بخش الگوریتم‌های تبدیل صوت به صوت و صوت به متن ایجاد خواهد کرد.

متا در پست وبلاگ رسمی خود نوشته است: “مدل هوش مصنوعی SeamlessM4T قادر است ترجمه آنی و دقیقی برای افرادی که قصد برقراری ارتباط به زبان‌های مختلف دارند را فراهم کرده و در مسیر ایجاد ارتباطات مؤثر آنان را یاری کند.”
متا ادامه داد: “مدل SeamlessM4T می‌تواند فارغ از نیاز به وجود یک سیستم ویژه تشخیص زبان مبدأ، همه زبان‌ها را شناسایی کرده و پروسه ترجمه یا نگارش را آغاز کند.”

مدل

نحوه توسعه و تعلیم SeamlessM4T

درحالی‌که کمپانی‌های آمازون، مایکروسافت، OpenAI و گوگل همگی در حال توسعه دادن ابزارهای هوش مصنوعی ترجمه و نگارش متون اختصاصی خود هستند؛ مدل زبانی SeamlessM4T یکی از معدود هوش مصنوعی‌هایی است که به‌صورت یکپارچه و همزمان قابلیت ترجمه و نگارش متون را دارد.

به گفته کمپانی متا، برای توسعه و تعلیم این مدل زبانی از بیش از میلیاردها جمله و متون عمومی و بیش از 4 میلیون ساعت داده صوتی موجود در سراسر وب استفاده شده است.
البته که استفاده از داده‌های عمومی برای تعلیم مدل‌های هوش مصنوعی مخالفان سرسخت خود را نیز دارد.

تا این لحظه چندین پرونده و شکایت قضایی علیه کمپانی‌های بزرگی که از داده‌های موجود در وب برای تعلیم هوش مصنوعی اختصاصی خود استفاده کرده بودند؛ ثبت شده است.
عده‌ای سرسختانه معتقدند باید از طرف این کمپانی‌ها به صاحبین اثر (چه هنری، چه متنی) حق‌الزحمه پرداخت شد و درغیراین‌صورت استفاده از دست‌رنج آنها کاملاً غیرقانونی است.

هرچند متا ادعا کرده داده‌هایی که برای توسعه و تعلیم مدل هوش مصنوعی SeamlessM4T استفاده شده‌اند؛ هیچ کدام شامل قانون کپی‌رایت نبوده‌اند.

مدل

داده‌های ورودی و نتیجه خروجی مدل SeamlessM4T

درهرصورت، متا با جمع‌آوری میزان انبوهی از داده‌های متنی و صوتی از سراسر اینترنت، دیتاستی به‌نام SeamlessAlign را برای هوش مصنوعی SeamlessM4T ایجاد کرده است.
محققان با تنظیم و پردازش بیش از 443 هزار ساعت داده‌های صوتی و متنی، موفق شدند بیش از 29 هزار ساعت الگوریتم‌های تبدیل صوت به صوت را ایجاد کنند.
با استفاده از این داده‌ها، به مدل هوش مصنوعی SeamlessM4T آموخته شده که چگونه فایل‌های صوتی ورودی را به متن نگارش کند، متن را ترجمه کند، از داده‌های متنی فایل صوتی بسازد، و حتی کلمات بیان شده به یک زبان را به زبان دیگری ترجمه کند.

متا در پست منتشر شده در وبلاگ خود ادعا کرده که “با توجه به نتایج خارق‌العاده و بسیار پیشرفته به‌دست آمده، مدل هوش مصنوعی SeamlessM4T انقلابی عظیم را در این حوزه به‌وجود خواهد آورد”.

منبع: techcrunch

لینک کوتاه :
اشتراک گذاری : Array