ترجمه و نگارش متون به بیش از 100 زبان با مدل زبانی جدید متا
کمپانی متا با توسعه دادن یک مدل هوش مصنوعی یکپارچه بهنام SeamlessM4T؛ ترجمه و نگارش متون به بیش از 100 زبان زنده دنیا را برای کاربران خود امکانپذیر کرده است. این مدل زبانی پیشرفته و دستاوردهای چشمگیر آن، انقلابی در زمینه هوش مصنوعی و مقوله زبان ایجاد خواهد کرد.
به گزارش واحد ترجمه ایراندکونومی، کمپانی متا در مسیر اقدامات خود برای ایجاد هوش مصنوعیهای کاربردی، یک مدل زبانی جدید را توسعه داده که توانایی ترجمه و نگارش متون به بیش از 100 زبان زنده دنیا را دارد.
مدل هوش مصنوعی SeamlessM4T؛ قادر است ورودی متنی و ورودی صوتی را دریافت و پردازش کرده و نتیجه نهایی دلخواه کاربران را به آنها تحویل دهد.
به گفته کمپانی متا، مدل زبانی متنباز SeamlessM4T که در محیط دیتاست SeamlessAlign در دسترس قرار گرفته است؛ “انقلاب عظیمی” را در بخش الگوریتمهای تبدیل صوت به صوت و صوت به متن ایجاد خواهد کرد.
متا در پست وبلاگ رسمی خود نوشته است: “مدل هوش مصنوعی SeamlessM4T قادر است ترجمه آنی و دقیقی برای افرادی که قصد برقراری ارتباط به زبانهای مختلف دارند را فراهم کرده و در مسیر ایجاد ارتباطات مؤثر آنان را یاری کند.”
متا ادامه داد: “مدل SeamlessM4T میتواند فارغ از نیاز به وجود یک سیستم ویژه تشخیص زبان مبدأ، همه زبانها را شناسایی کرده و پروسه ترجمه یا نگارش را آغاز کند.”
نحوه توسعه و تعلیم SeamlessM4T
درحالیکه کمپانیهای آمازون، مایکروسافت، OpenAI و گوگل همگی در حال توسعه دادن ابزارهای هوش مصنوعی ترجمه و نگارش متون اختصاصی خود هستند؛ مدل زبانی SeamlessM4T یکی از معدود هوش مصنوعیهایی است که بهصورت یکپارچه و همزمان قابلیت ترجمه و نگارش متون را دارد.
به گفته کمپانی متا، برای توسعه و تعلیم این مدل زبانی از بیش از میلیاردها جمله و متون عمومی و بیش از 4 میلیون ساعت داده صوتی موجود در سراسر وب استفاده شده است.
البته که استفاده از دادههای عمومی برای تعلیم مدلهای هوش مصنوعی مخالفان سرسخت خود را نیز دارد.
تا این لحظه چندین پرونده و شکایت قضایی علیه کمپانیهای بزرگی که از دادههای موجود در وب برای تعلیم هوش مصنوعی اختصاصی خود استفاده کرده بودند؛ ثبت شده است.
عدهای سرسختانه معتقدند باید از طرف این کمپانیها به صاحبین اثر (چه هنری، چه متنی) حقالزحمه پرداخت شد و درغیراینصورت استفاده از دسترنج آنها کاملاً غیرقانونی است.
هرچند متا ادعا کرده دادههایی که برای توسعه و تعلیم مدل هوش مصنوعی SeamlessM4T استفاده شدهاند؛ هیچ کدام شامل قانون کپیرایت نبودهاند.
دادههای ورودی و نتیجه خروجی مدل SeamlessM4T
درهرصورت، متا با جمعآوری میزان انبوهی از دادههای متنی و صوتی از سراسر اینترنت، دیتاستی بهنام SeamlessAlign را برای هوش مصنوعی SeamlessM4T ایجاد کرده است.
محققان با تنظیم و پردازش بیش از 443 هزار ساعت دادههای صوتی و متنی، موفق شدند بیش از 29 هزار ساعت الگوریتمهای تبدیل صوت به صوت را ایجاد کنند.
با استفاده از این دادهها، به مدل هوش مصنوعی SeamlessM4T آموخته شده که چگونه فایلهای صوتی ورودی را به متن نگارش کند، متن را ترجمه کند، از دادههای متنی فایل صوتی بسازد، و حتی کلمات بیان شده به یک زبان را به زبان دیگری ترجمه کند.
متا در پست منتشر شده در وبلاگ خود ادعا کرده که “با توجه به نتایج خارقالعاده و بسیار پیشرفته بهدست آمده، مدل هوش مصنوعی SeamlessM4T انقلابی عظیم را در این حوزه بهوجود خواهد آورد”.
منبع: techcrunch