به گزارش واحد ترجمه ایران دکونومی، تیم تحقیقاتی Audiocraft کمپانی متا به‌تازگی از هوش مصنوعی جدیدی به نام MusicGen رونمایی کرده‌اند.


این هوش مصنوعی اوپن‌سورس (متن‌باز) یک مدل زبانی بزرگ بر مبنای دیپ‌لرنینگ است که توانایی ایجاد موسیقی بر اساس داده‌های متنی و حتی تنظیم آنها با آهنگ از پیش نوشته شده را نیز دارد.

کارکرد این هوش مصنوعی به ChatGPT بی‌شباهت نیست؛ با این تفاوت که خروجی کار یک فایل صوتی خواهد بود.
کاربران ژانر موسیقی موردنظر خود را به این هوش مصنوعی توضیح می‌دهند، و ترجیحاً با آپلود یک فایل صدا (tune) و انتخاب گزینه Generate، این هوش مصنوعی بعد از گذر مدتی زمان (برای مثال 160 ثانیه) یک فایل صوتی موسیقی کوتاه بر اساس دستورات متنی و ملودی شما را تولید کرده و ارائه خواهد داد.

بر اساس گفته‌های فلیکس کروک، سرپرست این پروژه، هوش مصنوعی MusicGen توانایی تولید موسیقی هم بر اساس داده‌های متنی و هم بر اساس ملودی را دارد.

تیم توسعه دهنده MusicGen از 20 هزار ساعت موسیقی مجاز، شامل حدوداً 10 هزار ساعت موسیقی برگرفته از یک دیتای داخلی برای تعلیم این هوش مصنوعی استفاده کرده‌اند. برای تسریع پروسه ایجاد فایل موسیقی؛ تیم توسعه این هوش مصنوعی از توکنایزر صوتی EnCodec برای تولید فایل‌های صوتی کوتاه‌تر بهره گرفته‌اند.

MusicGen

رقابت MusicGen و MusicLM

ماه گذشته کمپانی گوگل از یک هوش مصنوعی مشابه به نام MusicLM رونمایی کرده بود. اما به‌نظر می‌رسد که در مقایسه، MusicGen عملکرد بهتری داشته و نتایج قابل‌قبول‌تری را عرضه می‌کند.

بر اساس بررسی کارشناسان، هوش مصنوعی MusicGen در سیستمی با کارت گرافیک 16 گیگی به‌راحتی اجرا می‌شود، و در چهار مدل و سایز، از کوچک (300 میلیون پارامتر) گرفته تا بزرگ (3.3 تریلیون پارامتر) در دسترس کاربران است.

البته که این هوش مصنوعی در عین شگفت‌انگیز بودن، ممکن است دردسرساز نیز باشد. طولی نخواهد کشید که پای هنرمندان و کمپانی‌ها به دادگاه باز شده تا از حق و حقوق خود دفاع کنند. خصوصاً با درنظر گرفتن اینکه از هزاران ساعت موسیقی هنرمندان برای تعلیم این هوش مصنوعی استفاده شده و ممکن است نتیجه تولید شده قوانین کپی‌رایت را نقض کند.

این هوش مصنوعی از طریق صفحه Hugging Face فسیبوک در دسترس است.

منبع: engadget

لینک کوتاه :
اشتراک گذاری : Array