به گزارش واحد ترجمه ایران‌دکونومی، جدیدترین دستاورد کمپانی چینی علی‌بابا در زمینه هوش مصنوعی، توانایی “خواندن” و پردازش تصاویر و امکان ایجاد مکالمات پیچیده‌تر با کاربران را دارد.

کمپانی علی‌بابا در روز جمعه از دو مدل زبانی جدید خود به نام‌های Qwen-VL و Qwen-VL-Chat رونمایی کرد. این کمپانی درباره بهبود توانایی این مدل زبانی در برقراری مکالمات پیشرفته‌تر و پردازش بهتر تصاویر تأکید بسیاری داشته است.

یکی از مثال‌های ارائه‌شده توسط علی‌بابا در زمینه توانایی‌های بهبودیافته این مدل‌های زبانی جدید؛ امکان درک “علامت‌ها و نشان‌های مربوط به بیمارستان‌ها” است.
براساس ادعای علی‌بابا، چت‌بات Qwen-VL-Chat قادر است با دریافت و درک هر علامت مخصوص، به سؤالات کاربران درباره محل استقرار دپارتمان‌های مختلف بیمارستان در طبقات مختلف ساختمان و خدمات آنها پاسخ دهد.

تغییرات زیرساختی در علی‌بابا

دستاوردهای جدید کمپانی علی‌بابا در زمینه هوش مصنوعی، نتیجه زحمات و تحقیقات واحد بخش خدمات ابری این کمپانی است. این شرکت عظیم که به‌تازگی خدمات خود را به چندین بخش زیرمجموعه مجزا تقسیم‌بندی کرده است؛ امیدوار است بتواند با ارتقای خدمات بخش هوش مصنوعی توجه کاربران را به خود جلب کند.

در اوایل سال میلادی جاری علی بابا در بیانیه‌ای اعلام کرده بود که این کمپانی تغییرساختار عظیمی خواهد داد و به 6بخش مجزا تقسیم خواهد شد. هر بخش مدیرعامل و هیئت‌مدیره خاص خود را خواهد داشت و قرار بود دنیل ژانگ مدیرعامل بخش فضای ذخیره‌سازی ابری باقی بماند. تنها چند ماه بعد، در اواخر بهار، ژانگ از سمت مدیرعاملی خود استعفا داد تا بتواند به‌صورت تمام‌وقت در بخش ذخیره‌سازی ابری فعالیت کند.

علی‌بابا اظهار کرده که این دو مدل زبانی جدید نسبت به پروژه‌های هوش مصنوعی قبلی این کمپانی پیشرفته‌تر هستند و توانایی درک و پردازش دستورات پیچیده‌تر را نیز دارند.

به گفته کمپانی علی‌بابا، هر دو مدل زبانی Qwen-VL و Qwen-VL-Chat متن‌باز هستند و در نتیجه محققین، افراد آکادمیک و سازمان‌ها در سراسر جهان می‌توانند برای ایجاد و توسعه هوش مصنوعی‌های اختصاصی خود و تعلیم سیستم‌های مربوطه از این مدل‌های زبانی بزرگ بهره بگیرند.
با این کار صرفه‌جویی قابل‌توجهی در وقت، هزینه و منابع صورت خواهد گرفت.

هوش مصنوعی

عملکرد مدل‌های زبانی هوش مصنوعی علی‌بابا

به گفته این کمپانی، مدل زبانی Qwen-VL توانایی پاسخگویی به سؤالات تشریحی و متعدد درباره تصاویر مختلف و ایجاد داده‌های تصویری را دارد.

از طرفی، مدل زبانی Qwen-VL-Chat بیشتر مناسب برقراری “تعاملات پیچیده‌تر” است، مانند مقایسه چندین داده تصویری مشابه و پاسخ دادن به چندین سری سؤالات تخصصی.
بعضی از کاربردهای این چت‌بات شامل توانایی نگارش داستان، خلق تصاویر براساس عکس‌های ورودی کاربران و حتی حل کردن مسائل و معادلات ریاضی نمایش داده شده در یک تصویر می‌باشند.

همانطور که در بالاتر ذکر شد، این چت‌بات توانایی پردازش علامت‌های مخصوص بیمارستان‌ها و پاسخگویی به سؤالات مربوطه در این زمینه را نیز دارد.

تمایز مدل‌های زبانی علی‌بابا نسبت به دیگر رقبا

تا این لحظه، بیشتر ابزارهای هوش مصنوعی زایا (ابزارهای هوش مصنوعی که در پاسخ به دستورات/داده‌های ورودی انسان‌ها پاسخ ایجاد می‌کنند)؛ بیشتر بر “محتواهای متنی” تمرکز داشته است.
جدیدترین آپدیت هوش مصنوعی محبوب و کاربردی کمپانی OpenAI، چت‌بات ChatGPT قابلیت درک و پردازش تصاویر و ایجاد پاسخ به‌صورت متنی را نیز دارد؛ تقریباً عملکردی مانند مدل زبانی Qwen-VL-Chat علی‌بابا.

این دو هوش مصنوعی جدید براساس مدل زبانی بزرگ کمپانی علی‌بابا یعنی Tongyi Qianwen که در اوایل سال جاری میلادی عرضه شده بود؛ ساخته شده‌اند.

منبع: CNBC

لینک کوتاه :
اشتراک گذاری : Array