هوش مصنوعی جدید علیبابا با قابلیت “درک” تصاویر
![هوش مصنوعی جدید علیبابا با قابلیت “درک” تصاویر](https://irandeconomy.com/wp-content/uploads/2023/08/020604-AliBaba-AIModels-1024x576.jpg)
کمپانی چینی علیبابا اخیراً دو هوش مصنوعی جدید با نامهای Qwen-VL و Qwen-VL-Chat، که براساس مدل زبانی بزرگ Tongyi Qianwen ساخته شدهاند را به کاربران عرضه کرده است. علیبابا این ابزار هوش مصنوعی زایا و پیشرفته خود که قابلیت "درک" تصاویر و حل مسائل پیچیده دارند را بهصورت متنباز در اختیار محققان و مشتریان قرار داده است.
به گزارش واحد ترجمه ایراندکونومی، جدیدترین دستاورد کمپانی چینی علیبابا در زمینه هوش مصنوعی، توانایی “خواندن” و پردازش تصاویر و امکان ایجاد مکالمات پیچیدهتر با کاربران را دارد.
کمپانی علیبابا در روز جمعه از دو مدل زبانی جدید خود به نامهای Qwen-VL و Qwen-VL-Chat رونمایی کرد. این کمپانی درباره بهبود توانایی این مدل زبانی در برقراری مکالمات پیشرفتهتر و پردازش بهتر تصاویر تأکید بسیاری داشته است.
یکی از مثالهای ارائهشده توسط علیبابا در زمینه تواناییهای بهبودیافته این مدلهای زبانی جدید؛ امکان درک “علامتها و نشانهای مربوط به بیمارستانها” است.
براساس ادعای علیبابا، چتبات Qwen-VL-Chat قادر است با دریافت و درک هر علامت مخصوص، به سؤالات کاربران درباره محل استقرار دپارتمانهای مختلف بیمارستان در طبقات مختلف ساختمان و خدمات آنها پاسخ دهد.
تغییرات زیرساختی در علیبابا
دستاوردهای جدید کمپانی علیبابا در زمینه هوش مصنوعی، نتیجه زحمات و تحقیقات واحد بخش خدمات ابری این کمپانی است. این شرکت عظیم که بهتازگی خدمات خود را به چندین بخش زیرمجموعه مجزا تقسیمبندی کرده است؛ امیدوار است بتواند با ارتقای خدمات بخش هوش مصنوعی توجه کاربران را به خود جلب کند.
در اوایل سال میلادی جاری علی بابا در بیانیهای اعلام کرده بود که این کمپانی تغییرساختار عظیمی خواهد داد و به 6بخش مجزا تقسیم خواهد شد. هر بخش مدیرعامل و هیئتمدیره خاص خود را خواهد داشت و قرار بود دنیل ژانگ مدیرعامل بخش فضای ذخیرهسازی ابری باقی بماند. تنها چند ماه بعد، در اواخر بهار، ژانگ از سمت مدیرعاملی خود استعفا داد تا بتواند بهصورت تماموقت در بخش ذخیرهسازی ابری فعالیت کند.
علیبابا اظهار کرده که این دو مدل زبانی جدید نسبت به پروژههای هوش مصنوعی قبلی این کمپانی پیشرفتهتر هستند و توانایی درک و پردازش دستورات پیچیدهتر را نیز دارند.
به گفته کمپانی علیبابا، هر دو مدل زبانی Qwen-VL و Qwen-VL-Chat متنباز هستند و در نتیجه محققین، افراد آکادمیک و سازمانها در سراسر جهان میتوانند برای ایجاد و توسعه هوش مصنوعیهای اختصاصی خود و تعلیم سیستمهای مربوطه از این مدلهای زبانی بزرگ بهره بگیرند.
با این کار صرفهجویی قابلتوجهی در وقت، هزینه و منابع صورت خواهد گرفت.
![هوش مصنوعی](https://irandeconomy.com/wp-content/uploads/2023/08/020604-AliBaba-AIModels2-1024x461.jpg)
عملکرد مدلهای زبانی هوش مصنوعی علیبابا
به گفته این کمپانی، مدل زبانی Qwen-VL توانایی پاسخگویی به سؤالات تشریحی و متعدد درباره تصاویر مختلف و ایجاد دادههای تصویری را دارد.
از طرفی، مدل زبانی Qwen-VL-Chat بیشتر مناسب برقراری “تعاملات پیچیدهتر” است، مانند مقایسه چندین داده تصویری مشابه و پاسخ دادن به چندین سری سؤالات تخصصی.
بعضی از کاربردهای این چتبات شامل توانایی نگارش داستان، خلق تصاویر براساس عکسهای ورودی کاربران و حتی حل کردن مسائل و معادلات ریاضی نمایش داده شده در یک تصویر میباشند.
همانطور که در بالاتر ذکر شد، این چتبات توانایی پردازش علامتهای مخصوص بیمارستانها و پاسخگویی به سؤالات مربوطه در این زمینه را نیز دارد.
تمایز مدلهای زبانی علیبابا نسبت به دیگر رقبا
تا این لحظه، بیشتر ابزارهای هوش مصنوعی زایا (ابزارهای هوش مصنوعی که در پاسخ به دستورات/دادههای ورودی انسانها پاسخ ایجاد میکنند)؛ بیشتر بر “محتواهای متنی” تمرکز داشته است.
جدیدترین آپدیت هوش مصنوعی محبوب و کاربردی کمپانی OpenAI، چتبات ChatGPT قابلیت درک و پردازش تصاویر و ایجاد پاسخ بهصورت متنی را نیز دارد؛ تقریباً عملکردی مانند مدل زبانی Qwen-VL-Chat علیبابا.
این دو هوش مصنوعی جدید براساس مدل زبانی بزرگ کمپانی علیبابا یعنی Tongyi Qianwen که در اوایل سال جاری میلادی عرضه شده بود؛ ساخته شدهاند.
منبع: CNBC