رونمایی از مدل زبانی جدید گوگل: PaLM 2
در رویداد Google I/O اتفاق افتاد: گوگل رسماً از مدل زبانی جدید خود به نام PaLM 2 رونمایی کرد. این مدل زبانی از طریق پلتفرمهای مربوطه در دسترس توسعهدهندگان قرار گرفته است. به گفته ژوبین قهرمانی، نائبرئیس DeepMind، عملکرد این مدل در زمینههای بسیاری مانند ریاضیات بهبود یافته است.
به گزارش واحد ترجمه ایران دکونومی، در کنفرانس توسعه Google I/O، کمپانی گوگل رسماً از مدل زبانی بزرگ (LLM) جدید خود به نام PaLM 2 رونمایی کرد. مدل PaLM 2 قدرتدهنده نسخه جدید چتبات Bard، رقیب هوش مصنوعی محبوب ChatGPT محصول کمپانی OpenAI خواهد بود. گوگل در طی برگزاری همین رویداد اعلام کرد که از این به بعد محدودیت لیست انتظار برای چتبات Bard وجود نخواهد داشت و کاربران میتوانند از این هوش مصنوعی آزادانه بهره ببرند. در ابتدا نسخه زبان انگلیسی این چتبات و سپس نسخههای مستقل بیش از 40 زبان زنده دیگر دنیا به جهان عرضه خواهد شد.
به گفته گوگل، این مدل زبانی قرار است بنیان و پایه بسیاری از قابلیتهای مبتنی بر هوش مصنوعی در این کمپانی باشد. مدل PaLM 2 هماکنون از طریق PaLM API (رابط برنامهنویسی کاربردی)، Firebase و Colab در دسترس توسعهدهندگان قرار گرفته است.
کمپانی گوگل، درست مانند رقیب خود OpenAI، اطلاعات و جزئیات فنی بیشتری درباره نحوه تعلیم مدل زبانی جدید خود ارائه نداده است. از این جزئیات فنی میتوان به شمار پارامترهای موجود در یک مدل زبانی نام برد که بهنظر میرسد آمار آن در PaLM 2 حدوداً 540 میلیارد پارامتر باشد. تنها اطلاعاتی که گوگل در این باره به اشتراک گذاشت این بود که مدل زبانی PaLM 2 بر مبنای زیرساختهای JAX و TPU v4 ساخته شده است.
ویژگیهای مدل زبانی PaLM 2
ژوبین قهرمانی، نائبرئیس کمپانی DeepMind در مصاحبهای مطبوعاتی پیش از آغاز رسمی این رویداد گفت: “مسئلهای که ما در تحقیقاتمان با آن مواجه شدیم، این بود که مدل زبانی هر چقدر بزرگتر باشد، لزوماً بهتر هم نیست.”
او ادامه داد: “به همین دلیل است که ما تعدادی مدل زبانی در سایزها و اندازههای مختلف، در قالب یک مجموعه توسعه دادهایم. به نظر ما، شمار پارامترهای یک مدل زبانی، روش مناسبی برای ارزیابی قابلیتهای آن نیست. میزان توانایی یک مدل زبانی معمولاً بر اساس نحوه استفاده مردم و بازخوردهای آنان است که بهدست میآید.”
در عوض، گوگل تصمیم گرفته که بر مسئله “قابلیتها و تواناییها” تمرکز کند. به گفته این کمپانی، توانایی مدل زبانی جدید PaLM 2 در زمینههای استدلال عقل سلیم، ریاضیات و منطق بهبود چشمگیری یافته است. دقیقاً مانند گفتههای قهرمانی، گوگل این مدل زبانی را بر اساس انبوهی از دادههای ریاضی و متون علمی تعلیم داده است. بر هیچکس پوشیده نیست که مدلهای زبانی بزرگ، با درنظر گرفتن اینکه هدف اصلی آنها بر مقوله “زبان” است، در حل مسائل ریاضی با مشکلاتی مواجه شدهاند و صرفاً به کمک پلاگینهای واسطه از پس ریاضیات برمیآمدند.
با این وجود، گوگل ادعا میکند که مدل زبانی جدید PaLM 2، به راحتی قادر است مسائل ریاضی را حل کرده و حتی نمودار رسم کند.
PaLM 2، مجموعهای از مدلها
یکی دیگر از قابلیتهای ارتقاء یافته در مدل زبانی PaLM 2، بهبود کیفیت کدنویسی و عیبیابی از این کدهاست. این مدل زبانی بر اساس 20 زبان برنامهنویسی، شامل محبوبترین آنها جاوا اسکریپت و پایتون، تعلیم داده شده است. از دیگر زبانها میتوان به Prolog، Verilog و Fortran اشاره کرد.
مدل زبانی PaLM 2 پایه اصلی Codey را تشکیل میدهد. Codey، مدل جدید و مخصوص گوگل برای کدنویسی و عیبیابی است و در میان چندین پروژه رونمایی شده در رویداد Google I/O، از این مدل جدید نیز رونمایی شد.
به گفته گوگل، مدل زبانی PaLM 2 بر اساس پیکره زبانیای تعلیم داده شده که شامل بیش از 100 زبان زنده دنیاست و “بهترین عملکرد را برای انجام وظایف چندزبانی” دارد.
گوگل میگوید که مدل زبانی PaLM 2 شامل مجموعهای از مدلهاست، مانند مدل کدنویسی Codey. از دیگر مدلهای توسعهیافته توسط این کمپانی، میتوان از مدل Med-PaLM 2 نام برد که مخصوص مقاصد درمانی و علم پزشکی است. همچنین مدل Sec-PaLM، که بر مسائل امنیتی تمرکز دارد و نسخه کوچکتری از مدل PaLM 2 که مخصوص اجرا در گوشیهای هوشمند ساخته شده است.
همانطور که مشخص است، گوگل انرژی خود را تمام و کمال به توسعه ویژگیهای جدیدی در دنیای هوش مصنوعی اختصاص داده است. اما نکته حائز اهمیت این است که در عین توسعه دادن چندین پروژه بهصورت همزمان، خط فکری گوگل ایجاب میکند که با رعایت همه جوانب امنیتی پیش رَوی کند.
همین طرزفکر در مورد مدل زبانی PaLM 2 نیز صدق میکند. با توجه به اینکه امکان آزمایش کردن این مدل زبانی هنوز وجود ندارد، اطلاعاتی درباره نحوه عملکرد و طرز کار آن نیز در دسترس نیست.
منبع: techcrunch