به گزارش واحد ترجمه ایران دکونومی، شرکت هوش مصنوعی OpenAI اعلام کرده است که یک مدل هوش مصنوعی مبتنی بر GPT-4 به نام CriticGPT را برای یافتن خطاهای احتمالی در خروجی کد ارائه شده توسط چت بات محبوب این شرکت یعنی ChatGPT آموزش داده است. این ابزار قادر است نقدهایی بنویسد که به اشتباهات موجود در پاسخ‌های ChatGPT اشاره کند. این مدل به صورت داخلی مورد استفاده قرار می‌گیرد و OpenAI یک مقاله تحقیقاتی برای توصیف جزئیات آن منتشر کرده است.

نحوه آموزش مدل هوش مصنوعی جدید OpenAI

هدف از ارائه CriticGPT، کمک به مربیان هوش مصنوعی است که کارشان آموزش و بهبود پاسخ‌های GPT-4 با استفاده از تکنیکی به نام یادگیری تقویتی از بازخورد انسانی (RLHF) است. این تکنیک آن دسته از مربیان هوش‌مصنوعی را شامل می‌شود که پاسخ‌های مختلف ChatGPT را در برابر یکدیگر رتبه‌بندی می‌کنند. به گفته این شرکت،  CriticGPT با استفاده از RLHF و با وظیفه تحلیل و نقد انبوهی از ورودی‌های حاوی اشتباهات متعدد، آموزش داده شده است.

این مدل باید اشتباهاتی را که به طور عمدی توسط انسان وارد ورودی‌ها شده بود و باگ‌های طبیعی ChatGPT که قبلاً توسط یک مربی شناسایی شده بود را پیدا می‌کرد. OpenAI گفته است تیم توسعه دهنده با جدیت برای رفع محدودیت‌های موجود در عملکرد این مدل تلاش می‌کند.

هوش مصنوعی CriticGPT
تصویری از عملکرد مدل هوش مصنوعی جدید CriticGPT

با گسترش کاربرد این مدل جدید، همه چیز برای مربیان هوش مصنوعی سخت‌تر می‌شود، زیرا ChatGPT دقیق‌تر و اشتباهات آن ظریف‌تر خواهد شد. با این حال، این مدل می‌تواند به انسان کمک کند تا نسبت به زمانی که کار را به تنهایی انجام می‌داد، خطاها را با دقت بیشتری شناسایی کند.

به گفته OpenAI “دومین مربی تصادفی” که برای بررسی نتیجه انتخاب می‌شد، در بیش از 60 درصد موارد، انتقادات تیم انسان با کمک هوش مصنوعی (Human+CriticGPT) را به نقدهای نوشته شده توسط یک انسان و بدون کمک ماشین ترجیح می‌دهد.

منبع: neowin

لینک کوتاه :
اشتراک گذاری : Array