به گزارش واحد ترجمه ایران دکونومی، OpenAI به‌تازگی مدل جدیدی به نام o1 را معرفی کرده است که اولین مدل از سری جدید “مدل‌های استدلال” به شمار می‌رود و برای پاسخ به سوالات پیچیده‌تر و سریع‌تر از انسان طراحی شده است. این مدل به همراه نسخه کوچکتر و ارزان‌تر آن، o1-mini، منتشر شده است.

مدل o1 نمایانگر گامی به سوی هدف وسیع‌تر OpenAI برای دستیابی به هوش مصنوعی مشابه انسان است. از نظر عملی، این مدل عملکرد بهتری در نوشتن کد و حل مسائل چندمرحله‌ای نسبت به مدل‌های قبلی دارد. این مدل به گونه‌ای طراحی شده که توانایی پردازش و تحلیل مسائل پیچیده‌تر را با دقت بیشتری دارد. با این حال، استفاده از آن هزینه‌برتر و کندتر از GPT-4o است. OpenAI این نسخه از o1 را به عنوان “پیش‌نمایش” معرفی کرده تا تاکید کند که هنوز در مرحله ابتدایی و توسعه‌پذیر است.

کاربران ChatGPT Plus و Team از امروز به هر دو نسخه o1-preview و o1-mini دسترسی پیدا می‌کنند، در حالی که کاربران Enterprise و Edu اوایل هفته آینده به این مدل‌ها دسترسی خواهند یافت. OpenAI همچنین اعلام کرده است که قصد دارد دسترسی به o1-mini را برای تمامی کاربران رایگان ChatGPT فراهم کند، اما تاریخ مشخصی برای آن تعیین نشده است. دسترسی توسعه‌دهندگان به o1 هزینه‌بر است: در API، o1-preview به قیمت ۱۵ دلار به ازای هر ۱ میلیون توکن ورودی و ۶۰ دلار به ازای هر ۱ میلیون توکن خروجی عرضه می‌شود. برای مقایسه، هزینه استفاده از GPT-4o به ترتیب ۵ دلار برای هر ۱ میلیون توکن ورودی و ۱۵ دلار برای هر ۱ میلیون توکن خروجی است.

آموزش پشت o1 به طور بنیادین متفاوت از مدل‌های قبلی است. طبق گفته جری توورک، رئیس تحقیقات OpenAI، این مدل با استفاده از الگوریتم بهینه‌سازی جدید و مجموعه داده‌های جدید خاص برای آن آموزش داده شده است. این مدل با استفاده از تکنیک یادگیری تقویتی، که به سیستم از طریق جوایز و مجازات‌ها آموزش می‌دهد، به طور موثری در حل مسائل بهبود یافته است. سپس از یک “زنجیره تفکر” برای پردازش سوالات استفاده می‌کند، مشابه آنچه که انسان‌ها با پردازش مسائل به صورت مرحله‌ای انجام می‌دهند.

استفاده از عبارات “کنجکاوم درباره”، “دارم فکر می‌کنم”، و “باشه، بذار ببینم” برای ایجاد توهم مرحله‌ای تفکر
تصاویر: OpenAI

به لطف این روش آموزشی جدید، OpenAI معتقد است که این مدل باید دقت بیشتری داشته باشد. توورک می‌گوید: “ما متوجه شده‌ایم که این مدل کمتر دچار توهم می‌شود”، اما مشکل همچنان وجود دارد. “ما نمی‌توانیم بگوییم که توهمات را حل کرده‌ایم.” بهبود دقت و کاهش خطاهای منطقی از مهم‌ترین مزایای این مدل جدید است که باعث افزایش اعتماد به توانایی‌های آن در حل مسائل پیچیده می‌شود.

آنچه که این مدل را از GPT-4o متمایز می‌کند، توانایی آن در مقابله با مسائل پیچیده‌تر، مانند کدنویسی و ریاضیات، بهبود یافته است و همچنین قادر است استدلال‌های خود را به طور شفاف توضیح دهد. برای مثال، o1 در آزمون‌های ریاضیات پیشرفته، درصد درستی بیشتری نسبت به GPT-4o نشان داده است. این توانایی به ویژه در محیط‌های آموزشی و تحقیقاتی می‌تواند بسیار مفید واقع شود.

در عین حال، o1 در بسیاری از زمینه‌ها به اندازه GPT-4o قدرتمند نیست. این مدل در زمینه دانش حقیقی درباره جهان عملکرد ضعیف‌تری دارد و همچنین قادر به مرور وب یا پردازش فایل‌ها و تصاویر نیست. با این حال، OpenAI معتقد است که این مدل نمایانگر کلاس جدیدی از قابلیت‌ها است و نام آن، o1، به معنای “صفر کردن شمارش به ۱” است که نشان‌دهنده آغاز یک دوره جدید در توسعه مدل‌های هوش مصنوعی است.

OpenAI به طراحی این مدل به گونه‌ای که به نظر برسد مانند تفکر انسانی است، تأکید کرده است تا نشان دهد که این مدل زمان بیشتری را برای پردازش و حل مسائل صرف می‌کند و همچنین به طرز حیرت‌آوری به تفکر انسانی نزدیک است. طراحی مدل به گونه‌ای که به نظر برسد در حال تفکر است، به کاربران این امکان را می‌دهد که به وضوح مراحل استدلال و تحلیل مدل را مشاهده کنند.

با توجه به هدف OpenAI برای دستیابی به سیستم‌های خودمختار و هوش مصنوعی مشابه انسان، این مدل گام مهمی به سوی تحقق این هدف است. هرچند که o1 هنوز در مرحله ابتدایی و پرهزینه برای توسعه‌دهندگان است، اما امید می‌رود که با گذر زمان و توسعه‌های بیشتر، به یکی از ابزارهای قدرتمند و موثر در حوزه هوش مصنوعی تبدیل شود.

منبع : theverge

لینک کوتاه :
اشتراک گذاری : Array