برتری جدید در دنیای هوش مصنوعی؛ مدل O1-Mini علی‌بابا، Deepseek R1 را شکست داد!

به گزارش زوم ارز، Alibaba Cloud از یک مدل هوش مصنوعی با استدلال جدید رونمایی کرده است که با وجود بخشی از اندازه آنها ، می تواند با عملکرد رقبای بسیار بزرگتر مطابقت داشته باشد.

آخرین ارائه در حوزه محاسبات ابری، سوال رایج را که بزرگتر همیشه بهتر است در دنیای هوش مصنوعی را به چالش می‌کشد.

مدل QWQ-32B، بر اساس پایه Qwen2.5-32B، تولید شده و در حالی که عملکردی قابل مقایسه با Deepseek R1 دارد، از ۳۲.۵ میلیارد پارامتر استفاده می کند که از آن‌ها یک پارامتر در اندازه ۶۷۱ میلیون قرار دارد.

“تیم Qwen Alibaba تأکید می‌کند که اثربخشی یادگیری تقویتی به شدت واضح است، زمانی که از مدل‌های پایه‌ای قدرتمند استفاده می‌شود که بر اطلاعات گسترده و رویه‌های جهان اعمال شود.”

با توجه به اظهارات شرکت، QWQ-32B بویژه در زمینه‌های استدلال ریاضی و برنامه‌نویسی برجسته عمل می‌کند.

“درکی کامل از آموزش تقویتی (RL) می تواند به بهبود مداوم عملکرد در زمینه‌های ریاضیات و برنامه نویسی کمک کند. بهبود عملکرد قابل ملاحظه ای در آزمون‌های GPQA، AIME و MATH-500 از طریق استفاده موفق از RL نشان داده شده است. پاسخ مثبت جوامع AI واکنش قوی و خوشحالی نسبت به این پیشرفت نشان داده است. آخرین مدل‌های هوش مصنوعی، مانند Pic و QWQ-32B، به عنوان ابزارهای کاربردی و قدرتمند شناخته شده‌اند. اعلام حمایت از این مدل‌ها توسط شرکت‌های معتبر نشان از پتانسیل شگرف آن‌ها دارد. این تغییرات نشان می‌دهند که صنعت هوش مصنوعی به سمت مدل‌های کوچک‌تر و بهینه‌تر حرکت می‌کند. هرچند، محدودیت‌هایی همچون مشکل در اختلاط زبان و نظارت‌های محلی وجود دارد. این تغییرات بزرگ نشان‌دهنده پیشرفت‌های بزرگ در حوزه هوش مصنوعی است که باید با اقدامات و انطباق‌های مناسب همراه شوند.”

در آزمون استدلال علمی GPQA 65.2٪، در ریاضیات پیشرفته AIME 50٪، و در آزمون MATH-500 که شامل مشکلات ریاضی گسترده‌ای می‌شود، نتایج خوبی به دست آمده است. اعضای جامعه هوش مصنوعی با انگیزه به این نتایج واکنش نشان داده‌اند. واژه “کاملاً آن را دوست داشته باشید!” توسط Vaibhav Srivastav، دانشمند داده و محقق هوش مصنوعی، به کار رفته است. همچنین، Julien Chaumond، CTO در شرکت Huggin، مدل را به عنوان “همه چیز را تغییر می‌دهد” توصیف کرده است. علاوه بر این، اطلاعیه‌ها از اولاما و Groq نشان می‌دهد که این مدل بهبود یافته تحتی است که کاربران می‌توانند از آن در برنامه‌های شخصی و منابع متن باز استفاده کنند.
رویکرد QWQ-32B مورد استفاده قرار گرفته است که شبیه به Deepseek R1 است. این نشان می‌دهد که تکنیک‌های آموزش هوش مصنوعی ممکن است همان اندازه مهم باشد که تعداد پارامترهای خام در عملکرد AI استفاده شوند. این مدل نیز محدودیت‌هایی دارد، از جمله مشکلاتی با اختلاط زبان و حلقه‌های استدلال بازگشتی. همچنین، مشابه دیگر مدل‌های هوش مصنوعی چینی، تابع به‌روزرسانی محلی دارد که ممکن است منجر به محدود شدن پاسخ‌ها به موضوعات حساس شود. در مقابل، QWQ-32B به عنوان یک نرم‌افزار منبع باز زیر لیسانس Apache 2.0 در دسترس است، به طوری که به همه امکان دسترسی به آن را فراهم می‌کند بدون نیاز به پرداخت هزینه.

جامعه تخصصی هوش مصنوعی با اشتیاق به اعلانات و اخبار پاسخ داد. Vaibhav Srivastav، که یک دانشمند داده و پژوهشگر هوش مصنوعی است، به طرز مثبتی از این مدل تحولی خلق شده است. به همین ترتیب، Julien Chaumond، CTO در Huggin، این مدل را به عنوان یک تغییر عظیم معرفی کرده است. همچنین، در میان این اعلان ها، برخی از شوخی های جالب نیز معرفی شده بود. آقا چین یک مدل دیگر از هوش مصنوعی را منتشر کرده است.

همچنین، Ulama و Groq اعلام کرده اند که آن‌ها از این مدل حمایت می‌کنند و اعمال آن را پیاده سازی کرده‌اند. این به این معنی است که کاربران می‌توانند از منابع باز برای برنامه‌ریزی عامل‌ها استفاده کنند و از این مدل در برنامه‌های شخص ثالث و همچنین برای دستیابی به سرعت استنباط بی‌نظیر با زیرساخت‌های Groq بهره برده و به آن‌ها دسترسی داشته باشند.

منبع: