برتری جدید در دنیای هوش مصنوعی؛ مدل O1-Mini علیبابا، Deepseek R1 را شکست داد!
به گزارش زوم ارز، Alibaba Cloud از یک مدل هوش مصنوعی با استدلال جدید رونمایی کرده است که با وجود بخشی از اندازه آنها ، می تواند با عملکرد رقبای بسیار بزرگتر مطابقت داشته باشد.
آخرین ارائه در حوزه محاسبات ابری، سوال رایج را که بزرگتر همیشه بهتر است در دنیای هوش مصنوعی را به چالش میکشد.
مدل QWQ-32B، بر اساس پایه Qwen2.5-32B، تولید شده و در حالی که عملکردی قابل مقایسه با Deepseek R1 دارد، از ۳۲.۵ میلیارد پارامتر استفاده می کند که از آنها یک پارامتر در اندازه ۶۷۱ میلیون قرار دارد.
“تیم Qwen Alibaba تأکید میکند که اثربخشی یادگیری تقویتی به شدت واضح است، زمانی که از مدلهای پایهای قدرتمند استفاده میشود که بر اطلاعات گسترده و رویههای جهان اعمال شود.”
با توجه به اظهارات شرکت، QWQ-32B بویژه در زمینههای استدلال ریاضی و برنامهنویسی برجسته عمل میکند.
“درکی کامل از آموزش تقویتی (RL) می تواند به بهبود مداوم عملکرد در زمینههای ریاضیات و برنامه نویسی کمک کند. بهبود عملکرد قابل ملاحظه ای در آزمونهای GPQA، AIME و MATH-500 از طریق استفاده موفق از RL نشان داده شده است. پاسخ مثبت جوامع AI واکنش قوی و خوشحالی نسبت به این پیشرفت نشان داده است. آخرین مدلهای هوش مصنوعی، مانند Pic و QWQ-32B، به عنوان ابزارهای کاربردی و قدرتمند شناخته شدهاند. اعلام حمایت از این مدلها توسط شرکتهای معتبر نشان از پتانسیل شگرف آنها دارد. این تغییرات نشان میدهند که صنعت هوش مصنوعی به سمت مدلهای کوچکتر و بهینهتر حرکت میکند. هرچند، محدودیتهایی همچون مشکل در اختلاط زبان و نظارتهای محلی وجود دارد. این تغییرات بزرگ نشاندهنده پیشرفتهای بزرگ در حوزه هوش مصنوعی است که باید با اقدامات و انطباقهای مناسب همراه شوند.”
در آزمون استدلال علمی GPQA 65.2٪، در ریاضیات پیشرفته AIME 50٪، و در آزمون MATH-500 که شامل مشکلات ریاضی گستردهای میشود، نتایج خوبی به دست آمده است. اعضای جامعه هوش مصنوعی با انگیزه به این نتایج واکنش نشان دادهاند. واژه “کاملاً آن را دوست داشته باشید!” توسط Vaibhav Srivastav، دانشمند داده و محقق هوش مصنوعی، به کار رفته است. همچنین، Julien Chaumond، CTO در شرکت Huggin، مدل را به عنوان “همه چیز را تغییر میدهد” توصیف کرده است. علاوه بر این، اطلاعیهها از اولاما و Groq نشان میدهد که این مدل بهبود یافته تحتی است که کاربران میتوانند از آن در برنامههای شخصی و منابع متن باز استفاده کنند.
رویکرد QWQ-32B مورد استفاده قرار گرفته است که شبیه به Deepseek R1 است. این نشان میدهد که تکنیکهای آموزش هوش مصنوعی ممکن است همان اندازه مهم باشد که تعداد پارامترهای خام در عملکرد AI استفاده شوند. این مدل نیز محدودیتهایی دارد، از جمله مشکلاتی با اختلاط زبان و حلقههای استدلال بازگشتی. همچنین، مشابه دیگر مدلهای هوش مصنوعی چینی، تابع بهروزرسانی محلی دارد که ممکن است منجر به محدود شدن پاسخها به موضوعات حساس شود. در مقابل، QWQ-32B به عنوان یک نرمافزار منبع باز زیر لیسانس Apache 2.0 در دسترس است، به طوری که به همه امکان دسترسی به آن را فراهم میکند بدون نیاز به پرداخت هزینه.
جامعه تخصصی هوش مصنوعی با اشتیاق به اعلانات و اخبار پاسخ داد. Vaibhav Srivastav، که یک دانشمند داده و پژوهشگر هوش مصنوعی است، به طرز مثبتی از این مدل تحولی خلق شده است. به همین ترتیب، Julien Chaumond، CTO در Huggin، این مدل را به عنوان یک تغییر عظیم معرفی کرده است. همچنین، در میان این اعلان ها، برخی از شوخی های جالب نیز معرفی شده بود. آقا چین یک مدل دیگر از هوش مصنوعی را منتشر کرده است.
همچنین، Ulama و Groq اعلام کرده اند که آنها از این مدل حمایت میکنند و اعمال آن را پیاده سازی کردهاند. این به این معنی است که کاربران میتوانند از منابع باز برای برنامهریزی عاملها استفاده کنند و از این مدل در برنامههای شخص ثالث و همچنین برای دستیابی به سرعت استنباط بینظیر با زیرساختهای Groq بهره برده و به آنها دسترسی داشته باشند.
منبع:
نظرات کاربران