AI Chatbot Jailbreak: فاش کردن داده‌های خصوصی OpenAI و Amazon

AI Chatbot Jailbreak داده های خصوصی OpenAI و Amazon را فاش می کند
بازدید 26
۰

AI Chatbot Jailbreak: فاش کردن داده‌های خصوصی OpenAI و Amazon

به گزارش زوم ارز، توسعه‌دهندگان ChatGPT از OpenAI، حفره‌ای را کشف کردند که باعث شد ربات چت پرچم‌دار آن اطلاعات داخلی شرکت را فاش کند. شرکت پیشرو در حوزه هوش مصنوعی این حمله را به عنوان ارسال هرزنامه و نقض شرایط خدمات خود دسته‌بندی کرده است. اتفاق مشابهی در سرویس جدید هوش مصنوعی آمازون به نام Q نیز رخ داده است و به دلیل اشتراک بیش از حد، به طور مشابه پرچم‌گذاری شده است.

پژوهشگران از دانشگاه واشنگتن، دانشگاه کارنگی ملون، دانشگاه کورنل، دانشگاه کالیفرنیا برکلی، ETH زوریخ و Google DeepMind گزارشی منتشر کرده‌اند که نشان می‌دهد ChatGPT با درخواست تکرار یک کلمه به صورت نامحدود، اطلاعات قبل از آموزش را در قالب اطلاعات خصوصی OpenAI شامل ایمیل، شماره تلفن و فکس فاش می‌کند.

در این گزارش آمده است: «به منظور بازیابی داده‌ها از مدل اقتباس‌شده با گفتگو، باید راهی پیدا کنیم که مدل را از آموزش هم‌ترازی خارج کند و به هدف مدل‌سازی زبان اصلی خود بازگردد.» "امید است که این به مدل اجازه می دهد تا نمونه هایی شبیه توزیع قبل از آموزش خود را تولید کند."

در این گزارش آمده است: «به منظور بازیابی داده‌ها از مدل اقتباس‌شده با گفتگو، باید راهی پیدا کنیم که مدل را از آموزش هم‌ترازی خارج کند و به هدف مدل‌سازی زبان اصلی خود بازگردد.» “امید است که این به مدل اجازه می دهد تا نمونه هایی شبیه توزیع قبل از آموزش خود را تولید کند.”

 

اما پس از انتشار گزارش، تلاش‌ها برای ایجاد مجدد خطا متوقف می‌شوند. ChatGPT-3 و GPT-4 به کاربر هشدار می دهند، “این محتوا ممکن است خط مشی محتوای یا شرایط استفاده ما را نقض کند.”

تصویر: ChatGPT

تصویر: ChatGPT

اگرچه خط‌ مشی OpenAI درباره حلقه‌های همیشگی اشاره نمی‌کند، اما بیان می‌کند که فعالیت‌های تقلبی مانند ارسال هرزنامه مجاز نیست. مهمتر از آن، شرایط خدمات شرکت مشخص می‌کند که هرگونه تلاش برای دسترسی به اطلاعات خصوصی یا کشف کد منبع مجموعه ابزارهای هوش مصنوعی OpenAI، از جمله مدل‌ها، الگوریتم‌ها و سیستم‌های آنها، غیرمجاز است.

“شما نباید تلاش کنید یا به هر نحوی کمک کنید تا کد منبع یا اجزای اساسی سرویس‌های ما، از جمله مدل‌ها، الگوریتم‌ها یا سیستم‌های ما را مهندسی معکوس، کامپایل یا کشف کنید (مگر در مواردی که قوانین قابل اجرا اجازه می‌دهد).

هنگامی که ChatGPT نمی‌تواند درخواست را به درستی انجام دهد و دلیل آن را توضیح می‌دهد، این محدودیت‌های پردازشی، محدودیت‌های کاراکتر، محدودیت‌های شبکه و ذخیره‌سازی، و عملی بودن تکمیل فرمان را به عنوان دلیل عدم توانایی خود معرفی می‌کند.

تصویر: ChatGPT

تصویر: ChatGPT

یک فرمان برای تکرار یک کلمه به طور نامحدود می‌تواند به عنوان یک روش هماهنگ برای ایجاد اختلال در عملکرد یک ربات چت استفاده شود؛ با قفل کردن ربات در یک حلقه پردازشی. این روش مشابه حمله انکار سرویس توزیع شده عمل می‌کند و منجر به افت کارایی ربات می‌شود.

OpenAI در ماه گذشته اعلام کرد که ChatGPT تحت حمله DDoS قرار گرفته است و توسعه‌دهنده هوش مصنوعی این موضوع را در صفحه وضعیت ChatGPT تأیید کرد.

شرکت اعلام کرد: “ما با قطعی‌های دوره‌ای مواجه شده‌ایم که ناشی از الگوی ترافیک غیرعادی است و نشان‌دهنده یک حمله DDoS می‌باشد. ما در حال کاهش این مشکل هستیم و بر روی آن کار می‌کنیم.”

همچنین، طبق گزارشی از Platformer، به نظر می‌رسد که آمازون نیز مشکلاتی با یک چت بات دارد که اطلاعات خصوصی را درز می‌کند. آمازون به تازگی ربات چت Q خود را راه‌اندازی کرده است (لطفا با پروژه Q* OpenAI اشتباه گرفته نشود).

Platformer گفت که آمازون سعی کرده است این افشاگری را کم‌اهمیت نشان دهد و توضیح داده است که کارمندان از طریق کانال‌های داخلی بازخورد خود را به اشتراک می‌گذارند و این یک روش استاندارد است که آمازون آن را استفاده می‌کند.

آمازون در بیانیه‌ای اظهار کرد: “هیچ مشکل امنیتی به دنبال این بازخورد شناسایی نشده است. ما از همه بازخوردهایی که قبلاً دریافت کرده‌ایم قدردانی می‌کنیم و همچنین، با توجه به تبدیل Q از یک محصول در حال پیش‌نمایش به در دسترس عمومی، کار روی بهبود و بهینه‌سازی Q را ادامه می‌دهیم.

منبع: decrypt.co

اشتراک گذاری

نوشته شده توسط:

تیم خبری

من متین هستم، کارشناس ارشد مالی. عاشق تکنولوژی و بازار های مالی هستم. حدود 2 سال است که در حوزه ارزهای دیجیتال و بلاکچین فعالیت دارم. عاشق ورزش و بازی های کامپیوتری هستم.

نظرات کاربران

0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
0 نظرات خود را ثبت نمایید
تازه‌ترین
قدیمی‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها