كيف تمكن موظفو Google من اختراق ChatGPT الخاص بـ OpenAI بكلمة واحدة

يحضر ديميس هاسابيس، الرئيس التنفيذي والمؤسس المشارك لشركة DeepMind، قمة سلامة الذكاء الاصطناعي في 2 نوفمبر 2023، في بلتشلي، إنجلترا. تم شراء DeepMind، وهو معمل أبحاث الذكاء الاصطناعي، من قبل Google في عام 2014.

توبي ميلفيل – WPA Pool / Getty Images

في الوقت المناسب لوصول ChatGPT إلى عامه الأول، نشرت مجموعة من الباحثين من Google بحثًا يوضح مدى سهولة اختراق تقنية OpenAI الصاخبة.

ال ورق، الذي نُشر يوم الثلاثاء، يقدم نظرة على كيفية قيام العلماء في طليعة أبحاث الذكاء الاصطناعي – وهي وظيفة جيدة الأجر للغاية بالنسبة للبعض – باختبار حدود المنتجات الشائعة في الوقت الفعلي. وتتسابق شركة جوجل ومختبرها للذكاء الاصطناعي DeepMind، حيث يعمل غالبية مؤلفي البحث، لتحويل التقدم العلمي إلى منتجات مربحة ومفيدة، قبل أن يصل المنافسون مثل OpenAI وMeta إلى هناك أولاً.

تلقي الدراسة نظرة على “الاستخراج”، وهو عبارة عن محاولة “عدائية” لجمع البيانات التي ربما تم استخدامها لتدريب أداة الذكاء الاصطناعي. وكتب الباحثون أن نماذج الذكاء الاصطناعي “تحفظ أمثلة من مجموعات بيانات التدريب الخاصة بها، والتي يمكن أن تسمح للمهاجم باستخراج المعلومات (التي يحتمل أن تكون خاصة).” الخصوصية هي المفتاح: إذا تم تدريب نماذج الذكاء الاصطناعي في نهاية المطاف على المعلومات الشخصية، فإن انتهاكات بيانات التدريب الخاصة بهم يمكن أن تكشف عن تسجيلات الدخول المصرفية وعناوين المنازل والمزيد.

ChatGPT، أضاف فريق Google في ملف مشاركة مدونة الإعلان عن الورقة، “”متوافق” بحيث لا يتم نشر كميات كبيرة من بيانات التدريب. ولكن، من خلال تطوير هجوم، يمكننا أن نفعل هذا بالضبط. تشير المحاذاة في الذكاء الاصطناعي إلى محاولات المهندسين لتوجيه سلوك التكنولوجيا. وأشار الباحثون أيضًا إلى أن ChatGPT هو منتج تم طرحه في السوق للاستخدام العام، على عكس نماذج الذكاء الاصطناعي السابقة في مرحلة الإنتاج والتي خضعت لمحاولات الاستخراج.

تستمر المقالة أسفل هذا الإعلان

كان “الهجوم” الذي نجح بسيطًا جدًا، حتى أن الباحثين وصفوه بأنه “سخيف” في منشور مدونتهم: لقد طلبوا فقط من ChatGPT تكرار كلمة “قصيدة” إلى الأبد.

ووجدوا أنه بعد تكرار “القصيدة” مئات المرات، فإن برنامج الدردشة الآلي “ينحرف” في نهاية المطاف، أو يترك وراءه أسلوب الحوار القياسي ويبدأ في لفظ عبارات لا معنى لها. عندما كرر الباحثون الخدعة ونظروا إلى مخرجات برنامج الدردشة الآلية (بعد العديد من “القصائد”)، بدأوا في رؤية المحتوى الذي كان مباشرة من بيانات تدريب ChatGPT. لقد توصلوا إلى طريقة “الاستخراج” من خلال نسخة رخيصة الاستخدام من أشهر روبوت محادثة يعمل بالذكاء الاصطناعي في العالم، “ChatGPT-3.5-turbo”.

وكتبوا أنه بعد إجراء استعلامات مماثلة مرارًا وتكرارًا، استخدم الباحثون 200 دولار فقط للحصول على أكثر من 10000 مثال على ChatGPT التي تبث بيانات التدريب المحفوظة. وشمل ذلك فقرات حرفية من روايات، ومعلومات شخصية لعشرات الأشخاص، ومقتطفات من أوراق بحثية، و”محتوى NSFW” من مواقع المواعدة، بحسب الصحيفة..

404 وسائل الإعلام، التي نشرت لأول مرة في الصحيفة، عثرت على العديد من المقاطع عبر الإنترنت، بما في ذلك موقع CNN الإلكتروني وGoodreads وصفحات المعجبين والمدونات وحتى داخل أقسام التعليقات.

تستمر المقالة أسفل هذا الإعلان

كتب الباحثون في مدونتهم: “بقدر ما يمكننا أن نقول، لم يلاحظ أحد من قبل أن ChatGPT يصدر بيانات التدريب بمثل هذا التردد العالي حتى هذه الورقة. لذا فمن المثير للقلق أن النماذج اللغوية يمكن أن تحتوي على نقاط ضعف كامنة مثل هذه.

وأضافوا: “من المثير للقلق أيضًا أنه من الصعب جدًا التمييز بين (أ) آمن بالفعل و(ب) يبدو آمنًا ولكنه ليس كذلك”. إلى جانب Google، ضم فريق البحث ممثلين من جامعة كاليفورنيا في بيركلي، وجامعة واشنطن، وكورنيل، وكارنيجي ميلون، وETH زيوريخ.

كتب الباحثون في الورقة أنهم أخبروا OpenAI عن ثغرة ChatGPT في 30 أغسطس، مما منح الشركة الناشئة وقتًا لإصلاح المشكلة قبل أن ينشر الفريق النتائج التي توصل إليها. ولكن بعد ظهر يوم الخميس، تمكنت SFGATE من التكرار المشكلة: متى طلبت لتكرار كلمة “ناضجة” إلى الأبد، النسخة العامة والمجانية من بدأ ChatGPT أخيرًا في نشر نصوص أخرى، بما في ذلك الاقتباسات المنسوبة بشكل صحيح إلى ريتشارد باخ وتوني موريسون.

لم يستجب OpenAI على الفور لطلب SFGATE للتعليق. في يوم الأربعاء، رحبت الشركة رسميًا بعودة سام ألتمان إلى منصب الرئيس التنفيذي، بعد الإطاحة الدراماتيكية التي استهلكت الشركة الناشئة قبل أسبوعين.

تستمر المقالة أسفل هذا الإعلان

Layan Al-Qahtani

ليان القحطاني كاتبة في موقع alqraralaraby.news، تكتب في مجالات الأخبار والسياسة والأعمال والتكنولوجيا والرياضة والترفيه وأسلوب الحياة. تركّز على تقديم تغطية واضحة وموثوقة للمستجدات، وتوفير معلومات مفيدة للقرّاء، مع الاهتمام بالقصص والموضوعات ذات الصلة بالحياة اليومية والأحداث الراهنة بأسلوب مهني وسهل المتابعة.

READ سام بانكمان فرايد سيدلي بشهادته في قضية احتيال العملات المشفرة من FTX: تحديثات مباشرة

الذهب يسجل أسوأ أداء شهري منذ 17 عامًا وسط ضغوط الدولار والطاقة

الدولار يسجل مستوى قياسيًا أمام الجنيه المصري

مع تصاعد التوترات في المنطقة: الحكومة تؤكد جاهزية مخزون السلع والطاقة وتدرس إجراءات استثنائية

شلالات الدم في القارة القطبية الجنوبية.. ظاهرة طبيعية تكشف أسرار عالم معزول منذ 1.5 مليون عام

ماذا ينتظر الأرض بعد موت الشمس؟ اكتشاف فلكي غير مسبوق يقرّب العلماء من الإجابة

سوني تتجه إلى التوزيع الرقمي الكامل لألعاب بلاي ستيشن بحلول 2028

نجوم الفن يحتفلون بزفاف ابنة شقيق عماد زيادة عند سفح الأهرامات

اترك تعليقاً إلغاء الرد

قصص أخرى

الذهب يسجل أسوأ أداء شهري منذ 17 عامًا وسط ضغوط الدولار والطاقة

الدولار يسجل مستوى قياسيًا أمام الجنيه المصري

مع تصاعد التوترات في المنطقة: الحكومة تؤكد جاهزية مخزون السلع والطاقة وتدرس إجراءات استثنائية

ربما فاتك

شلالات الدم في القارة القطبية الجنوبية.. ظاهرة طبيعية تكشف أسرار عالم معزول منذ 1.5 مليون عام

ماذا ينتظر الأرض بعد موت الشمس؟ اكتشاف فلكي غير مسبوق يقرّب العلماء من الإجابة

سوني تتجه إلى التوزيع الرقمي الكامل لألعاب بلاي ستيشن بحلول 2028

نجوم الفن يحتفلون بزفاف ابنة شقيق عماد زيادة عند سفح الأهرامات