ابتكار طريقة جديدة بالذكاء الاصطناعي لوقف خطر روبوتات الدردشة

ابتكر باحثون من معهد ماساتشوستس للتكنولوجيا بمدينة كامبريدج طريقة جديدة ” تحاكي فضول الإنسان” لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود “خطيرة” على الأسئلة المثيرة.

وقد سميت الطريقة القائمة على التعلم الآلي، بـ “الفريق الأحمر القائم على الفضول” (CRT)، المصممة خصيصًا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

ويمكن من خلال هذه الأسئلة تحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

ويقوم الخبراء عادة بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus؛ بهدف تقييد المحتوى الخطير أو الضار.

ويتم أثناء عملية التدريب استخدام الأسئلة التي تثير محتوى خطيرًا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيًّا نطاقًا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعًا. ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال “التعلم الآلي”، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعًا لجميع خيارات الأسئلة المريبة المحتملة.

ابتكار طريقة جديدة بالذكاء الاصطناعي لوقف خطر روبوتات الدردشة

الوسوم:

المملكة تحقق قفزات نوعية في مجالات الاتصالات والذكاء الاصطناعي ومراكز البيانات لتصبح أكبر اقتصاد رقمي في الشرق الأوسط وشمال أفريقيا بقيمة 495 مليار ريال

الرسوم الجمركية تكلف “آبل” 900 مليون دولار

للحد من رسوم ترامب..أبل تفتتح مصنعين جديدين لآي فون في الهند

وكالة الأنباء العمانية

أضف تعليق إلغاء التعليق

المملكة تحقق قفزات نوعية في مجالات الاتصالات والذكاء الاصطناعي ومراكز البيانات لتصبح أكبر اقتصاد رقمي في الشرق الأوسط وشمال أفريقيا بقيمة 495 مليار ريال

آخر المقالات من عرب تريبيون

بـ 25 مليار دولار..السعودية تؤكد التزامها بالاستثمار في إفريقيا

اليونيسف/ تعلن تأثر 12 مليون طفل على الأقل بالصراعات في الشرق الأوسط وشمال إفريقيا خلال عامين

الهلال السعودي يعلن انضمام المغربي حمد الله للمشاركة في كأس العالم للأندية

التعاون الإسلامي تجدد دعوتها المجتمع الدولي إلى الاعتراف بدولة فلسطين ودعم عضويتها الكاملة في الأمم المتحدة

جمال فندي يكتب: رؤية إصلاحية لقانون الإيجار القديم: تحويل العلاقة من صراع إلى شراكة عادلة

اقتراحات

الوسوم:

موضوعات تهمك

أضف تعليق إلغاء التعليق

آخر المقالات من عرب تريبيون