تواجه شركة OpenAi التي تطور نموذج الذكاء الاصطناعي التوليدي للمحادثة باللغة الطبيعية شات جي بي تي، رفض العديد من مواقع الويب جمع هذه  الشركة البيانات من صفحاتها بحجة تحسين دقة نماذج الذكاء الاصطناعي التي تطورها OpenAi

 


في 8 أغسطس2023، كشفت شركة OpenAI النقاب، من دون ضجة، عن زاحف الويب GPTBot، وهو روبوت أو برنامج يمسح صفحات الويب بطريقة منهجية وآلية ومنظمة، لفهرسة صفحات الويب و استخراج البيانات. والغرض منه، وفقًا لشركة OpenAI، هو مساعدة "نماذج الذكاء الاصطناعي الخاصة بها على أن تصبح أكثر دقة"، ولكن أيضًا "تحسين قدراتها العامة وموثوقيتها".حينها أعلنت OpenAI أن GPTBot يتفادى جمع البيانات من مصادر تتطلب الوصول المدفوع. ويزيل البيانات التي تحتوي معلومات التعريف الشخصية (PII) Personal Identifiable Information

الهدف من هذا الإعلان هو بالتحديد طمأنة مواقع وسائل الإعلام والمنصات الإخبارية من عدم جمع GPTBot البيانات المحمية بجدار دفع Paywall

لكن سرعان ما لجأت العديد من وسائل الإعلام  لتقييد وصول GPTBot لمحتوى مواقع الويب التابعة لها، موقع صحيفة نيويورك تايمز تبنت نفس النهج، وسائل الإعلام أخرى كـ  CNN الأمريكية و مجموعة ABC الأسترالية، الغارديان البريطانية، و أيضا وكالات الأنباء رويترز و بلومبيرغ

في فرنسا تبنت هذا النهج  وكالة الصحافة الفرنسية وأيضا المجموعات الإعلامية العامة كـ فرانس ميديا موند، المؤسسة الأم لإذاعة مونت كارلو الدولية، التي تجمع أيضا قناة فرانس24 و إذاعة فرنسا الدولية. تبعتها مجموعة إذاعة فرنسا ومجموعة التلفزة الفرنسية، تحظر مجموعات الإعلام الفرنسي العام  وصول روبوت GPTBot لمحتوى مواقع الويب الخاصة بها "بصفة إجراء احترازي". هذا بالإضافة إلى مواقع مؤسسات إعلامية خاصة كمجموعة TF1. وصحيفة لو فيغارو وغيرها

وفقًا لدراسة أجرتها Originality.ai، وهي أداة لكشف انتحال النصوص plagiarism، التي فحصت ملفات robots.txt، التي تدير عمل الروبوتات الزاحفة على مواقع الويب، في أكثر من ألف موقع في العالم، تبين أن 9.2% من المنصات قامت بحظر GPTBot خلال أول أسبوعين من تشغيله

من أبرز المواقع التي قيدت وصول الروبوت، Amazon.com، Wikihow.com، Quora.com،  Shutterstock. وأيضا مواقع WikiHow، Foursquare، Tumblr، Ikea، Airbnb، Lonely Planet

من المفترض أن ترتفع نسبة المواقع التي  ستحظر زاحف الويب GPTBot

تقدر دراسة Originality.ai، أن نسبة مواقع الويب التي ستحظر وصول GPTBot ستزيد بنسبة 5% أسبوعيًا.وأن نسبة الحظر هي أعلى في مواقع الويب التي تسجل أعلى نسبة من الزيارات

تعتبر معظم المؤسسات الإعلامية التي قيدت وصول GPTBot، أن ما تقوم به OpenAI هو نهب غير مصرح به للمحتوى، وأيضا  الخوف من أسلوب عمل نموذج الذكاء الاصطناعي التوليدي للمحادثة  باللغة الطبيعية ChatGPT. فهو نموذج توليدي  تنبؤي، يمزج في أجوبته ما يجمعه من عمل صحفي جدي، موثوق ومكلف، إلى جانب معلومات قد تكون غير مؤكدة أو تحوي بيانات نتيجة هلوسة النموذج

يقول فنسان فلوري، مدير البيئات الرقمية في فرانس ميديا ​​موند: "إن الذكاء الاصطناعي التوليدي يعمل وفق نموذج احتمالي، يمكنه ربط بيانات مواقعنا  ببيانات أخرى أكثر أو أقل دقة، أو حتى خاطئة"

ويضيف فنسان فلوري "هنالك اليوم مئات الشركات الناشئة في مجالات مختلفة تتعلق بالإعلام تعتمد  توليد النصوص من نماذج الذكاء الاصطناعي التوليدي  للمحادثة  باللغة الطبيعية، و من ثم نشرها بهدف الربح، وهي عملية سلب لعمل الصحافيين وأيضا التضليل بواسطة معلومات غير موثوق بها"

تعتبر الغارديان البريطانية، أن ما يقوم به  GPTBot "هو استغلال تجاري من طريق جمع البيانات المحمية بموجب حقوق الطبع والنشر"

تدرس العديد من المؤسسات الصحافية ومنها نيويورك تايمز، اتخاذ إجراءات قانونية ضد شركة OpenAI لحماية حقوق الطبع والنشر، في حين ستعتمد مؤسسات أخرى منطق المفاوضات مع الشركات المتخصصة في الذكاء الاصطناعي التوليدي لبيع بياناتها مقابل عمولة

يمكن تقييد وصول الزاحف GPTBot  كليا أو جزئيًا، لصناع المحتوى من الصحافيين و غيرهم، من لديهم مواقع مجانية أوتحتاج اشتراكا مدفوعا ، وضعت OpenAI على مدونتها  أوامر تضاف إلى ملف robots.txt الخاص بموقع الويب  لمنع وصول الزاحف GPTBot،  أو السماح لـ GPTBot بالوصول إلى أجزاء معينة من محتوى الموقع

 


{source}<script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js?client=ca-pub-4474625449481215"

crossorigin="anonymous"></script>

<!-- moss test ad -->

<ins class="adsbygoogle"

style="display:block"

data-ad-client="ca-pub-4474625449481215"

data-ad-slot="6499882985"

data-ad-format="auto"

data-full-width-responsive="true"></ins>

<script>

(adsbygoogle = window.adsbygoogle || []).push({});

</script>{/source}

الأكثر مشاهدة

Who's Online

259 زائر، ولايوجد أعضاء داخل الموقع

الصحة

الدائرة الأخيرة

فيديو كاسل جورنال

الدائرة الأخيرة  

الدائرة الأخيرة مع الدكتور عاصم الليثى

 الدائرة الأخيرة مع اللواء نبيل أبو النجا

 كلمة د/عبير المعداوى فى عيد الشرطة

عنوان الجريدة

  • 104-ش6-المجاورة الأولى-الحى الخامس-6أكتوبر
  • عنوان البريد الإلكتروني هذا محمي من روبوتات السبام. يجب عليك تفعيل الجافاسكربت لرؤيته.
  • 01004734646

إصدارات مجموعة كاسل