تطلق OpenAI متتبع الويب GTBot الخاص بها وتعليمات حظره
OpenAI تطلق برنامج webcrawlerلتحسين نماذجهاالذكاء الاصطناعيمثل جي بي تي-4. عمدGTBot، يتصفح النظام الويب لتدريب وتحسين قدرات الذكاء الاصطناعي الخاص به. وفقًا لمنشور مدونة من OpenAI، فإن استخدام GTTBot لديه القدرة على تحسين نماذج الذكاء الاصطناعي الحالية فيما يتعلق بالدقة والدقةحماية.
"يمكن استخدام صفحات الويب التي تم استردادها باستخدام وكيل مستخدم GTBot لتحسين النماذج المستقبلية وتصفيتها لإزالة المصادر التي تتطلب الوصول المدفوع، أو المعروفة بجمع معلومات التعريف الشخصية (PII)، أو التي تحتوي على نص ينتهك سياساتنا،" يمكننا قراءة في هذا المنصب.
ومع ذلك، يمكن لمواقع الويب اختيار تقييد الوصول إلى هذا الروبوت ومنع GTBot من الوصول إلى مواقعها، سواء جزئيًا أو كليًا. يوضح OpenAI أنه يمكن لمسؤولي الموقع حظر الزاحف عن طريق حظر عنوان IP الخاص به أو عبر ملف robots.txt.
لقد أثارت OpenAi بالفعل جدلاً بسبب الطريقة التي تجمع بها البيانات وانتهاكات حقوق الطبع والنشر والانتهاكات الأمنية. وفي يونيو/حزيران، تمت مقاضاة المنصة بتهمة "سرقة".البيانات الشخصيةتهدف إلى القيادةChatGPT.
تم تنفيذ وظائف إلغاء الاشتراك في برامج التحسين هذه مؤخرًا، بما في ذلك السماح لك بإلغاء تنشيط سجل المحادثات، مما يمنح المستخدمين مزيدًا من التحكم في بياناتهم الشخصية.
تم تدريب ChatGPT 3.5 و4 على البيانات والنصوص عبر الإنترنت التي يعود تاريخها إلى سبتمبر 2021 للأحدث. لا توجد حاليًا طريقة لإزالة المحتوى من مجموعة البيانات هذه.
وفقOpenAI، يمكنك تعطيل GTBot عن طريق إضافة بضعة أسطر إلى ملف Robots.txt الخاص بموقعك. يتم استخدام هذا الملف بالفعل على وجه التحديد لإعطاء تعليمات لبرامج زحف الويب، للإشارة إلى ما يمكنهم أو لا يمكنهم الوصول إليه.
يمكنك تخصيص ما يمكن أن يستخدمه هذا الروبوت، مما يسمح بصفحات معينة وعدم السماح بصفحات أخرى.
وكيل المستخدم: GTBot
السماح: /my-folder-1/
عدم السماح: /mon-dossier-2/
للسماح بجمع المحتوى في /my-folder-1/ وحظره في /my-folder-2/. باستخدام Disallow://، فإنك تحظر الوصول الكامل إلى موقعك.
الخلاصة
هل يعجبك المحتوى الخاص بنا؟
احصل على أحدث منشوراتنا كل يوم مجانًا ومباشرة في صندوق الوارد الخاص بك