شركة Anthropic الناشئة للذكاء الاصطناعي متهمة بانتهاك بروتوكولات مكافحة تجريف مواقع الويب

وفقًا لـ iFixit وFreelancer، قام الروبوت Anthropic بالزحف إلى مواقعهم على الويب بقوة.

TL;DR

  • أنثروبي، أبدءIA متهم بجمع بيانات الويب على الرغم من بروتوكولات الاستبعاد.
  • يقول Freelancer وiFixit إنهما تأثرا بتجريف Anthropic.
  • تستخدم شركات الذكاء الاصطناعي أسلوب الكشط لتدريب تقنيات الذكاء الاصطناعي التوليدية الخاصة بها.

اتهام بانتهاك بروتوكول الاستبعاد من قبل الأنثروبيك

أنثروبي، أبدء التشغيل واحدالذكاء الاصطناعي، يواجه اتهامات خطيرة. تنتقد شركة Freelancer، وهي منصة كبيرة للعمل الحر، الشركة لفشلها في احترام بروتوكول “عدم الزحف” الخاص بملف robots.txt، والذي يحظر استخراج (استخراج) البيانات من مواقعها الإلكترونية. هذا الاتهام ليس معزولا، حيث أن الرئيس التنفيذي لشركة iFixit، كايل وينز، يدين أيضًا جرائم مماثلة.

ممارسة تعتبر “عدوانية”

الوصف مات باري، الرئيس التنفيذي لشركة Freelancer، روبوت Anthropic لمسح الويب، المسمى ClaudeBot، بأنه "الأكثر عدوانية على الإطلاق". ويدعي أنه خلال فترة أربع ساعات فقط، تمت زيارة موقعه حوالي 3.5 مليون مرة بواسطة الروبوت الأنثروبي. وهذا "ربما يعادل خمسة أضعاف حجم روبوت الذكاء الاصطناعي الثاني". وبالمثل، أكد وينزتغريدأنه في غضون 24 ساعة، كان الروبوت الأنثروبي قد أرسل مليون طلب إلى خادم iFixit. وهو يستنكر على وجه الخصوص أنه لا يتم فقط استعارة محتوى موقعهم دون تعويض مالي، ولكن هذا يتسبب أيضًا في زيادة عبء العمل على فريق تطوير الموقع.

إذا تمكن أي من هذه الطلبات من الوصول إلى شروط الخدمة الخاصة بنا، فسيخبرك أن استخدام المحتوى الخاص بنا محظور صراحةً. لكن لا تسألني، اسأل كلود!

إذا كنت ترغب في إجراء محادثة حول ترخيص المحتوى الخاص بنا للاستخدام التجاري، فنحن هنا.pic.twitter.com/CAkOQDnLjD

- كايل وينز (@ kwiens)24 يوليو 2024

شركات الذكاء الاصطناعي في حالة اضطراب

وفقالأعمال من الداخل، تقوم العديد من شركات الذكاء الاصطناعي أيضًا بجمع بيانات الويب مع تجاهل بروتوكول الاستبعاد. هذا هو حال شركة Perplexity، وهي شركة أخرى متخصصة في الذكاء الاصطناعي، والتي سلطت الضوء عليها مجلة Wired في يونيو الماضي.

يكمن سبب هذه الممارسة في حقيقة أن الذكاء الاصطناعي يستخدم محتوى الويب لتدريب تقنياته.الذكاء الاصطناعيتوليدي. ونتيجة لذلك، أصبحت العديد من شركات الذكاء الاصطناعي بالفعل هدفًا لدعاوى قضائية بسبب انتهاك حقوق الطبع والنشر. ومن أجل تجنب هذا الوضع، فضل البعض، مثل OpenAI، إبرام اتفاقيات مع الناشرين وأصحاب المواقع.

الأنثروبي يدافع عن نفسه

وأمام هذه الادعاءات..أنثروبيأبلغ الموقعالمعلوماتأنها تحترم بروتوكول robots.txt وأن الحالة قيد التحقيق حاليًا. ورغم الخلافات، يبدو الباب مفتوحا للنقاش. قال Wiens من iFixit، إنه على استعداد للنظر في اتفاقية بشأن محتوى موقعه للاستخدام التجاري.

هل يعجبك المحتوى الخاص بنا؟

احصل على أحدث منشوراتنا كل يوم مجانًا ومباشرة في صندوق الوارد الخاص بك

Leave a Reply

Your email address will not be published. Required fields are marked *

Subscribe Now & Never Miss The Latest Tech Updates!

Enter your e-mail address and click the Subscribe button to receive great content and coupon codes for amazing discounts.

Don't Miss Out. Complete the subscription Now.