يُزعم أن شركات Apple وNVIDIA وAnthropic استخدمت نصوص YouTube لتدريب الذكاء الاصطناعي الخاص بها دون تصريح

تحتوي قاعدة البيانات هذه على نسخ من مقاطع فيديو YouTube من منشئي المحتوى الأكثر شهرة على النظام الأساسي.

TL;DR

  • شركات التكنولوجيا مثل أبل ونفيديانسخ الفيديو المستخدمةيوتيوبدون إذن لتدريب الذكاء الاصطناعي الخاص بهم.
  • من المحتمل أن تنتهك هذه الممارسة شروط خدمة YouTube.
  • لم تكن الشركات شفافة بشأن أصل البيانات المستخدمة لتدريبها.

ممارسات مشكوك فيها في تدريب الذكاء الاصطناعي من عمالقة التكنولوجيا

يكشف تحقيق حديث لـ Proof News أن بعض أكبر شركات التكنولوجيا في العالم، بما في ذلك Apple وNVIDIA، قامت بتدريب موظفيهاالذكاء الاصطناعي(IA) على البيانات غير المصرح لهم باستخدامها. واعتمدوا على مجموعة بيانات مكونة من نسخ لأكثر من 173 ألف مقطع فيديو على موقع يوتيوب، تم استردادها دون تصريح.

مجموعة بيانات تم إنشاؤها دون موافقة

تأتي هذه النسخ من أكثر من 48000 قناة على YouTube، بما في ذلك منشئو المحتوى الرئيسيون مثل Marques Brownlee وMrBeast، ولكن أيضًا ناشري الأخبار الرئيسيين مثل The New York Times وBBC وABC News. ونلاحظ أيضًا وجود ترجمات لمقاطع الفيديو التابعة لموقع Engadget.

يعلن ماركيز براونلي عن هذا الموضوع على منصة X:"حصلت شركة Apple على بيانات الذكاء الاصطناعي الخاص بها من خلال العديد من الشركات. استخرج أحدهم الكثير من البيانات/النسخ من مقاطع فيديو YouTube، بما في ذلك مقاطع الفيديو الخاصة بي. »بالنسبة له، سوف تستمر هذه المشكلة في الظهور في المستقبل.

حصلت شركة Apple على بيانات الذكاء الاصطناعي الخاصة بها من العديد من الشركات

قام أحدهم بجمع الكثير من البيانات/النصوص من مقاطع فيديو YouTube، بما في ذلك مقاطع الفيديو الخاصة بي

تتجنب شركة Apple من الناحية الفنية "الخطأ" هنا لأنها ليست من يقوم بالتخلص

لكن هذه ستكون مشكلة متطورة لفترة طويلةhttps://t.co/U93riaeSlY

— ماركيز براونلي (@MKBHD)16 يوليو 2024

نقص واضح في الشفافية

لم تكن غالبية الشركات التي تعمل على نماذج الذكاء الاصطناعي شفافة بشأن مصادر البيانات المستخدمة في تدريبها. وفي وقت سابق من هذا الشهر، انتقد الفنانون والمصورونتفاحةلعدم الكشف عن مصدر البيانات المستخدمة لتدريب Apple Intelligence، الذكاء الاصطناعي الجديد المخصص لتوليد المحتوى، والذي من المقرر إطلاقه هذا العام على ملايين أجهزة Apple.

وأمام هذه الانتهاكات، هناك حاجة إلى التنظيم

يمثل موقع يوتيوب، باعتباره أكبر منصة للفيديو في العالم، منجم ذهب للبيانات (النسخ والصوت والفيديو والصور)، وهو أمر جذاب بشكل خاص للشركات الحريصة على تدريب نماذج الذكاء الاصطناعي الخاصة بها. ممثلينجوجلوقالت OpenAI إن استخدام البيانات من YouTube لهذا الغرض من شأنه أن ينتهك شروط خدمة النظام الأساسي.

تثير هذه الاكتشافات أسئلة حرجة حول شرعية وأخلاقيات ممارسات جمع البيانات. تستحق هذه القضية الاهتمام، والأمر متروك لشركات التكنولوجيا لاتخاذ الخطوات اللازمة لضمان الاستخدام الأخلاقي للبيانات.

هل يعجبك المحتوى الخاص بنا؟

احصل على أحدث منشوراتنا كل يوم مجانًا ومباشرة في صندوق الوارد الخاص بك

Leave a Reply

Your email address will not be published. Required fields are marked *

Subscribe Now & Never Miss The Latest Tech Updates!

Enter your e-mail address and click the Subscribe button to receive great content and coupon codes for amazing discounts.

Don't Miss Out. Complete the subscription Now.