تحتوي قاعدة البيانات هذه على نسخ من مقاطع فيديو YouTube من منشئي المحتوى الأكثر شهرة على النظام الأساسي.
TL;DR
ممارسات مشكوك فيها في تدريب الذكاء الاصطناعي من عمالقة التكنولوجيا
يكشف تحقيق حديث لـ Proof News أن بعض أكبر شركات التكنولوجيا في العالم، بما في ذلك Apple وNVIDIA، قامت بتدريب موظفيهاالذكاء الاصطناعي(IA) على البيانات غير المصرح لهم باستخدامها. واعتمدوا على مجموعة بيانات مكونة من نسخ لأكثر من 173 ألف مقطع فيديو على موقع يوتيوب، تم استردادها دون تصريح.
مجموعة بيانات تم إنشاؤها دون موافقة
تأتي هذه النسخ من أكثر من 48000 قناة على YouTube، بما في ذلك منشئو المحتوى الرئيسيون مثل Marques Brownlee وMrBeast، ولكن أيضًا ناشري الأخبار الرئيسيين مثل The New York Times وBBC وABC News. ونلاحظ أيضًا وجود ترجمات لمقاطع الفيديو التابعة لموقع Engadget.
يعلن ماركيز براونلي عن هذا الموضوع على منصة X:"حصلت شركة Apple على بيانات الذكاء الاصطناعي الخاص بها من خلال العديد من الشركات. استخرج أحدهم الكثير من البيانات/النسخ من مقاطع فيديو YouTube، بما في ذلك مقاطع الفيديو الخاصة بي. »بالنسبة له، سوف تستمر هذه المشكلة في الظهور في المستقبل.
حصلت شركة Apple على بيانات الذكاء الاصطناعي الخاصة بها من العديد من الشركات
قام أحدهم بجمع الكثير من البيانات/النصوص من مقاطع فيديو YouTube، بما في ذلك مقاطع الفيديو الخاصة بي
تتجنب شركة Apple من الناحية الفنية "الخطأ" هنا لأنها ليست من يقوم بالتخلص
لكن هذه ستكون مشكلة متطورة لفترة طويلةhttps://t.co/U93riaeSlY
— ماركيز براونلي (@MKBHD)16 يوليو 2024
نقص واضح في الشفافية
لم تكن غالبية الشركات التي تعمل على نماذج الذكاء الاصطناعي شفافة بشأن مصادر البيانات المستخدمة في تدريبها. وفي وقت سابق من هذا الشهر، انتقد الفنانون والمصورونتفاحةلعدم الكشف عن مصدر البيانات المستخدمة لتدريب Apple Intelligence، الذكاء الاصطناعي الجديد المخصص لتوليد المحتوى، والذي من المقرر إطلاقه هذا العام على ملايين أجهزة Apple.
وأمام هذه الانتهاكات، هناك حاجة إلى التنظيم
يمثل موقع يوتيوب، باعتباره أكبر منصة للفيديو في العالم، منجم ذهب للبيانات (النسخ والصوت والفيديو والصور)، وهو أمر جذاب بشكل خاص للشركات الحريصة على تدريب نماذج الذكاء الاصطناعي الخاصة بها. ممثلينجوجلوقالت OpenAI إن استخدام البيانات من YouTube لهذا الغرض من شأنه أن ينتهك شروط خدمة النظام الأساسي.
تثير هذه الاكتشافات أسئلة حرجة حول شرعية وأخلاقيات ممارسات جمع البيانات. تستحق هذه القضية الاهتمام، والأمر متروك لشركات التكنولوجيا لاتخاذ الخطوات اللازمة لضمان الاستخدام الأخلاقي للبيانات.
الخلاصة
هل يعجبك المحتوى الخاص بنا؟
احصل على أحدث منشوراتنا كل يوم مجانًا ومباشرة في صندوق الوارد الخاص بك