تعد هذه التقنية امتدادًا لواجهة برمجة تطبيقات تحويل النص إلى كلام الموجودة بالفعل في الشركة.
Tl;dr
- تعلن OpenAI عن معاينة لأداة Voice Engine الجديدة.
- تحاكي التقنية أي صوت من عينة صوتية مدتها 15 ثانية.
- يمكن أن يساعد في اضطرابات القراءة والترجمة والكلام.
- ولكن هناك مخاوف بشأن إساءة الاستخدام المحتملة وقضايا الخصوصية.
الذكاء الاصطناعي يعيد فتح حدود الصوت
أعزائي القراء، مستقبل الصوت يتشكل. الشركةOpenAIحديثاًأعلنت عن معاينة صغيرة الحجم لـ Voice Engine، أداة ثورية قادرة على نسخ أي صوت من عينة صوتية مدتها 15 ثانية فقط. ووفقا للشركة، فإن هذه التكنولوجيا تقدم "كلامًا طبيعيًا واقعيًا للغاية ومشحونًا عاطفيًا".
وعود محرك الصوت والمخاوف
"بعد إضافي لعالم الصوت"كما طرح المروجون لهذه التكنولوجيا. تدرس OpenAI عدةالتطبيقاتمثل:
- المساعدة في القراءة،
- ترجمة اللغة،
- دعم الأشخاص الذين يعانون من اضطرابات النطق المفاجئة أو التنكسية.
وقد أظهر مشروع تجريبي لجامعة براون بالفعل إمكانات هذه التكنولوجيا، حيث يساعد المريض الذي يعاني من اضطراب في النطق على التواصل باستخدام استنساخ صوتي من إنتاج Voice Engine.
لكن،المخاوف لا تزال قائمة. خطر إساءة استخدام هذه التكنولوجيا من قبل الجهات الخبيثة، وخاصة في مجالالتزييف العميق، يزن مثل سيف ديموقليس. تدرك OpenAI هذه المشكلات وتؤكد على الحاجة إلى معالجة مخاوف الخصوصية بشكل فعال ومسؤول قبل النشر على نطاق واسع.
النشر المسؤول
تدعي OpenAI أنها تعمل بشكل وثيق مع الشركاء فيالولايات المتحدةوعلى المستوى الدولي، من مختلف القطاعات مثل الحكومة والإعلام والترفيه والتعليم والمجتمع المدني، لتقليل المخاطر. تم وضع تدابير الشفافية: يجب على أي مستخدم للتكنولوجيا أن يوضح لجمهوره أن الأصوات يتم إنشاؤها بواسطة الذكاء الاصطناعي. كما تم اتخاذ تدابير أمنية، مثل وضع العلامات المائية لتحديد مصدر الصوت والمراقبة الاستباقية لاستخدام النظام.
في الوقت الراهن،يظل OpenAI متحفظًا في تاريخ الإصدارالمحرك الصوتي وسعره. ومع ذلك، تشير المعلومات التي اكتشفتها TechCrunch إلى أن التكلفة ربما تكون أقل من المنافسين مثل ElevenLabs. ومن الممكن أن يؤدي نشر هذه التكنولوجيا إلى إحداث ثورة صوتية، طالما تم استخدامها بوعي ومسؤولية.
هل يعجبك المحتوى الخاص بنا؟
احصل على أحدث منشوراتنا كل يوم مجانًا ومباشرة في صندوق الوارد الخاص بك