يقوم نموذج الذكاء الاصطناعي الجديد من NVIDIA، Fugatto، بإنشاء الصوت من المطالبات النصية

كشفت NVIDIA للتو عن Fugatto، وهو نموذج ذكاء اصطناعي ثوري جديد قادر على إنشاء ملفات صوتية من تعليمات نصية بسيطة.

Tl;dr

  • تقدم NVIDIA Fugatto، وهو نموذج جديد للذكاء الاصطناعي لتوليد الصوت.
  • يمكن لـ Fugatto إنشاء أو تحرير الملفات الصوتية من الأوامر النصية.
  • يمكن استخدام النموذج في إنتاج الموسيقى وتعليم اللغة وتطوير الألعاب.

نفيديا، إحدى الشركات العالمية الرائدة في مجال التكنولوجيا، قدمت مؤخرًا مشروعها المبتكر الجديد: نموذجالذكاء الاصطناعي(AI) الذي يصفه بأنه أ"سكين الجيش السويسري للصوت". تم تصميم هذا القالب، الذي يُطلق عليه اسم Fugatto، لإنشاء ملفات صوتية أو تعديلها استجابةً للتعليمات النصية.

إنجاز كبير في مجال الذكاء الاصطناعي

تم تصميم نموذج Fugatto من قبل فريق من الباحثين في مجال الذكاء الاصطناعي من جميع أنحاء العالم، والذي قالت NVIDIA إنه عزز قدراتهلهجات متعددة ومتعددة اللغات. وقال رافائيل فالي، أحد الباحثين وراء المشروع ورئيس الأبحاث الصوتية التطبيقية في NVIDIA:"أردنا إنشاء نموذج يفهم الصوت وينتجه مثلما يفعل البشر".

تطبيقات متنوعة لFugatto

قامت NVIDIA بإدراج العديد من سيناريوهات الاستخدام الواقعية لـFugatto. فيما بينها:

  • يمكن لمنتجي الموسيقى استخدام هذه التكنولوجيا لإنشاء نموذج أولي لفكرة الأغنية بسرعة، والتي يمكنهم بعد ذلك تعديلها بسهولة لتجربة أنماط وأصوات وآلات مختلفة.
  • يمكن للأفراد استخدامه لإنشاء مواد لأدوات تعلم اللغة بالصوت الذي يختارونه.
  • مطوروألعاب الفيديويمكن استخدامها لإنشاء أشكال مختلفة من الأصول المسجلة مسبقًا بناءً على اختيارات اللاعب وإجراءاته.

Fugatto: ذكاء اصطناعي يتمتع بقدرات واسعة النطاق

واكتشف فريق البحث أيضًا أن فوجاتو قادر على أداء المهام التي لم يتم تدريبه عليها مسبقًا، مع القليل من الضبط الدقيق. على سبيل المثال، يمكنه الجمع بين التعليمات التي تم تدريبه عليها بشكل منفصل، مثل توليد خطاب غاضب بلكنة معينة أو صوت غناء الطيور أثناء عاصفة رعدية. يستطيع Fugatto أيضًا توليد أصوات تتغير بمرور الوقت، مثل صوت عاصفة ممطرة تتحرك عبر المناظر الطبيعية.

لم تعلن NVIDIA بعد ما إذا كان عامة الناس سيتمكنون من الوصول إلى Fugatto. من المهم ملاحظة أن هذه ليست أول تقنية ذكاء اصطناعي توليدية قادرة على إنشاء أصوات من الأوصاف النصية. في الواقع، أصدرت Meta بالفعل مجموعة أدوات ذكاء اصطناعي مفتوحة المصدر بميزات مماثلة، وقامت جوجل بتطوير MusicLM، وهو عبارة عن ذكاء اصطناعي لتحويل النص إلى موسيقى يمكن الوصول إليه من خلال موقع AI Test Kitchen الخاص بالشركة.

هل يعجبك المحتوى الخاص بنا؟

احصل على أحدث منشوراتنا كل يوم مجانًا ومباشرة في صندوق الوارد الخاص بك

Leave a Reply

Your email address will not be published. Required fields are marked *

Subscribe Now & Never Miss The Latest Tech Updates!

Enter your e-mail address and click the Subscribe button to receive great content and coupon codes for amazing discounts.

Don't Miss Out. Complete the subscription Now.