قام Google DeepMind بإخراج أداة الذكاء الاصطناعي الجديدة لإنشاء مقاطع صوتية للفيديو. بالإضافة إلى استخدام مطالبة نصية لإنشاء الصوت، تأخذ أداة DeepMind أيضًا في الاعتبار محتويات الفيديو.
من خلال الجمع بين الاثنين، تقول DeepMind أنه يمكن للمستخدمين استخدام الأداة لإنشاء مشاهد “بموسيقى درامية أو مؤثرات صوتية واقعية أو حوار يتطابق مع شخصيات ونبرة الفيديو”. يمكنك رؤية بعض الأمثلة المنشورة على موقع DeepMind الإلكتروني، وهي تبدو جيدة جدًا.
بالنسبة لمقطع فيديو لسيارة تقود عبر مناظر المدينة الشبيهة بالسايبربانك، استخدمت جوجل عبارة “انزلاق السيارات، واختناق محرك السيارة، والموسيقى الإلكترونية الملائكية” لتوليد الصوت. يمكنك أن ترى كيف تتوافق أصوات الانزلاق مع حركة السيارة. مثال آخر ينشئ مشهدًا صوتيًا تحت الماء باستخدام الموجه، “قنديل البحر ينبض تحت الماء، الحياة البحرية، المحيط”.
على الرغم من أنه يمكن للمستخدمين تضمين مطالبة نصية، إلا أن DeepMind تقول إنها اختيارية. لا يحتاج المستخدمون أيضًا إلى المطابقة بدقة…