ذات صلة

اخر الاخبار

جوجل تُتيح ميزة بحث “AI Overviews” في ست دول جديدة

أطلقت جوجل ميزة "AI Overviews" في محرك البحث في...

سامسونج تُطلق هاتفها الجديد جلاكسي A06 رسمياً

أعلنت سامسونج رسميًا عن إطلاق هاتف جلاكسي A06 في...

مايكروسوفت تدخل سباق أجهزة الألعاب المحمولة

تستعد شركة Valve لاستثمار جهودها البارزة في تطوير نظام...

جوجل تسعى لتقديم ميزة الطوارئ عبر الأقمار الصناعية في هواتف بيكسل 9

أصبحت ميزة الطوارئ عبر الأقمار الصناعية أكثر شيوعًا في...

جلب ميزة انشاء الصور بالذكاء الاصطناعي لمنصة X

أطلقت شركة xAI للذكاء الاصطناعي التابعة لإيلون ماسك نموذجين...

مايكروسوفت تُطلق إداة تحويل الصور إلى فيديوهات واقعية بالذكاء الاصطناعي

أعلن مركز بحوث مايكروسوفت آسيا عن أداة تجريبية جديدة للذكاء الاصطناعي تسمى VASA-1. هذه الإداة تستطيع تحويل صورة ثابتة أو رسم لشخص مع ملف صوتي موجود لإنشاء وجه حديث واقعي منهما في الوقت الحقيقي. وتتميز الأداة بقدرتها على إنشاء تعبيرات وجه وحركات رأس لصورة ثابتة موجودة وحركات شفاه مناسبة لتطابق كلام أو أغنية. وقد قام الباحثون بتحميل العديد من الأمثلة على صفحة المشروع، وتبدو النتائج جيدة بما يكفي لخداع الناس إلى التفكير في أنها حقيقية.

وبالرغم من أن حركات الشفاه والرأس في الأمثلة قد تبدو قليلاً آلية وغير متزامنة عند فحصها بدقة. الا إنه من الواضح لا يزال بإمكان هذه التكنولوجيا أن تستخدم بسهولة وسرعة لإنشاء فيديوهات “ديبفيك” Deepfake لأشخاص حقيقيين. ويدرك الباحثون أنفسهم هذا الإمكان، لذلك قرروا عدم إصدار “عرض توضيحي عبر الإنترنت، أو واجهة برمجة تطبيقات API، أو منتج، أو تفاصيل تنفيذ إضافية، أو أي عروض ذات صلة” حتى يتأكدوا من أن تكنولوجياهم “سيتم استخدامها بشكل مسؤول وفقًا للتنظيمات السليمة”. ولم يذكروا، ومع ذلك، ما إذا كانوا يخططون لتنفيذ تدابير وقائية معينة لمنع الأشخاص السيئين من استخدامها لأغراض خبيثة، مثل إنشاء محتوى إباحي ديبفيك أو حملات تضليلية.

يعتقد الباحثون أن تكنولوجياهم لها العديد من الفوائد على الرغم من إمكانية سوء استخدامها. وقالوا إنه يمكن استخدامها لتعزيز المساواة التعليمية، وكذلك لتحسين إمكانية الوصول لأولئك الذين يواجهون تحديات في التواصل. وذلك عن طريق منحهم وصولًا إلى شخصية افتراضية يمكنها التواصل عنهم. كما يمكن أن توفر الدعم والرفاقة العلاجية لأولئك الذين يحتاجون إليها، مما يشير إلى أن VASA-1 يمكن استخدامه في برامج تقدم وصولاً إلى شخصيات ذكاء اصطناعي يمكن للناس التحدث إليها.

ووفقًا للورقة المنشورة مع الإعلان، تم تدريب VASA-1 على مجموعة بيانات VoxCeleb2. هذه المجموهة تحتوي على “أكثر من مليون جملة لـ 6,112 شخصية” تم استخراجها من مقاطع فيديو على يوتيوب. على الرغم من أن الأداة تم تدريبها على وجوه حقيقية، إلا أنها تعمل أيضًا على الصور الفنية مثل لوحة “موناليزا”، التي جمعها الباحثون بشكل ممتع مع ملف صوتي لأن هاثاواي أداء أغنية “باباراتزي” لـ ليل واين.