ذات صلة

اخر الاخبار

أوبن أيه آي تعلن عن محرك البحث الجديد SearchGPT

أعلنت شركة "أوبن أيه آي" OpenAI عن إطلاق محرك...

واتساب يصل الى 100 مليون مستخدم شهريًا في الولايات المتحدة

تطبيق واتساب وصل أخيرًا إلى 100 مليون مستخدم نشط...

ريلمي تكشف تفاصيل جديدة حول هواتف 13 برو و 13 برو بلس

ستقوم ريلمي بإطلاق هاتفي 13 برو و 13 برو...

أوبن إيه آي تقدم نموذج GPT-4o ميني بسعر رخيص

أعلنت شركة أوبن إيه "OpenAI" عن إطلاق نموذج GPT-4o...

إطلاق هاتف ريد ماجيك 9S برو عالميًا

أعلنت شركة ريد ماجيك "Red Magic" اليوم عن إطلاق هاتفها الجديد ريد ماجيك 9S برو "Red Magic 9S Pro" عالميًا، بعد أسبوعين فقط من تقديمه. سيكون هذا الهاتف هو الوحيد من سلسلة 9S المتاح دوليًا، حيث سيظل الإصدار الأقوى Pro+ حصريًا للصين.

مايكروسوفت تُطلق إداة تحويل الصور إلى فيديوهات واقعية بالذكاء الاصطناعي

أعلن مركز بحوث مايكروسوفت آسيا عن أداة تجريبية جديدة للذكاء الاصطناعي تسمى VASA-1. هذه الإداة تستطيع تحويل صورة ثابتة أو رسم لشخص مع ملف صوتي موجود لإنشاء وجه حديث واقعي منهما في الوقت الحقيقي. وتتميز الأداة بقدرتها على إنشاء تعبيرات وجه وحركات رأس لصورة ثابتة موجودة وحركات شفاه مناسبة لتطابق كلام أو أغنية. وقد قام الباحثون بتحميل العديد من الأمثلة على صفحة المشروع، وتبدو النتائج جيدة بما يكفي لخداع الناس إلى التفكير في أنها حقيقية.

وبالرغم من أن حركات الشفاه والرأس في الأمثلة قد تبدو قليلاً آلية وغير متزامنة عند فحصها بدقة. الا إنه من الواضح لا يزال بإمكان هذه التكنولوجيا أن تستخدم بسهولة وسرعة لإنشاء فيديوهات “ديبفيك” Deepfake لأشخاص حقيقيين. ويدرك الباحثون أنفسهم هذا الإمكان، لذلك قرروا عدم إصدار “عرض توضيحي عبر الإنترنت، أو واجهة برمجة تطبيقات API، أو منتج، أو تفاصيل تنفيذ إضافية، أو أي عروض ذات صلة” حتى يتأكدوا من أن تكنولوجياهم “سيتم استخدامها بشكل مسؤول وفقًا للتنظيمات السليمة”. ولم يذكروا، ومع ذلك، ما إذا كانوا يخططون لتنفيذ تدابير وقائية معينة لمنع الأشخاص السيئين من استخدامها لأغراض خبيثة، مثل إنشاء محتوى إباحي ديبفيك أو حملات تضليلية.

يعتقد الباحثون أن تكنولوجياهم لها العديد من الفوائد على الرغم من إمكانية سوء استخدامها. وقالوا إنه يمكن استخدامها لتعزيز المساواة التعليمية، وكذلك لتحسين إمكانية الوصول لأولئك الذين يواجهون تحديات في التواصل. وذلك عن طريق منحهم وصولًا إلى شخصية افتراضية يمكنها التواصل عنهم. كما يمكن أن توفر الدعم والرفاقة العلاجية لأولئك الذين يحتاجون إليها، مما يشير إلى أن VASA-1 يمكن استخدامه في برامج تقدم وصولاً إلى شخصيات ذكاء اصطناعي يمكن للناس التحدث إليها.

ووفقًا للورقة المنشورة مع الإعلان، تم تدريب VASA-1 على مجموعة بيانات VoxCeleb2. هذه المجموهة تحتوي على “أكثر من مليون جملة لـ 6,112 شخصية” تم استخراجها من مقاطع فيديو على يوتيوب. على الرغم من أن الأداة تم تدريبها على وجوه حقيقية، إلا أنها تعمل أيضًا على الصور الفنية مثل لوحة “موناليزا”، التي جمعها الباحثون بشكل ممتع مع ملف صوتي لأن هاثاواي أداء أغنية “باباراتزي” لـ ليل واين.