ذات صلة

اخر الاخبار

فيفو تطلق رسمياً إصدار جديد من هاتف Y200

أعلنت شركة فيفو اليوم عن توسيع سلسلة هواتف Y200 في الصين بإصدار جديد يحمل اسم Y200. هذا الإصدار الجديد يتميز بمعالج Snapdragon 6 Gen 1،

آيفون 16 برو ماكس سيأتي ببطارية عالية الكثافة

شاهدنا مؤخرًا صورًا مقارنة بين iPhone 15 Pro Max وiPhone 16 Pro Max القادم، التي تبرز الفروقات في الحجم بين الجهازين. الآن، المحلل Ming-Chi Kuo

يوتيوب ميوزيك يطرح تصميم التدرج اللوني على آيفون

في السابق، كان YouTube Music يعتمد على لون ثابت مستند إلى صورة الألبوم لخلفية "التشغيل الآن". الآن، يضيف التصميم الجديد تدرجًا لونيًا يتراوح بين الفاتح في الجزء العلوي والداكن في الجزء السفلي، مما يساعد على إبراز أزرار التشغيل/الإيقاف المؤقت، التالي/السابق، التبديل، التكرار، بالإضافة إلى شريط التمرير ومجموعة الأزرار.

آيفون 17 Slim سيكون أغلى من آيفون 17 برو ماكس

أعلنت آبل أنها ستقوم بإعادة تشكيل خط إنتاج آيفون العام القادم، متخلية عن نموذج Plus لصالح نموذج Slim. كنا نعتقد أن iPhone 17 Slim سيكون بديلاً لنموذج Plus، لكنه سيكون أنحف فقط.

قبل الإعلان الرسمي… فيديو فتح علبة بوكو F6 برو

على الرغم من أننا نعرف الكثير بالفعل عن تصميم ومواصفات الهاتفين، إلا أن تأكيد هذه المعلومات يأتي هذه المرة عبر فيديو فتح علبة هاتف Poco F6 Pro الذي ظهر على موقع Dailymotion.

مايكروسوفت تُطلق إداة تحويل الصور إلى فيديوهات واقعية بالذكاء الاصطناعي

أعلن مركز بحوث مايكروسوفت آسيا عن أداة تجريبية جديدة للذكاء الاصطناعي تسمى VASA-1. هذه الإداة تستطيع تحويل صورة ثابتة أو رسم لشخص مع ملف صوتي موجود لإنشاء وجه حديث واقعي منهما في الوقت الحقيقي. وتتميز الأداة بقدرتها على إنشاء تعبيرات وجه وحركات رأس لصورة ثابتة موجودة وحركات شفاه مناسبة لتطابق كلام أو أغنية. وقد قام الباحثون بتحميل العديد من الأمثلة على صفحة المشروع، وتبدو النتائج جيدة بما يكفي لخداع الناس إلى التفكير في أنها حقيقية.

وبالرغم من أن حركات الشفاه والرأس في الأمثلة قد تبدو قليلاً آلية وغير متزامنة عند فحصها بدقة. الا إنه من الواضح لا يزال بإمكان هذه التكنولوجيا أن تستخدم بسهولة وسرعة لإنشاء فيديوهات “ديبفيك” Deepfake لأشخاص حقيقيين. ويدرك الباحثون أنفسهم هذا الإمكان، لذلك قرروا عدم إصدار “عرض توضيحي عبر الإنترنت، أو واجهة برمجة تطبيقات API، أو منتج، أو تفاصيل تنفيذ إضافية، أو أي عروض ذات صلة” حتى يتأكدوا من أن تكنولوجياهم “سيتم استخدامها بشكل مسؤول وفقًا للتنظيمات السليمة”. ولم يذكروا، ومع ذلك، ما إذا كانوا يخططون لتنفيذ تدابير وقائية معينة لمنع الأشخاص السيئين من استخدامها لأغراض خبيثة، مثل إنشاء محتوى إباحي ديبفيك أو حملات تضليلية.

يعتقد الباحثون أن تكنولوجياهم لها العديد من الفوائد على الرغم من إمكانية سوء استخدامها. وقالوا إنه يمكن استخدامها لتعزيز المساواة التعليمية، وكذلك لتحسين إمكانية الوصول لأولئك الذين يواجهون تحديات في التواصل. وذلك عن طريق منحهم وصولًا إلى شخصية افتراضية يمكنها التواصل عنهم. كما يمكن أن توفر الدعم والرفاقة العلاجية لأولئك الذين يحتاجون إليها، مما يشير إلى أن VASA-1 يمكن استخدامه في برامج تقدم وصولاً إلى شخصيات ذكاء اصطناعي يمكن للناس التحدث إليها.

ووفقًا للورقة المنشورة مع الإعلان، تم تدريب VASA-1 على مجموعة بيانات VoxCeleb2. هذه المجموهة تحتوي على “أكثر من مليون جملة لـ 6,112 شخصية” تم استخراجها من مقاطع فيديو على يوتيوب. على الرغم من أن الأداة تم تدريبها على وجوه حقيقية، إلا أنها تعمل أيضًا على الصور الفنية مثل لوحة “موناليزا”، التي جمعها الباحثون بشكل ممتع مع ملف صوتي لأن هاثاواي أداء أغنية “باباراتزي” لـ ليل واين.