سيتم إطلاق Sora من OpenAI اليوم — فيما يلي أبرز النقاط من المراجعة الأولى

سيتم إطلاق Sora، مولد الفيديو الخاص بـ OpenAI، اليوم – على الأقل لبعض المستخدمين.
وكشف مستخدم اليوتيوب ماركيز براونلي عن الخبر في مقطع فيديو نشره على قناته صباح الاثنين. حصل براونلي على وصول مبكر إلى سورا، وقدم انطباعاته الأولية في مراجعة مدتها 15 دقيقة.
سورا تعيش سورا.كومقال براونلي، إن الصفحة الرئيسية التي تظهر بها مجموعة من مقاطع فيديو Sora التي تم إنشاؤها مؤخرًا والتي تم تنسيقها بواسطة OpenAI. (لم يتم نشرها هنا في TechCrunch اعتبارًا من وقت النشر.) والجدير بالذكر أن الأداة ليست مدمجة في ChatGPT، منصة chatbot المدعومة بالذكاء الاصطناعي من OpenAI. يبدو أن Sora هو منتج منفصل خاص به في الوقت الحالي.
يمكن وضع إشارة مرجعية على مقاطع الفيديو الموجودة على صفحة Sora الرئيسية لمشاهدتها لاحقًا في علامة التبويب “المحفوظة”، وتنظيمها في مجلدات، والنقر عليها لمعرفة المطالبات النصية التي تم استخدامها لإنشائها. يمكن لـ Sora إنشاء مقاطع فيديو من الصور التي تم تحميلها بالإضافة إلى المطالبات، وفقًا لبراونلي، ويمكنه تعديل مقاطع الفيديو الحالية التي أنشأها Sora.
باستخدام ميزة “إعادة المزج”، يمكن للمستخدمين وصف التغييرات التي يريدون رؤيتها في مقطع الفيديو وسيحاول Sora دمجها في مقطع تم إنشاؤه حديثًا. يحتوي Re-mix على إعداد “القوة” الذي يتيح للمستخدمين تحديد مدى رغبتهم في تغيير Sora للفيديو المستهدف بشكل جذري، مع القيم الأعلى التي تنتج مقاطع فيديو تأخذ المزيد من الحريات الفنية.
وقال براونلي إن سورا يستطيع إنتاج لقطات بدقة تصل إلى 1080 بكسل، ولكن كلما زادت الدقة، استغرق إنشاء مقاطع الفيديو وقتًا أطول. تستغرق اللقطات بدقة 1080 بكسل وقتًا أطول بمقدار 8 مرات من 480 بكسل، وهو الخيار الأسرع، بينما تستغرق اللقطات بدقة 720 بكسل وقتًا أطول بمقدار 4 مرات.
قال براونلي إن متوسط الفيديو بدقة 1080 بكسل يستغرق “بضع دقائق” لإنتاجه في اختباره. وقال: “هذا أيضًا، في الوقت الحالي، عندما لا يستخدمه أي شخص آخر تقريبًا”. “أتساءل نوعًا ما عن المدة التي سيستغرقها الأمر عندما يكون هذا مفتوحًا ليستخدمه أي شخص.”
وقال براونلي إنه بالإضافة إلى إنشاء مقاطع لمرة واحدة، يمتلك Sora ميزة “Storyboard” التي تتيح للمستخدمين ربط المطالبات معًا لإنشاء مشاهد أو تسلسلات من مقاطع الفيديو. ويهدف هذا إلى المساعدة في تحقيق الاتساق، وهو ما يمثل نقطة ضعف سيئة السمعة لمولدات فيديو الذكاء الاصطناعي.
ولكن كيف أداء سورا؟ حسنًا، قال براونلي، إنها تعاني من نفس العيوب التي تعاني منها الأدوات التوليدية الأخرى، وهي المشكلات المتعلقة بديمومة الكائن. في فيديوهات سورا، تمر الأشياء أمام بعضها البعض أو خلف بعضها البعض بطرق غير منطقية، وتختفي وتعاود الظهور دون أي سبب.
وقال براونلي إن الساقين مصدر رئيسي آخر لمشاكل سورا. في أي وقت يضطر فيه شخص أو حيوان ذو أرجل إلى المشي لفترة طويلة في المقطع، سوف يخلط سورا بين الأرجل الأمامية والأرجل الخلفية. وقال براونلي إن الأرجل سوف “تتبادل” ذهابًا وإيابًا بطريقة مستحيلة من الناحية التشريحية.
وقال براونلي إن سورا لديه عدد من الضمانات المضمنة، ويمنع المبدعين من إنشاء لقطات تظهر أشخاصًا تقل أعمارهم عن 18 عامًا، وتحتوي على عنف أو “موضوعات صريحة”، وقد ينتهك ذلك حقوق الطبع والنشر الخاصة بطرف ثالث. وقال براونلي إن Sora أيضًا لن يقوم بإنشاء مقاطع فيديو من صور بها شخصيات عامة أو شخصيات أو شعارات يمكن التعرف عليها، كما أنه يضع علامة مائية على كل مقطع فيديو – وإن كان ذلك باستخدام علامة مائية مرئية يمكن اقتصاصها بسهولة.
إذًا، ما فائدة سورا؟ وجد براونلي أنه مفيد لأشياء مثل شرائح العناوين بأسلوب معين، والرسوم المتحركة، والملخصات، ولقطات الحركة المتوقفة. لكنه لم يصل إلى حد تأييده لأي شيء واقعي.
وقال عن غالبية مقاطع سورا: “إنه أمر مثير للإعجاب أنه فيديو تم إنشاؤه بواسطة الذكاء الاصطناعي، ولكن يمكنك أن تعرف بسرعة كبيرة أنه فيديو تم إنشاؤه بواسطة الذكاء الاصطناعي”. “الأمور تصبح متزعزعة حقًا.”