أصبح ChatGPT يفهم الآن الفيديو في الوقت الفعلي، بعد سبعة أشهر من عرض OpenAI لأول مرة له

أصدرت OpenAI أخيرًا إمكانات الفيديو في الوقت الفعلي لـ ChatGPT والتي تم عرضها منذ ما يقرب من سبعة أشهر.
وفي يوم الخميس، خلال بث مباشر، قالت الشركة إن وضع الصوت المتقدم، وهي ميزة المحادثة الشبيهة بالإنسان لـ ChatGPT، أصبحت تكتسب رؤية واضحة. باستخدام تطبيق ChatGPT، يمكن للمستخدمين المشتركين في ChatGPT Plus وTeam وPro توجيه هواتفهم نحو الكائنات وجعل ChatGPT يستجيب في الوقت الفعلي تقريبًا.
يمكن أيضًا لوضع الصوت المتقدم مع الرؤية فهم ما هو موجود على شاشة الجهاز، عبر مشاركة الشاشة. يمكنه شرح قوائم الإعدادات المختلفة، على سبيل المثال، أو تقديم اقتراحات بشأن مسألة رياضية.
للوصول إلى وضع الصوت المتقدم مع الرؤية، انقر فوق أيقونة الصوت بجوار شريط الدردشة ChatGPT. بمجرد الدخول إلى الوضع الصوتي، اضغط على أيقونة الفيديو في الجزء السفلي الأيسر لبدء الفيديو. لمشاركة الشاشة، انقر على قائمة النقاط الثلاث وحدد “مشاركة الشاشة”.
يقول OpenAI إن طرح وضع الصوت المتقدم مع الرؤية سيبدأ اليوم، وينتهي في الأسبوع المقبل. ولكن لن يتمكن جميع المستخدمين من الوصول. تقول OpenAI أن ChatGPT Enterprise وEdu لن تحصلا على الميزة حتى يناير، وأنه ليس لديها جدول زمني لمستخدمي ChatGPT في الاتحاد الأوروبي وسويسرا وأيسلندا والنرويج وليختنشتاين.
في أ العرض الأخير في برنامج 60 دقيقة على قناة CNN، كان لدى رئيس OpenAI جريج بروكمان وضع الصوت المتقدم مع اختبار الرؤية أندرسون كوبر حول مهاراته في علم التشريح. وبينما كان كوبر يرسم أجزاء الجسم على السبورة، تمكن ChatGPT من “فهم” ما كان يرسمه.
قال المساعد: “الموقع محدد”. “الدماغ موجود هناك في الرأس. أما بالنسبة للشكل، فهي بداية جيدة. الدماغ هو أكثر بيضاويًا.
في نفس العرض التوضيحي، ارتكب وضع الصوت المتقدم مع الرؤية خطأً في مشكلة هندسية، مما يشير إلى أنه عرضة للهلوسة.
تم تأخير وضع الصوت المتقدم مع الرؤية عدة مرات — يقال ويرجع ذلك جزئيًا إلى أن OpenAI أعلنت عن الميزة قبل أن تصبح جاهزة للإنتاج بفترة طويلة. في شهر أبريل، وعدت شركة OpenAI بأن وضع الصوت المتقدم سيتم طرحه للمستخدمين “في غضون أسابيع قليلة”. وبعد أشهر، قالت الشركة إنها بحاجة إلى مزيد من الوقت.
عندما وصل وضع الصوت المتقدم أخيرًا في أوائل الخريف لبعض مستخدمي ChatGPT، كان يفتقر إلى مكون التحليل المرئي. في الفترة التي سبقت الإطلاق اليوم، ركزت OpenAI معظم اهتمامها على جلب تجربة الوضع الصوتي المتقدم للصوت فقط إلى منصات إضافية و المستخدمين في الاتحاد الأوروبي.
بالإضافة إلى وضع الصوت المتقدم مع الرؤية، أطلقت OpenAI “وضع سانتا” الاحتفالي، والذي يضيف صوت سانتا كصوت محدد مسبقًا في وضع الصوت المتقدم ChatGPT. يمكن للمستخدمين العثور عليه من خلال النقر أو النقر على أيقونة ندفة الثلج في ChatGPT بجوار شريط المطالبة.