تقنية

تقوم Google بتجربة منشئ صور جديد يقوم بإعادة مزج ثلاث صور في إنشاء واحد

مختبرات جوجل، الذراع التجريبي لشركة جوجل، هي اختبار مولد صور جديد يسمى Whisk. تتيح هذه الأداة للأشخاص المطالبة بالصور بدلاً من النص، مما يسمح لهم بإعادة مزج الصورة عن طريق تغيير الموضوع والمشهد والأسلوب.

يستخدم Whisk نموذج توليد الصور من Google، Imagen 3، لدمج ثلاث صور: واحدة للموضوع، وأخرى للمشهد، وواحدة للنمط. على سبيل المثال، يمكنك تحديد صورة لنفسك كموضوع، ومنظر طبيعي مستقبلي كمشهد، ونمط الرسوم المتحركة للمظهر النهائي.

يقوم النموذج تلقائيًا بإنشاء تعليق تفصيلي لصورك، والذي يتم استخدامه بعد ذلك لتوجيه Imagen 3 في إنشاء ريمكس للصورة. يمكنك أيضًا إدخال مطالبات نصية لتحديد النتيجة المرجوة بشكل أكبر، بما في ذلك الأوصاف التفصيلية مثل “الموضوع يركب دراجة طائرة”.

نظرًا لأن Whisk يركز فقط على بعض الخصائص الأساسية من كل صورة، توضح الشركة أن النتائج قد لا تلبي توقعاتك دائمًا. على سبيل المثال، يمكن أن يختلف الموضوع الذي تم إنشاؤه في الطول أو الوزن أو تصفيفة الشعر أو لون البشرة. تقول Google أنه يمكنك عرض المطالبات الأساسية وتعديلها في أي وقت.

التجربة متاحة حاليًا فقط للمستخدمين المقيمين في الولايات المتحدة في labs.google/whisk.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى