يمكن أن تساعد تقنية NeRF الجديدة من NVIDIA في الدخول إلى Metaverse

جدول المحتويات:

يمكن أن تساعد تقنية NeRF الجديدة من NVIDIA في الدخول إلى Metaverse
يمكن أن تساعد تقنية NeRF الجديدة من NVIDIA في الدخول إلى Metaverse
Anonim

الوجبات الجاهزة الرئيسية

  • عرضت Nvidia مؤخرًا تقنية تحول الصور ثنائية الأبعاد إلى مشاهد ثلاثية الأبعاد في ثوانٍ معدودة.
  • تستخدم الطريقة قوة الكمبيوتر لتقريب سلوك الضوء في العالم الحقيقي.
  • metaverse هو أحد المجالات التي تكون فيها المشاهد ثلاثية الأبعاد مفيدة لأنه يمكن عرضها من أي منظور للكاميرا.
Image
Image

تكنولوجيا الذكاء الاصطناعي (AI) الجديدة من Nvidia يمكنها قريبًا تحويل الصور ثنائية الأبعاد إلى مشاهد ثلاثية الأبعاد في ثوانٍ فقط ، مما يجعل إنشاء مساحات افتراضية غامرة مثل metaverse أمرًا بسيطًا مثل معالجة الكلمات.

عرضت Nvidia مؤخرًا طريقة الصورة المسماة Instant NeRF ، والتي تستخدم قوة الحوسبة لتقريب كيفية تصرف الضوء في العالم الحقيقي. يمكن أن يحول صورك القديمة إلى مشهد لعبة فيديو ، أو يمكن استخدامه لتدريب الروبوتات والسيارات ذاتية القيادة لفهم حجم وشكل الأشياء في العالم الحقيقي.

"التصوير ثلاثي الأبعاد يجلب عالمًا جديدًا من التحول ،" قال أورين ديبي ، الرئيس التنفيذي لشركة Visionary.ai ، وهي شركة رؤية كمبيوتر تدير خوارزمياتها ثلاثية الأبعاد على منصة Nvidia ، لـ Lifewire في مقابلة عبر البريد الإلكتروني. "باستخدام ثلاثي الأبعاد ، يمكنك محاكاة عمق العالم الحقيقي في المشهد وتجعل الصورة تبدو أكثر حيوية وواقعية. إلى جانب AR / VR والكاميرات الصناعية ، حيث تكون الأبعاد الثلاثية شائعة جدًا ، نرى الآن أنها تُستخدم على كل هاتف ذكي تقريبًا بدون حتى أن المستخدم يعرف."

إضافة الأبعاد

أول صورة فورية ، تم التقاطها منذ 75 عامًا بكاميرا بولارويد ، تهدف إلى التقاط العالم ثلاثي الأبعاد في صورة ثنائية الأبعاد بسرعة. الآن ، يعمل باحثو الذكاء الاصطناعي على العكس: تحويل مجموعة من الصور الثابتة إلى مشهد رقمي ثلاثي الأبعاد في ثوانٍ.

المعروفة باسم العرض العكسي ، تستخدم العملية الذكاء الاصطناعي لتقريب كيفية تصرف الضوء في العالم الحقيقي ، مما يتيح للباحثين إعادة بناء مشهد ثلاثي الأبعاد من مجموعة من الصور ثنائية الأبعاد الملتقطة بزوايا مختلفة. تدعي Nvidia أنها طورت أسلوبًا ينجز هذه المهمة على الفور تقريبًا.

استخدمت Nvidia هذا النهج مع تقنية جديدة تسمى حقول الإشعاع العصبي ، أو NeRF. تقول الشركة إن النتيجة ، التي يطلق عليها اسم Instant NeRF ، هي أسرع تقنية NeRF حتى الآن. يتطلب النموذج ثوانٍ فقط للتدريب على بضع عشرات من الصور الثابتة ويمكنه بعد ذلك عرض المشهد ثلاثي الأبعاد الناتج في غضون عشرات المللي ثانية.

"إذا كانت التمثيلات ثلاثية الأبعاد التقليدية مثل الشبكات متعددة الأضلاع تشبه الصور المتجهة ، فإن NeRFs تشبه الصور النقطية: فهي تلتقط بكثافة الطريقة التي يشع بها الضوء من كائن أو داخل مشهد" ، هكذا قال David Luebke ، نائب الرئيس لأبحاث الرسومات في وقالت Nvidia في بيان صحفي: "بهذا المعنى ، يمكن أن تكون تقنية NeRF الفورية بنفس أهمية الكاميرات الرقمية وضغط JPEG بالنسبة للتصوير ثنائي الأبعاد - مما يزيد بشكل كبير من سرعة وسهولة ومدى الالتقاط والمشاركة ثلاثية الأبعاد."

يتطلب جمع البيانات لتغذية NeRF الشبكة العصبية لالتقاط بضع عشرات من الصور المأخوذة من مواقع متعددة حول المشهد ، بالإضافة إلى موضع الكاميرا لكل من تلك اللقطات.

تدرب NeRF شبكة عصبية صغيرة لإعادة بناء المشهد من خلال التنبؤ بلون الضوء المشع في أي اتجاه ، من أي نقطة في الفضاء ثلاثي الأبعاد.

نداء ثلاثي الأبعاد

إن metaverse هو أحد المجالات التي تكون فيها المشاهد ثلاثية الأبعاد مفيدة لأنه يمكن عرضها من أي منظور كاميرا ، كما قال براد كوينتون ، مؤسس منصة Perceptus للواقع المعزز (AR) ، لـ Lifewire في مقابلة عبر البريد الإلكتروني. تمامًا كما يمكننا أن نتجول في غرفة في الحياة الواقعية ونرى محتوياتها من عدة زوايا مختلفة ، مع مشهد ثلاثي الأبعاد أعيد بناؤه ، يمكننا فعليًا التحرك عبر الفضاء ومشاهدته من أي منظور.

Image
Image

"يمكن أن يكون هذا مفيدًا بشكل خاص لإنشاء بيئات لاستخدامها في الواقع الافتراضي ،" قال كوينتون.

تستخدم برامج مثل برنامج Object Capture من Apple تقنية تسمى القياس التصويري لإنشاء كائنات افتراضية ثلاثية الأبعاد من سلسلة من الصور ثنائية الأبعاد. وتوقع كوينتون أن النماذج ثلاثية الأبعاد ستُستخدم على نطاق واسع في تطبيقات الواقع الافتراضي والواقع المعزز. على سبيل المثال ، تستخدم بعض أنظمة الذكاء الاصطناعي ، مثل تلك الموجودة في منصة Perceptus AR ، نماذج ثلاثية الأبعاد لإنشاء فهم للعالم الحقيقي ، مما يسمح بتطبيقات الواقع المعزز في الوقت الفعلي.

قال ديبي إن استخدام الصور ثلاثية الأبعاديحاكي أيضًا عمق العالم الحقيقي في المشهد ويجعل الصورة تبدو أكثر حيوية وواقعية. لإنشاء تأثير بوكيه (يُعرف أيضًا باسم الوضع الرأسي أو الوضع السينمائي) ، من الضروري تعيين عمق ثلاثي الأبعاد. يتم استخدام هذه التقنية في كل هاتف ذكي تقريبًا.

"هذا هو بالفعل المعيار لمصوري الفيديو المحترفين الذين يصورون الأفلام ، وهذا أصبح المعيار لكل مستهلك ،" أضافت ديبي.

موصى به: