إنفيديا تكشف عن نماذج متطورة لتدريب الروبوتات على فهم العالم

0
9

قال جنسن هوانج، المدير التنفيذي لشركة إنفيديا، إن العالم يدخل حالياً عصراً جديداً للذكاء الاصطناعي أطلق عليه تسمية “الذكاء الاصطناعي الوكيل” Agentic AI، مشيراً إلى أن هذه الطفرة الجديدة ستحدث تحولاً تقنياً كبيراً وستغير طريقة عمل البشر، وتدريب الروبوتات والسيارات على فهم العالم بشكل أفضل، واصفاً إياها بأنها “فرصة تساوي تريليونات الدولارات”.

وأشار هوانج، خلال مؤتمر إنفيديا بمعرض إلكترونيات المستهلكين CES 2025، إلى أن الذكاء الاصطناعي ينتقل من مرحلة الذكاء الاصطناعي التوليدي إلى عصر الوكلاء الأذكياء، وهي مرحلة سيكون خلالها الذكاء الاصطناعي عنصراً مساعداً للبشر يمكنهم من إنجاز المهام الروتينية بشكل أفضل وأسرع.

وكشفت إنفيديا عن مجموعة من الرقائق الجديدة الموجهة لتدريب وتشغيل نماذج الذكاء الاصطناعي، بالإضافة إلى عدد من الأدوات والمنصات البرمجية.

أداء قياسي بأسعار أقل

واستعرض هوانج رقائق الشركة الجديدة ضمن عائلة رقائق RTX Blackwell لمعالجة الرسوميات، حيث كشفت عن الجيل الجديد من معالجاتها الرائدة RTX 5090 بقدرة على إنجاز 3404 تريليون مهمة ذكاء اصطناعي في الثانية الواحدة، وذاكرة سعتها 32 جيجابايت، وذلك بسعر 1999 دولار.

إلى جانب ذلك، قدمت الشركة إصدار RTX 5080 ضمن رقائقها للفئة المتوسطة، بقدرة 1800 تريليون مهمة ذكاء اصطناعي في الثانية الواحدة، مع سعة داخلية 16 جيجابايت، بسعر 999 دولار.

وأشار المدير التنفيذي لشركة إنفيديا إلى أن شركته نجحت في خفض تكلفة إنتاج رقائق الذكاء الاصطناعي بشكل كبير بفضل الذكاء الاصطناعي نفسه، حيث كشفت عن شريحتي RTX 5070 وRTX 5070i، واللتين تقدمان أداءً مقارباً للجيل السابق من معالجاتها الرائدة RTX 4090، ولكن بأسعار أقل بثلاثة أضعاف.

وتقدم شريحة RTX 5070 نفس أداء RTX 4090، ولكن بسعر 549 دولاراً، مقارنة بسعر الشريحة الرائدة السابقة الذي كان يبلغ 1599 دولاراً، بينما تأتي شريحة RTX 5070i بأداء متطور بعض الشيء، مع ذاكرة من نوع G7 سعتها 16 جيجابايت وقدرة على إنجاز 1406 تريليون مهمة ذكاء اصطناعي في الثانية الواحدة.

كما كشفت إنفيديا عن قدوم عائلة حواسيب شخصية جديدة مدعومة بمعالجات الرسوميات RTX Blackwell، حيث تقدم عمر بطارية أطول بمعدل 40%، إلى جانب ضعف قوة الأداء باستخدام نصف الطاقة المطلوبة، وتتراوح أسعارها بين 1299 و2899 دولاراً.

تحسين المعالجة

وزودت إنفيديا رقائقها الجديدة بمجموعة من التقنيات التي تحسن من مستوى معالجة الرسوميات المتطورة مثل ميزة RTX Neural Shaders وRTX Neural Face، وتستخدمان في معالجة وجوه بشرية باستخدام الذكاء الاصطناعي لتظهر ملامحها بشكل طبيعي، إلى جانب ميزة RTX Mega Geometry، والتي تقدم قدرة فائقة على معالجة تفاصيل وملامح البيئات المختلفة التي يتم تصميمها في هيئة رسوميات عالية الدقة، إلى جانب ميزة RTX Reflex 2 التي تخفض من مدة تأخير معالجة وعرض الرسوميات المتقدمة.

وكشفت الشركة أيضاً عن طفرة في تقنياتها الخاصة بتحسين جودة المحتوى المصور باستخدام الذكاء الاصطناعي، وذلك مع الجيل الجديد DLSS 4، القادر على معالجة مجموعة متعددة من الإطارات في آنٍ واحد، إذ أن بإمكان التقنية الجديدة معالجة 247 إطاراً في الثانية الواحدة، وذلك أسرع بثماني مرات من أساليب المعالجة غير المعتمدة على الذكاء الاصطناعي، مع إبقاء معدل التأخير في المعالجة عند حد 43 مللي ثانية.

أدوات للمطورين

كما كشفت إنفيديا عن عدد من الأدوات البرمجية التي تساعد المطورين على تدريب الوكلاء الرقميين AI Agents، وكذلك تدريب الروبوتات على عدد من المهام التي لا حصر لها. ويتم ذلك من خلال تزويدها بتدريب عملي عبر محاكاة حركة البشر باستخدام أدوات مختلفة، منها نظارة Apple Vision Pro، وكذلك تدريب رقمي من خلال تزويدها بالمعرفة المعلوماتية عبر إضافة قواعد بيانات ضخمة من خلال منصات إنفيديا الجديدة للمطورين.

وأعلنت الشركة عن مجموعة من النماذج الذكية Nvidia NIM، والتي يمكن تشغيلها محلياً على الحواسيب المكتبية والشخصية التي تعمل بمعالجات إنفيديا الجديدة.

وتتعاون الشركة مع كبار مطوري النماذج الذكية كذلك مثل ميتا وميسترال وStability AI وكذلك Black Forest Labs، ليتمكن مستخدمو الحواسيب من تشغيل النماذج الذكية، سواءً محلياً عبر حواسيب تعمل بمعالجات إنفيديا الجديدة أو عبر الخوادم السحابية.

والهدف الرئيسي من تلك الخطوة هو مساعدة المطورين على إنشاء وكلاء رقميين بقدرات متعددة على التعامل مع المحتوى النصي والمصور، من صور وفيديوهات، وكذلك الصوتي، لمساعدة المستخدمين في الحياة اليومية.

كما قدمت إنفيديا عائلتها الخاصة للنماذج الذكية المبنية على تقنيات نماذج Llama، وهي تحمل اسم Llama Nemotron Models، تمثل هذه النماذج عائلة مفتوحة من نماذج اللغة الكبيرة (LLMs). 

وتتيح هذه النماذج للمطورين إنشاء وكلاء ذكاء اصطناعي مخصصين يدعمون مجموعة واسعة من التطبيقات، مثل خدمة العملاء وإدارة سلاسل التوريد والكشف عن الاحتيال.

صممت إنفيديا نماذج Llama Nemotron لتكون قادرة على تقديم أداء متقدم في مجالات البرمجة، الرياضيات، تنفيذ الأوامر، والمحادثات.

وفرت الشركة نماذج لاما نيموترون بثلاث أحجام مختلفة، تتناسب مع إمكانيات الأجهزة والتطبيقات المطلوب تحقيقها، وهي نموذج نانو، وهو منخفض التكلفة، ومُصمم للتطبيقات اللحظية التي تحتاج إلى استجابة سريعة، ويتناسب تشغيله على أجهزة الحواسيب الشخصية والأجهزة الطرفية مثل أنظمة كاميرات المراقبة، ونموذج Super، والذي يقدم أداء عالي الدقة مع قدرة على تشغيله باستخدام وحدة معالجة رسوميات واحدة GPU، إلى جانب الإصدار الأكثر تطوراً وهو نموذج Ultra، والذي يقدم أعلى مستويات الدقة والأداء، ومخصص للتطبيقات الضخمة في مراكز البيانات.

تدريب الروبوتات والسيارات على فهم العالم

كذلك أتاحت إنفيديا عائلة نماذج عائلة جديدة تحت اسم Cosmos، تهدف إلى تدريب الروبوتات ذات الهيئة البشرية، الروبوتات الصناعية، والمركبات ذاتية القيادة.

وعلى عكس النماذج اللغوية التي تُدرب على كميات كبيرة من النصوص لتوليد محتوى نصي، فإن نماذج كوزموس مصممة لإنشاء صور ونماذج ثلاثية الأبعاد تحاكي العالم الحقيقي.

وكشف هوانج أن نماذج كوزموس قد تم تدريبها باستخدام 2 مليون ساعة من المحتوى المصور عبر كاميرات السيارات ذاتية القيادة والطائرات المسيرة وغيرها من كاميرات مثبتة في مركبات ذاتية الحركة.

وزودت إنفيديا تلك النماذج بقدرات فائقة في معالجة الصور والفيديو باستخدام الذكاء الاصطناعي، حيث أنها قادرة على تحليل الصور والفيديوهات من كاميرات المراقبة في الأماكن العامة، والمستشفيات، والمتاجر، والمستودعات، مما يقدم قدرات غير مسبوقة للمؤسسات والشركات للاستفادة من تلك البيانات، إلى جانب قدراتها على تحليل محتوى الفعاليات الرياضية والأفلام والنشرات الإخبارية، في الوقت الفعلي.

كما أن نماذج كوزموس قادرة على إنشاء لقطات فيديو واقعية ليتم استخدامها في عملية تدريب الروبوتات على كيفية التعامل مع السيناريوهات المختلفة، مثل إنشاء مقاطع تُظهر سقوط الصناديق من الرفوف في مستودع، ويتم تدريب الروبوتات على التعرف على كيفية التعامل مع ذلك.

ويمكن لمستخدمي نماذج كوزموس تدريبها باستخدام بياناتهم الخاصة، مما يُعزز كفاءة التدريب لتلبية احتياجات محددة.

وكجزء من نماذج كوزموس، قدمت إنفيديا نماذج Cosmos World، المدربة على 20 مليون ساعة من لقطات فيديو واقعية تُظهر “البشر أثناء المشي، وحركة الأيدي، والتعامل مع الأشياء”، وأوضح قائلاً: “الأمر لا يتعلق بإنتاج محتوى إبداعي، بل بتعليم الذكاء الاصطناعي فهم العالم الفيزيائي”، وفق ما ذكره مدير إنفيديا.

وتتيح نماذج كوزموس وورلد تدريب الروبوتات على التجول في العالم الحقيقي بشكل طبيعي وآمن، لأن تلك النماذج تسمح لمطوري ومصنعي الروبوتات على إنتاج كم ضخم من بيانات التدريب ذات الطابع الحقيقي والواقعي لتدريب روبوتاتهم على التعامل مع السيناريوهات المختلفة للحركة في مختلف البيئات حول العالم.

وأعلنت إنفيديا أن لديها قائمة من الشركات العالمية في مجالات الروبوتات والسيارات ذاتية القيادة التي بدأت بالفعل استخدام نماذج كوزموس، ومنهم شركات الروبوتات Agility Robotics وFigure AI، وكذلك شركات Uber وWaabi وWayve.

كما أتاحت الشركة دليل للمطورين حول كيفية استخدام منصتها Isaac Gr00t لتدريب الروبوتات عبر محاكاة البشر، والتي تعتمد على جمع عدد محدود من مقاطع الفيديو الخاصة بأداء البشر لمهام محددة، ومن ثم يتم استخدامها في توليد كم ضخم من البيانات المصورة عبر الذكاء الاصطناعي واستخدامها لتدريب الروبوتات.

المنصة الجديدة تعتمد على 3 مكونات، الأول هو أداة GR00T-Teleop والتي تقوم على جمع بيانات حركة المستخدم من خلال أجهزة ذكية قابلة للارتداء، مثل نظارة أبل فيجن برو، ومن ثم يتم محاكاة حركات البشر عبر روبوت رقمي ويتم تسجيل حركته داخل الأداة

بعد ذلك، يتم إدخال تلك البيانات إلى المكون الثاني وهو أداة GR00T-Mimic، والتي تقوم بتحليل تلك الحركات ووضعها في إطار قاعدة بيانات أكبر من الحركات المصطنعة، والتي يتم بعد ذلك معالجتها وتطويرها وإنتاج محتوى أكثر تنوعاً على أساسها من خلال المكون الثالث وهو أداة GR00T-Gen.

مع شرائحها ونماذجها الذكية وأدواتها البرمجية الجديدة، تعزز إنفيديا، التي تجاوزت قيمتها السوقية حاجز 3 تريليونات دولار، فرصتها للبقاء لفترة أطول في قلب سوق الذكاء الاصطناعي، مع تحوله بشكل واضح ناحية الروبوتات الذكية، سواء المجسمة أو البرمجية.

المصدر


اكتشاف المزيد من مركز الكوثر الثقافي التعليمي

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك رد