به نظر می‌رسد سال ۲۰۲۴ سال مهمی برای هوش مصنوعی مولد و مدل‌های زبانی بزرگ و رباتیک خواهد بود. کاربردهای مختلف این ابزارها شامل ابزارهای یادگیری و طراحی محصول می‌شود و هیجان زیادی در آن وجود دارد. محققان DeepMind Robotics گوگل یکی از گروه‌هایی است که به دنیال استفاده از روش‌های جدیدی در این زمینه هستند.

در واقع ربات‌ها در طول زندگی خود به‌طور مکرر بر انجام یک کار منحصربه‌فرد تمرکز دارند. ربات‌های تک منظوره در این زمینه بسیار خوب عمل می‌کنند. البته این ربات‌ها نیز با بروز تغییرات و خطاهای ناخواسته با مشکلاتی مواجه می‌شوند.

به تازگی اعلام شد که AutoRT قرار است برای کنترل مدل‌های بزرگ و دستیابی به اهداف مختلف طراحی شود. در یک مثال ارائه شده توسط تیم DeepMind، این سیستم با استفاده از یک مدل زبان بصری (VLM) برای آگاهی بهتر از موقعیت شروع به کار می‌کند. AutoRT می‌تواند تعداد زیادی از ربات‌ها را مدیریت کند که به صورت پشت سر هم کار می‌کنند. این ربات‌ها به دوربین مجهز هستند تا طرح محیط و شیء درون آن را به دست آورند.

یک مدل زبانی بزرگ وظایفی را پیشنهاد می‌دهد که می‌توانند توسط سخت‌افزار اجرا شوند. بسیاری از افراد LLM را کلیدی برای حل مشکلات رباتیک می‌دانند. این زبان به‌طور مؤثر دستورات زبان طبیعی را درک می‌کند و نیاز به مهارت‌های کد نویسی را کاهش می‌دهد.

این سیستم در طول هفت یا چند ماه گذشته به صورت کامل آزمایش شده است. AutoRT قادر است تا ۲۰ ربات و در مجموع ۵۲ دستگاه مختلف را هماهنگ کند. در مجموع، DeepMind حدود ۷۷۰۰۰ آزمایش شامل بیش از ۶۰۰۰ کار بررسی کرده است.

علاوه بر آن، RT-Trajectory فناوری جدیدی از این تیم است که از ورودی ویدیو برای یادگیری رباتیک استفاده می‌کند. گروه‌های زیادی در حال بررسی استفاده از ویدیوهای یوتیوب به عنوان روشی برای آموزش ربات‌ها هستند. با این حال RT-Trajectory یک لایه جالب اضافه می‌کند و طرحی دوبعدی از این مسئله ارائه می‌دهد.

این تیم اعلام کرد: «این فناوری نکات بصری عملی و سطح پایین را در قالب تصاویر RGB به مدل ارائه می‌کند.»

طبق اعلام DeepMind، آموزش‌های جدید دو برابر آموزش RT-2 موفقیت‌آمیز بوده است. میزان موفقیت این آموزش ۶۳ درصد در مقابل ۲۹ درصد است.

این تیم بیان کرده:

RT-Trajectory از اطلاعات حرکت رباتیک که در همه مجموعه داده‌های ربات وجود دارد، استفاده می‌کند. این اطلاعات امروزه کمتر مورداستفاده قرار می‌گیرند. RT-Trajectory گام بزرگی در مسیر ساخت ربات‌های با دقت بالا است. این ربات‌ها می‌توانند به مجموعه وسیعی از دانش دسترسی داشته باشند.


0 دیدگاه

دیدگاهتان را بنویسید

Avatar placeholder