شرکت Figure AI از پیشرفت بزرگی در ربات انساننمای خود خبر داد. این شرکت معماری جدید هوش مصنوعی را معرفی کرد که به رباتها امکان میدهد دستورات صوتی طبیعی را تفسیر و اجرا کنند.
براساس اعلام وبسایت Figure AI، مدل هوش مصنوعی «بینایی-زبانی-کنشی» (VLA) این شرکت با نام Helix به رباتهای انساننمای Figure امکان میدهد دستورات زبانی کاربر را متوجه بشوند و با ابزارهایی که پیشتر ندیدهاند، تعامل کنند. برخلاف رباتهای معمولی که برای هر کار جدیدی نیاز به برنامهریزی دارند، هلیکس سیستم استدلال پیشرفته با قابلیت پردازش لحظهای دارد. این سیستم به رباتها کمک میکند ضمن درک معنایی (دانستن اینکه هر شیء چیست) توانایی کنش و حرکت (دانستن نحوه گرفتن اشیا را) نیز داشته باشند.
سیستم هوش مصنوعی Helix این امکان را به رباتها میدهد تا بدون نیاز به دریافت آپدیت نرمافزاری یا آموزش با دادههای جدید، بهمرور توانایی بیشتری پیدا کنند. برای نشان دادن نحوه کار این هوش مصنوعی، این شرکت ویدیویی منتشر کرد که در آن 2 ربات فیگور با همکاری یکدیگر مواد غذایی و وسایل مختلفی را که اولین بار میدیدند، در یخچال یا کشو بگذارند:
هرچند در ویدیو حرکات رباتها بسیار آهسته است، ویژگی حیرتانگیز کارشان قابلیت درک و تفسیر چیزهایی است که میبینند. آنها قابلیت تعمیم دارند و میدانند مثلاً شیر خوراکی محسوب میشود و باید آن را در یخچال گذاشت. استارتاپ فیگر برای این امر مدلی توسعه داده که آن را Vision-Language-Action مینامد که قدرت بینایی، ادراک زبانی و کنترل را یکپارچه میکند.
شرکت فیگر سیستم Helix را روی تقریباً 500 ساعت کنترل رباتیک از راه دور آموزش داده، سپس از فرایند برچسبگذاری خودکار برای تولید دستورالعملهای زبانی طبیعی برای هر رفتار استفاده کرده است. همچنین کل سیستم هوش مصنوعی جدید روی پردازشگرهای گرافیکی تعبیهشده در رباتها اجرا میشود.
همانطور که در ویدیو میبینید، ربات فیگر توجه خاصی به کارهای خانه دارد. سیستم هوش مصنوعی جدید باعث میشود رباتهای فیگر برای کارهای خانه مناسبتر شوند؛ چون در خانه ابزارها و چیزهای زیادی وجود دارد و مدام نیز جای آنها عوض میشود؛ روش بهینه این است با سیستم VLA قدرت تفسیر و شناسایی لحظهای در ربات قرار بگیرد.