Humanoidalny robot GR-1 rejestruje wielokamerowy obraz otaczającego go świata

Zamiast wyposażyć swojego świetnie wyglądającego humanoida ogólnego przeznaczenia GR-1 w pełny zestaw czujników nowej generacji, w tym radar i LiDAR, inżynierowie Fourier Intelligence postawili wyłącznie na wizję.
Humanoid GR-1 jest wyposażony w sześć kamer RGB, które zapewniają 360-stopniowy widok otaczającego go świata. Konfiguracja ta umożliwia również tworzenie mapy z lotu ptaka przy użyciu danych z kamery i sieci neuronowej, która uczy się na podstawie kontekstu w celu generowania cech przestrzennych 3D i wirtualnych obiektów.
Firma twierdzi, że technologia "następnie przekłada dane na trójwymiarową siatkę zajętości, pomagając GR-1 poruszać się po przejezdnych i nieprzejezdnych obszarach". Bot przeprowadził niedawno testy chodzenia na świeżym powietrzu, podczas których wykazał się "wysoką wydajnością i dokładnością w wykrywaniu pojazdów i pieszych wzdłuż chodników" w czasie rzeczywistym.
Podobnie jak w przypadku decyzji Tesli z 2021 r. o uruchomieniu systemów Autopilota przy użyciu głównie systemów wizyjnych, ta ścieżka rozwoju powinna znacznie obniżyć koszty sprzętu, a wszystko to przy jednoczesnym "zwiększeniu percepcji środowiskowej GR-1, osiągnięciu bezpieczniejszych i bardziej wydajnych operacji z ludzką precyzją".
Obecny model GR-1 wygląda zupełnie inaczej niż szkieletowe prototypy dwunożne. Strona produktowa Fourier podaje, że jest on w stanie chodzić z prędkością przypominającą ludzki chód po różnych powierzchniach, z adaptacyjnymi algorytmami równowagi pomagającymi utrzymać go w pozycji pionowej podczas wchodzenia lub schodzenia ze zboczy.
Firma podaje, że posiada on 54 stopnie swobody w całym ciele - co przekłada się na trzy w głowie i talii, siedem w każdym ramieniu i jedenaście w każdej pięciocyfrowej ręce oraz sześć w każdej nodze. Bot może pochwalić się szczytowym momentem obrotowym stawów wynoszącym 230 Nm.
Sześć modułów kamer RGB w połączeniu z przetwarzaniem AI pozwala GR-1 "widzieć" otaczający go świat i generować mapę 3D, aby pomóc w nawigacji w czasie rzeczywistym i unikaniu przeszkód
MOŻE ZAINTERESUJE CIĘ TAKŻE
Inteligencja AI obejmuje "multimodalny model językowy podobny do ChatGPT, a także zaawansowaną wiedzę semantyczną, przetwarzanie języka naturalnego i logiczne rozumowanie".
Niegdyś pusta głowa ma teraz twarz, która jest domem dla wyświetlacza o wysokiej rozdzielczości, głośników audio i mikrofonu. Wszechstronny system wizyjny nie tylko pozwala mu mapować i nawigować po otoczeniu w czasie rzeczywistym, ale także zasila jego możliwości unikania przeszkód i kolizji.
– Ten postęp wyznacza nowy etap naszych badań nad ucieleśnioną sztuczną inteligencją – powiedział Roger Cai, dyrektor firmy ds. badań i rozwoju aplikacji robotów. – Dzięki naszemu czystemu rozwiązaniu wizyjnemu, GR-1 może odegrać kluczową rolę w różnych zastosowaniach, takich jak rehabilitacja medyczna, usługi rodzinne, recepcja i przewodnictwo, inspekcja bezpieczeństwa, ratownictwo i produkcja przemysłowa.
Źródło: Fourier Intelligence