Visual AI GUIDE

Ọhụụ-Asụsụ-Ụdị omume maka Robotics

Ụdị Ọhụụ-Asụsụ-Ọrụ (VLA) bụ nnukwu netwọkụ akwara ozi na-ewere onyonyo igwefoto gbakwunyere ntuziaka edere na iwepụta iwu moto robot ozugbo.

Nchịkọta

Ụdị Ọhụụ-Asụsụ-Ọrụ (VLA) bụ nnukwu netwọkụ akwara ozi na-ewere onyonyo igwefoto gbakwunyere ntuziaka edere na iwepụta iwu moto robot ozugbo. Ha dị mkpa n'ihi na ha na-ebute nghọta zuru oke nke ụdị ntọala na igwe anụ ahụ, na-ahapụ ka otu ụdị chịkwaa robot n'ọtụtụ ọrụ kama iji aka na-edepụta àgwà ọ bụla.

Ọhụụ-Asụsụ-Ihe Nlereanya maka Robotics bụ nke na-arụ ọrụ n'ọhụụ kọmputa nke na-akọwa ma ọ bụ mepụta mgbasa ozi anya maka nyocha, arụmọrụ, na imepụta ihe.

Ime miri emi

Ihe nlereanya VLA na-ejikọta iyi atọ: ọhụụ (okirikiri igwefoto), asụsụ (ihe mgbaru ọsọ dị ka 'tinye iko n'ime sink'), na ime ihe (akụkụ ọnụ, gripper open/ close, or end-effector velocities). Google DeepMind's RT-2 bụ ihe ama ama: ọ were ụdị asụsụ ọhụụ zụrụ na onyonyo weebụ na ederede, wee mekọrịta ya nke ọma na trajectories robot ka otu netwọk ahụ nwere ike ịza 'gịnị mkpụrụ bụ nke a?' na-ewepụtakwa omume tokened dị ka ederede. Mepee ụdị dị ka OpenVLA (nkeji 7B) na ọgụgụ isi nke anụ ahụ pi-0 sochiri. N'ụzọ dị mkpa, ụdị ndị a na-egosi ịnyefe 'ngwa ngwa': ihe ọmụma weebụ (ịghọta akara ngosi akara ngosi, ịghọta 'nke nta') na-arụ ọrụ, ya mere robot na-ejikọta ihe na ntụziaka ọ na-ahụtụbeghị n'oge ọzụzụ robot.

Nghọta nka nka

Ọtụtụ VLA na-amapụ omume na-aga n'ihu n'ime akara ka onye ngbanwe nwere ike ibu amụma na-akpaghị aka, dị ka okwu. Maapụ RT-2 na-esetịpụ akụkụ omume ọ bụla gaa na otu n'ime bins 256 wee wepụta ha dị ka eriri ederede. Ụdị ọhụrụ dị ka pi-0 na-etinye mgbasa ozi ma ọ bụ na-asọba 'ọkachamara ihe omume' n'isi n'ọkpụkpụ azụ nke asụsụ ọhụụ kpọnwụrụ akpọnwụ, na-emepụta chunks dị elu dị elu (dịka, 50 Hz) kama otu usoro pụrụ iche, na-eme ka ọ dị mma.

Ịmụta Ụdị Ọhụụ-Asụsụ- Omume maka Robotics

Ụdị Ọhụụ-Asụsụ-Ọrụ (VLA) bụ nnukwu netwọkụ akwara ozi na-ewere onyonyo igwefoto gbakwunyere ntuziaka edere na iwepụta iwu moto robot ozugbo. Ha dị mkpa n'ihi na ha na-ebute nghọta zuru oke nke ụdị ntọala na igwe anụ ahụ, na-ahapụ ka otu ụdị chịkwaa robot n'ọtụtụ ọrụ kama iji aka na-edepụta àgwà ọ bụla. Ọhụụ-Asụsụ-Ihe Nlereanya maka Robotics bụ nke na-arụ ọrụ n'ọhụụ kọmputa nke na-akọwa ma ọ bụ mepụta mgbasa ozi anya maka nyocha, arụmọrụ, na imepụta ihe. Iji wulite nghọta miri emi, na-emeso Models Vision-Language-Action Models for Robotics dị ka ihe eji arụ ọrụ, ọ bụghị otu akụkụ: kọwaa nsonaazụ achọrọ, dokwuo anya echiche, kewaa ihe sistemụ nwere ike ime nke ọma na ihe ka na-achọ mkpebi ndị ọkachamara.

Na omume, ndị otu siri ike na-eji Ọhụụ-Asụsụ-Ọrụ Models maka Robotics itule ziri ezi na eziokwu arụ ọrụ dị ka ogo data, iche iche ọkụ, na ịdekọ aha. Ha na-edepụta njirisi ịga nke ọma nke ọma, nwalee megide data ziri ezi yana usoro ọrụ, yana na-atụgharị dabere na usoro ọdịda ahụrụ karịa karịa mmeri otu oge. Nke a bụ ebe nghọta usoro ihe atụ na-atụgharị ghọọ ike na-adịgide adịgide n'ofe ngwaahịa, amụma na arụmọrụ.

Visual AI nwere ike megharịa nyocha, nchọpụta na mkpado ọrụ n'ọtụtụ. N'otu oge ahụ, ikike onyonyo na nkwenye nwere ike bụrụ ihe egwu iwu ma ọ bụrụ na edoghị anya. Ụzọ kachasị na-agbanwe agbanwe bụ ijikọ ọsọ nnwale na ịdọ aka ná ntị ọchịchị: ndị na-anya ụgbọ elu, ijide ihe akaebe, bipụta ndekọ mkpebi, na na-aga n'ihu na-emelite nchekwa dị ka omume nlereanya, atụmanya ndị ọrụ, na ihe iwu chọrọ.

Mmetụta atụmatụ

Visual AI nwere ike megharịa nyocha, nchọpụta na mkpado ọrụ n'ọtụtụ.

Visual AI nwere ike megharịa nyocha, nchọpụta na mkpado ọrụ n'ọtụtụ. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.

Otu ndị na-emepụta ihe nwere ike imepụta echiche ngwa ngwa site na ngbanwe akwụkwọ ntuziaka ole na ole.

Otu ndị na-emepụta ihe nwere ike imepụta echiche ngwa ngwa site na ngbanwe akwụkwọ ntuziaka ole na ole. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.

Ọrụ nwere ike iji onyonyo na akara vidiyo siri ike ịhazi.

Ọrụ nwere ike iji onyonyo na akara vidiyo siri ike ịhazi. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.

Ọdịnihu nke Ọhụụ-Asụsụ-Ụdị Omume maka Robotics

Na-atụ anya nnukwu datasets cross-embodiment (mgbalị Mepee X-Embodiment na-etinyerị data sitere na ụdị robot 22+) yabụ otu ụdị na-ebugharị ogwe aka, humanoids, na ntọala mkpanaka. Nchọcha na-akwalite nhọpụta ngwa ngwa maka njikwa oge, 3D bara ụba na ntinye aka, yana ụdọ echiche ebe ihe nlereanya ahụ 'na-eche' tupu ya emee ihe. Ebumnobi bụ otu amụma izugbe ị nwere ike kpalite n'asụsụ bekee dị larịị, yana mgbazi na-efe efe, dị ka iso onye inyeaka kparịta ụka.

Mmejuputa n'ezie n'ụwa

RT-2 na-achịkwa robot kichin Google iji 'bugharịa banana ahụ gaa na nọmba 3' site na iji ọnụọgụ ọ mụtara na ederede webụ, ọ bụghị ngosi robot.

OpenVLA, ihe ngosi 7B mepere emepe, nke ụlọ nyocha na-eme nke ọma ka ọ na-etinye tebụl na ebe dị ọnụ ala.

Ọgụgụ isi nke anụ ahụ pi-0 na-ehicha akwa ma na-ekpochapụ tebụl site na ijikọ ọtụtụ obere nka site na otu nkuzi.

Otu ogwe aka ụlọ nkwakọba ihe gwara 'buru ihe kacha emebi emebi' wee chepụta ihe sitere na ọdịdị anya ya

Usoro mmejuputa

Ọhụụ-Asụsụ-Ụdị omume maka Robotics na omume

RT-2 na-achịkwa robot kichin Google iji 'bugharịa banana gaa na nọmba 3' site na iji mkpụrụ edemede ọ mụtara na ederede webụ, ọ bụghị ngosi robot.

RT-2 na-achịkwa robot kichin Google iji 'bugharịa banana gaa na nọmba 3' site na iji ọnụọgụ ọ mụtara site na ederede webụ, ọ bụghị ihe ngosi robot Otu na-enwetakarị nsonaazụ ka mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka ọnụ okwu, ma soro ma uru nrụpụta na ụgwọ njehie na oge.

Ọhụụ-Asụsụ-Ụdị omume maka Robotics na omume

OpenVLA, ihe ngosi 7B mepere emepe, nke ụlọ nyocha na-eme nke ọma ka ọ na-etinye tebụl na ebe dị ọnụ ala.

OpenVLA, ihe ngosi 7B mepere emepe, nke a na-enyocha nke ọma site na ụlọ nyocha iji na-eme tabletop pick-na-ebe na ogwe aka dị ọnụ ala Ndị otu na-enwetakarị nsonaazụ kacha mma mgbe ha kọwapụtara ọnụ ụzọ dị mma n'ihu, na-echekwa ụzọ mmụba mmadụ maka ikpe ọnụ, ma soro ma uru nrụpụta yana ụgwọ njehie n'oge.

Ọhụụ-Asụsụ-Ụdị omume maka Robotics na omume

Ọgụgụ isi nke anụ ahụ pi-0 mpịachi na-asa ákwà na ikpochapụ a table site na ịgbụ ọtụtụ sub-nkà site na otu ntụziaka.

Pi-0 ọgụgụ isi nke anụ ahụ na-ehicha akwa na ikpochapụ tebụl site n'ịkpọkọta ọtụtụ nkà site na otu ntụziaka Otu egwuregwu na-enwetakarị nsonaazụ ka mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka ikpe ikpe, ma soro ma uru nrụpụta na ụgwọ njehie na oge.

Ọhụụ-Asụsụ-Ụdị omume maka Robotics na omume

Otu ogwe aka ụlọ nkwakọba ihe gwara 'buru ihe kacha emebi emebi' wee chepụta ihe sitere na ọdịdị anya ya.

Otu ogwe aka ụlọ nkwakọba ihe gwara 'họrọ ihe kachasị emebi emebi' na ịkọwapụta ihe sitere na ọdịdị anya ya Ndị otu na-enwetakarị nsonaazụ ka mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka ikpe ikpe, ma soro ma uru nrụpụta yana ụgwọ njehie n'ime oge.

Ihe ize ndụ & okporo ụzọ nche

!

Ikike onyonyo na nkwenye nwere ike bụrụ ihe egwu dị n'iwu ma ọ bụrụ na edoghị anya.

!

Ọrụ nlereanya nwere ike ịdịgasị iche n'ofe ọkụ, igwe mmadụ, na gburugburu.

!

Enwere ike ghara ịhụ ihe dị mma ma ọ bụrụ na enyochaghị oke ntụkwasị obi.

Map mmejuputa

1

Kọwaa ụkpụrụ nnabata maka nkenke, icheta, na ụgwọ njehie.

Kọwaa ụkpụrụ nnabata maka nkenke, icheta, na ụgwọ njehie. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

2

Nwalee na data dabara na ọnọdụ mmepụta n'ezie.

Nwalee na data dabara na ọnọdụ mmepụta n'ezie. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

3

Tinye nyocha mmadụ maka obere obi ike ma ọ bụ amụma mmetụta dị elu.

Tinye nyocha mmadụ maka obere obi ike ma ọ bụ amụma mmetụta dị elu. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

4

Sochie ihe nlere anya wee megharịa ka emechara mgbanwe igwefoto ma ọ bụ dataset.

Sochie ihe nlere anya wee megharịa ka emechara mgbanwe igwefoto ma ọ bụ dataset. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.

Nọgide na-eme nchọpụta