Nchịkọta
DepthAnything bụ ụdị ntọala nke na-eme atụmatụ ka pikselụ ọ bụla dị anya site na otu foto nkịtị, na-enweghị ngwaike pụrụ iche. Ọ mere omimi siri ike, ebumnuche izugbe na-ahụta dị ọnụ ala yana ịnweta maka ihe ọ bụla site na ekwentị ruo na robots.
Omimi ihe ọ bụla Monocular Omimi bụ nke kọmpụta na-arụ ọrụ ọhụụ nke na-akọwa ma ọ bụ mepụta mgbasa ozi anya maka nyocha, ọrụ na imepụta ihe.
Ime miri emi
DepthAnything (2024, nke ndị nyocha wepụtara gụnyere ndị nọ na TikTok/ByteDance na HKU) na-eme atụmatụ omimi nke monocular: ịkọ maapụ omimi site na otu onyonyo RGB. Ọganihu ya bụ ọnụ ọgụgụ: kama ịdabere naanị na ntakịrị data omimi akpọrọ dị, ndị otu ahụ wuru injin nke ejiri akara ngosi nde 62 na-enweghị akara site na iji ụdị onye nkuzi wee zụọ nwa akwụkwọ na nnukwu ụlọ ọrụ a. Nke a na-enye nkọwapụta efu efu n'ofe ime ụlọ, n'èzí na ihe nkiri pụrụ iche. Nsonaazụ mbụ a na-egosi omimi dị omimi (nke pikselụ dị nso ma ọ bụ karịa, ọ bụghị kpọmkwem mita). Omimi ihe ọ bụla V2 (n'etiti 2024) na-eme ka nkọwa dị mma site n'ịzụ onye nkuzi banyere data sịntetik na ezi-okwu zuru oke, wee na-atụgharị na foto n'ezie, na-edozi akụkụ ndị na-adịghị mma na njehie ihe doro anya.
Nghọta nka nka
Ọ na-eji DINov2 ntụgharị ihe ntụgharị ọhụụ na-enye isi amụma oke ụdị DPT. Isi aghụghọ bụ distillation nke a na-ahụ maka ọkara: onye nkuzi zụrụ azụ na data pseudo-labeled ọtụtụ nde onyonyo enweghị akara, nwa akwụkwọ na-amụtakwa na ha abụọ. V2 na-agbanwe ezigbo akara mkpọtụ maka data sịntetik na omimi pikselụ zuru oke, wee tụgharịa azụ na foto n'ezie, na-ewepụ ụkọ na mkpọtụ nkọwa nkọwa dị omimi ma na-edobe oke.
Ịmụta Omimi Ihe ọ bụla Monocular Omimi
DepthAnything bụ ụdị ntọala nke na-eme atụmatụ ka pikselụ ọ bụla dị anya site na otu foto nkịtị, na-enweghị ngwaike pụrụ iche. Ọ mere omimi siri ike, ebumnuche izugbe na-ahụta dị ọnụ ala yana ịnweta maka ihe ọ bụla site na ekwentị ruo na robots. Omimi ihe ọ bụla Monocular Omimi bụ nke kọmpụta na-arụ ọrụ ọhụụ nke na-akọwa ma ọ bụ mepụta mgbasa ozi anya maka nyocha, ọrụ na imepụta ihe. Iji wuo nghọta miri emi, na-emeso DepthAnything Monocular Depth dị ka ihe nlereanya na-arụ ọrụ, ọ bụghị otu njirimara: kọwaa nsonaazụ achọrọ, dokwuo anya echiche, ma kewapụ ihe usoro ahụ nwere ike ime nke ọma na ihe ka na-achọ mkpebi ndị ọkachamara.
Na omume, ndị otu siri ike na-eji DepthAnything Monocular Depth itule ziri ezi yana ezigbo arụmọrụ dị ka ogo data, iche iche ọkụ, na ịkpọ aha. Ha na-edepụta njirisi ịga nke ọma nke ọma, nwalee megide data ziri ezi yana usoro ọrụ, yana na-atụgharị dabere na usoro ọdịda ahụrụ karịa karịa mmeri otu oge. Nke a bụ ebe nghọta usoro ihe atụ na-atụgharị ghọọ ike na-adịgide adịgide n'ofe ngwaahịa, amụma na arụmọrụ.
Visual AI nwere ike megharịa nyocha, nchọpụta na mkpado ọrụ n'ọtụtụ. N'otu oge ahụ, ikike onyonyo na nkwenye nwere ike bụrụ ihe egwu iwu ma ọ bụrụ na edoghị anya. Ụzọ kachasị na-agbanwe agbanwe bụ ijikọ ọsọ nnwale na ịdọ aka ná ntị ọchịchị: ndị na-anya ụgbọ elu, ijide ihe akaebe, bipụta ndekọ mkpebi, na na-aga n'ihu na-emelite nchekwa dị ka omume nlereanya, atụmanya ndị ọrụ, na ihe iwu chọrọ.
Mmetụta atụmatụ
Visual AI nwere ike megharịa nyocha, nchọpụta na mkpado ọrụ n'ọtụtụ.
Visual AI nwere ike megharịa nyocha, nchọpụta na mkpado ọrụ n'ọtụtụ. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Otu ndị na-emepụta ihe nwere ike imepụta echiche ngwa ngwa site na ngbanwe akwụkwọ ntuziaka ole na ole.
Otu ndị na-emepụta ihe nwere ike imepụta echiche ngwa ngwa site na ngbanwe akwụkwọ ntuziaka ole na ole. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Ọrụ nwere ike iji onyonyo na akara vidiyo siri ike ịhazi.
Ọrụ nwere ike iji onyonyo na akara vidiyo siri ike ịhazi. N'ịkwanye ọkwa dị elu, a na-atụgharị nke a ka ọ bụrụ iwu arụ ọrụ enwere ike ịtụnye, oke nwe, na emume ntụlegharị ugboro ugboro ka ndị otu wee nwee ike ịbawanye ntụkwasị obi kama iwelite enweghị mgbagha.
Mmejuputa n'ezie n'ụwa
Na-emepụta maapụ omimi iji chụpụ ezigbo nhụsianya ndabere (bokeh) na foto eserese ekwentị nwere otu oghere.
Inye nghọta ihe mgbochi 3D maka drones dị ọnụ ala na robots na-enweghị LiDAR ma ọ bụ igwefoto stereo.
Ịmepụta maapụ ihe ndozi omimi maka ControlNet ka ndị na-emepụta ihe onyonyo wee chekwaa geometry ọnọdụ.
Na-atụgharị foto na ihe nkiri 2D ka ọ bụrụ mmetụta 3D ma ọ bụ parallax maka ihe ngosi VR na stereoscopic.
Usoro mmejuputa
Omimi Ihe ọ bụla Omimi Monocular na omume
Na-emepụta maapụ omimi iji chụpụ ezigbo nhụsianya ndabere (bokeh) na foto eserese ekwentị nwere otu oghere.
Ịmepụta maapụ omimi iji chụpụ ezigbo blur (bokeh) na foto eserese ekwentị nwere otu oghere Otu dị iche iche na-enweta nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka ikpe ikpe, ma soro ma uru nrụpụta yana ụgwọ njehie n'ime oge.
Omimi Ihe ọ bụla Omimi Monocular na omume
Inye nghọta ihe mgbochi 3D maka drones dị ọnụ ala na robots na-enweghị LiDAR ma ọ bụ igwefoto stereo.
Inye nghọta ihe mgbochi 3D maka drones dị ọnụ ala na robots na-enweghị LiDAR ma ọ bụ igwefoto stereo Ndị otu na-enwetakarị nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, debe ụzọ ịrị elu mmadụ maka ikpe ihu, ma soro ma uru nrụpụta yana ụgwọ njehie n'ime oge.
Omimi Ihe ọ bụla Omimi Monocular na omume
Ịmepụta maapụ ihe ndozi omimi maka ControlNet ka ndị na-emepụta ihe onyonyo wee chekwaa geometry ọnọdụ.
Ịmepụta maapụ ihe ndozi omimi maka ControlNet ka ndị na-emepụta ihe oyiyi na-echekwa geometry ọnọdụ Otu egwuregwu na-enwetakarị nsonaazụ kacha mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ si abawanye maka ọnụ ahịa, ma soro ma uru nrụpụta yana ụgwọ njehie na oge.
Omimi Ihe ọ bụla Omimi Monocular na omume
Na-atụgharị foto na ihe nkiri 2D ka ọ bụrụ mmetụta 3D ma ọ bụ parallax maka ihe ngosi VR na stereoscopic.
Ịtụgharị foto na ihe nkiri 2D n'ime 3D ma ọ bụ mmetụta parallax maka VR na ihe ngosi stereoscopic Otu na-enwetakarị nsonaazụ ka mma mgbe ha na-akọwapụta ọnụ ụzọ dị mma n'ihu, na-eme ka ụzọ mmadụ na-ebuwanye ibu maka ikpe ikpe, ma soro ma uru mmepụta na ụgwọ njehie na oge.
Ihe ize ndụ & okporo ụzọ nche
Ikike onyonyo na nkwenye nwere ike bụrụ ihe egwu dị n'iwu ma ọ bụrụ na edoghị anya.
Ọrụ nlereanya nwere ike ịdịgasị iche n'ofe ọkụ, igwe mmadụ, na gburugburu.
Enwere ike ghara ịhụ ihe dị mma ma ọ bụrụ na enyochaghị oke ntụkwasị obi.
Map mmejuputa
Kọwaa ụkpụrụ nnabata maka nkenke, icheta, na ụgwọ njehie.
Kọwaa ụkpụrụ nnabata maka nkenke, icheta, na ụgwọ njehie. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Nwalee na data dabara na ọnọdụ mmepụta n'ezie.
Nwalee na data dabara na ọnọdụ mmepụta n'ezie. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Tinye nyocha mmadụ maka obere obi ike ma ọ bụ amụma mmetụta dị elu.
Tinye nyocha mmadụ maka obere obi ike ma ọ bụ amụma mmetụta dị elu. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.
Sochie ihe nlere anya wee megharịa ka emechara mgbanwe igwefoto ma ọ bụ dataset.
Sochie ihe nlere anya wee megharịa ka emechara mgbanwe igwefoto ma ọ bụ dataset. Mesoo nzọụkwụ ọ bụla dị ka ọnụ ụzọ akaebe: ọ bụrụ na emezughị ụkpụrụ, kwụsịtụ mbugharị, mechie oghere ahụ, naanị wee gbasaa ojiji.