ΟΔΗΓΟΣ οπτικού AI

Gaussian Splatting

Το Gaussian Splatting αντιπροσωπεύει μια τρισδιάστατη σκηνή ως εκατομμύρια μικροσκοπικές, χρωματιστές, ημιδιαφανείς σταγόνες που μπορούν να αποδοθούν σε πραγματικό χρόνο.

Επισκόπηση

Το Gaussian Splatting αντιπροσωπεύει μια τρισδιάστατη σκηνή ως εκατομμύρια μικροσκοπικές, χρωματιστές, ημιδιαφανείς σταγόνες που μπορούν να αποδοθούν σε πραγματικό χρόνο. Προσφέρει φωτορεαλισμό τύπου NeRF ενώ λειτουργεί αρκετά γρήγορα για διαδραστική προβολή.

Το Gaussian Splatting ανήκει σε ροές εργασιών όρασης υπολογιστή που ερμηνεύουν ή δημιουργούν οπτικά μέσα για ανάλυση, λειτουργίες και δημιουργικότητα.

Βαθιά κατάδυση

Το 3D Gaussian Splatting, που παρουσιάστηκε στο SIGGRAPH 2023, αναδομεί σκηνές από φωτογραφίες όπως το NeRF, αλλά χρησιμοποιεί μια ρητή αναπαράσταση αντί για ένα κρυφό νευρωνικό δίκτυο. Κάθε σκηνή είναι ένα σύννεφο από τρισδιάστατα Gaussians, ασαφείς ελλειψοειδείς κηλίδες, και κάθε σταγόνα αποθηκεύει μια θέση, ένα μέγεθος και τον προσανατολισμό (τη συνδιακύμανσή της), μια αδιαφάνεια και ένα χρώμα. Αντί να εκτοξεύει αργά ακτίνες μέσα από ένα δίκτυο, η μέθοδος «πιτσίζει» αυτές τις σταγόνες απευθείας στην οθόνη και τις αναμειγνύει, μια διαδικασία πιο κοντά στην παραδοσιακή ραστεροποίηση και επομένως πολύ γρήγορη. Η εκπαίδευση ξεκινά από ένα σύννεφο αραιού σημείου που παράγεται από τη βαθμονόμηση της κάμερας, στη συνέχεια βελτιστοποιεί τις σταγόνες, ενώ προσθέτει προσαρμοστικά λεπτομέρεια όπου η σκηνή δεν έχει ανακατασκευαστεί και περικόπτει εκεί όπου είναι υπερπληθυσμένη. Το αποτέλεσμα είναι απόδοση σε πραγματικό χρόνο στα 1080p με ποιότητα που συναγωνίζεται τα καλύτερα NeRF, γι' αυτό εξαπλώθηκε γρήγορα μέσω γραφικών και εργαλείων λήψης.

Τεχνική διορατικότητα

Το κλειδί είναι ένας διαφοροποιήσιμος ραστεροποιητής που βασίζεται σε πλακίδια. Τα τρισδιάστατα Gaussians προβάλλονται σε 2D, ταξινομούνται κατά βάθος και αναμειγνύονται με άλφα ανά πλακίδιο οθόνης, επομένως η απόδοση αποφεύγει την πορεία ακτίνων ανά εικονοστοιχείο που κάνει το NeRF αργό. Το χρώμα αποθηκεύεται με σφαιρικές αρμονικές, επιτρέποντας σε κάθε σταγόνα να αλλάξει εμφάνιση με τη γωνία θέασης για να συλλάβει τις αντανακλάσεις. Επειδή ολόκληρος ο αγωγός είναι διαφοροποιήσιμος, η ίδια κάθοδος κλίσης αντιστοίχισης φωτογραφιών που χρησιμοποιείται από το NeRF βελτιστοποιεί τις θέσεις, τα σχήματα, τις αδιαφάνειες και τα χρώματα, ενώ ένα βήμα πυκνοποίησης μεγαλώνει ή χωρίζει τα Gaussians για να προσθέσει λεπτομέρειες που λείπουν.

Mastering Gaussian Splatting

Το Gaussian Splatting αντιπροσωπεύει μια τρισδιάστατη σκηνή ως εκατομμύρια μικροσκοπικές, χρωματιστές, ημιδιαφανείς σταγόνες που μπορούν να αποδοθούν σε πραγματικό χρόνο. Προσφέρει φωτορεαλισμό τύπου NeRF ενώ λειτουργεί αρκετά γρήγορα για διαδραστική προβολή. Το Gaussian Splatting ανήκει σε ροές εργασιών όρασης υπολογιστή που ερμηνεύουν ή δημιουργούν οπτικά μέσα για ανάλυση, λειτουργίες και δημιουργικότητα. Για να δημιουργήσετε βαθιά κατανόηση, αντιμετωπίστε το Gaussian Splatting ως λειτουργικό μοντέλο, όχι ως ένα μεμονωμένο χαρακτηριστικό: ορίστε τα επιθυμητά αποτελέσματα, διευκρινίστε τις υποθέσεις και διαχωρίστε τι μπορεί να κάνει το σύστημα με αξιοπιστία από αυτό που απαιτεί ακόμα την κρίση των ειδικών.

Στην πράξη, ισχυρές ομάδες που χρησιμοποιούν Gaussian Splatting εξισορροπούν την ακρίβεια με λειτουργικές πραγματικότητες όπως η ποιότητα των δεδομένων, η διακύμανση φωτισμού και η συνέπεια των ετικετών. Τεκμηριώνουν ρητά κριτήρια επιτυχίας, δοκιμάζουν με ρεαλιστικά δεδομένα και ροές εργασίας και επαναλαμβάνουν με βάση τα παρατηρούμενα μοτίβα αποτυχίας και όχι τις εφάπαξ νίκες αναφοράς. Αυτό είναι όπου η θεωρητική κατανόηση μετατρέπεται σε ανθεκτική ικανότητα σε όλα τα προϊόντα, την πολιτική και τις λειτουργίες.

Το Visual AI μπορεί να αυτοματοποιήσει εργασίες επιθεώρησης, ανίχνευσης και επισήμανσης σε κλίμακα. Ταυτόχρονα, τα δικαιώματα εικόνας και η συναίνεση μπορεί να αποτελέσουν νομικούς κινδύνους εάν η προέλευση είναι ασαφής. Η πιο ανθεκτική προσέγγιση είναι ο συνδυασμός της ταχύτητας πειραματισμού με την πειθαρχία διακυβέρνησης: εκτέλεση πιλότων, λήψη στοιχείων, δημοσίευση αρχείων καταγραφής αποφάσεων και συνεχής ενημέρωση των διασφαλίσεων καθώς εξελίσσονται η συμπεριφορά του μοντέλου, οι προσδοκίες των χρηστών και οι ρυθμιστικές απαιτήσεις.

Στρατηγικός αντίκτυπος

Το Visual AI μπορεί να αυτοματοποιήσει εργασίες επιθεώρησης, ανίχνευσης και επισήμανσης σε κλίμακα.

Το Visual AI μπορεί να αυτοματοποιήσει εργασίες επιθεώρησης, ανίχνευσης και επισήμανσης σε κλίμακα. Σε αναπτύξεις υψηλής ποιότητας, αυτό μεταφράζεται σε μετρήσιμους κανόνες λειτουργίας, όρια ιδιοκτησίας και επαναλαμβανόμενα τελετουργικά ελέγχου, ώστε οι ομάδες να μπορούν να κλιμακώνουν την εμπιστοσύνη αντί να κλιμακώνουν την ασάφεια.

Οι δημιουργικές ομάδες μπορούν να δημιουργήσουν πρωτότυπες ιδέες γρηγορότερα με λιγότερες μη αυτόματες αναθεωρήσεις.

Οι δημιουργικές ομάδες μπορούν να δημιουργήσουν πρωτότυπες ιδέες γρηγορότερα με λιγότερες μη αυτόματες αναθεωρήσεις. Σε αναπτύξεις υψηλής ποιότητας, αυτό μεταφράζεται σε μετρήσιμους κανόνες λειτουργίας, όρια ιδιοκτησίας και επαναλαμβανόμενα τελετουργικά ελέγχου, ώστε οι ομάδες να μπορούν να κλιμακώνουν την εμπιστοσύνη αντί να κλιμακώνουν την ασάφεια.

Οι λειτουργίες μπορούν να χρησιμοποιούν σήματα εικόνας και βίντεο που προηγουμένως ήταν δύσκολο να επεξεργαστούν.

Οι λειτουργίες μπορούν να χρησιμοποιούν σήματα εικόνας και βίντεο που προηγουμένως ήταν δύσκολο να επεξεργαστούν. Σε αναπτύξεις υψηλής ποιότητας, αυτό μεταφράζεται σε μετρήσιμους κανόνες λειτουργίας, όρια ιδιοκτησίας και επαναλαμβανόμενα τελετουργικά ελέγχου, ώστε οι ομάδες να μπορούν να κλιμακώνουν την εμπιστοσύνη αντί να κλιμακώνουν την ασάφεια.

Το μέλλον του Gaussian Splatting

Το Gaussian Splatting προχωρά γρήγορα από την έρευνα σε προϊόντα για τρισδιάστατη λήψη, χαρτογράφηση και εικονική παραγωγή, εν μέρει επειδή αποδίδει σε πραγματικό χρόνο σε GPUs καταναλωτών και ακόμη και προγράμματα περιήγησης. Η ενεργή εργασία στοχεύει στη συρρίκνωση των μεγεθών αρχείων (οι σκηνές μπορεί να είναι μεγάλες), στο χειρισμό δυναμικών και κινούμενων σκηνών, στον επαναφωτισμό και στην επεξεργασία μεμονωμένων αντικειμένων. Περιμένετε στενότερη ενσωμάτωση με μηχανές παιχνιδιών και AR/VR, υβριδικές μεθόδους που συνδυάζουν splats με πλέγματα και λήψη βίντεο από το τηλέφωνο. Θεωρείται ολοένα και περισσότερο ως πρακτικό συμπλήρωμα ή αντικατάσταση του NeRF οπουδήποτε έχει σημασία η διαδραστική ταχύτητα.

Υλοποίηση σε πραγματικό κόσμο

Δημιουργία σε πραγματικό χρόνο, εξερευνήσιμες τρισδιάστατες λήψεις δωματίων ή προϊόντων για τον Ιστό

Εικονική παραγωγή και προοπτική προβολή ταινιών με φωτορεαλιστικά, πλοηγήσιμα σκηνικά

Γρήγορη τρισδιάστατη σάρωση αντικειμένων και περιβαλλόντων από τηλέφωνο ή βίντεο drone

Δημιουργία διαδραστικών σκηνών AR/VR που λειτουργούν ομαλά σε καταναλωτικό υλικό

Πρότυπα Υλοποίησης

Gaussian Splatting στην πράξη

Δημιουργία σε πραγματικό χρόνο, εξερευνήσιμες τρισδιάστατες λήψεις δωματίων ή προϊόντων για τον Ιστό.

Δημιουργία σε πραγματικό χρόνο, εξερευνήσιμες τρισδιάστατες λήψεις δωματίων ή προϊόντων για τον ιστό Οι ομάδες συνήθως έχουν καλύτερα αποτελέσματα όταν ορίζουν κατώφλια ποιότητας εκ των προτέρων, διατηρούν μια ανθρώπινη διαδρομή κλιμάκωσης για περιπτώσεις αιχμής και παρακολουθούν τόσο τα κέρδη παραγωγικότητας όσο και το κόστος σφαλμάτων με την πάροδο του χρόνου.

Gaussian Splatting στην πράξη

Εικονική παραγωγή και προοπτική προβολή ταινιών με φωτορεαλιστικά, πλοηγήσιμα σκηνικά.

Εικονική παραγωγή και προοπτικοποίηση ταινιών με φωτορεαλιστικά, πλοηγήσιμα σύνολα Οι ομάδες συνήθως έχουν καλύτερα αποτελέσματα όταν ορίζουν κατώφλια ποιότητας εκ των προτέρων, διατηρούν μια ανθρώπινη πορεία κλιμάκωσης για περιπτώσεις αιχμής και παρακολουθούν τόσο τα κέρδη παραγωγικότητας όσο και το κόστος σφαλμάτων με την πάροδο του χρόνου.

Gaussian Splatting στην πράξη

Γρήγορη τρισδιάστατη σάρωση αντικειμένων και περιβαλλόντων από τηλέφωνο ή βίντεο drone.

Γρήγορη τρισδιάστατη σάρωση αντικειμένων και περιβαλλόντων από ένα τηλέφωνο ή βίντεο drone Οι ομάδες συνήθως έχουν καλύτερα αποτελέσματα όταν ορίζουν κατώφλια ποιότητας εκ των προτέρων, διατηρούν μια ανθρώπινη διαδρομή κλιμάκωσης για ακραίες περιπτώσεις και παρακολουθούν τόσο τα κέρδη παραγωγικότητας όσο και το κόστος σφαλμάτων με την πάροδο του χρόνου.

Gaussian Splatting στην πράξη

Δημιουργία διαδραστικών σκηνών AR/VR που λειτουργούν ομαλά σε καταναλωτικό υλικό.

Δημιουργία διαδραστικών σκηνών AR/VR που εκτελούνται ομαλά σε καταναλωτικό υλικό Οι ομάδες συνήθως έχουν καλύτερα αποτελέσματα όταν ορίζουν κατώφλια ποιότητας εκ των προτέρων, διατηρούν μια ανθρώπινη διαδρομή κλιμάκωσης για περιπτώσεις αιχμής και παρακολουθούν τόσο τα κέρδη παραγωγικότητας όσο και το κόστος σφαλμάτων με την πάροδο του χρόνου.

Κίνδυνοι & προστατευτικά κιγκλιδώματα

!

Τα δικαιώματα εικόνας και η συναίνεση μπορεί να αποτελέσουν νομικούς κινδύνους εάν η προέλευση είναι ασαφής.

!

Η απόδοση του μοντέλου μπορεί να διαφέρει ανάλογα με το φωτισμό, τα δημογραφικά στοιχεία και τα περιβάλλοντα.

!

Τα ψευδώς θετικά μπορεί να περάσουν απαρατήρητα εκτός εάν παρακολουθούνται τα όρια εμπιστοσύνης.

Οδικός Χάρτης Εφαρμογής

1

Καθορίστε κριτήρια αποδοχής για το κόστος ακρίβειας, ανάκλησης και σφάλματος.

Καθορίστε κριτήρια αποδοχής για το κόστος ακρίβειας, ανάκλησης και σφάλματος. Αντιμετωπίστε κάθε βήμα ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

2

Δοκιμή με δεδομένα που ταιριάζουν με πραγματικές συνθήκες παραγωγής.

Δοκιμή με δεδομένα που ταιριάζουν με πραγματικές συνθήκες παραγωγής. Αντιμετωπίστε κάθε βήμα ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

3

Προσθέστε ανθρώπινη κριτική για προβλέψεις χαμηλής εμπιστοσύνης ή υψηλού αντίκτυπου.

Προσθέστε ανθρώπινη κριτική για προβλέψεις χαμηλής εμπιστοσύνης ή υψηλού αντίκτυπου. Αντιμετωπίστε κάθε βήμα ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

4

Παρακολουθήστε τη μετατόπιση του μοντέλου και επικυρώστε εκ νέου μετά από αλλαγές κάμερας ή δεδομένων.

Παρακολουθήστε τη μετατόπιση του μοντέλου και επικυρώστε εκ νέου μετά από αλλαγές κάμερας ή δεδομένων. Αντιμετωπίστε κάθε βήμα ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

Συνεχίστε την εξερεύνηση