ΟΔΗΓΟΣ ΒΑΣΙΚΩΝ

Υπόθεση λαχείου

Η Υπόθεση Εισιτηρίου Λοταρίας λέει ότι μέσα σε ένα μεγάλο, τυχαία αρχικοποιημένο νευρωνικό δίκτυο κρύβεται ένα μικρό υποδίκτυο — ένα «κερδισμένο εισιτήριο» — το οποίο, εκπαιδευμένο μόνο από τα ίδια αρχικά βάρη, μπορεί να ταιριάζει με την ακρίβεια του πλήρους δικτύου.

Επισκόπηση

Η Υπόθεση Εισιτηρίου Λοταρίας λέει ότι μέσα σε ένα μεγάλο, τυχαία αρχικοποιημένο νευρωνικό δίκτυο κρύβεται ένα μικρό υποδίκτυο — ένα «κερδισμένο εισιτήριο» — το οποίο, εκπαιδευμένο μόνο από τα ίδια αρχικά βάρη, μπορεί να ταιριάζει με την ακρίβεια του πλήρους δικτύου. Έχει σημασία γιατί υποδηλώνει ότι εκπαιδεύουμε πολύ περισσότερες παραμέτρους από όσες πραγματικά χρειαζόμαστε.

Η Υπόθεση Εισιτηρίων Λοταρίας βρίσκεται στην βασική εργαλειοθήκη AI. Όταν το καταλαβαίνετε, άλλα θέματα τεχνητής νοημοσύνης γίνονται πιο εύκολο να αξιολογηθούν και να συγκριθούν.

Βαθιά κατάδυση

Προτάθηκε από τους Jonathan Frankle και Michael Carbin στο MIT το 2018, η υπόθεση προέκυψε από έρευνα κλαδέματος. Κανονικά μπορείτε να κλαδέψετε ένα εκπαιδευμένο δίκτυο στο 10-20% των βαρών του χωρίς να χάσετε την ακρίβεια, αλλά η εκπαίδευση αυτού του μικρού δικτύου από την αρχή αποτυγχάνει. Ο Frankle και ο Carbin βρήκαν το κόλπο: να διατηρήσουν τα αρχικά αρχικά βάρη των επιζώντων συνδέσεων. Αυτό το αραιό υποδίκτυο - το νικητήριο δελτίο - στη συνέχεια εκπαιδεύεται με πλήρη ακρίβεια μεμονωμένα, μερικές φορές πιο γρήγορα από το πυκνό πρωτότυπο. Αναγνώρισαν τα εισιτήρια μέσω του «επαναληπτικού κλαδέματος»: τρένο, κλάδεψε τα βάρη μικρότερου μεγέθους, τύλιξε τα υπόλοιπα στις αρχικές τους τιμές και επανάλαβε. Το αποτέλεσμα υποδηλώνει ότι η πυκνή υπερπαραμετροποίηση βοηθά κυρίως τη βελτιστοποίηση να βρει μια καλή αραιή δομή, όχι ότι όλα αυτά τα βάρη είναι ξεχωριστά απαραίτητα.

Τεχνική διορατικότητα

Η βασική διαδικασία είναι το επαναληπτικό κλάδεμα μεγέθους με επανατύλιξη βάρους: μετά την προπόνηση, αφαιρέστε τα βάρη χαμηλότερου μεγέθους, επαναφέρετε τα υπόλοιπα βάρη στην αρχική τους αρχική (ή ένα σημείο ελέγχου πρώιμης προπόνησης, μια βελτίωση που ονομάζεται «επανατύλιξη») και μετά εκπαιδεύστε ξανά. Ο συνδυασμός μιας συγκεκριμένης αραιής μάσκας ΚΑΙ της αντίστοιχης αρχικοποίησής της είναι αυτό που κάνει ένα δελτίο να «κερδίζει» — η τυχαία επανεκκίνηση της ίδιας μάσκας καταστρέφει το αποτέλεσμα.

Mastering Ticket Hypothesis

Η Υπόθεση Εισιτηρίου Λοταρίας λέει ότι μέσα σε ένα μεγάλο, τυχαία αρχικοποιημένο νευρωνικό δίκτυο κρύβεται ένα μικρό υποδίκτυο — ένα «κερδισμένο εισιτήριο» — το οποίο, εκπαιδευμένο μόνο από τα ίδια αρχικά βάρη, μπορεί να ταιριάζει με την ακρίβεια του πλήρους δικτύου. Έχει σημασία γιατί υποδηλώνει ότι εκπαιδεύουμε πολύ περισσότερες παραμέτρους από όσες πραγματικά χρειαζόμαστε. Η Υπόθεση Εισιτηρίων Λοταρίας βρίσκεται στην βασική εργαλειοθήκη AI. Όταν το καταλαβαίνετε, άλλα θέματα τεχνητής νοημοσύνης γίνονται πιο εύκολο να αξιολογηθούν και να συγκριθούν. Για να χτίσετε βαθιά κατανόηση, αντιμετωπίστε την Υπόθεση Εισιτηρίων Λοταρίας ως μοντέλο λειτουργίας, όχι ως ένα μεμονωμένο χαρακτηριστικό: ορίστε τα επιθυμητά αποτελέσματα, διευκρινίστε τις υποθέσεις και διαχωρίστε τι μπορεί να κάνει το σύστημα αξιόπιστα από αυτό που απαιτεί ακόμα την κρίση των ειδικών.

Στην πράξη, ισχυρές ομάδες που χρησιμοποιούν την Υπόθεση Εισιτηρίων Λοταρίας κατασκευάζουν πρώτα ισχυρά εννοιολογικά μοντέλα και μετά αντιστοιχίζουν αυτά τα μοντέλα σε πραγματικούς περιορισμούς παραγωγής. Τεκμηριώνουν ρητά κριτήρια επιτυχίας, δοκιμάζουν με ρεαλιστικά δεδομένα και ροές εργασίας και επαναλαμβάνουν με βάση τα παρατηρούμενα μοτίβα αποτυχίας και όχι τις εφάπαξ νίκες αναφοράς. Αυτό είναι όπου η θεωρητική κατανόηση μετατρέπεται σε ανθεκτική ικανότητα σε όλα τα προϊόντα, την πολιτική και τις λειτουργίες.

Σας βοηθά να διαχωρίσετε σαφείς τεχνικούς ισχυρισμούς από τη γλώσσα μάρκετινγκ. Ταυτόχρονα, Διαφορετικές ομάδες μπορεί να χρησιμοποιούν τον ίδιο όρο με διαφορετικό τρόπο, επομένως ορίστε το εύρος νωρίς. Η πιο ανθεκτική προσέγγιση είναι ο συνδυασμός της ταχύτητας πειραματισμού με την πειθαρχία διακυβέρνησης: εκτέλεση πιλότων, λήψη στοιχείων, δημοσίευση αρχείων καταγραφής αποφάσεων και συνεχής ενημέρωση των διασφαλίσεων καθώς εξελίσσονται η συμπεριφορά του μοντέλου, οι προσδοκίες των χρηστών και οι ρυθμιστικές απαιτήσεις.

Στρατηγικός αντίκτυπος

Σας βοηθά να διαχωρίσετε σαφείς τεχνικούς ισχυρισμούς από τη γλώσσα μάρκετινγκ.

Σας βοηθά να διαχωρίσετε σαφείς τεχνικούς ισχυρισμούς από τη γλώσσα μάρκετινγκ. Σε αναπτύξεις υψηλής ποιότητας, αυτό μεταφράζεται σε μετρήσιμους κανόνες λειτουργίας, όρια ιδιοκτησίας και επαναλαμβανόμενα τελετουργικά ελέγχου, ώστε οι ομάδες να μπορούν να κλιμακώνουν την εμπιστοσύνη αντί να κλιμακώνουν την ασάφεια.

Μπορείτε να κάνετε καλύτερες ερωτήσεις εφαρμογής προτού ξοδέψετε χρήματα ή χρόνο.

Μπορείτε να κάνετε καλύτερες ερωτήσεις εφαρμογής προτού ξοδέψετε χρήματα ή χρόνο. Σε αναπτύξεις υψηλής ποιότητας, αυτό μεταφράζεται σε μετρήσιμους κανόνες λειτουργίας, όρια ιδιοκτησίας και επαναλαμβανόμενα τελετουργικά ελέγχου, ώστε οι ομάδες να μπορούν να κλιμακώνουν την εμπιστοσύνη αντί να κλιμακώνουν την ασάφεια.

Οι ομάδες με κοινή κατανόηση λαμβάνουν καλύτερες αποφάσεις για προϊόντα, πολιτικές και μάθηση.

Οι ομάδες με κοινή κατανόηση λαμβάνουν καλύτερες αποφάσεις για προϊόντα, πολιτικές και μάθηση. Σε αναπτύξεις υψηλής ποιότητας, αυτό μεταφράζεται σε μετρήσιμους κανόνες λειτουργίας, όρια ιδιοκτησίας και επαναλαμβανόμενα τελετουργικά ελέγχου, ώστε οι ομάδες να μπορούν να κλιμακώνουν την εμπιστοσύνη αντί να κλιμακώνουν την ασάφεια.

The Future of Lottery Ticket Hypothesis

Τα λαχεία τροφοδοτούν την έρευνα για την εκπαίδευση σε αραιά δίκτυα από την αρχή για εξοικονόμηση υπολογιστών και ενέργειας και για το αν τα εισιτήρια μεταφέρονται σε σύνολα δεδομένων και εργασίες. Η κλιμάκωση του επαναληπτικού κλαδέματος σε μοντέλα δισεκατομμυρίων παραμέτρων παραμένει δαπανηρή, επομένως η εργασία συνεχίζεται για την εύρεση εισιτηρίων φθηνά ή την απόδειξη ότι υπάρχουν (η υπόθεση του «ισχυρού» λαχείου λέει ότι τα εισιτήρια υπάρχουν κατά την προετοιμασία χωρίς καθόλου εκπαίδευση). Αναμένετε συνδέσεις με αποτελεσματικά μοντέλα στη συσκευή και πράσινη τεχνητή νοημοσύνη.

Υλοποίηση σε πραγματικό κόσμο

Συμπίεση ενός μεγάλου ταξινομητή εικόνας σε λιγότερο από το 20% του βάρους του για ανάπτυξη σε ένα τηλέφωνο, διατηρώντας παράλληλα την ακρίβεια

Επιτάχυνση της προπόνησης προσδιορίζοντας και εκπαιδεύοντας μόνο ένα αραιό υποδίκτυο που κερδίζει

Μελέτη της δυνατότητας μεταφοράς βάρους επαναχρησιμοποιώντας ένα εισιτήριο που βρίσκεται σε ένα σύνολο δεδομένων για να ξεκινήσετε την προπόνηση σε ένα σχετικό

Μείωση της ενέργειας και της μνήμης συμπερασμάτων σε συσκευές ακμής στέλνοντας το κλαδευμένο νικητήριο δελτίο αντί για το πυκνό μοντέλο

Πρότυπα Υλοποίησης

Υπόθεση Λαχείου στην πράξη

Συμπίεση ενός μεγάλου ταξινομητή εικόνας σε λιγότερο από το 20% του βάρους του για ανάπτυξη σε ένα τηλέφωνο, διατηρώντας παράλληλα την ακρίβεια.

Συμπίεση ενός μεγάλου ταξινομητή εικόνας σε λιγότερο από το 20% του βάρους του για ανάπτυξη σε ένα τηλέφωνο, διατηρώντας παράλληλα την ακρίβεια Οι ομάδες συνήθως λαμβάνουν καλύτερα αποτελέσματα όταν ορίζουν κατώφλια ποιότητας εκ των προτέρων, διατηρούν μια ανθρώπινη διαδρομή κλιμάκωσης για περιπτώσεις αιχμής και παρακολουθούν τόσο τα κέρδη παραγωγικότητας όσο και το κόστος σφαλμάτων με την πάροδο του χρόνου.

Υπόθεση Λαχείου στην πράξη

Επιτάχυνση της προπόνησης προσδιορίζοντας και εκπαιδεύοντας μόνο ένα αραιό υποδίκτυο που κερδίζει.

Επιτάχυνση της προπόνησης προσδιορίζοντας και εκπαιδεύοντας μόνο ένα αραιό υποδίκτυο που κερδίζει. Οι ομάδες συνήθως έχουν καλύτερα αποτελέσματα όταν ορίζουν κατώφλια ποιότητας εκ των προτέρων, διατηρούν μια ανθρώπινη διαδρομή κλιμάκωσης για περιπτώσεις αιχμής και παρακολουθούν τόσο τα κέρδη παραγωγικότητας όσο και το κόστος σφαλμάτων με την πάροδο του χρόνου.

Υπόθεση Λαχείου στην πράξη

Μελέτη της δυνατότητας μεταφοράς βάρους επαναχρησιμοποιώντας ένα εισιτήριο που βρίσκεται σε ένα σύνολο δεδομένων για να ξεκινήσετε την προπόνηση σε ένα σχετικό.

Μελέτη της δυνατότητας μεταφοράς βάρους επαναχρησιμοποιώντας ένα εισιτήριο που βρίσκεται σε ένα σύνολο δεδομένων για την εκκίνηση της προπόνησης σε ένα σχετικό.

Υπόθεση Λαχείου στην πράξη

Μείωση της ενέργειας και της μνήμης συμπερασμάτων σε συσκευές άκρων με την αποστολή του κλαδευμένου νικητηρίου δελτίου αντί του πυκνού μοντέλου.

Μείωση της ενέργειας και της μνήμης συμπερασμάτων σε συσκευές ακρών αποστέλλοντας το κλαδευμένο νικητήριο δελτίο αντί του πυκνού μοντέλου Οι ομάδες συνήθως έχουν καλύτερα αποτελέσματα όταν ορίζουν κατώφλια ποιότητας εκ των προτέρων, διατηρούν μια ανθρώπινη διαδρομή κλιμάκωσης για τις ακραίες περιπτώσεις και παρακολουθούν τόσο τα κέρδη παραγωγικότητας όσο και το κόστος σφαλμάτων με την πάροδο του χρόνου.

Κίνδυνοι & προστατευτικά κιγκλιδώματα

!

Διαφορετικές ομάδες μπορεί να χρησιμοποιούν τον ίδιο όρο με διαφορετικό τρόπο, επομένως ορίστε το πεδίο εφαρμογής νωρίς.

!

Τα σημεία αναφοράς μπορεί να φαίνονται ισχυρά ενώ η απόδοση στον πραγματικό κόσμο είναι άνιση.

!

Η αγνόηση της ποιότητας των δεδομένων και των σχεδίων αξιολόγησης δημιουργεί συχνά εύθραυστα αποτελέσματα.

Οδικός Χάρτης Εφαρμογής

1

Ξεκινήστε με έναν ορισμό σε απλή γλώσσα του αποτελέσματος που χρειάζεστε.

Ξεκινήστε με έναν ορισμό σε απλή γλώσσα του αποτελέσματος που χρειάζεστε. Αντιμετωπίστε κάθε βήμα ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

2

Επιλέξτε μία μέτρηση επιτυχίας και μία συνθήκη αποτυχίας πριν από τη δοκιμή.

Επιλέξτε μία μέτρηση επιτυχίας και μία συνθήκη αποτυχίας πριν από τη δοκιμή. Αντιμετωπίστε κάθε βήμα ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

3

Εκτελέστε ένα μικρό πιλότο με αντιπροσωπευτικά δεδομένα, όχι ένα εκλεπτυσμένο σετ επίδειξης.

Εκτελέστε ένα μικρό πιλότο με αντιπροσωπευτικά δεδομένα, όχι ένα εκλεπτυσμένο σετ επίδειξης. Αντιμετωπίστε κάθε βήμα ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

4

Τεκμηριώστε πού βοηθάει η Υπόθεση Λαχείου και πού είναι καλύτερες οι απλούστερες μέθοδοι.

Τεκμηριώστε πού βοηθάει η Υπόθεση Λαχείου και πού είναι καλύτερες οι απλούστερες μέθοδοι. Αντιμετωπίστε κάθε βήμα ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

Συνεχίστε την εξερεύνηση