ΟΔΗΓΟΣ ΓΛΩΣΣΑΣ AI

ELMo Contextual Embeddings

Το ELMo (Ενσωματώσεις από γλωσσικά μοντέλα) ήταν μια σημαντική ανακάλυψη του 2018 που έδωσε σε κάθε λέξη μια αναπαράσταση που διαμορφώθηκε από την πρόταση της, επομένως η λέξη «όχθη» στην «όχθη ποταμού» διαφέρει από τη λέξη «όχθη» σε «ταμιευτήριο».

Επισκόπηση

Το ELMo (Ενσωματώσεις από γλωσσικά μοντέλα) ήταν μια σημαντική ανακάλυψη του 2018 που έδωσε σε κάθε λέξη μια αναπαράσταση που διαμορφώθηκε από την πρόταση της, επομένως η λέξη «όχθης» στην «όχθη ποταμού» διαφέρει από την «όχθη» σε «ταμιευτήριο». Σηματοδότησε τη μετάβαση από στατικά διανύσματα λέξεων σε NLP με επίγνωση του περιβάλλοντος.

Το ELMo Contextual Embeddings είναι μέρος της στοίβας γλώσσας-AI που χρησιμοποιείται για την ανάγνωση, τη δημιουργία, την ταξινόμηση και τη μετατροπή κειμένου και ομιλίας σε κλίμακα.

Βαθιά κατάδυση

Το ELMo, που εισήχθη από το Ινστιτούτο Allen για ερευνητές τεχνητής νοημοσύνης (Peters et al., 2018), παράγει αναπαραστάσεις λέξεων εκτελώντας μια πρόταση μέσα από ένα βαθύ αμφίδρομο μοντέλο γλώσσας LSTM εκπαιδευμένο σε ένα σώμα δισεκατομμυρίων λέξεων. Σε αντίθεση με το Word2Vec ή το GloVe, που εκχωρούν ένα σταθερό διάνυσμα ανά λέξη, το ELMo υπολογίζει ένα νέο διάνυσμα για κάθε εμφάνιση με βάση το περιβάλλον περιβάλλον. Κυρίως, το ELMo συνδυάζει όλα τα εσωτερικά επίπεδα LSTM μέσω μαθησμένων, ειδικών βαρών για εργασίες αντί να χρησιμοποιεί μόνο το ανώτερο στρώμα. Τα χαμηλότερα στρώματα τείνουν να συλλαμβάνουν τη σύνταξη (μέρος του λόγου, δομή) ενώ τα υψηλότερα επίπεδα συλλαμβάνουν τη σημασιολογία και την έννοια της λέξης. Η προσθήκη του ELMo σε υπάρχοντα μοντέλα παρήγαγε μεγάλα κέρδη σε έξι εργασίες αναφοράς, συμπεριλαμβανομένης της απάντησης σε ερωτήσεις, της ανάλυσης συναισθήματος και της αναγνώρισης επώνυμης οντότητας.

Τεχνική διορατικότητα

Το ELMo στοιβάζει δύο LSTM: ένα μοντέλο γλώσσας προς τα εμπρός που προβλέπει την επόμενη λέξη και ένα προς τα πίσω που προβλέπει την προηγούμενη λέξη, το καθένα πάνω από εισόδους CNN σε επίπεδο χαρακτήρων (έτσι χειρίζεται λέξεις που δεν εμφανίζονται). Για μια εργασία κατάντη, το ELMo συμπτύσσει τις αναπαραστάσεις του επιπέδου χρησιμοποιώντας κανονικοποιημένα βάρη softmax συν ένα βαθμωτό, που όλα μαθαίνονται κατά τη λεπτομέρεια. Αυτό σημαίνει ότι κάθε εργασία μπορεί να αποφασίσει πόσο συντακτικό έναντι σημασιολογικού σήματος θέλει από το παγωμένο προεκπαιδευμένο biLM.

Μάστερ ELMo Contextual Embeddings

Το ELMo (Ενσωματώσεις από γλωσσικά μοντέλα) ήταν μια σημαντική ανακάλυψη του 2018 που έδωσε σε κάθε λέξη μια αναπαράσταση που διαμορφώθηκε από την πρόταση της, επομένως η λέξη «όχθης» στην «όχθη ποταμού» διαφέρει από την «όχθη» σε «ταμιευτήριο». Σηματοδότησε τη μετάβαση από στατικά διανύσματα λέξεων σε NLP με επίγνωση του περιβάλλοντος. Το ELMo Contextual Embeddings είναι μέρος της στοίβας γλώσσας-AI που χρησιμοποιείται για την ανάγνωση, τη δημιουργία, την ταξινόμηση και τη μετατροπή κειμένου και ομιλίας σε κλίμακα. Για να δημιουργήσετε βαθιά κατανόηση, αντιμετωπίστε το ELMo Contextual Embeddings ως μοντέλο λειτουργίας, όχι ως ένα μεμονωμένο χαρακτηριστικό: ορίστε τα επιθυμητά αποτελέσματα, διευκρινίστε τις υποθέσεις και διαχωρίστε τι μπορεί να κάνει το σύστημα αξιόπιστα από αυτό που εξακολουθεί να απαιτεί την κρίση των ειδικών.

Στην πράξη, ισχυρές ομάδες που χρησιμοποιούν το ELMo Contextual Embeddings σχεδιάζουν βρόχους προτροπών, ανάκτησης και επανεξέτασης ως ένα ολοκληρωμένο σύστημα επικοινωνίας. Τεκμηριώνουν ρητά κριτήρια επιτυχίας, δοκιμάζουν με ρεαλιστικά δεδομένα και ροές εργασίας και επαναλαμβάνουν με βάση τα παρατηρούμενα μοτίβα αποτυχίας και όχι τις εφάπαξ νίκες αναφοράς. Αυτό είναι όπου η θεωρητική κατανόηση μετατρέπεται σε ανθεκτική ικανότητα σε όλα τα προϊόντα, την πολιτική και τις λειτουργίες.

Οι ροές εργασίας της γλώσσας μπορούν να κινηθούν πιο γρήγορα χωρίς να θυσιάζεται η συνέπεια. Ταυτόχρονα, τα ψευδαισθησιακά γεγονότα μπορούν να εισάγουν αθόρυβα αναφορές, να υποστηρίζουν ροές ή ερευνητικά αποτελέσματα. Η πιο ανθεκτική προσέγγιση είναι ο συνδυασμός της ταχύτητας πειραματισμού με την πειθαρχία διακυβέρνησης: εκτέλεση πιλότων, λήψη στοιχείων, δημοσίευση αρχείων καταγραφής αποφάσεων και συνεχής ενημέρωση των διασφαλίσεων καθώς εξελίσσονται η συμπεριφορά του μοντέλου, οι προσδοκίες των χρηστών και οι ρυθμιστικές απαιτήσεις.

Στρατηγικός αντίκτυπος

Οι ροές εργασίας της γλώσσας μπορούν να κινηθούν πιο γρήγορα χωρίς να θυσιάζεται η συνέπεια.

Οι ροές εργασίας της γλώσσας μπορούν να κινηθούν πιο γρήγορα χωρίς να θυσιάζεται η συνέπεια. Σε αναπτύξεις υψηλής ποιότητας, αυτό μεταφράζεται σε μετρήσιμους κανόνες λειτουργίας, όρια ιδιοκτησίας και επαναλαμβανόμενα τελετουργικά ελέγχου, ώστε οι ομάδες να μπορούν να κλιμακώνουν την εμπιστοσύνη αντί να κλιμακώνουν την ασάφεια.

Επεκτείνει την πρόσβαση σε όλες τις γλώσσες και τα στυλ επικοινωνίας.

Επεκτείνει την πρόσβαση σε όλες τις γλώσσες και τα στυλ επικοινωνίας. Σε αναπτύξεις υψηλής ποιότητας, αυτό μεταφράζεται σε μετρήσιμους κανόνες λειτουργίας, όρια ιδιοκτησίας και επαναλαμβανόμενα τελετουργικά ελέγχου, ώστε οι ομάδες να μπορούν να κλιμακώνουν την εμπιστοσύνη αντί να κλιμακώνουν την ασάφεια.

Οι ομάδες μπορούν να αφιερώσουν περισσότερο χρόνο στην κρίση, ενώ ο αυτοματισμός χειρίζεται την επανάληψη.

Οι ομάδες μπορούν να αφιερώσουν περισσότερο χρόνο στην κρίση, ενώ ο αυτοματισμός χειρίζεται την επανάληψη. Σε αναπτύξεις υψηλής ποιότητας, αυτό μεταφράζεται σε μετρήσιμους κανόνες λειτουργίας, όρια ιδιοκτησίας και επαναλαμβανόμενα τελετουργικά ελέγχου, ώστε οι ομάδες να μπορούν να κλιμακώνουν την εμπιστοσύνη αντί να κλιμακώνουν την ασάφεια.

The Future of ELMo Contextual Embeddings

Η βασική ιδέα της ELMo, οι αναπαραστάσεις με βάση τα συμφραζόμενα από την προεκπαίδευση γλωσσικών μοντέλων, έγινε θεμελιώδης, αλλά η επαναλαμβανόμενη αρχιτεκτονική της LSTM επισκιάστηκε γρήγορα από μοντέλα που βασίζονται σε Transformer όπως το BERT στα τέλη του 2018, τα οποία διαβάζουν ολόκληρες προτάσεις παράλληλα και κλιμακώνονται πολύ καλύτερα. Σήμερα το ELMo έχει ως επί το πλείστον ιστορική και εκπαιδευτική σημασία, αν και οι ιδέες χειρισμού εισόδου χαρακτήρων CNN και στάθμισης επιπέδων εξακολουθούν να επηρεάζουν την εξειδικευμένη εργασία ενσωμάτωσης σε γλώσσες χαμηλών πόρων και μορφολογικά πλούσιες.

Υλοποίηση σε πραγματικό κόσμο

Βελτίωση συστημάτων αναγνώρισης επώνυμων οντοτήτων που πρέπει να προσδιορίζουν εάν η λέξη «Ουάσιγκτον» αναφέρεται σε ένα άτομο, μια πολιτεία ή μια πόλη με βάση τις γύρω λέξεις

Ενίσχυση της ανάλυσης συναισθημάτων καταγράφοντας ότι «άρρωστος» σημαίνει αρνητικό στο «αισθάνομαι άρρωστος» αλλά θετικό στην αργκό «αυτό είναι άρρωστο»

Ενίσχυση των συστημάτων απάντησης ερωτήσεων στο σημείο αναφοράς SQuAD τροφοδοτώντας διανύσματα διακριτικών που είναι ευαίσθητα στο περιβάλλον στον αναγνώστη

Αποσαφηνιστικές αισθήσεις λέξεων στην αυτόματη μετάφραση, τόσο πολύσημες λέξεις όπως «φυτό» μεταφράζουν σωστά το δεδομένο πλαίσιο

Πρότυπα Υλοποίησης

ELMo Contextual Embeddings στην πράξη

Βελτίωση συστημάτων αναγνώρισης ονομαστικών οντοτήτων που πρέπει να προσδιορίζουν εάν η λέξη «Ουάσιγκτον» αναφέρεται σε ένα άτομο, μια πολιτεία ή μια πόλη με βάση τις γύρω λέξεις.

Βελτίωση συστημάτων αναγνώρισης επώνυμων οντοτήτων που πρέπει να προσδιορίζουν εάν η «Ουάσιγκτον» αναφέρεται σε ένα άτομο, μια πολιτεία ή πόλη με βάση τις λέξεις που τις περιβάλλουν.

ELMo Contextual Embeddings στην πράξη

Η ενίσχυση της ανάλυσης συναισθημάτων καταγράφοντας ότι «άρρωστος» σημαίνει αρνητικό στο «αισθάνομαι άρρωστος» αλλά θετικό στην αργκό «αυτό είναι άρρωστο».

Ενίσχυση της ανάλυσης συναισθήματος καταγράφοντας ότι «άρρωστος» σημαίνει αρνητικό στο «αισθάνομαι άρρωστος» αλλά θετικό στην αργκό «αυτό είναι άρρωστο».

ELMo Contextual Embeddings στην πράξη

Βελτίωση των συστημάτων απάντησης ερωτήσεων στο σημείο αναφοράς SQuAD, τροφοδοτώντας διανύσματα διακριτικών που είναι ευαίσθητα στο περιβάλλον στον αναγνώστη.

Βελτίωση συστημάτων απάντησης ερωτήσεων στο σημείο αναφοράς SQuAD τροφοδοτώντας διανύσματα διακριτικών με ευαισθησία στο περιβάλλον στον αναγνώστη.

ELMo Contextual Embeddings στην πράξη

Αποσαφηνιστικές αισθήσεις λέξεων στην αυτόματη μετάφραση, τόσο πολύσημες λέξεις όπως «φυτό» μεταφράζουν σωστά το δεδομένο πλαίσιο.

Αποσαφηνιστικές αισθήσεις λέξεων στη μηχανική μετάφραση τόσο πολύσημες λέξεις όπως «φυτό» μεταφράζουν σωστά δεδομένο πλαίσιο. Οι ομάδες συνήθως έχουν καλύτερα αποτελέσματα όταν ορίζουν κατώφλια ποιότητας εκ των προτέρων, διατηρούν μια ανθρώπινη διαδρομή κλιμάκωσης για περιπτώσεις αιχμής και παρακολουθούν τόσο τα κέρδη παραγωγικότητας όσο και το κόστος σφαλμάτων με την πάροδο του χρόνου.

Κίνδυνοι & προστατευτικά κιγκλιδώματα

!

Τα παραισθησιακά γεγονότα μπορούν να εισάγουν αθόρυβα αναφορές, να υποστηρίζουν ροές ή αποτελέσματα έρευνας.

!

Η άμεση ευαισθησία μπορεί να δημιουργήσει ασυνεπή αποτελέσματα σε παρόμοια αιτήματα.

!

Τα ευαίσθητα δεδομένα κειμένου ενδέχεται να εκτεθούν εάν τα στοιχεία ελέγχου πρόσβασης είναι αδύναμα.

Οδικός Χάρτης Εφαρμογής

1

Καθορίστε τη μορφή εξόδου, τον τόνο και τα πρότυπα ποιότητας πριν από την κυκλοφορία.

Καθορίστε τη μορφή εξόδου, τον τόνο και τα πρότυπα ποιότητας πριν από την κυκλοφορία. Αντιμετωπίστε κάθε βήμα ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

2

Επίγειες απαντήσεις με αξιόπιστες πηγές όποτε έχει σημασία η ακρίβεια.

Επίγειες απαντήσεις με αξιόπιστες πηγές όποτε έχει σημασία η ακρίβεια. Αντιμετωπίστε κάθε βήμα ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

3

Διατηρήστε ένα σημείο ελέγχου ανθρώπινης αξιολόγησης για αποτελέσματα υψηλού πονταρίσματος.

Διατηρήστε ένα σημείο ελέγχου ανθρώπινης αξιολόγησης για αποτελέσματα υψηλού πονταρίσματος. Αντιμετωπίστε κάθε βήμα ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

4

Παρακολουθήστε τα μοτίβα αποτυχίας και επανεκπαιδεύστε τις προτροπές ή τις ροές εργασίας τακτικά.

Παρακολουθήστε τα μοτίβα αποτυχίας και επανεκπαιδεύστε τις προτροπές ή τις ροές εργασίας τακτικά. Αντιμετωπίστε κάθε βήμα ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

Συνεχίστε την εξερεύνηση