Οδηγός Reflexion and Self-Correcting Agents

Επισκόπηση

Το Reflexion είναι μια τεχνική όπου ένας πράκτορας AI εξετάζει γραπτώς τις δικές του αποτυχίες και τροφοδοτεί αυτά τα μαθήματα στην επόμενη προσπάθειά του. Έχει σημασία γιατί επιτρέπει στους πράκτορες να βελτιώσουν μια εργασία χωρίς να επανεκπαιδεύσουν το υποκείμενο μοντέλο.

Το Reflexion and Self-Correcting Agents εστιάζει στην πρακτική ανάπτυξη: μετατρέποντας την ικανότητα του μοντέλου σε αξιόπιστες καθημερινές ροές εργασίας που προσφέρουν μετρήσιμη αξία.

Βαθιά κατάδυση

Το Reflexion, που εισήχθη σε μια εργασία του 2023 από τον Shinn και τους συναδέλφους του, δίνει σε έναν πράκτορα έναν βρόχο: επιχειρεί μια εργασία, λαμβάνει ένα μήνυμα για το πώς τα κατάφερε (ένα αποτέλεσμα δοκιμής, μια ανταμοιβή ή μια κριτική), και στη συνέχεια γράφει μια σύντομη «αναστοχασμό» σε φυσική γλώσσα εξηγώντας τι πήγε στραβά και τι να δοκιμάσει στη συνέχεια. Αυτή η αντανάκλαση αποθηκεύεται στη μνήμη και προσαρτάται στην προτροπή της επόμενης προσπάθειας. Το σημαντικό είναι ότι τα βάρη του μοντέλου δεν αλλάζουν ποτέ. Η μάθηση γίνεται εξ ολοκλήρου στο παράθυρο περιβάλλοντος ως κείμενο. Αυτή η «λεκτική μάθηση ενίσχυσης» επιτρέπει στους πράκτορες να επαναλαμβάνουν προβλήματα κωδικοποίησης, πλοήγηση στον ιστό και συλλογιστικές εργασίες. Στο σημείο αναφοράς κωδικοποίησης HumanEval, η αυτοδιόρθωση τύπου Reflexion ώθησε τα ποσοστά περασμάτων σημαντικά υψηλότερα από τις προσπάθειες μίας βολής, απλώς αφήνοντας τον πράκτορα να διορθώσει τα δικά του λάθη σε μερικές προσπάθειες.

Τεχνική διορατικότητα

Το Reflexion διαχωρίζει τρεις ρόλους: έναν Ηθοποιό που δημιουργεί ενέργειες, έναν Αξιολογητή που βαθμολογεί το αποτέλεσμα (δοκιμές ενοτήτων, έλεγχος ακριβούς αντιστοίχισης ή κριτής LLM) και ένα μοντέλο Αυτοστοχασμού που μετατρέπει αυτή τη βαθμολογία σε μάθημα κειμένου. Το μάθημα προσγειώνεται σε ένα επεισοδιακό buffer μνήμης που χρησιμοποιείται ξανά στην επόμενη δοκιμή. Επειδή η ανατροφοδότηση είναι γλώσσα και όχι διαβαθμίσεις, δεν απαιτείται εκπαίδευση GPU, αλλά εξαρτάται σε μεγάλο βαθμό από ένα αξιόπιστο σήμα αξιολόγησης για να αποφευχθεί η ενίσχυση σίγουρων αλλά εσφαλμένων ανακλάσεων.

Mastering Reflexion and Self-Corecting Agents

Για να αποκτήσετε βαθιά κατανόηση, αντιμετωπίστε τους Αντικατοπτρισμούς και τους Αυτοδιορθωτικούς Παράγοντες ως μοντέλο λειτουργίας και όχι ως ένα μεμονωμένο χαρακτηριστικό. Καθορίστε τα επιθυμητά αποτελέσματα, διευκρινίστε τις υποθέσεις και διαχωρίστε τι μπορεί να κάνει το σύστημα με αξιοπιστία από αυτό που απαιτεί ακόμα την κρίση των ειδικών.

Στην πράξη, ισχυρές ομάδες που χρησιμοποιούν Reflexion και Self-Correcting Agents εστιάζουν στα αποτελέσματα της ροής εργασιών και όχι στα μοντέλα επιδείξεων και ορίζουν νωρίς τα ανθρώπινα σημεία ελέγχου. Τεκμηριώνουν ρητά κριτήρια επιτυχίας, δοκιμάζουν με ρεαλιστικά δεδομένα και ροές εργασίας και επαναλαμβάνουν με βάση τα παρατηρούμενα μοτίβα αποτυχίας και όχι τις εφάπαξ νίκες αναφοράς. Αυτό είναι όπου η θεωρητική κατανόηση μετατρέπεται σε ανθεκτική ικανότητα σε όλα τα προϊόντα, την πολιτική και τις λειτουργίες.

Ο σχεδιασμός σε επίπεδο εφαρμογής καθορίζει εάν η τεχνητή νοημοσύνη βελτιώνει τα πραγματικά αποτελέσματα. Ταυτόχρονα, η αυτοματοποίηση μιας διαλυμένης διαδικασίας μπορεί να ενισχύσει τα υπάρχοντα προβλήματα. Η πιο ανθεκτική προσέγγιση είναι ο συνδυασμός της ταχύτητας πειραματισμού με την πειθαρχία διακυβέρνησης: εκτέλεση πιλότων, λήψη στοιχείων, δημοσίευση αρχείων καταγραφής αποφάσεων και συνεχής ενημέρωση των διασφαλίσεων καθώς εξελίσσονται η συμπεριφορά του μοντέλου, οι προσδοκίες των χρηστών και οι ρυθμιστικές απαιτήσεις.

Στρατηγικός αντίκτυπος

Ο σχεδιασμός σε επίπεδο εφαρμογής καθορίζει εάν η τεχνητή νοημοσύνη βελτιώνει τα πραγματικά αποτελέσματα.

Ο σχεδιασμός σε επίπεδο εφαρμογής καθορίζει εάν η τεχνητή νοημοσύνη βελτιώνει τα πραγματικά αποτελέσματα. Σε αναπτύξεις υψηλής ποιότητας, αυτό μεταφράζεται σε μετρήσιμους κανόνες λειτουργίας, όρια ιδιοκτησίας και επαναλαμβανόμενα τελετουργικά ελέγχου, ώστε οι ομάδες να μπορούν να κλιμακώνουν την εμπιστοσύνη αντί να κλιμακώνουν την ασάφεια.

Η καλή ενσωμάτωση ροής εργασιών δημιουργεί κέρδη παραγωγικότητας που μπορούν να εμπιστευτούν οι χρήστες.

Η καλή ενσωμάτωση ροής εργασιών δημιουργεί κέρδη παραγωγικότητας που μπορούν να εμπιστευτούν οι χρήστες. Σε αναπτύξεις υψηλής ποιότητας, αυτό μεταφράζεται σε μετρήσιμους κανόνες λειτουργίας, όρια ιδιοκτησίας και επαναλαμβανόμενα τελετουργικά ελέγχου, ώστε οι ομάδες να μπορούν να κλιμακώνουν την εμπιστοσύνη αντί να κλιμακώνουν την ασάφεια.

Οι καλές περιπτώσεις χρήσης μειώνουν την κόπωση λόγω αλλαγής και τον κίνδυνο εφαρμογής.

Οι καλές περιπτώσεις χρήσης μειώνουν την κόπωση λόγω αλλαγής και τον κίνδυνο εφαρμογής. Σε αναπτύξεις υψηλής ποιότητας, αυτό μεταφράζεται σε μετρήσιμους κανόνες λειτουργίας, όρια ιδιοκτησίας και επαναλαμβανόμενα τελετουργικά ελέγχου, ώστε οι ομάδες να μπορούν να κλιμακώνουν την εμπιστοσύνη αντί να κλιμακώνουν την ασάφεια.

The Future of Reflexion and Self-Correcting Agents

Η αυτοδιόρθωση γίνεται ένα προεπιλεγμένο επίπεδο στα πλαίσια πρακτόρων και όχι ένα ερευνητικό τέχνασμα. Αναμένετε στενότερη ενσωμάτωση με αυτοματοποιημένους επαληθευτές, όπως κουτιά άμμου κώδικα, επίσημους ελεγκτές και ανάκτηση που επιβεβαιώνει τα γεγονότα, έτσι ώστε οι αντανακλάσεις να βασίζονται σε αντικειμενικά σήματα αντί να μαντεύει το ίδιο το μοντέλο. Οι ανοιχτές προκλήσεις είναι η αποφυγή βρόχων όπου ένας πράκτορας «διορθώνει» ατελείωτα το λειτουργικό αποτέλεσμα, αποφασίζει πότε θα σταματήσει την επανάληψη και εμποδίζει τις αντανακλάσεις να παρασυρθούν σε εύλογους αλλά μη επαληθευμένους εξορθολογισμούς.

Υλοποίηση σε πραγματικό κόσμο

Ένας παράγοντας κωδικοποίησης που εκτελεί δοκιμές μονάδων, διαβάζει τον ισχυρισμό που αποτυγχάνει, γράφει μια σημείωση στο σφάλμα και επεξεργάζεται τον κώδικά του πριν εκτελέσει ξανά τη σουίτα.

Ένας βοηθός ερευνητής που συλλαμβάνει μια παραισθησιολογική αναφορά όταν αποτυγχάνει ένας έλεγχος ανάκτησης, στη συνέχεια αναθεωρεί την απάντηση για να χρησιμοποιήσει μόνο επαληθευμένες πηγές.

Ένας πράκτορας πλοήγησης ιστού (π.χ. στα κριτήρια αξιολόγησης AlfWorld ή WebShop) που καταγράφει "Έκανα κλικ σε λάθος φίλτρο" και αποφεύγει αυτό το λάθος κατά την επανάληψη.

Ένας μαθηματικός επίλυσης προβλημάτων που ελέγχει την τελική του απάντηση σε σχέση με έναν περιορισμό, παρατηρεί ένα σφάλμα πρόσημου και επεξεργάζεται ξανά το σχετικό βήμα.

Πρότυπα Υλοποίησης

Αντανακλαστικοί και Αυτοδιορθωτικοί Πράκτορες στην πράξη

Ένας παράγοντας κωδικοποίησης που εκτελεί δοκιμές μονάδων, διαβάζει τον ισχυρισμό που αποτυγχάνει, γράφει μια σημείωση στο σφάλμα και επεξεργάζεται τον κώδικά του πριν εκτελέσει ξανά τη σουίτα.

Οι ομάδες συνήθως έχουν καλύτερα αποτελέσματα όταν ορίζουν κατώφλια ποιότητας εκ των προτέρων, διατηρούν μια ανθρώπινη πορεία κλιμάκωσης για περιπτώσεις αιχμής και παρακολουθούν τόσο τα κέρδη παραγωγικότητας όσο και το κόστος σφαλμάτων με την πάροδο του χρόνου.

Αντανακλαστικοί και Αυτοδιορθωτικοί Πράκτορες στην πράξη

Ένας βοηθός ερευνητής που συλλαμβάνει μια παραισθησιολογική αναφορά όταν αποτυγχάνει ένας έλεγχος ανάκτησης, στη συνέχεια αναθεωρεί την απάντηση για να χρησιμοποιήσει μόνο επαληθευμένες πηγές.

Οι ομάδες συνήθως έχουν καλύτερα αποτελέσματα όταν ορίζουν κατώφλια ποιότητας εκ των προτέρων, διατηρούν μια ανθρώπινη πορεία κλιμάκωσης για περιπτώσεις αιχμής και παρακολουθούν τόσο τα κέρδη παραγωγικότητας όσο και το κόστος σφαλμάτων με την πάροδο του χρόνου.

Αντανακλαστικοί και Αυτοδιορθωτικοί Πράκτορες στην πράξη

Ένας πράκτορας πλοήγησης ιστού (π.χ. στα κριτήρια αξιολόγησης AlfWorld ή WebShop) που καταγράφει "Έκανα κλικ σε λάθος φίλτρο" και αποφεύγει αυτό το λάθος κατά την επανάληψη.

Οι ομάδες συνήθως έχουν καλύτερα αποτελέσματα όταν ορίζουν κατώφλια ποιότητας εκ των προτέρων, διατηρούν μια ανθρώπινη πορεία κλιμάκωσης για περιπτώσεις αιχμής και παρακολουθούν τόσο τα κέρδη παραγωγικότητας όσο και το κόστος σφαλμάτων με την πάροδο του χρόνου.

Αντανακλαστικοί και Αυτοδιορθωτικοί Πράκτορες στην πράξη

Ένας μαθηματικός επίλυσης προβλημάτων που ελέγχει την τελική του απάντηση σε σχέση με έναν περιορισμό, παρατηρεί ένα σφάλμα πρόσημου και επεξεργάζεται ξανά το σχετικό βήμα.

Οι ομάδες συνήθως έχουν καλύτερα αποτελέσματα όταν ορίζουν κατώφλια ποιότητας εκ των προτέρων, διατηρούν μια ανθρώπινη πορεία κλιμάκωσης για περιπτώσεις αιχμής και παρακολουθούν τόσο τα κέρδη παραγωγικότητας όσο και το κόστος σφαλμάτων με την πάροδο του χρόνου.

Κίνδυνοι & προστατευτικά κιγκλιδώματα

!

Η αυτοματοποίηση μιας διαλυμένης διαδικασίας μπορεί να ενισχύσει τα υπάρχοντα προβλήματα.

!

Οι ομάδες μπορεί να αυτοματοποιήσουν υπερβολικά και να αφαιρέσουν την απαραίτητη ανθρώπινη κρίση.

!

Η ποιότητα μπορεί να αλλάξει αν τα αποτελέσματα δεν αξιολογούνται συνεχώς.

Οδικός Χάρτης Εφαρμογής

1

Χαρτογραφήστε την τρέχουσα ροή εργασίας και εντοπίστε το βήμα της υψηλότερης τριβής.

Αντιμετωπίστε το ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

2

Καθορίστε ανθρώπινα σημεία ελέγχου πριν από την πλήρη αυτοματοποίηση.

Αντιμετωπίστε το ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

3

Εκπαιδεύστε τους χρήστες σε προτροπές, διαδρομές κλιμάκωσης και πρότυπα ποιότητας.

Αντιμετωπίστε το ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

4

Παρακολουθήστε τα αποτελέσματα σε επίπεδο εργασίας για να επιβεβαιώσετε τη σταθερή αξία.

Αντιμετωπίστε το ως πύλη αποδείξεων: εάν δεν πληρούνται τα κριτήρια, σταματήστε την κυκλοφορία, κλείστε το κενό και μόνο τότε επεκτείνετε τη χρήση.

Συνεχίστε την εξερεύνηση

Βοηθοί AI

Σχεδιάστε ροές εργασίας βοηθών που παραμένουν χρήσιμες και αξιόπιστες.

Διαβάστε τον Οδηγό

Κωδικοποίηση AI

Δείτε πώς η εφαρμοσμένη τεχνητή νοημοσύνη βελτιώνει την παράδοση λογισμικού.

Διαβάστε τον Οδηγό

Αντανακλαστικοί και Αυτοδιορθωτικοί Παράγοντες

Επισκόπηση

Βαθιά κατάδυση

Τεχνική διορατικότητα

Mastering Reflexion and Self-Corecting Agents

Στρατηγικός αντίκτυπος

The Future of Reflexion and Self-Correcting Agents

Υλοποίηση σε πραγματικό κόσμο

Πρότυπα Υλοποίησης

Αντανακλαστικοί και Αυτοδιορθωτικοί Πράκτορες στην πράξη

Αντανακλαστικοί και Αυτοδιορθωτικοί Πράκτορες στην πράξη

Αντανακλαστικοί και Αυτοδιορθωτικοί Πράκτορες στην πράξη

Αντανακλαστικοί και Αυτοδιορθωτικοί Πράκτορες στην πράξη

Κίνδυνοι & προστατευτικά κιγκλιδώματα

Οδικός Χάρτης Εφαρμογής

Συνεχίστε την εξερεύνηση

Βοηθοί AI

Κωδικοποίηση AI

Related guides