GHID de aplicații

AI în accesibilitatea pentru persoanele cu deficiențe de vedere

Inteligența artificială descrie lumea vizuală cu voce tare - citirea textului, identificarea obiectelor și povestirea scenelor pentru persoanele care sunt orbi sau au vedere slabă.

Prezentare generală

Inteligența artificială descrie lumea vizuală cu voce tare - citirea textului, identificarea obiectelor și povestirea scenelor pentru persoanele care sunt orbi sau au vedere slabă. Acest lucru contează pentru că transformă o cameră a unui smartphone într-o pereche de ochi mereu disponibilă pentru sarcinile de zi cu zi.

AI în accesibilitatea pentru persoanele cu deficiențe de vedere se concentrează pe implementarea practică: transformând capacitatea modelului în fluxuri de lucru zilnice fiabile, care oferă valoare măsurabilă.

Deep Dive

Timp de decenii, accesibilitatea s-a bazat pe instrumente precum cititoarele de ecran (JAWS, NVDA, VoiceOver) care convertesc textul de pe ecran în vorbire. AI extinde dramatic acest lucru la lumea fizică. Aplicații precum Seeing AI, Be My Eyes și Lookout folosesc viziunea computerizată și recunoașterea optică a caracterelor pentru a citi e-mailurile, a identifica moneda, a recunoaște fețele și a descrie o cameră. Cel mai mare salt a venit atunci când modelele multimodale precum GPT-4 au alimentat Be My Eyes, „Be My AI”, permițând utilizatorului să fotografieze orice scenă și să pună întrebări ulterioare în limbaj natural – „Este aragazul pornit? sau „Ce culoare este această cămașă?” Aceste instrumente completează, mai degrabă decât înlocuiesc, voluntarii umani și câinii ghid și funcționează deoarece atât înțelegerea imaginii, cât și sinteza vorbirii au devenit suficient de rapide și ieftine pentru a fi rulate pe un telefon.

Perspectivă tehnică

Se combină trei tehnologii: OCR convertește textul fotografiat în caractere; modelele de detectare a obiectelor și subtitrări de imagini identifică și descriu ceea ce vede camera; și LLM-urile multimodale le permit utilizatorilor să solicite urmăriri conversaționale despre o imagine. Motoarele de accelerare de pe dispozitiv și de transformare a textului în vorbire oferă răspunsuri sub formă de sunet natural în câteva secunde. Pentru conținutul digital, inteligența artificială generează, de asemenea, descrieri de „text alternativ” ale imaginilor, făcând navigabile paginile web și postările sociale de către cititoarele de ecran.

Stăpânirea AI în accesibilitatea pentru persoanele cu deficiențe de vedere

Inteligența artificială descrie lumea vizuală cu voce tare - citirea textului, identificarea obiectelor și povestirea scenelor pentru persoanele care sunt orbi sau au vedere slabă. Acest lucru contează pentru că transformă o cameră a unui smartphone într-o pereche de ochi mereu disponibilă pentru sarcinile de zi cu zi. AI în accesibilitatea pentru persoanele cu deficiențe de vedere se concentrează pe implementarea practică: transformând capacitatea modelului în fluxuri de lucru zilnice fiabile, care oferă valoare măsurabilă. Pentru a construi o înțelegere profundă, tratați AI în Accesibilitatea pentru persoanele cu deficiențe de vedere ca un model de operare, nu o singură caracteristică: definiți rezultatele dorite, clarificați ipotezele și separați ceea ce poate face sistemul în mod fiabil de ceea ce necesită încă o judecată expertă.

În practică, echipele puternice care folosesc inteligența artificială în Accesibilitatea pentru persoanele cu deficiențe de vedere se concentrează pe rezultatele fluxului de lucru, nu pe demonstrații de model și definesc punctele de control umane din timp. Aceștia documentează criteriile de succes explicite, testează în funcție de date și fluxuri de lucru realiste și repetă pe baza modelelor de eșec observate, mai degrabă decât a câștigurilor de referință unice. Aici înțelegerea teoretică se transformă în capacitate durabilă pentru produse, politici și operațiuni.

Designul la nivel de aplicație determină dacă AI îmbunătățește rezultatele reale. În același timp, automatizarea unui proces întrerupt poate amplifica problemele existente. Cea mai rezistentă abordare este combinarea vitezei de experimentare cu disciplina de guvernare: desfășurați pilot, capturați dovezi, publicați jurnalele de decizie și actualizați continuu măsurile de protecție pe măsură ce comportamentul modelului, așteptările utilizatorilor și cerințele de reglementare evoluează.

Impact strategic

Designul la nivel de aplicație determină dacă AI îmbunătățește rezultatele reale.

Designul la nivel de aplicație determină dacă AI îmbunătățește rezultatele reale. În implementările de înaltă calitate, acest lucru se traduce în reguli de operare măsurabile, limite de proprietate și ritualuri de revizuire recurente, astfel încât echipele să poată mări încrederea în loc să crească ambiguitatea.

O bună integrare a fluxului de lucru creează câștiguri de productivitate în care utilizatorii pot avea încredere.

O bună integrare a fluxului de lucru creează câștiguri de productivitate în care utilizatorii pot avea încredere. În implementările de înaltă calitate, acest lucru se traduce în reguli de operare măsurabile, limite de proprietate și ritualuri de revizuire recurente, astfel încât echipele să poată mări încrederea în loc să crească ambiguitatea.

Cazurile de utilizare bine definite reduc oboseala schimbării și riscul de implementare.

Cazurile de utilizare bine definite reduc oboseala schimbării și riscul de implementare. În implementările de înaltă calitate, acest lucru se traduce în reguli de operare măsurabile, limite de proprietate și ritualuri de revizuire recurente, astfel încât echipele să poată mări încrederea în loc să crească ambiguitatea.

Viitorul AI în accesibilitatea pentru persoanele cu deficiențe de vedere

Materialele purtabile sunt următoarea frontieră – ochelarii inteligenți (Meta Ray-Bans, Envision Glasses) oferă o narațiune continuă, fără mâini, astfel încât utilizatorii să nu fie nevoiți să ridice telefonul. Așteptați-vă la descrieri spațiale mai bogate, navigare în timp real care citește semnele stradale și obstacolele și o integrare mai strânsă cu cititoarele de ecran. Provocarea este fiabilitatea: o descriere greșită cu încredere („calea este clară”) poate fi periculoasă, așa că sistemele viitoare vor avea nevoie de incertitudine calibrată și semnale clare despre ceea ce nu pot vedea.

Implementare în lumea reală

Îndreptarea telefonului către o scrisoare sau eticheta unui medicament și citirea textului cu voce tare prin OCR.

Folosind Be My AI pentru a fotografia un frigider și a întreba ce ingrediente sunt disponibile pentru cină.

Identificarea numelor de monedă de hârtie sau scanarea codurilor de bare ale produselor în timpul cumpărăturilor.

Generarea automată a descrierilor alt-text pentru imaginile de pe un site web, astfel încât utilizatorii cititorilor de ecran să le înțeleagă.

Modele de implementare

AI în accesibilitatea pentru persoanele cu deficiențe de vedere în practică

Îndreptarea telefonului către o scrisoare sau eticheta unui medicament și citirea textului cu voce tare prin OCR.

Îndreptarea telefonului către o scrisoare sau eticheta unui medicament și citirea textului cu voce tare prin echipele OCR obțin de obicei rezultate mai bune atunci când definesc praguri de calitate în avans, păstrează o cale de escaladare umană pentru cazurile marginale și urmăresc atât câștigurile de productivitate, cât și costurile erorilor în timp.

AI în accesibilitatea pentru persoanele cu deficiențe de vedere în practică

Folosind Be My AI pentru a fotografia un frigider și a întreba ce ingrediente sunt disponibile pentru cină.

Folosind Be My AI pentru a fotografia un frigider și a întreba ce ingrediente sunt disponibile pentru cină Echipele obțin de obicei rezultate mai bune atunci când definesc praguri de calitate în avans, păstrează o cale de escaladare umană pentru cazurile marginale și urmăresc atât câștigurile de productivitate, cât și costurile erorilor în timp.

AI în accesibilitatea pentru persoanele cu deficiențe de vedere în practică

Identificarea numelor de monedă de hârtie sau scanarea codurilor de bare ale produselor în timpul cumpărăturilor.

Identificarea numelor de monedă pe hârtie sau scanarea codurilor de bare ale produselor în timpul cumpărăturilor Echipele obțin de obicei rezultate mai bune atunci când definesc praguri de calitate în avans, păstrează o cale de escaladare umană pentru cazurile marginale și urmăresc atât câștigurile de productivitate, cât și costurile de eroare în timp.

AI în accesibilitatea pentru persoanele cu deficiențe de vedere în practică

Generarea automată a descrierilor alt-text pentru imaginile de pe un site web, astfel încât utilizatorii cititorilor de ecran să le înțeleagă.

Generarea automată a descrierilor de text alternativ pentru imaginile de pe un site web, astfel încât utilizatorii cititorilor de ecran să le înțeleagă. Echipele obțin de obicei rezultate mai bune atunci când definesc praguri de calitate în avans, păstrează o cale de escaladare umană pentru cazurile marginale și urmăresc atât câștigurile de productivitate, cât și costurile erorilor în timp.

Riscuri și balustrade

!

Automatizarea unui proces întrerupt poate amplifica problemele existente.

!

Echipele pot supraautomatiza și elimina raționamentul uman necesar.

!

Calitatea poate varia dacă rezultatele nu sunt evaluate continuu.

Foaia de parcurs de implementare

1

Hartă fluxul de lucru actual și identifică pasul cu cea mai mare frecare.

Hartă fluxul de lucru actual și identifică pasul cu cea mai mare frecare. Tratați fiecare pas ca pe o poartă de dovezi: dacă criteriile nu sunt îndeplinite, întrerupeți lansarea, închideți decalajul și abia apoi extindeți utilizarea.

2

Definiți puncte de control umane înainte de automatizarea completă.

Definiți puncte de control umane înainte de automatizarea completă. Tratați fiecare pas ca pe o poartă de dovezi: dacă criteriile nu sunt îndeplinite, întrerupeți lansarea, închideți decalajul și abia apoi extindeți utilizarea.

3

Instruiți utilizatorii cu privire la solicitări, căi de escaladare și standarde de calitate.

Instruiți utilizatorii cu privire la solicitări, căi de escaladare și standarde de calitate. Tratați fiecare pas ca pe o poartă de dovezi: dacă criteriile nu sunt îndeplinite, întrerupeți lansarea, închideți decalajul și abia apoi extindeți utilizarea.

4

Urmăriți rezultatele la nivel de sarcină pentru a confirma valoarea susținută.

Urmăriți rezultatele la nivel de sarcină pentru a confirma valoarea susținută. Tratați fiecare pas ca pe o poartă de dovezi: dacă criteriile nu sunt îndeplinite, întrerupeți lansarea, închideți decalajul și abia apoi extindeți utilizarea.

Continuați să explorați