Uygulama KILAVUZU

Görme Engelliler için Erişilebilirlikte Yapay Zeka

Yapay zeka, görsel dünyayı yüksek sesle tanımlıyor; metinleri okuyor, nesneleri tanımlıyor ve görme engelli veya az gören kişiler için sahneleri anlatıyor.

Genel Bakış

Yapay zeka görsel dünyayı yüksek sesle tanımlıyor; metinleri okuyor, nesneleri tanımlıyor ve görme engelli veya az gören kişiler için sahneleri anlatıyor. Bu önemli çünkü bir akıllı telefon kamerasını günlük işler için her zaman ulaşılabilir bir çift göze dönüştürüyor.

Görme Engelliler için Erişilebilirlik alanında yapay zeka, pratik dağıtıma odaklanır: model yeteneğini ölçülebilir değer sağlayan güvenilir günlük iş akışlarına dönüştürmek.

Derin Dalış

Onlarca yıldır erişilebilirlik, ekrandaki metni konuşmaya dönüştüren ekran okuyucular (JAWS, NVDA, VoiceOver) gibi araçlara bağlıydı. Yapay zeka bunu dramatik bir şekilde fiziksel dünyaya genişletiyor. Seeing AI, Be My Eyes ve Lookout gibi uygulamalar, postaları okumak, para birimini tanımlamak, yüzleri tanımak ve bir odayı tanımlamak için bilgisayar görüşünü ve optik karakter tanımayı kullanır. En büyük sıçrama, GPT-4 gibi multimodal modellerin Be My Eyes'ın 'Be My AI' özelliğini kullanarak kullanıcının herhangi bir sahneyi fotoğraflamasına ve doğal dilde takip soruları sormasına olanak tanımasıyla geldi: 'Ocak açık mı?' veya 'Bu gömlek ne renk?' Bu araçlar, gönüllü insanların ve rehber köpeklerin yerine geçmek yerine onları tamamlıyor ve işe yarıyor çünkü hem görüntü anlama hem de konuşma sentezi telefonda çalıştırılabilecek kadar hızlı ve ucuz hale geldi.

Teknik Bilgi

Üç teknoloji birleşiyor: OCR, fotoğraflanan metni karakterlere dönüştürür; nesne algılama ve resim yazısı modelleri, kameranın gördüklerini tanımlar ve açıklar; ve çok modlu LLM'ler, kullanıcıların bir görsel hakkında sohbet yoluyla takipler istemesine olanak tanır. Cihaz içi hızlandırma ve metinden konuşmaya motorları, saniyeler içinde doğal ses kalitesiyle yanıtlar sunar. Yapay zeka ayrıca dijital içerik için görsellerin 'alternatif metin' açıklamalarını otomatik olarak oluşturarak web sayfalarını ve sosyal paylaşımları ekran okuyucular tarafından gezinilebilir hale getiriyor.

Görme Engelliler için Erişilebilirlik Konusunda Yapay Zekada Uzmanlaşmak

Yapay zeka, görsel dünyayı yüksek sesle tanımlıyor; metinleri okuyor, nesneleri tanımlıyor ve görme engelli veya az gören kişiler için sahneleri anlatıyor. Bu önemli çünkü bir akıllı telefon kamerasını günlük işler için her zaman ulaşılabilir bir çift göze dönüştürüyor. Görme Engelliler için Erişilebilirlik alanında yapay zeka, pratik dağıtıma odaklanır: model yeteneğini ölçülebilir değer sağlayan güvenilir günlük iş akışlarına dönüştürmek. Derin bir anlayış oluşturmak için, Görme Engelliler için Erişilebilirlik alanında yapay zekayı tek bir özellik olarak değil, bir işletim modeli olarak ele alın: istenen sonuçları tanımlayın, varsayımları netleştirin ve sistemin güvenilir bir şekilde yapabileceklerini hâlâ uzman görüşü gerektiren şeylerden ayırın.

Uygulamada, Görme Engelliler için Erişilebilirlik alanında yapay zekayı kullanan güçlü ekipler, demoları modellemek yerine iş akışı sonuçlarına odaklanır ve insan kontrol noktalarını erken tanımlar. Açık başarı kriterlerini belgeliyorlar, gerçekçi verilere ve iş akışlarına göre test ediyorlar ve tek seferlik kıyaslama kazanımları yerine gözlemlenen başarısızlık modellerine dayalı olarak yineleniyorlar. Burası teorik anlayışın ürün, politika ve operasyonlar genelinde dayanıklı yeteneğe dönüştüğü yerdir.

Uygulama düzeyinde tasarım, yapay zekanın gerçek sonuçları iyileştirip iyileştirmediğini belirler. Aynı zamanda bozuk bir süreci otomatikleştirmek mevcut sorunları daha da büyütebilir. En dayanıklı yaklaşım, deneme hızını yönetişim disiplini ile birleştirmektir: pilot uygulamaları çalıştırın, kanıtları toplayın, karar günlüklerini yayınlayın ve model davranışı, kullanıcı beklentileri ve düzenleyici gereksinimler geliştikçe koruma önlemlerini sürekli olarak güncelleyin.

Stratejik Etki

Uygulama düzeyinde tasarım, yapay zekanın gerçek sonuçları iyileştirip iyileştirmediğini belirler.

Uygulama düzeyinde tasarım, yapay zekanın gerçek sonuçları iyileştirip iyileştirmediğini belirler. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

İyi iş akışı entegrasyonu, kullanıcıların güvenebileceği üretkenlik kazanımları sağlar.

İyi iş akışı entegrasyonu, kullanıcıların güvenebileceği üretkenlik kazanımları sağlar. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

İyi kapsamlı kullanım örnekleri, değişiklik yorgunluğunu ve uygulama riskini azaltır.

İyi kapsamlı kullanım örnekleri, değişiklik yorgunluğunu ve uygulama riskini azaltır. Yüksek kaliteli dağıtımlarda bu, ölçülebilir işletim kurallarına, sahiplik sınırlarına ve yinelenen inceleme ritüellerine dönüştürülür, böylece ekipler belirsizliği ölçeklendirmek yerine güveni ölçeklendirebilir.

Görme Engelliler İçin Erişilebilirlikte Yapay Zekanın Geleceği

Giyilebilir teknolojiler bir sonraki sınırdır; akıllı gözlükler (Meta Ray-Bans, Envision Glasses), eller serbest, sürekli anlatım sağlar, böylece kullanıcıların telefonlarını kaldırmalarına gerek kalmaz. Daha zengin mekansal açıklamalar, sokak tabelalarını ve engelleri okuyan gerçek zamanlı navigasyon ve ekran okuyucularla daha sıkı entegrasyon bekleyebilirsiniz. Buradaki zorluk güvenilirliktir: Kendinden emin bir şekilde yanlış bir açıklama ("yol açıktır") tehlikeli olabilir, bu nedenle gelecekteki sistemlerin kalibre edilmiş belirsizliğe ve göremedikleri şeyler hakkında net sinyallere ihtiyacı olacaktır.

Gerçek Dünya Uygulaması

Telefonu bir mektuba veya ilaç etiketine doğrultmak ve metnin OCR aracılığıyla yüksek sesle okunmasını sağlamak.

Bir buzdolabının fotoğrafını çekmek ve akşam yemeği için hangi malzemelerin mevcut olduğunu sormak için Be My AI'yi kullanın.

Alışveriş sırasında kağıt para birimlerinin tanımlanması veya ürün barkodlarının taranması.

Bir web sitesindeki görseller için otomatik olarak oluşturulan alternatif metin açıklamaları, böylece ekran okuyucu kullanıcılarının bunları anlayabilmesi.

Uygulama Modelleri

Uygulamada Görme Engelliler için Erişilebilirlikte Yapay Zeka

Telefonu bir mektuba veya ilaç etiketine doğrultmak ve metnin OCR aracılığıyla yüksek sesle okunmasını sağlamak.

Telefonu bir mektuba veya ilaç etiketine doğrultmak ve metnin OCR aracılığıyla yüksek sesle okunmasını sağlamak Ekipler, kalite eşiklerini önceden belirlediklerinde, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde genellikle daha iyi sonuçlar elde ederler.

Uygulamada Görme Engelliler için Erişilebilirlikte Yapay Zeka

Bir buzdolabının fotoğrafını çekmek ve akşam yemeği için hangi malzemelerin mevcut olduğunu sormak için Be My AI'yi kullanın.

Bir buzdolabının fotoğrafını çekmek ve akşam yemeği için hangi malzemelerin mevcut olduğunu sormak için Be My AI'yi kullanma Ekipler genellikle kalite eşiklerini önceden belirlediklerinde, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Uygulamada Görme Engelliler için Erişilebilirlikte Yapay Zeka

Alışveriş sırasında kağıt para birimlerinin tanımlanması veya ürün barkodlarının taranması.

Alışveriş sırasında kağıt para birimlerini belirlemek veya ürün barkodlarını taramak Ekipler genellikle kalite eşiklerini önceden belirlediklerinde, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Uygulamada Görme Engelliler için Erişilebilirlikte Yapay Zeka

Bir web sitesindeki görseller için otomatik olarak oluşturulan alternatif metin açıklamaları, böylece ekran okuyucu kullanıcılarının bunları anlayabilmesi.

Bir web sitesindeki görseller için otomatik olarak alternatif metin açıklamaları oluşturarak ekran okuyucu kullanıcılarının bunları anlaması Ekipler genellikle kalite eşiklerini önceden belirlediklerinde, uç durumlar için insani bir yükseltme yolu tuttuklarında ve zaman içinde hem üretkenlik kazanımlarını hem de hata maliyetlerini takip ettiklerinde daha iyi sonuçlar elde ederler.

Riskler ve Korkuluklar

!

Bozuk bir süreci otomatikleştirmek mevcut sorunları büyütebilir.

!

Ekipler aşırı otomatikleşebilir ve gerekli insan muhakemesini ortadan kaldırabilir.

!

Çıktılar sürekli olarak değerlendirilmezse kalite düşebilir.

Uygulama Yol Haritası

1

Mevcut iş akışının haritasını çıkarın ve en yüksek sürtünmeli adımı belirleyin.

Mevcut iş akışının haritasını çıkarın ve en yüksek sürtünmeli adımı belirleyin. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

2

Tam otomasyondan önce insan kontrol noktalarını tanımlayın.

Tam otomasyondan önce insan kontrol noktalarını tanımlayın. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

3

Kullanıcıları istemler, yükseltme yolları ve kalite standartları konusunda eğitin.

Kullanıcıları istemler, yükseltme yolları ve kalite standartları konusunda eğitin. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

4

Sürdürülebilir değeri doğrulamak için görev düzeyindeki sonuçları izleyin.

Sürdürülebilir değeri doğrulamak için görev düzeyindeki sonuçları izleyin. Her adımı bir kanıt kapısı olarak değerlendirin: Kriterler karşılanmazsa, kullanıma sunumu duraklatın, boşluğu kapatın ve ancak bundan sonra kullanımı genişletin.

Keşfetmeye Devam Edin