Tổng quan
AI mô tả thế giới thị giác một cách rõ ràng—đọc văn bản, xác định đồ vật và kể lại cảnh cho những người mù hoặc có thị lực kém. Điều này quan trọng vì nó biến camera của điện thoại thông minh thành một đôi mắt luôn sẵn sàng cho các công việc hàng ngày.
AI trong Khả năng tiếp cận dành cho người khiếm thị tập trung vào triển khai thực tế: biến khả năng của mô hình thành quy trình công việc hàng ngày đáng tin cậy mang lại giá trị có thể đo lường được.
Lặn sâu
Trong nhiều thập kỷ, khả năng truy cập phụ thuộc vào các công cụ như trình đọc màn hình (JAWS, NVDA, VoiceOver) để chuyển văn bản trên màn hình thành giọng nói. AI mở rộng đáng kể điều này sang thế giới vật chất. Các ứng dụng như See AI, Be My Eyes và Lookout sử dụng thị giác máy tính và nhận dạng ký tự quang học để đọc thư, nhận dạng tiền tệ, nhận dạng khuôn mặt và mô tả một căn phòng. Bước nhảy vọt lớn nhất xảy ra khi các mô hình đa phương thức như Be My Eyes' 'Be My AI' hỗ trợ GPT-4, cho phép người dùng chụp ảnh bất kỳ cảnh nào và đặt các câu hỏi tiếp theo bằng ngôn ngữ tự nhiên— 'Bếp có bật không?' hoặc 'Cái áo này màu gì?' Những công cụ này bổ sung, thay vì thay thế, tình nguyện viên của con người và chó dẫn đường, và chúng hoạt động vì cả khả năng hiểu hình ảnh và tổng hợp giọng nói đều trở nên đủ nhanh và rẻ để chạy trên điện thoại.
Hiểu biết kỹ thuật
Ba công nghệ kết hợp: OCR chuyển đổi văn bản trong ảnh thành ký tự; mô hình phát hiện đối tượng và chú thích hình ảnh xác định và mô tả những gì máy ảnh nhìn thấy; và LLM đa phương thức cho phép người dùng hỏi các nội dung đàm thoại tiếp theo về một hình ảnh. Công cụ tăng tốc trên thiết bị và chuyển văn bản thành giọng nói mang lại câu trả lời dưới dạng âm thanh tự nhiên trong vòng vài giây. Đối với nội dung kỹ thuật số, AI cũng tự động tạo mô tả 'văn bản thay thế' cho hình ảnh, giúp trình đọc màn hình có thể điều hướng được các trang web và bài đăng trên mạng xã hội.
Làm chủ AI trong khả năng tiếp cận cho người khiếm thị
AI mô tả rõ ràng thế giới thị giác—đọc văn bản, xác định đồ vật và kể lại cảnh cho những người mù hoặc có thị lực kém. Điều này quan trọng vì nó biến camera của điện thoại thông minh thành một đôi mắt luôn sẵn sàng cho các công việc hàng ngày. AI trong Khả năng tiếp cận dành cho người khiếm thị tập trung vào triển khai thực tế: biến khả năng của mô hình thành quy trình công việc hàng ngày đáng tin cậy mang lại giá trị có thể đo lường được. Để xây dựng sự hiểu biết sâu sắc, hãy coi AI trong Khả năng tiếp cận dành cho người khiếm thị như một mô hình vận hành chứ không phải một tính năng duy nhất: xác định kết quả mong muốn, làm rõ các giả định và tách biệt những gì hệ thống có thể thực hiện một cách đáng tin cậy với những gì vẫn cần đến sự đánh giá của chuyên gia.
Trong thực tế, các nhóm mạnh sử dụng AI trong Khả năng tiếp cận dành cho người khiếm thị tập trung vào kết quả của quy trình làm việc chứ không phải các bản trình diễn mô hình và xác định sớm các điểm kiểm tra của con người. Họ ghi lại các tiêu chí thành công rõ ràng, kiểm tra dựa trên dữ liệu và quy trình làm việc thực tế, đồng thời lặp lại dựa trên các kiểu thất bại được quan sát thay vì chiến thắng điểm chuẩn một lần. Đây là nơi sự hiểu biết về mặt lý thuyết biến thành khả năng bền vững trên toàn bộ sản phẩm, chính sách và hoạt động.
Thiết kế cấp ứng dụng xác định liệu AI có cải thiện kết quả thực tế hay không. Đồng thời, Tự động hóa một quy trình bị hỏng có thể khuếch đại các vấn đề hiện có. Cách tiếp cận linh hoạt nhất là kết hợp tốc độ thử nghiệm với kỷ luật quản trị: chạy thử nghiệm, thu thập bằng chứng, xuất bản nhật ký quyết định và liên tục cập nhật các biện pháp bảo vệ khi hành vi của mô hình, kỳ vọng của người dùng và các yêu cầu pháp lý phát triển.
Tác động chiến lược
Thiết kế cấp ứng dụng xác định liệu AI có cải thiện kết quả thực tế hay không.
Thiết kế cấp ứng dụng xác định liệu AI có cải thiện kết quả thực tế hay không. Trong quá trình triển khai chất lượng cao, điều này được chuyển thành các quy tắc vận hành, ranh giới quyền sở hữu và quy trình đánh giá định kỳ có thể đo lường được để các nhóm có thể mở rộng quy mô một cách tự tin thay vì mở rộng quy mô sự mơ hồ.
Tích hợp quy trình làm việc tốt sẽ giúp tăng năng suất mà người dùng có thể tin tưởng.
Tích hợp quy trình làm việc tốt sẽ giúp tăng năng suất mà người dùng có thể tin tưởng. Trong quá trình triển khai chất lượng cao, điều này được chuyển thành các quy tắc vận hành, ranh giới quyền sở hữu và quy trình đánh giá định kỳ có thể đo lường được để các nhóm có thể mở rộng quy mô một cách tự tin thay vì mở rộng quy mô sự mơ hồ.
Các trường hợp sử dụng có phạm vi phù hợp giúp giảm bớt sự mệt mỏi khi thay đổi và rủi ro triển khai.
Các trường hợp sử dụng có phạm vi phù hợp giúp giảm bớt sự mệt mỏi khi thay đổi và rủi ro triển khai. Trong quá trình triển khai chất lượng cao, điều này được chuyển thành các quy tắc vận hành, ranh giới quyền sở hữu và quy trình đánh giá định kỳ có thể đo lường được để các nhóm có thể mở rộng quy mô một cách tự tin thay vì mở rộng quy mô sự mơ hồ.
Triển khai trong thế giới thực
Hướng điện thoại vào một lá thư hoặc nhãn thuốc và đọc to văn bản đó qua OCR.
Sử dụng Be My AI để chụp ảnh tủ lạnh và hỏi xem có những nguyên liệu nào cho bữa tối.
Nhận dạng mệnh giá tiền giấy hoặc quét mã vạch sản phẩm khi mua sắm.
Tự động tạo mô tả văn bản thay thế cho hình ảnh trên trang web để người dùng trình đọc màn hình hiểu được chúng.
Các mẫu triển khai
AI trong khả năng tiếp cận của người khiếm thị trong thực tế
Hướng điện thoại vào một lá thư hoặc nhãn thuốc và đọc to văn bản đó qua OCR.
Hướng điện thoại vào một lá thư hoặc nhãn thuốc và yêu cầu đọc to văn bản qua OCR. Nhóm thường nhận được kết quả tốt hơn khi họ xác định trước các ngưỡng chất lượng, duy trì lộ trình báo cáo của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất và chi phí do lỗi theo thời gian.
AI trong khả năng tiếp cận của người khiếm thị trong thực tế
Sử dụng Be My AI để chụp ảnh tủ lạnh và hỏi xem có những nguyên liệu nào cho bữa tối.
Sử dụng AI của Be My để chụp ảnh tủ lạnh và hỏi những nguyên liệu nào có sẵn cho bữa tối Các nhóm thường đạt được kết quả tốt hơn khi họ xác định trước các ngưỡng chất lượng, theo dõi lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất và chi phí sai sót theo thời gian.
AI trong khả năng tiếp cận của người khiếm thị trong thực tế
Nhận dạng mệnh giá tiền giấy hoặc quét mã vạch sản phẩm khi mua sắm.
Xác định mệnh giá tiền giấy hoặc quét mã vạch sản phẩm trong khi mua sắm Các nhóm thường đạt được kết quả tốt hơn khi họ xác định trước các ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất và chi phí sai sót theo thời gian.
AI trong khả năng tiếp cận của người khiếm thị trong thực tế
Tự động tạo mô tả văn bản thay thế cho hình ảnh trên trang web để người dùng trình đọc màn hình hiểu được chúng.
Tự động tạo mô tả văn bản thay thế cho hình ảnh trên trang web để người dùng trình đọc màn hình hiểu chúng. Các nhóm thường đạt được kết quả tốt hơn khi họ xác định trước các ngưỡng chất lượng, duy trì lộ trình leo thang của con người đối với các trường hợp khó khăn và theo dõi cả mức tăng năng suất và chi phí lỗi theo thời gian.
Rủi ro & lan can
Tự động hóa một quy trình bị hỏng có thể khuếch đại các vấn đề hiện có.
Các nhóm có thể tự động hóa quá mức và loại bỏ sự phán xét cần thiết của con người.
Chất lượng có thể thay đổi nếu kết quả đầu ra không được đánh giá liên tục.
Lộ trình thực hiện
Lập sơ đồ quy trình làm việc hiện tại và xác định bước có mức độ ma sát cao nhất.
Lập sơ đồ quy trình làm việc hiện tại và xác định bước có mức độ ma sát cao nhất. Hãy coi mỗi bước như một cổng bằng chứng: nếu không đáp ứng được các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.
Xác định các điểm kiểm tra của con người trước khi tự động hóa hoàn toàn.
Xác định các điểm kiểm tra của con người trước khi tự động hóa hoàn toàn. Hãy coi mỗi bước như một cổng bằng chứng: nếu không đáp ứng được các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.
Đào tạo người dùng về lời nhắc, đường dẫn leo thang và tiêu chuẩn chất lượng.
Đào tạo người dùng về lời nhắc, đường dẫn leo thang và tiêu chuẩn chất lượng. Hãy coi mỗi bước như một cổng bằng chứng: nếu không đáp ứng được các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.
Theo dõi kết quả ở cấp độ nhiệm vụ để xác nhận giá trị bền vững.
Theo dõi kết quả ở cấp độ nhiệm vụ để xác nhận giá trị bền vững. Hãy coi mỗi bước như một cổng bằng chứng: nếu không đáp ứng được các tiêu chí, hãy tạm dừng triển khai, thu hẹp khoảng cách và chỉ sau đó mới mở rộng mức sử dụng.