Исследователи из Microsoft Research создали приложение для ввода текста движением глаз
Исследователи из Microsoft Research при участии коллеги из Университета Вашингтона реализовали удобный и недорогой метод ввода текста взглядом, сделав его значительно более доступными для людей с недостатком двигательной способности (к примеру, страдающих боковым амиотропическим склерозом, который диагностирован у Стивена Хокинга).
Специальное оборудование, которое позволяло парализованным пациентам «печатать глазами», существовало и раньше. Обычно оно работает так: сидящий перед камерой пользователь сначала переводит взгляд в сторону одной из нескольких групп букв, а вторым движением глаз выбирает конкретную букву в группе, затем повторяет это с каждой следующей буквой. Для отслеживания направления взгляда в таких системах используются инфракрасные датчики, которые плохо работают при свете, а стоимость всего комплекта может составлять пять-десять тысяч долларов.
Ученым из Microsoft Research удалось не только значительно удешевить систему, но и упростить сам процесс ввода. Созданная ими программа Eye-gaze работает на обычном смартфоне и следит за глазами через его камеру. Из дополнительного оборудования понадобится лишь картинка с буквами, а сам смартфон даже не нужно закреплять на штативе. Отказ от инфракрасных датчиков также означает, что Eye-gaze можно использовать при ярком солнечном свете.
Программа сканирует и захватывает изображение глаз с помощью технологии распознавания изображений Microsoft, после чего соотносит каждое движение глаз с соответствующими командами.
Упрощение процесса печати достигается благодаря предиктивному механизму ввода текста. Групп букв в Eye-gaze всего четыре, и пользователю достаточно выбирать лишь группу, но не букву в ней. Для удаления введенной буквы нужно моргнуть левым глазом, а для подтверждения слова — правым. Ассистент, держащий в руках телефон с Eye-gaze, видит список подсказок и может помогать вводить слова, выбирая подходящие по контексту варианты.
В среднем на печать предложения при помощи Eye-gaze уходит примерно 1.5 минуты, тогда как ввод того же предложения на более дорогой и сложной системе e-tran занимает более 2 минут. Опрос участников тестирования показал, что они находят Eye-gaze менее сложным и более приятным способом ввода.
Для того чтобы понять о каких переменах идет речь, попробуем сфокусироваться на событиях после 2022 года и их масштабах с точки зрения кибербезопасности.