Мухамедияров Р.М.

Казахский национальный технический университет К.И.Сатпаева, Алматы, Казахстан

Человеко-машинный интерфейс на основе слежения за взглядом на видеопоследовательности, полученной с камеры.

В настоящее время с ощутимо увеличивающейся производительностью аппаратной части компьютеров то, что только вчера казалось нам фантастикой, сегодня становится реальным.

С ростом уровня внедрения компьютеров практически во все сферы человеческой деятельности все более остро встает проблема построения как можно более удобных интерфейсов человек-компьютер. Одним из основных направлений в этой области является создание естественного человеко-машинного интерфейса, позволяющего пользователю вводить информацию в компьютер наиболее привычными и естественными для него способами: с помощью речи, жестов, мимики и т.п.

Gaze tracking (слежение за взглядом) – одна из задач машинного зрения, для решения проблемы отслеживания направления, продолжительности и некоторые других параметров взгляда человека на видеопоследовательности.

Информация о глазах, совместно с информацией о положении головы, позволяет получить информацию о том, куда смотрит человек, а информация о частоте и скорости морганий позволяет сделать вывод о состоянии человека на данный момент.

         Для решения данной задачи требуется выполнить определенные виды операций над полученной последовательностью изображений. А именно:

·       Обнаружение и локализация лица  - вынесение решения о наличии (и, возможно, количестве) лиц на изображении, определение их положения.

·       Отслеживание лица – определение позиции лица в текущем кадре видео на основе позиции на предыдущем.

·       Автоматическое выделение антропометрических точек лица (контуры краев глаз, зрачков, бровей, носа, рта, подбородка и т.п) на фронтальном изображении.

·        На основе полученных данных определение ориентации головы в трехмерном пространстве и направления взгляда.

В свою очередь каждый из выше описанных пунктов является отдельной задачей и для их решения требуются свои методы и алгоритмы анализа и обработки изображения и/или видео.

Для человека эти задачи являются более чем простой, но при построении автоматической системы обнаружения лиц и слежения за направлением взгляда приходится столкнуться с некоторыми сложностями:

·        У разных людей сильно варьируется внешний вид лица.

·        Даже относительно небольшое изменение ориентации лица относительно камеры влечет за собой серьезное изменение изображения лица.

·        Возможное присутствие индивидуальных особенностей, таких как усы, бороды, очки, морщины и т.п. существенно осложняет автоматическое распознавание.

·        Изменение выражения лица может сильно сказаться на том, как лицо выглядит на изображении.

·        Возможное перекрытие части лица другими предметами на изображении.

·        Условия съемки (освещение, цветовой баланс камеры, искажения изображения, привносимые оптикой системы, качество изображения) в значительной степени влияют на получаемое изображение лица.

 

С помощью технологий, использующие методы и алгоритмы слежения за объектом, а в частности за лицом и глазами человека, можно управлять компьютером, периферийными устройствами, различной бытовой техникой, набирать тексты при помощи взгляда, что особенно важно для людей с разными физическими недостатками. Помимо этого, такие системы могут найти самое широкое применение для детектирования состояния водителя, слежения за состоянием операторов сложных систем (например, машинистов поездов, авиационного диспетчера, диспетчера атомной станции и т.п.), с целью предотвращения сбоев в их работе из-за усталости (отвлечения, засыпания и т.п.). А также строить системы оценки Web-дизайна и реализовывать еще множество различных интересных и полезных проектов.

 

Литература:

1.     Computer Vision: A Modern Approach by D. A. Forsyth and J. Ponce, Prentice Hall, Upper Saddle River, N.J., 2002

2.     Computer Vision. L. Shapiro and G. Stockman, Prentice-Hall, Upper Saddle River, N.J., 2000

3.     Искусственный интеллект. Современный подход. Стюарт Рассел, Питер Норвиг. Москва/Санкт-Петербург/Киев, 2006.

4.     http://graphics.cs.msu.ru/

5.     Vezhnevets V. Face and facial feature tracking for natural Human-Computer Interface // Proceedings Graphicon - 2002, September 16 - September 21, 2002, pp. 86-90