Мухамедияров
Р.М.
Казахский
национальный технический университет К.И.Сатпаева, Алматы,
Казахстан
Человеко-машинный
интерфейс на основе слежения за взглядом на видеопоследовательности, полученной
с камеры.
В настоящее время с ощутимо увеличивающейся производительностью
аппаратной части компьютеров то, что только вчера казалось нам фантастикой,
сегодня становится реальным.
С ростом уровня внедрения компьютеров практически во
все сферы человеческой деятельности все более остро встает проблема построения
как можно более удобных интерфейсов человек-компьютер. Одним из основных
направлений в этой области является создание естественного человеко-машинного
интерфейса, позволяющего пользователю вводить информацию в компьютер наиболее
привычными и естественными для него способами: с помощью речи, жестов, мимики и
т.п.
Gaze tracking (слежение за взглядом) – одна из задач машинного зрения,
для решения проблемы отслеживания направления, продолжительности и некоторые
других параметров взгляда человека на видеопоследовательности.
Информация о
глазах, совместно с информацией о положении головы, позволяет получить
информацию о том, куда смотрит человек, а информация о частоте и скорости
морганий позволяет сделать вывод о состоянии человека на данный момент.
Для
решения данной задачи требуется выполнить определенные виды операций над
полученной последовательностью изображений. А именно:
·
Обнаружение и локализация лица - вынесение решения о наличии (и, возможно,
количестве) лиц на изображении, определение их положения.
·
Отслеживание лица – определение
позиции лица в текущем кадре видео на основе позиции на предыдущем.
·
Автоматическое выделение
антропометрических точек лица (контуры краев глаз, зрачков, бровей, носа, рта,
подбородка и т.п) на фронтальном изображении.
·
На основе полученных данных определение ориентации головы в трехмерном
пространстве и направления взгляда.
В свою очередь каждый из выше
описанных пунктов является отдельной задачей и для их решения требуются свои
методы и алгоритмы анализа и обработки изображения и/или видео.
Для человека эти задачи являются
более чем простой, но при построении автоматической системы обнаружения лиц и
слежения за направлением взгляда приходится столкнуться с некоторыми
сложностями:
·
У разных людей сильно варьируется
внешний вид лица.
·
Даже относительно небольшое
изменение ориентации лица относительно камеры влечет за собой серьезное
изменение изображения лица.
·
Возможное присутствие индивидуальных
особенностей, таких как усы, бороды, очки, морщины и т.п. существенно осложняет
автоматическое распознавание.
·
Изменение выражения лица может
сильно сказаться на том, как лицо выглядит на изображении.
·
Возможное перекрытие части лица
другими предметами на изображении.
·
Условия съемки (освещение, цветовой
баланс камеры, искажения изображения, привносимые оптикой системы, качество
изображения) в значительной степени влияют на получаемое изображение лица.
С
помощью технологий, использующие методы и алгоритмы слежения за объектом, а в
частности за лицом и глазами человека, можно управлять компьютером,
периферийными устройствами, различной бытовой техникой, набирать тексты при
помощи взгляда, что особенно важно для людей с разными физическими
недостатками. Помимо этого, такие системы могут найти самое широкое применение
для детектирования состояния водителя, слежения за состоянием операторов
сложных систем (например, машинистов поездов, авиационного диспетчера,
диспетчера атомной станции и т.п.), с целью предотвращения сбоев в их работе
из-за усталости (отвлечения, засыпания и т.п.). А также строить системы оценки
Web-дизайна и реализовывать еще множество различных интересных и полезных
проектов.
Литература:
1.
Computer Vision: A Modern Approach by D. A. Forsyth and J. Ponce,
Prentice Hall, Upper Saddle River, N.J., 2002
2.
Computer Vision. L. Shapiro and G. Stockman, Prentice-Hall, Upper Saddle
River, N.J., 2000
3. Искусственный интеллект. Современный подход. Стюарт
Рассел, Питер Норвиг. Москва/Санкт-Петербург/Киев, 2006.
5.
Vezhnevets V. Face and facial feature
tracking for natural Human-Computer Interface // Proceedings Graphicon - 2002,
September 16 - September 21, 2002, pp. 86-90