За последние несколько десятилетий можно отметить возросший интерес к проблеме идентификации по голосу, в основном он связан как с успехами, достигнутыми в последнее время, так и с большим спектром практических применений данной задачи.
В связи с существованием разнообразных методов идентификации личности по голосу, в основном связанных с выбором индивидуальных параметров речи и ее характеристик, возникает важно анализа не только существующих методов и моделей, но и создан современных и более надежных.
В настоящее время продолжаются работы по совершенствованию алгоритмов обработки речевых сигналов с целью создания механизмов автоматического опознавания человека по голосу, более адекватных процессу восприятия речи человеком, что приведет созданию современных и более надежных методов идентифи диктора по его речи.
На сегодняшний день созданы десятки различных систем идентификации по голосу, имеющих различные параметры и требования к процессу идентификации в зависимости от конкретных задач, сожалению, на сегодняшний день разработанные программы не отличаются простотой обучения, удобством работы, низкой стоимостью и точностью идентификации диктора по его речи.
Налицо отсутствие детализации описания методов и механизмо построения программных комплексов, в освещении данной темы присутствуют только тезисы и описание самих программных продуктов. Большая часть учебно-научной русскоязычной литературы по данной теме относится к 60-90 годам XX века, что создает большие трудности по изучению данной темы.
В данной работе автором удалось реализовать одну из самых распространенных моделей идентификации диктора по голосу с помощью анализа спектрального представления сигнала. Также была сделана попытка сравнения данной программы с уже существующими и свободно распространяемыми программами по идентификации личности.
Ошибка первого рода для реализованной программы равняется приблизительно 20 %, что влияет на количество попыток пройти процедуру верификации, хотя самая важная характеристика — это ошибка второго рода, вероятность пропустить в систему «чужого», и она равняется 13 %, что является приемлемым результатом и сравнимым с естественной идентификацией человека с помощью слухового аппарата. В сравнении с другими реализациями методов идентификации диктора по голосу, данная реализация сильно уступает и не обеспечивает достаточно надежную точность идентификации.
Также была проделана большая работа по изучению и сравнено методов и моделей идентификации диктора по голосовым данным, используемых уже в существующих программных комплексах анализу речевого сигнала. Отсутствие технических документаций современной русскоязычной литературы по данной теме создает самую большую проблему в изучении и практической реализации. Все основные теоретические результаты по анализу и реализации программного комплекса пригодятся для дальнейшего изучения оптических основ идентификации диктора по голосовым данным. Также был сделан анализ необходимых приемов и технологий для практической реализации методов и моделей идентификации диктора по голосовым данным и анализ рынка продуктов по идентификации дикторов по речевому сигналу.
Стоит отметить, что в ЧелГУ был создан семинар по биометрии целью изучения и практической реализации этой технологии, что должно существенно сказаться на дальнейшем развитии данного научного направления в ЧелГУ. Также были созданы необходимые методические, теоретические и практические рекомендации по практической реализации идентификации диктора по голосу.