Ebook: Автоматическое распознавание речи
Author: Тампель И.Б. Карпов А.А.
- Genre: Компьютеры // Организация и обработка данных
- Tags: Информатика и вычислительная техника, Обработка медиа-данных, Обработка звука, Обработка речи
- Language: Русский
- pdf
Учебное пособие. − СПб: Университет ИТМО, 2016. – 138 с.В учебном пособии рассматриваются методы автоматического распознавания речи. Материал пособия разбит на 16 разделов. Первые два раздела посвящены вопросам речеобразования и восприятия слуховой системой. В каждом разделе приведены краткие теоретические и/или практические сведения.
Пособие может быть использовано при подготовке магистров по направлению 09.04.02 - "Информационные системы и технологии" и аспирантов.Введение.
Речеобразование.
Физиология речеобразования.
Процесс образования звуков с голосовым возбуждением.
Передаточная функция голосового тракта.
Расчёт передаточной функции с помощью электроаналогий.
Турбулентный и импульсный источники звука.
Носовые согласные.
Выводы.
Слуховая система.
Строение уха человека.
Маскировка. Восприятие высоты звука.
Восприятие громкости звука. Кривая равной громкости.
Адаптация.
Физиологические методы обработки сигналов.
Выводы.
Признаки речевого сигнала для распознавания речи.
Количественная оценка систем распознавания речи.
Показатели оценки качества распознавания речи.
Показатели оценки скорости распознавания речи.
Метод динамического программирования для распознавания речи.
Меры близости в пространстве признаков.
Распознавание речи с помощью скрытых марковских моделей.
Алгоритм «Вперёд-Назад».
Алгоритм Витерби.
Алгоритм Баума-Уэлша.
Неоднородная марковская модель.
Проблема выбора единиц фонетического уровня.
Кластеризация на основе дерева решений.
Управляемый данными метод построения состояний.
Методы нормализации и адаптации.
Вычитание среднего кепстра.
Адаптация акустических моделей к шуму векторными рядами Тейлора.
Байесовская адаптация.
Линейная регрессия максимума правдоподобия.
Метод собственных дикторов.
Нормализация признаков по длине голосового тракта.
Дискриминантные методы.
Долговременные признаки.
Условные случайные поля.
Глубокие нейронные сети.
Модели языка.
Использование условных вероятностей.
Статистическое сглаживание.
Классовые модели.
Морфемные модели.
Синтаксические и семантические модели.
Модели темы высказывания.
Декодер.
Организация лексикона в виде префиксного дерева.
Использование взвешенных конечных автоматов.
Использование взвешенных преобразователей с конечным числом состояний.
Проблема внесловарных слов.
Использование моделей заполнения.
Использование фиксированных комбинаций фонем.
Использование нескольких систем распознавания.
Аудиовизуальное распознавание речи.
Способы объединения аудио- и видеомодальностей речи.
Методы аудиовизуального моделирования и распознавания речи.
Литература.
Пособие может быть использовано при подготовке магистров по направлению 09.04.02 - "Информационные системы и технологии" и аспирантов.Введение.
Речеобразование.
Физиология речеобразования.
Процесс образования звуков с голосовым возбуждением.
Передаточная функция голосового тракта.
Расчёт передаточной функции с помощью электроаналогий.
Турбулентный и импульсный источники звука.
Носовые согласные.
Выводы.
Слуховая система.
Строение уха человека.
Маскировка. Восприятие высоты звука.
Восприятие громкости звука. Кривая равной громкости.
Адаптация.
Физиологические методы обработки сигналов.
Выводы.
Признаки речевого сигнала для распознавания речи.
Количественная оценка систем распознавания речи.
Показатели оценки качества распознавания речи.
Показатели оценки скорости распознавания речи.
Метод динамического программирования для распознавания речи.
Меры близости в пространстве признаков.
Распознавание речи с помощью скрытых марковских моделей.
Алгоритм «Вперёд-Назад».
Алгоритм Витерби.
Алгоритм Баума-Уэлша.
Неоднородная марковская модель.
Проблема выбора единиц фонетического уровня.
Кластеризация на основе дерева решений.
Управляемый данными метод построения состояний.
Методы нормализации и адаптации.
Вычитание среднего кепстра.
Адаптация акустических моделей к шуму векторными рядами Тейлора.
Байесовская адаптация.
Линейная регрессия максимума правдоподобия.
Метод собственных дикторов.
Нормализация признаков по длине голосового тракта.
Дискриминантные методы.
Долговременные признаки.
Условные случайные поля.
Глубокие нейронные сети.
Модели языка.
Использование условных вероятностей.
Статистическое сглаживание.
Классовые модели.
Морфемные модели.
Синтаксические и семантические модели.
Модели темы высказывания.
Декодер.
Организация лексикона в виде префиксного дерева.
Использование взвешенных конечных автоматов.
Использование взвешенных преобразователей с конечным числом состояний.
Проблема внесловарных слов.
Использование моделей заполнения.
Использование фиксированных комбинаций фонем.
Использование нескольких систем распознавания.
Аудиовизуальное распознавание речи.
Способы объединения аудио- и видеомодальностей речи.
Методы аудиовизуального моделирования и распознавания речи.
Литература.
Download the book Автоматическое распознавание речи for free or read online
Continue reading on any device:
Last viewed books
Related books
{related-news}
Comments (0)