Эксπир
Регистрация / Вход

Разработка и реализация в виде программного обеспечения технологии синтеза речи на русском языке с учетом синтаксического и семантического анализа русского текста с высоким качеством звучания

Стадии проекта
Предложение принято
Конкурс завершен
Проект закончен
Проект
02.524.11.4001
Продолжительность работ
2007 - 2009, 30 мес.
Бюджетные средства
152,87 млн
Внебюджетные средства
66,95 млн

Создание технологии синтеза русской речи в реальном времени с высоким качеством произношения, семантическим анализом для управления интонацией, согласованием времени и падежей, с соблюдением правил произношения.
Создание программного обеспечения качественного синтеза речи для широкого спектра электронных устройств, что обеспечит стратегические конкурентные преимущества Российской Федерации в критически важной сфере создания голосового интерфейса управления сложными техническими объектами.

Этапы проекта

1
20.04.2007 - 30.06.2007
Результатом выполнения первого этапа контракта является определение концепции разработки технологических средств обеспечивающих технологию синтеза речи на русском языке с учетом синтаксического и семантического анализа русского текста с высоким качеством звучания.
Проведены патентные исследования. Сделан отбор и анализ исходных материалов, а именно: принципы формирования текстового материла, правила выбора диктора, технология записи дикторов. Проведен предварительный выбор методов создания синтеза с естественным звучанием. Выполнен анализ целесообразности применения ранее разработанных программ.
Развернуть
2
01.07.2007 - 30.11.2007
Результатом выполнения второго этапа контракта является разработка эскизного проекта обеспечивающего технологию синтеза речи на русском языке с учетом синтаксического и семантического анализа русского текста с высоким качеством звучания.
Разработана общая архитектура программного комплекса. Проведена предварительная разработка структуры входных и выходных данных. Разработано описание общих алгоритмов решения задач. Разработана общая методика по применению технологий синтеза.
Развернуть
3
01.12.2007 - 31.12.2007
Результатом выполнения третьего этапа контракта является разработка эскизного проекта обеспечивающего технологию синтеза речи на русском языке с учетом синтаксического и семантического анализа русского текста с высоким качеством звучания.
Проработаны технические решения по обеспечению заданных показателей надежности. Разработана пояснительная записка к Эскизному проекту. Проведена оценка программных средств в соответствии с требованиями ГОСТ 28195-89. Проведены мероприятия по достижению показателей (раздел 8ТЗ).
Развернуть
4
01.01.2008 - 30.06.2008
Результатом выполнения четвертого этапа контракта является разработка технического проекта обеспечивающего технологию синтеза речи на русском языке с учетом синтаксического и семантического анализа русского текста с высоким качеством звучания.
Уточнена структура входных и выходных данных. Определена форма представления входных и выходных данных. Разработана структура программного комплекса и принципы взаимодействия его составных частей. Разработано описание алгоритмов составных частей Программного комплекса. Определена окончательная конфигурация технических средств. Приняты окончательные технические решения по обеспечению заданных показателей надежности. Разработана пояснительная записка. Доработана общая методика по применению технологии синтеза речи. Реализованы мероприятия по достижению показателей (раздел 8 ТЗ). Оценено качество программных средств в соответствии с требованиями ГОСТ 28195-89.
Развернуть
5
01.07.2008 - 30.11.2008
1. Разработан новый подход выбора речевых единиц для синтеза речи методом гибридного Unit Selection:
- Разработан гибридный алгоритм стыковки единиц, взятых их двух разных речевых баз: речевой корпус Unit Selection и аллофонной базы;
- Качество синтеза приближается к естественной речи при реализации на стационарных платформах;
- Достигнуто высокое качество (масштабируемость) синтеза при реали-зации на платформах с ограниченными ресурсами;
2. Впервые реализован единый метод анализа текста, адаптированный под задачи синтеза:
- Учет специфики использования в системе синтеза речи
1) Анализируется не сам знак в его графической форме, а набор аль-тернативных характеристик сочетаемостных свойств знака;
2) Многоуровневость анализа;
- Позволяет на каждом уровне связывать знаки, которые имеют общие значения признаков.
- С помощью укрупнения знаков можно установить формально содер-жательные связи у знаков, которые находятся на большом удалении друг от друга.
- Возможность формулировать правила сегментирования и связывания
для групп знаков, объединенных общим признаком.
- Правила анализа вынесены на внешний уровень и отделены от алго-ритма-кода.
3. Реализован новый специализированный метод графематического анализа.
- Единый алгоритм на всех уровнях (графематика, морфология, синтак-сис) анализа текста.
- Метод максимально использует информацию, которая сообщается чи-тателю с помощью внешнего оформления и структурирования текста.
1) Анализ разбиения текста на зрительно выделяемые части.
2) Форматирование частей текста, структуры абзаца, а также использо-ванных пунктуационных знаков (напр., прямая речь, текст в кавычках, пар-ные скобки и т.п.).
- Автоматическое определение и учет структуры текста как внутри предложения, так и за его пределами. Значительно облегчает лингвистиче-ский (морфологический, синтаксический и семантический) анализ предложе-ния.
Развернуть
6
01.12.2008 - 31.12.2008
2.1. Разработана программная документация для программного комплекса для персональной ЭВМ (ПК-П). Реализованы мероприятия по достижению показателей (Раздел 8 ТЗ). Проведена оценка качества программных средств в соответствии с требованиями ГОСТ 28195-89.
2.2. Технология на стадии патентования в виде полезной модели. В дальнейшем планируется заявка на патент на изобретение.
Развернуть
7
01.01.2009 - 31.03.2009
Запрограммированы и отлажены программные компоненты ПК-М, разработана программная документация. Разработана и согласована программа и методика предварительных испытаний ПК-М. Разработаны методики компоновки и сопряжения аппаратно-программных средств, включаемых в состав технологии. Выполнена разработка бизнес-плана по коммерциализации разработанных технологий.
Развернуть
8
01.04.2009 - 31.07.2009
Проведены предварительные испытания ПК-П и ПК-М. Откорректированы программные средства и программная документация по результатам предварительных испытаний. Разработаны и согласованы Программы и методики приемочных испытаний ПК-П и ПК-М. Проведены дополнительные патентные исследования. Доработана Методика компоновки и сопряжения аппаратно-программных средств, включаемых в состав технологии.
Развернуть
9
01.08.2009 - 31.10.2009
Проведены приемочные испытания ПК-П и ПК-М. Откорректированы программные средства и программная документация по результатам приемочных испытаний. Доработаны Бизнес-план по коммерциализации разработанных технологий, общая методика по применению технологии синтеза речи, методики компоновки и сопряжения аппаратно-программных средств, включаемых в состав технологии
Развернуть

Программа

Программа "Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы"

Программное мероприятие

2.4 Осуществление комплексных проектов, в том числе разработка конкурентоспособных технологий, предназначенных для последующей коммерциализации в области информационно-телекоммуникационных систем
Тема
Разработка и реализация в виде программного обеспечения технологии синтеза речи на русском языке с учетом синтаксического и семантического анализа русского текста с высоким качеством звучания
Продолжительность работ
2007 - 2009, 30 мес.
Бюджетные средства
155,2 млн
Количество заявок
5
Тема
Исследование методов и разработка программного обеспечения автоматического распознавания, диаризации, семантической классификации и реферирования разговорной русской речи.
Продолжительность работ
2012 - 2013, 18 мес.
Бюджетные средства
60 млн
Количество заявок
11
Тема
««Организационно-техническое обеспечение проведения международной молодежной научной школы «Российско-Германская дистанционная научная школа. Актуальные и перспективные направления создания систем, обеспечивающих семантический анализ данных в режиме реального времени» в рамках фестиваля науки».
Продолжительность работ
2012, 2 мес.
Бюджетные средства
1,6 млн
Количество заявок
2
Тема
Разработка и реализация алгоритмических и программных средств тематической категоризации Интернет-ресурсов с использованием семантического анализа текстового содержимого web-страниц
Продолжительность работ
2005 - 2006, 23 мес.
Бюджетные средства
10 млн
Количество заявок
6
Тема
Разработка технологий извлечения данных и анализа текстовых информационных ресурсов на различных естественных языках для информационно-аналитических систем нового поколения в глобальных и локальных информационных сетях
Продолжительность работ
2007 - 2009, 30 мес.
Бюджетные средства
165 млн
Количество заявок
6