Эксπир
Регистрация / Вход

Разработка программно-аппаратного комплекса автоматизации создания компактных электронных архивов научно-технических информационных фондов с возможностью поиска и анализа текстовой и графической информации

Стадии проекта
Предложение принято
Конкурс завершен
Проект закончен
Проект
02.551.11.4014
Руководитель работ
Калафати Юрий Дмитриевич
Продолжительность работ
2008 - 2009, 17 мес.
Бюджетные средства
18 млн
Внебюджетные средства
0 млн

Разработка и исследование программно-аппаратного комплекса, автоматизирующего процесс создания компактных электронных архивов на основе имеющейся научно-технической документации (на бумажных носителях). Создаваемые компактные электронные архивы позволят обеспечивать хранение, анализ, поиск и редактирование текстовой и графической информации.
Разрабатываемый программный комплекс обеспечит:
1. Повышение не менее чем на 20 % производительности труда по созданию компактных электронных архивов научно-технической документации.
2. Уменьшение не менее чем на 30 % стоимости создания компактных электронных архивов, в том числе факсимильных мультимедиа-изданий (монографий, энциклопедий, справочников, учебников) на электронных носителях, созданных по предложенной технологии, по сравнению с аналогичными бумажными изданиями.

Соисполнители

Организация
МСП ИТТ

Предложения

Разработка программно-аппаратного комплекса автоматизации создания компактных электронных архивов научно-технических информационных фондов с возможностью поиска и анализа текстовой и графической информации
Тема
Разработка программно-аппаратного комплекса автоматизации создания компактных электронных архивов научно-технических информационных фондов с возможностью поиска и анализа текстовой и графической информации
Входящий номер
7924
Руководитель организации-инициатора
Калафати Юрий Дмитриевич

Этапы проекта

1
25.06.2008 - 30.09.2008
В ходе 1-го этапа разработана концепция и архитектура программно-аппаратного комплекса автоматизации создания компактных электронных архивов научно-технических информационных фондов с возможностью поиска и анализа текстовой и графической информации.
Следующим этапом после перевода в электронную форму бумажных документов является их классификация. При работе с большим количеством документов чрезвычайно важно автоматизировать процесс классификации и каталогизации. С этой целью в ходе 1 этапа разработано СПО для автоматической классификации и рубрикации текстовой информации, виртуализации представлений электронных документов и управления справочниками и каталогами электронных архивов.
Хранилища электронной информации, должны иметь мощные поисковые системы, позволяющие быстро находить необходимую информацию. Это особенно важно для баз данных с научно-технической информацией. В ходе этапа разработано СПО для поиска текстовой информации.
Проведены патентные исследования по ГОСТ 15.011.
Патентные исследования показали, что перспективным направлением исследований является разработка новых методов осуществления автоматизированного ввода текстовой и графической информации в электронные архивы, информационного поиска в больших массивах текстовых и графических документов, методов рубрикации документов и распознавания графических объектов. Наилучшими результатами должны обладать способы и устройства поиска информации, обеспечивающие быстродействие, точность поиска, релевантность, снимающие ограничения с объемов информационного массива.
Поиск патентной информации проводился в патентных базах данных Федеральной службы по интеллектуальной собственности, патентам и товарным знакам Российской Федерации, Бюро по патентам и товарным знакам США и Европейского патентного бюро.
Создание технологии автоматизации процесса формирования архивов научно-технической документации с современными методами поиска текстовой и графической информации делает возможным создание электронных архивов научно-технической и конструкторской документации и электронных архивов научных школ России, размещение полнотекстовых цифровых коллекций в Интернете, а также осуществление специализированных издательских проектов, и т.п.
Развернуть
2
01.10.2008 - 31.12.2008
Разработаны и программно реализованы два модуля для программно-аппаратного комплекса, автоматизирующего процесс создания компактных электронных архивов на основе имеющейся научно-технической документа-ции. Каждый из этих модулей является специальным программным обеспе-чением (СПО) по работе с графической информацией:
1) СПО, для автоматизированного распознавания графических объектов на графическом образе документа и поиска графических объектов, фрагментов изображений;
2) СПО для выделения найденной текстовой информации непосредственно в графическом образе документа.
Указанные СПО работают с текстографическими форматами документов, та-кими как DjVu и PDF, которые позволяют компактно сохранять графический образ документа, визуально-идентичный оригиналу и удовлетворяют требо-ваниям технического задания:
- обеспечивают показ найденной информации прямо на графических образах документов,
- компактно сохраняют координаты расположения распознанного символа на графическом образе документа;
- обеспечивают автоматизированное распознавание графических объектов на графическом образе документа.
Развернуть
3
01.01.2009 - 30.06.2009
Создано специальное программное обеспечение, которое преобразует оцифрованные бумажные документы в многослойный электронный формат, позволяющий компактно сохранять: графический образ документа, визуально-идентичный оригиналу, распознанный текст документа и координаты расположения распознанного символа на графическом образе документа.Выполнена интеграция модулей специального программного обеспечения и аппаратных компонент в единый программно-аппаратный комплекс. Разработана методика тестирования программно-аппаратного комплекса. Проведены работы по тестированию разработанного программно-аппаратного комплекса автоматизации создания компактных электронных архивов научно-технических информационных фондов.
Развернуть
4
01.07.2009 - 30.11.2009
Разработан текст и описание программы для ЭВМ «Архив НТИФ», которая позволяет преобразовать оцифрованные бумажные документы в многослойный электронный формат, позволяющий компактно сохранять как графический образ документа, визуально-идентичный оригиналу, так и распознанавать текст документа и координаты расположения распознанного символа на графическом образе документа, редактировать распознанный текст документа.
Развернуть

Программа

Программа "Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы"

Программное мероприятие

5.1 Развитие информационной инфраструктуры хранения и передачи новых знаний
Тема
Разработка программно-аппаратного комплекса автоматизации создания компактных электронных архивов научно-технических информационных фондов с возможностью поиска и анализа текстовой и графической информации.
Продолжительность работ
2008 - 2009, 17 мес.
Бюджетные средства
18 млн
Количество заявок
2
Тема
Создание программного комплекса информационно-аналитической поддержки научно-технической деятельности на основе вычислительного семантического поиска и анализа неструктурированной текстовой информации.
Продолжительность работ
2011 - 2013, 28 мес.
Бюджетные средства
120 млн
Количество заявок
16
Тема
Проведение поисковых исследований по созданию прикладного программного обеспечения, реализующего потенциал гибридных суперкомпьютерных систем с ускорителями на основе графических процессоров для резкого повышения производительности вычислений.
Продолжительность работ
2011 - 2012, 14 мес.
Бюджетные средства
30 млн
Количество заявок
18
Тема
Разработка web-сервиса для интеллектуального поиска, классификации и агрегации научной информации в пополняемых мультидисциплинарных коллекциях текстовых документов.
Продолжительность работ
2011 - 2013, 27 мес.
Бюджетные средства
90 млн
Количество заявок
6
Тема
Исследование и разработка программного обеспечения понимания неструктурированной текстовой информации на русском и английском языках на базе создания методов компьютерного полного лингвистического анализа.
Продолжительность работ
2012 - 2013, 18 мес.
Бюджетные средства
60 млн
Количество заявок
18