Эксπир
Регистрация / Вход

Разработка системы статистического анализа российской науки на основе данных российского индекса цитирования.

Стадии проекта
Предложение принято
Конкурс завершен
Выполнение этапа проекта
Проект
02.447.11.7001
Организация
НЭБ
Продолжительность работ
2005 - 2006, 17 мес.
Бюджетные средства
20 млн
Внебюджетные средства
0 млн

создание информационной системы, максимально полно отражающей публикации российских ученых в области естественных, технических, гуманитарных и общественных наук

Соисполнители

Организация
ГПНТБ СО РАН
Организация
ИНИОН РАН

Этапы проекта

1
31.05.2005 - 31.08.2005
2
01.09.2005 - 30.11.2005
Основные результаты работ:
Собрана и систематизирована информация о российских научных журналах (более 2200 наименований), в том числе контактная информация по издательствам.
Подготовлен типовой набор документов для издательств, принимающих участие в проекте РИНЦ.
Разосланы предложения об участии в проекте по созданию РИНЦ более 800 российским научным издательствам.
Заключены соглашения на поставку необходимой для обработки в РИНЦ информации для более 200 научных журналов.
Собрана дополнительная информация по более 1000 журналам из списка ВАК, в том числе об их периодичности, среднему числу страниц, среднем количестве статей, форматах оформления пристатейной библиографии, наличии постатейной рубрикации и др.
Заключено соглашение на поставку в течение 2006 года печатных версий российских научных журналов (не менее 800 наименований).
Разработана и создана структура базы данных для хранения данных РИНЦ и ЕРНП.
Разработано программное обеспечение и интерфейсные формы для регистрации персон и организаций, участвующих в ЕРНП и РИНЦ.
  Разработано ПО и интерфейс для поиска и работы администраторов системы с персонами и организациями.
Разработано ПО и интерфейсные формы для регистрации в системе публикаций для персон и организаций, участвующих в ЕРНП.
Разработан административный интерфейс для контроля, идентификации и корректной привязки входной информации о публикациях на основе нормативной информации из базы данных.
Разработана таблица соответствия УДК и ГРНТИ для проведения автоматической постатейной рубрикации журналов.
Разработаны требования и технология обработки печатных журналов из библиотечных фондов.
Проведено сканирование 300 годовых массивов печатных журналов за 2005 год из библиотечных фондов. Всего обработано более 2400 выпусков, что составляет более 240000 страниц.
Проведено распознавание текста в отсканированных статьях и редактирование текстовой информации в части, предназначенной для занесения в базу данных РИНЦ.
Разработаны требования и технология для поточного сканирования, распознавания и редактирования печатных журналов, получаемых от издательств или по подписке.
Проведено поточное сканирование, распознавание и редактирование 50 годовых массивов выпусков журналов за 2000-2005 годы, полученных от издательств в печатном виде на основании заключенных соглашений о включении информации в РИНЦ.
Разработано программное обеспечение для разметки текста статей и формирования библиографического описания статей в формате XML.
Разработана технология организации работ по разметке текстов статей, полученных в электронном виде или после сканирования и распознавания.
Разработана программа автоматической загрузки библиографических описаний в формате XML в базу данных РИНЦ.
Разработаны алгоритмы для автоматического разбора пристатейной библиографии.
Проведена работа по сбору и систематизации нормативной информации, необходимой для проведения автоматического разбора пристатейной библиографии. Собрана информация о 80000 научных журналах, в том числе 2300 российских, вариантах написания их названий и сокращений, используемых в библиографических описаниях. Для 7000 журналов дополнительно собрана информация о существующих выпусках (год, том, номер, страницы).
Проведена работа по рубрикации российских журналов из перечня ВАК на основании последней версии рубрикатора ГРНТИ.
  Доработан интерфейс системы для работы с пристатейными ссылками (списки литературы к статьям, списки статей, ссылающихся на данную, индикация количества цитирований и т.д.).
Разработано программное обеспечение для автоматической простановки ссылок на статьи, если их описания уже имеются в базе данных. Проведено тестирование на массиве 150000 ссылок к статьям из российских журналов, уже загруженных в базу данных РИНЦ.
Разработаны алгоритмы и протестировано программное обеспечение для осуществления автоматических запросов в авторитетные источники библиографической информации с целью дополнительного контроля и обнаружения возможных ошибок при зан
Развернуть
3
01.01.2006 - 30.06.2006
1. Разработано программное обеспечение для автоматической обработки данных, поступающих в Российский индекс научного цитирования (РИНЦ).
2. Разработана и отлажена комплексная технология обработки печатных и электронных выпусков журналов, включающая следующие стадии:
- сканирование печатных выпусков;
- автоматическое распознавание;
- выборочное редактирование;
- разметка данных;
- загрузка в базу данных;
- автоматический разбор пристатейных ссылок;
- идентификация и привязка информации в базе данных;
- тематическое рубрицирование статей.
3. По данной технологии обработано 430 наименований российских научных журналов (более 4500 выпусков, 70 тысяч статей, 720 тысяч пристатейных ссылок).
4. Проведен анализ различных алгоритмов расчета библиометрических показателей на основе индекса научного цитирования и возможности их использования для целей статистического анализа российской науки.
Развернуть
4
01.07.2006 - 31.10.2006
В результате выполнения работ по государственному контракту
от 30 мая 2005 № 02.447.11.7001 получены следующие основные результаты:
1. Разработана и отлажена комплексная технология обработки печатных и электронных выпусков журналов, включающая следующие стадии:
- сканирование печатных выпусков;
- автоматическое распознавание;
- выборочное редактирование;
- разметка данных;
- загрузка в базу данных;
- автоматический разбор пристатейных ссылок;
- идентификация и привязка информации в базе данных;
- тематическое рубрицирование статей.
2. Разработано программное обеспечение для автоматической обработки данных, поступающих в Российский индекс научного цитирования (РИНЦ).
3. По данной технологии обработано более 1100 наименований российских научных журналов (более 11 тысяч выпусков, 440 тысяч статей, 1.35 миллиона пристатейных ссылок).
4. Разработано необходимое программное обеспечение и интерфейс пользователей системы, позволяющее проводить поиск публикаций, авторов, организаций, журналов и рассчитывать для них индексы научного цитирования.
5. Проведен анализ различных алгоритмов расчета библиометрических показателей на основе индекса научного цитирования и возможности их использования для целей статистического анализа российской науки.
6. Собрана и систематизирована информация о российских научных журналах (более 3050 наименований), российских авторах (более 200 тыс.) и научных организациях (более 1200).
7. Разработано базовое программное обеспечение и интерфейс для Единого реестра научных публикаций (ЕРНП) российских ученых, предназначенного для сбора, систематизации и анализа библиографических описаний публикаций различных типов (статьи в журналах, монографии и учебники, доклады на конференциях, научно-образовательные курсы, патенты, диссертации и т.д.).
Развернуть

Программа

Программа "Исследования и разработки по приоритетным направлениям развития науки и техники" на 2002-2006 годы

Программное мероприятие

2.2 Проведение опытно-конструкторских, технологических и экспериментальных разработок по приоритетным направлениям развития научно-технической сферы (в том числе на долевой основе с хозяйствующими субъектами)
Тема
Разработка системы статистического анализа российской науки на основе данных российского индекса цитирования
Продолжительность работ
2005 - 2006, 23 мес.
Бюджетные средства
20 млн
Количество заявок
4
Тема
Разработка методики и инструментальных средств для статистического анализа российской науки на основе данных Российского индекса научного цитирования
Продолжительность работ
2007 - 2009, 29 мес.
Бюджетные средства
60 млн
Количество заявок
2
Тема
Разработка информационно-аналитической системы статистического анализа библиометрических показателей науки на основе данных Российского индекса научного цитирования.
Продолжительность работ
2010 - 2013, 37 мес.
Бюджетные средства
83,2 млн
Количество заявок
1
Тема
Поддержка и расширение системы обеспечения новыми информационными технологиями участников федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014 – 2020 годы». Обеспечение лицензионного доступа к международным индексам научного цитирования
Продолжительность работ
2014 - 2015, 21 мес.
Бюджетные средства
558 млн
Количество заявок
3
Тема
Модернизация и оптимизация системы обеспечения современными информационными источниками участников федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014 – 2020 годы». Обеспечение лицензионного доступа к международному индексу научного цитирования Scopus
Продолжительность работ
2016, 6 мес.
Бюджетные средства
182 млн
Количество заявок
2