Эксπир
Регистрация / Вход

Разработка методики и инструментальных средств для статистического анализа российской науки на основе данных Российского индекса научного цитирования

Стадии проекта
Предложение принято
Конкурс завершен
Проект закончен
Проект
02.551.11.4004
Организация
НЭБ
Руководитель работ
Еременко Геннадий Олегович
Продолжительность работ
2007 - 2009, 29 мес.
Бюджетные средства
60 млн
Внебюджетные средства
0 млн

Создание аналитической подсистемы в составе Российского индекса научного цитирования (РИНЦ), позволяющей корректно производить статистический анализ научной деятельности российских ученых, научно-образовательных организаций, научных коллективов и журналов на основе данных РИНЦ. Информационное наполнение и расширение функциональных возможностей Российского индекса научного цитирования

Соисполнители

Организация
НИУ ВШЭ
Организация
ГПНТБ СО РАН
Организация
ИФХИБПП РАН

Этапы проекта

1
18.05.2007 - 30.09.2007
Основные цели: 1. Создание аналитической подсистемы в составе Российского индекса научного цитирования (РИНЦ), позволяющей корректно производить статистический анализ научной деятельности российских ученых, научно-образовательных организаций, научных коллективов и журналов на основе данных РИНЦ.
2. Информационное наполнение и расширение функциональных возможностей Российского индекса научного цитирования.

В результате выполнения работ на этапе № 1 государственного контракта от 18 мая 2007 г. № 02.551.11.4004 получены следующие основные результаты:
1. Обработаны выпуски 1300 наименований российских научных журналов за первые три квартала 2007 года (более 6900 выпусков, 137 тысяч статей, 1.17 миллиона пристатейных ссылок) по комплексной технологии, включающей следующие стадии:
- сканирование печатных выпусков;
- автоматическое распознавание;
- выборочное редактирование;
- разметка данных;
- загрузка в базу данных;
- автоматический разбор пристатейных ссылок;
- идентификация и привязка информации в базе данных;
- тематическое рубрицирование статей.
2. Разработан проект постановления Правительства Российской Федерации «О Российском индексе научного цитирования», включая проект Положения о РИНЦ.
3. Расширена функциональность Единого реестра научных публикаций (ЕРНП) для расчетов показателя результативности научной деятельности научных работников и подразделений (ПРНД).
4. Собрана, систематизирована и актуализирована информация о российских научных журналах (более 3700 наименований), российских авторах (более 480 тысяч) и научных организациях (более 3500).
5. Доработано программное обеспечение и технология для разметки и формирования библиографического описания научных книг и диссертаций в формате XML.
6. Доработаны алгоритмы для автоматического разбора пристатейной библиографии.
7. Расширена функциональность интерфейса Российского индекса научного цитирования.
8. Проведен анализ различных алгоритмов расчета библиометрических показателей на основе индекса научного цитирования и возможности их использования для целей статистического анализа российской науки.
Развернуть
2
01.10.2007 - 31.12.2007
Основные цели работ, осуществляемых в рамках госконтракта от 18 мая 2007 г.
N2 02.551.11.4004 по теме "Разработка методики и инструментальных средств для статистического анализа российской науки на основе данных Российского индекса научного цитирования" :
1. Создание аналитической подсистемы в составе Российского индекса научного цитирования (РИНЦ), позволяющей корректно про изводить статистический анализ научной деятельности российских ученых, научно-образовательных организаций, научных коллективов и журналов на основе данных РИНЦ.
2. Информационное наполнение и расширение функциональных возможностей Российского индекса научного цитирования.
В результате выполнения работ на этапе N2 2 государственного контракта от 18 мая 2007 г. N2 02.551.11.4004 получены следующие основные результаты:
1. Обработаны выпуски 1300 наименований российских научных журналов за 2007 год
по комплексной технологии, включающей следующие стадии: - сканирование печатных выпусков;
- автоматическое распознавание;
- выборочное редактирование;
- разметка данных;
- загрузка в базу данных;
- автоматический разбор при статейных ссылок;
- идентификация и привязка информации в базе данных;
- тематическое рубрицирование статей.
Общий объем данных, представленных в РИНЦ, составил: более 29000 выпусков, 360 тысяч статей, 2.93 миллиона пристатейных ссылок.
2. Разработан проект постановления Правительства Российской Федерации «О Российском индексе научного цитирования», включая проект Положения о РИНЦ.
3. Расширена функциональность Единого реестра научных публикаций (ЕРНП) дЛЯ расчетов показателя результативности научной деятельности научных работников и подразделений (ПРНД).
4. Собрана, систематизирована и актуализирована информация о российских научных журналах (более 3800 наименований), российских авторах (более 480 тысяч) и научных организациях (более 3600).
5. Доработано программное обеспечение и технология для разметки и формирования библиографического описания научных книг и диссертаций в формате XML.
6. Доработаны алгоритмы для автоматического разбора пристатейной библиографии.
Разработан интерфейс для ручной коррекции ошибок в пристатейных ссылках, загруженных в базу данных РИНЦ.
7. Проведен анализ различных алгоритмов расчета библиометрических показателей на основе индекса научного цитирования и возможности их использования для целей статистического анализа российской науки.
8. Разработаны предложения по регламентам формирования и уточнения перечня журналов ВАК и обязательному предоставлению для обработки в РИНЦ экземпляров журналов, включенных в Перечень ВАК
9. Разработана комплексная количественная методика оценки уровня научных журналов.
Расширена функциональность интерфейса РИНЦ дЛЯ проведения таких расчетов
Развернуть
3
01.01.2008 - 31.05.2008
Работы по этапу № 3 государственного контракта от 18 мая 2007 г. № 02.551.11.4004 выполнялись в период с 01 января 2008 г. по 31 мая 2008 г. Основными задачами на данном этапе работ согласно Техническому заданию и Календарному плану выполняемых работ были:
1. Обработка выпусков 1400 журналов за январь-май 2008 года
2. Расширение состава документов, представленных в ЕРНП (монографии, патенты, научно-технические отчеты, диссертации, препринты, материалы конференций и т.д.)
В результате выполнения работ на этапе № 3 государственного контракта от 18 мая 2007 г. № 02.551.11.4004 получены следующие основные результаты:
1. Обработаны выпуски более 1400 наименований российских научных журналов за январь-май 2008 года по комплексной технологии, включающей следующие стадии:
- сканирование печатных выпусков;
- автоматическое распознавание;
- выборочное редактирование;
- разметка данных;
- загрузка в базу данных;
- автоматический разбор пристатейных ссылок;
- идентификация и привязка информации в базе данных;
- тематическое рубрицирование статей.
2. Общий объем данных, представленных в РИНЦ, составил: более 32000 выпусков, 420 тысяч статей, 3.6 миллиона пристатейных ссылок.
3. Количество российских журналов, представленных в полнотекстовом виде, составило 554 наименования, из них 211 находятся в открытом доступе.
4. Рассчитаны импакт-факторы для российских журналов за 2007 год.
5. Разработана система управления процессом обработки журналов на всех технологических стадиях, обеспечивающая учет, контроль и статистический анализ проводимых работ в условиях распределенной обработки журналов.
6. Доработаны программа загрузки, структура базы данных и интерфейс Единого реестра научных публикаций российских ученых для работы с документами разных типов (монографии, патенты, научно-технические отчеты, диссертации, препринты, материалы конференций).
7. Расширена и актуализирована информация о российских научных журналах (более 4300 наименований), российских авторах (более 486 тысяч) и научных организациях (более 3670).
8. Разработаны новые формы договоров для включения журналов в РИНЦ
Развернуть
4
01.06.2008 - 30.09.2008
1. Разработана система автоматизированного контроля качества разбора ссылок и их коррекции, позволяющая организовать распределенную работу операторов по проверке и исправлению ошибок, допущенных при автоматическом разборе пристатейных ссылок, и тем самым повысить качество информации по цитированию в базе данных.
2. Расширена и актуализирована информация о российских научных журналах (более 5040 наименований), российских авторах (более 486 тысяч) и научных организациях (более 4300).
3. Разработан пакет предложений по изменению нормативно-правовой базы в сфере науки и технологий с учетом введения в действие РИНЦ.
4. Расширен набор библиометрических показателей, рассчитываемых в системе, и проведена соответствующая доработка интерфейса РИНЦ для проведения статистического анализа с использованием этих показателей.
5. Обработаны выпуски более 1400 наименований российских научных журналов за июнь-сентябрь 2008 года по комплексной технологии, включающей следующие стадии:
- сканирование печатных выпусков;
- автоматическое распознавание;
- выборочное редактирование;
- разметка данных;
- загрузка в базу данных;
- автоматический разбор пристатейных ссылок;
- идентификация и привязка информации в базе данных;
- тематическое рубрицирование статей.
6. Общий объем данных, представленных в РИНЦ, составил: более 37000 выпусков, 510 тысяч статей, 4 миллиона пристатейных ссылок.
7. Количество российских журналов, представленных в полнотекстовом виде, составило 673 наименования, из них 280 находятся в открытом доступе
Развернуть
5
01.10.2008 - 31.12.2008
1. Разработаны предложения по применению РИНЦ для формирования экспертных советов, комиссий и рабочих групп в сфере науки и технологий и совершенствования системы оплаты труда научных и педагогических работников.
2. Обработаны выпуски более 1400 наименований российских научных журналов за октябрь-декабрь 2008 года по комплексной технологии, включающей следующие стадии:
- сканирование печатных выпусков;
- автоматическое распознавание;
- выборочное редактирование;
- разметка данных;
- загрузка в базу данных;
- автоматический разбор пристатейных ссылок;
- идентификация и привязка информации в базе данных;
- тематическое рубрицирование статей.
3. Общий объем данных, представленных в РИНЦ, составил: более 40000 выпусков, 580 тысяч статей, 4,5 миллиона пристатейных ссылок.
4. Количество российских журналов, представленных в полнотекстовом виде, составило 703 наименования, из них 347 находятся в открытом доступе.
5. Проведен анализ различных методик оценки и построения рейтингов российских ученых на основе данных РИНЦ и SCOPUS.
6. Разработан регламент размещения российских журналов в РИНЦ.
7. Проведен анализ различных методик оценки видимости сайта РИНЦ в Интернет и способов повышения его популярности среди российских пользователей.
8. Доработана система управления процессом обработки журналов на всех технологических стадиях, обеспечивающая учет, контроль и статистический анализ проводимых работ в условиях распределенной обработки журналов.
Развернуть
6
01.01.2009 - 31.05.2009
Проанализированы действующие и перспективные инструменты оценивания деятельности научных и образовательных организаций в РФ, для реализации которых может быть использован Российский индекс научного цитирования. Подготовлены предложения по использованию РИНЦ для разработки стратегических документов в области науки и технологий и формирования научно-технической политики. Разработана методика совместного использования данных международных индексов научного цитирования (ISI, Scopus) и российского (РИНЦ).Проанализированы теоретико-методологические подходы к созданию единого рейтинга российских научных журналов. Проведена научно-практическая конференция "Научный журнал в России" и проанализированы ее результаты.
Развернуть
7
01.06.2009 - 31.10.2009
Обработаны выпуски более 1500 журналов за второе полугодие 2009 года. Разработаны предложения по гармонизации классификаций, используемых в РИНЦ, с действующими статистическими, административными и другими классификациями и совершенствованию системы научных и образовательных классификаций на основе РИНЦ. Проведена работа про выявлению и ликвидации лакун (пропущенных выпусков) за 2006-2009 годы. Проведены маркетинговые исследования и доработан интерфейс РИНЦ для перехода проекта на коммерческую основу.
Развернуть

Программа

Программа "Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы"

Программное мероприятие

5.1 Развитие информационной инфраструктуры хранения и передачи новых знаний
Продолжительность работ
2005 - 2006, 17 мес.
Бюджетные средства
20 млн
Организация
НЭБ
профинансировано
Тема
Разработка методики и инструментальных средств для статистического анализа российской науки на основе данных Российского индекса научного цитирования
Продолжительность работ
2007 - 2009, 29 мес.
Бюджетные средства
60 млн
Количество заявок
2
Тема
Разработка информационно-аналитической системы статистического анализа библиометрических показателей науки на основе данных Российского индекса научного цитирования.
Продолжительность работ
2010 - 2013, 37 мес.
Бюджетные средства
83,2 млн
Количество заявок
1
Тема
Разработка системы статистического анализа российской науки на основе данных российского индекса цитирования
Продолжительность работ
2005 - 2006, 23 мес.
Бюджетные средства
20 млн
Количество заявок
4
Тема
Поддержка и расширение системы обеспечения новыми информационными технологиями участников федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014 – 2020 годы». Обеспечение лицензионного доступа к международным индексам научного цитирования
Продолжительность работ
2014 - 2015, 21 мес.
Бюджетные средства
558 млн
Количество заявок
3
Тема
Модернизация и оптимизация системы обеспечения современными информационными источниками участников федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014 – 2020 годы». Обеспечение лицензионного доступа к международному индексу научного цитирования Scopus
Продолжительность работ
2016, 6 мес.
Бюджетные средства
182 млн
Количество заявок
2