Эксπир
Регистрация / Вход

Cell-Textmining: Разработка методов и программных средств для извлечения и интеграции знаний о молекулярных взаимодействиях в клетке из фактографических и текстовых баз данных

Стадии проекта
Предложение принято
Конкурс завершен
Проект закончен
Проект
02.514.11.4065
Организация
ИЦиГ СО РАН
Продолжительность работ
2007 - 2008, 14 мес.
Бюджетные средства
1,5 млн
Внебюджетные средства
1,56 млн

Информация отсутствует

Этапы проекта

1
03.08.2007 - 31.10.2007
Осуществлены выбор и обоснование принятого направления исследований и способов решения поставленных задач.
2. Проведены исследование и разработка методов решения следующих задач:
- извлечения знаний о молекулярных взаимодействиях из фактографических баз данных и электронных текстов научных публикаций;
- представление, накопление и интеграция знаний о молекулярных взаимодействиях в виде ассоциативных семантических сетей.
- анализ ассоциативных сетей знаний с целью получения новых знаний.
- анализ текстовых источников информации с целью составления словарей для описания знаний о молекулярно-генетических объектах и системах.
- анализ фактографических баз данных с целью получения знаний о физических молекулярно-генетических взаимодействиях.
- анализ баз данных с целью извлечения описаний сетей молекулярно-генетических взаимодействий.
Развернуть
2
01.11.2007 - 31.12.2007
Разработана структура базы знаний о молекулярных взаимодействиях, полученных из фактографических баз данных и электронных текстов научных публикаций, включающая метаданные, онтологические знания, знания о методах извлечения информации из текстовых данных, знания о молекулярно-генетических объектах и их взаимоотношениях и т.д.
2. Проведен второй этап патентных исследований по программным системам извлечения знаний о молекулярно-генетических взаимодействиях.
Развернуть
3
01.01.2008 - 30.06.2008
1. Разработана база метаописаний распределенных информационных ресурсов в области биоинформатики (фактографических и текстовых баз данных), используемых для экстракции знаний о молекулярно-генетических взаимодействиях в клетках бактерий, животных и растений;
2. Разработаны программные средства для извлечения и интеграции знаний о молекулярно-генетических взаимоотношений;
3. Разработаны хранилища гетерогенных слабоструктурированных данных и знаний о молекулярно-генетических взаимодействиях в клетках, генетической регуляции, метаболических путях, путях передачи сигнала и ассоциациях нарушений в них с различными заболеваниями;
4. Разработаны средства поддержки описания онтологии предметной области;
5. Разработаны средства визуализации и анализа сетей ассоциативных знаний;
6. Разработана методика и программа вычислительного эксперимента для исследований возможности последующего применения системы Cell-textmining в различных областях в соответствии с требованиями п. 4.6 ТЗ;
7. Проведены вычислительные эксперименты для исследований возможности последующего применения разработанной системы Cell-textmining в биотехнологии, агробиологии, фармакологии.
8. Проведен третий этап патентных исследований по программным системам извлечения знаний о молекулярно-генетических взаимодействиях. Эти исследования показали, что:
- методы и программные средства для извлечения и интеграции знаний о молекулярных взаимодействиях в клетке из фактографических и текстовых баз данных, разрабатываемые в настоящем проекте, пригодны для массового коммерческого распространения в основных секторах рынка биоинженерной, биотехнологической, агробиологической, биомедицинской индустрии, а также в университетах и, кроме того, в академическом секторе.
- объект исследования обладает патентной чистотой в отношении России по состоянию на 20.05.2008 г.
Развернуть
4
01.07.2008 - 31.10.2008
Проведено обобщение результатов предыдущих этапов работ, включающих:
- Методы решения задач извлечения знаний о молекулярных
взаимодействиях из фактографических баз данных и электронных текстов научных публикаций; представления, накопления и интеграции знаний о молекулярных взаимодействиях в виде ассоциативных семантических сетей, а также их анализ с целью решения практически важных задач в области молекулярной биологии.
- Базовые программно-информационные компоненты интегрированной системы Cell-textmining для извлечения из фактографических и текстовых баз данных знаний о молекулярных взаимодействиях в клетке и их интеграции.

Все задачи проекта выполнены в полном объеме. Созданная в рамках проекта система Cell-textmining пригодна для внедрения и массового применения, как в России, так и за рубежом с целью получения новых знаний, проведения прикладных научных исследований и опытно-конструкторских разработок в системной биологии, структурной и функциональной геномике, транскриптомике, протеомике, метаболомике, биомедицине и других областях.
Развернуть

Программа

Программа "Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы"

Программное мероприятие

1.4 Проведение проблемно-ориентированных поисковых исследований и создание научно-технического задела по перспективным технологиям в области информационно-телекоммуникационных систем
Тема
Исследование и разработка методов автоматического создания фактографических информационных ресурсов на базе анализа текстовых документальных материалов.
Продолжительность работ
2011 - 2012, 14 мес.
Бюджетные средства
8 млн
Количество заявок
4
Тема
Разработка и реализация алгоритмических и программных средств тематической категоризации Интернет-ресурсов с использованием семантического анализа текстового содержимого web-страниц
Продолжительность работ
2005 - 2006, 23 мес.
Бюджетные средства
10 млн
Количество заявок
6
Тема
Разработка технологий извлечения данных и анализа текстовых информационных ресурсов на различных естественных языках для информационно-аналитических систем нового поколения в глобальных и локальных информационных сетях
Продолжительность работ
2007 - 2009, 30 мес.
Бюджетные средства
165 млн
Количество заявок
6
Тема
Разработка информационной системы семантико-фактографической обработки неструктурированных массивов информации с целью выявления неявных и аномальных связей между субъектами политической и экономической деятельности (на примере анализа массива средств массовой информации и открытых источников данных, в том числе официального сайта zakupki.gov.ru).
Продолжительность работ
2012 - 2013, 21 мес.
Бюджетные средства
45 млн
Количество заявок
1
Тема
Биолюминесцентные методы визуализации in vivo молекулярных процессов в клетках и целых организмах.
Продолжительность работ
2008 - 2009, 17 мес.
Бюджетные средства
7,8 млн
Количество заявок
1