Исследователи, студенты, ученые, библиотекари, журналисты и аналитики должны быть в курсе исследований, проводимых в конкретных областях для выполнения анализа научных публикаций, позволяющего оценить качество, новизну и достоверность проводимых исследований. Точность и актуальность сведений о проводимых во всем мире исследованиях призваны обеспечить системы автоматизированного сбора метаданных публикаций для цифровых репозиториев. Однако, такие репозитории имеют множество ограничений, что делает актуальной систему автоматизированного сбора метаданных из различных источников, исключающего дублирование и необходимость ввода метаданных вручную.
Важнейший аспект информатизации научной деятельности — увеличение количества ресурсов, аккумулирующих и распространяющих научные знания, генерируемые научными сообществами на своих мероприятиях. Сегодня распространение такой информации носит фрагментарный характер и часто выполняется вручную, что влияет на оперативность и качество. Необходимо сформировать комплексное информационное пространство, которое решает задачу оперативного распространения результатов научных исследований через открытые информационные ресурсы.
Идентификация авторов публикаций важна для определения их научного рейтинга, однако при обработке имен русскоязычных авторов в англоязычных публикациях нередки ошибки, приводящие к некорректным вычислениям, например, индекса Хирша. Система на основе комбинированного сравнения атрибутов и текстовых данных позволяет точно идентифицировать русскоязычных авторов.
Российские специалисты, за очень редким исключением, практически не публикуются в более-менее известных западных научно-технических журналах, редко выступают на международных конференциях, а если же все-таки встретишь "русскоязычную" фамилию, то с очень большой вероятностью окажется, что автор давно работает за рубежом. Возможно, компьютерная наука в России умерла, либо у потенциальных авторов нет желания и/или возможности писать и публиковаться, либо отсутствует четкое понимание технологии написания и процесса публикации научно-технической работы.