Система интеллектуального поиска (СИП)

Материал из IT KZ Association
Перейти к: навигация, поиск

Назначение

Анализ неструктурированных данных, различного рода текстов, веб-страниц.

Технология позволяет в считанное время справиться с гигантскими объемами данных.

Технология может использоваться для качественного анализа рынка (конкурентов, спроса и предложения, отзывов потребителей, моду и тенденцию) и среды, в которой существует компания.

Отличный инструмент в помощь социологам, политикам, маркетологам, сотрудникам службы безопасности, копирайтерам, специалистам по продажам, разного рода аналитикам и управленцам, нуждающимся в статистической информации для принятия решений.

Краткое описание

Технология позволяет наблюдать за изменениями в информационном поле доступном в открытых источниках информации, выявлять объекты и темы, представляющие наибольший интерес для анализа и устанавливать наличие связи между этими объектами, а также классифицировать объекты по заданным критериям.

Технология позволяет отслеживать события и факты, связанные с целевыми объектами:

  • прогнозирование результатов политических мероприятий,
  • реакция населения на реформы, наличие связей между компаниями и/или персонами,
  • отзывы о бренде,
  • смена руководителей компаний и многое другое.

При этом технология поддерживает аналитический инструмент Sentiment analysis (анализ тональности), который позволяет производить оценку эмоциональной окраски публикаций («позитив», «негатив») и далее анализировать мнения и отношение авторов к целевым объектам.

Такого вида анализ данных позволяет выявлять, например: отношение населения к какой либо публичной персоне, организации, к нововведению, событию и т.д.

Технология позволяет производить аналитику огромных массивов информации, обработать которые вручную невозможно в принципе.

Основные компоненты:

  • Модуль управления – управление процессом движения данных по системе.
  • Модуль сбора данных – сбор исходных документов из сети Интернет.
  • Модуль лексического анализа – лексический разбор документов собранных модулем сбора информации.
  • Модуль анализа и представления информации (BI отчетность) – генерация отчетов на основе данных хранящихся в основной схеме.

Среда функционирования и использованные инструменты

Используемые технологии: Java, Oracle Database, ClaraBridge

Уровень казахстанского содержания

100%

Где внедрено/Заказчик

Электронное правительство Республики Казахстан

Год создания

2009 (обновление 2012)

Область применения опыта

Мониторинг любых массивов данных - средств массовой информации, докуметов/файлов и различных Интернет-ресурсов.

Результаты внедрения системы интеллектуального поиска:

  • поиск и анализ информации доступной в публичном информационном пространстве, выявление упоминаний заданных объектов наблюдений (персоны, организации, факты, события);
  • способность обрабатывать действительно огромные объемы данных и получать необходимую релевантную информацию;
  • создание различных интерактивных отчетов по интересующим тематикам, с возможностью приведения их к необходимым стандартизированным формам. Формирование отчетов следующих типов:
  • анализ активности источников по исследуемым темам;
  • анализ популярности персон (организации) в связи с исследуемыми информационными поводами;
  • топ обсуждаемых информационных поводов;
  • отношение пользователей блогов и форумов к объектам наблюдений и т.д.
  • уменьшение штата аналитиков в информационно-аналитическом подразделении;
  • отслеживание аномальных отклонений по исследуемой тематике за определенный период;
  • выявление наличия «скрытых» связей между различными объектами наблюдений;
  • мониторинг и анализ тональности документов из информационного поля по отношению к исследуемым объектам наблюдения.

Способ поставки

Услуги

Разработчик

TOO "EPAM Kazakhstan"

Зарубежные аналоги