Big Data

Материал из IT KZ Association
Перейти к: навигация, поиск

Понятие Big Data и для чего оно нужно

В связи с постоянным ростом данных, которыми приходится оперировать крупным компаниям, существует большой спрос к технологиям класса Big data.

Что такое Big Data? Понятие больших данных подразумевает работу с информацией огромного объема и разнообразного состава, весьма часто обновляемой и находящейся в разных источниках в целях увеличения эффективности работы, создания новых продуктов и повышения конкурентоспособности.

Как правило, когда говорят о термине Big data, то используют наиболее популярное определение трех «V», что означает Volume – объем данных, Velocity – необходимость обрабатывать информацию с большой скоростью и Variety – многообразие и часто недостаточную структурированность данных.

Вместе со стремительным накоплением информации быстрыми темпами развиваются и технологии анализа данных. Если еще несколько лет назад было возможно, скажем, лишь сегментировать клиентов на группы со схожими предпочтениями, то теперь возможно строить модели для каждого клиента в режиме реального времени, анализируя, например, его перемещение по сети Интернет для поиска конкретного товара. Интересы потребителя могут быть проанализированы, и в соответствии с построенной моделью выведена подходящая реклама или конкретные предложения. Модель также может настраиваться и перестраиваться в режиме реального времени, что было немыслимо еще несколько лет назад. 

Методы и техники анализа Big Data

Существует множество разнообразных методик анализа массивов данных, в основе которых лежит инструмент, позволяющий рассчитывать любые показатели, применяемые в моделировании/прогнозировании/оценке вероятности события. 

Компания Prime Source предлагает:

  1. Внедрение инструмента углубленной аналитики IBM SPSS.
  2. Интеграция инструмента в ИТ-среду и построение аналитической витрины, на базе которой строятся модели.
  3. Обучение использованию инструмента, чтобы сотрудники Заказчика самостоятельно могли строить прогнозные модели, анализировать информацию компании.
  4. Построение прогнозных моделей:
    1. С какой вероятностью какой клиент купит продукт, если ему позвонить или отправить смс?
    2. Кому позвонить/отправить имейл/смс, чтобы увеличить депозитный портфель на 20%?
    3. Какой компании предложить зарплатный проект, чтобы увеличить долю зарплатников в банке на 30%?
    4. Какому заемщику давать кредит, какому – не давать?
    5. Какие клиенты уйдут в течение ближайшего месяца/квартала/полугода?
    6. В какой момент времени и на какую сумму необходимо пополнить данный банкомат наличностью?
    7. Какой товар рядом с каким выставить в магазине?
    8. Какое индивидуальное предложение сделать 300 000 клиентам, чтобы каждый из них приобрел хотя бы один товар/услугу?
    9. Любые другие на основе имеющихся данных.
    10. Как определить мошеннические операции сотрудников?
    11. Как определить мошенников-клиентов?
    12. Любые другие, где требуется применение технологии data mining.

IBM SPSS является лидером в области углубленной аналитики