Data Science: $$$=F(BigData), F=?

3 октября в Москве состоялся семинар по аналитике Больших Данных, который провел д-р Риккардо Санти.

Д-р Санти больше 16 лет занимается тем, что помогает заказчикам извлекать новую пользу из данных. Основной рыночный сегмент — финансы и сетевая розница.

Тема семинара: Аналитические Лаборатории. Именно так называется сервис, который EMC предлагает своим заказчикам, которые хотят узнать ответ на нетривиальный вопрос: «Какую (еще) пользу я могу извлечь из своих данных?»

Д-р Санти и его Data Science команда работают в регионе EMEA, и занимаются тем, что помогают находить ответы на такие вопросы.

Что такое Большие Данные?

Большие Данные, это, например GPS. Это очень, очень, очень, очень много данных, которые надо обрабатывать в реальном времени.

Все мы хорошо знаем про навигационные сервисы, предлагаемые различными интернет-компаниями, типа Yandex, Rambler, Google итп. Программа установленная на мобильном устройстве сообщает о нашем положении нам и провайдеру, а так же, мы узнаем информацию о пробках, и получаем прогноз времени, которое мы потратим на дорогу. Довольно неплохо все это работает.

А что если…

Что если эти программы сообщали бы нам вероятность застрять в пробке при движении из точки А в точку Б в заданное время, еще даже не фиксируя маршрут который мы выберем, и предлагали бы нам маршруты более оптимальные с точки зрения наших личных предпочтений? Например, купить по дороге что-то нужное, при этом сведя к минимуму потери времени в пробке?

Или лучше так: что если бы мы, пользуясь подобными мобильными программами, могли заказывать себе кофе, или другие товары и услуги с доставкой прямо в пробку?

Думаю, владельцы магазинов, находящихся на прилегающих к пробкам территориях платили бы за это поставщикам интернет-сервиса.

Как извлечь пользу из данных?

Любой проект по построению аналитического хранилища начинается с вопроса — как извлечь пользу из данных? Или какую пользу можно из них извлечь?

Так же естественно и желание любого заказчика, прежде чем приступать к работе с вендором, узнать примеры использования его аналитических решений в других компаниях. В англоязычной терминологии для таких примеров есть два термина:

А) Use case (пример использования)= идеи о том, какую пользу можно извлечь.

Б) Business Case(бизнес-кейс)= идея + внедрение + бизнес результат.

Примеров уровня use case у нас существует довольно много в самых разных индустриях. Что касается бизнес-кейсов — то это информация обычно конфиденциальная, потому, что содержит в себе коммерческую тайну той или иной организации.

А хорошая новость состоит в том, что при помощи Аналитических Лабораторий, проводимых при участии команды д-ра Санти можно построить индивидуальный бизнес кейс для конкретной организации, и потом довести его до состояния «под ключ».

Конечно же, для того чтобы это сделать нужно сотрудничество с заказчиком не только на уровне ИТ, но и на бизнес уровне, и взаимные двусторонние усилия довольно разносторонней команды.

Также невозможно обойтись и без понимания бизнеса в конкретной индустрии (банки/телекомы/ритейл/транспорт и тд).

Вертикаль бизнес-кейса представляет из себя «слоеный пирог», где сверху находится Бизнес Инициатива, под которой лежит Организационная структура, использующая Приложение, работающее на Инфраструктуре.

В этом слоеном пироге, аналитическая СУБД (например, Greenplum) занимает верхнюю часть на уровне инфраструктуры.

Коллаборационная среда взаимодействия Аналитиков (например, Chorus)- как начинка пирога, занимает промежуточный уровень между организацией и приложением.

Что касается такого важного слоя как приложение, то оно в парадигме EMC идет со стороны нашего партнера (например, от компании SAS Institute), с которым сертифицированы наши инфраструктурные решения

Пример идеи из банковского сектора.

Банк занимается выдачей кредитов. У них должна быть система обработки заявлений на займы, чтобы сократить время рассмотрения кредитов, повысить качество кредитного скорринга и снизить риски неплатежей. Это идея.

Бизнес-кейсом она становится, когда обрастает процессами (консультирование), приложением (например, Documentum), инфраструктурой (например, СУБД MS SQL), рассчитана стоимость ее внедрения, время окупаемости затрат и выхода на уровень прибыльности.

Казалось бы, что в идеале, все это должно поставляться от одного вендора. Но не с этим согласятся на 100%. Дело в том, что специфичные индустриальные решения поставляются компаниями сфокусированными именно на этом секторе. Инфраструктуру тоже хочется подобрать по принципу best of breed. Если бы было не так – миром рулили бы 100% моно-вендоры.

Но вот что делать заказчику, когда кто-то приходит к нему со своей отличной инфраструктурой (СУБД), и начинает ему ее продавать без приложения. Думаю, тем, кто иногда ездит в электричках —  это напомнило бы продавца отличных отверток, но без шурупов, и без понимания, где это заказчик будет их применять.

Он, знай себе, нахваливает свой товар, и дает очень выгодную цену, «дешевле, чем в магазине». Конечно, цена может быть весьма соблазнительная, но какова вероятность, что ты эту отвертку купишь, не зная, зачем она тебе нужна, и какую проблему ты с ее помощью будешь решать? Так что будьте любезны – подайте сначала бизнес-кейс, или хотя бы идею 🙂

Бывает, конечно, другая ситуация. Идея уже есть, но не совсем устраивает ее реализация.

Пример: Продолжая аналогию – надоело крутить шурупы отверткой и нужна новая. Идешь в магазин – смотришь какие есть, смотришь на цены, характеристики и выбираешь соразмерно вкусам и толщине кошелька. Можно попросить у продавца подержать отвертку в руке, попробовать повертеть шурупы. То есть, сделать ProofofConceptJ

Даже если речь идет о покупке шуруповерта бизнес-кейс уже существует – известно, зачем нужен этот инструмент, и можно прикинуть выгоды от преимущества в скорости и удобстве.

Короче, инфраструктура отдельно от всего остального покупается, когда уже есть бизнес-идея, есть проблема, она осознана, и назрело ее решение при помощи железа и софта. Это типичная ситуация.

Возвращаясь к нашим Большим Данным — бизнес-идея является ключевым условием появления всего остального.

Пример:

ПО для онлайн распознавания речи и перевода в текст. Инструмент, безусловно, интересный, но сравнительно дорогой. Т.е. просто так от нечего делать – какой смысл покупать? Сначала нужна идея как его применять, и какому подразделению бизнеса он может быть нужен. Скажем, колцентру такая вещь могла пригодиться. И мы с вами все давно привыкли что «разговоры в целях улучшения качества обслуживания записываются». И что дальше происходит, кто-нибудь знает? Если в компании это делается не ради галочки и слежки за сотрудниками, то речь распознается, переводится в текст, распознается дыхание, интонация и эмоциональное состояние говорящего, может быть распознан сарказм,  анализируется речевая семантика.

А что если… если бы это можно было выводить в онлайн режиме на экран монитора сотрудника колцентра, в реальном времени сообщая ему подсказки о его состоянии, о качестве его речи, состоянии звонящего? Что если в проблемной ситуации оповещался старший сотрудник, который мог бы оперативно подключиться для решения назревающей проблемы? Что если бы получение обратной связи от клиентов можно было бы довести до 100% по тому как они попрощались с сотрудником колцентра, и как они его поблагодарили? Во сколько раз сократилось бы количество жалоб клиентов на качество обслуживания? Повысилась бы их лояльность, если бы они были всегда удовлетворены качеством?

 

Или еще пример банка, выдающего ипотеки.

Ипотечный договор, как многие из нас знают, обязательно содержит информацию о жилище, адрес, план, а также сам текст с условиями договора. Что если бы банк мог анализировать информацию, и изучать корреляции о том, какие ипотеки оказываются наименее рискованными, наиболее прибыльными? Как, например, это зависит от планировки жилья? От его местоположения? Или как условия прописанные договоре сделать такими, чтобы сократить количество возможных просрочек платежей, или судебных разбирательств с клиентами? Здесь не обойтись без комбинированного анализа структурированных и неструктурированных данных, которое можно делать при помощи EMCUnifiedAnalyticsPlatform.

Но как быть в ситуации, когда нужна идея, а ее нет? Тогда надо звать на помощь команду исследователей данных (Data Scientists), которые как раз и помогают находить эти идеи во время проведения Аналитических Лабораторий.

Компания SAS Institute, стратегический партнер EMC, так же проводит подобные лаборатоиии. У них они называются «Мир Возможного»(«The World Of Possibilities»).

Как проходят Аналитические Лаборатории?

Прежде всего, надо собрать людей из различных ветвей организации. Это должны быть люди от бизнеса и люди от ИТ, вовлеченные в его обслуживание.

Дальше выясняется

Какие у компании бизнес-задачи?

Какие есть известные проблемы?

Где организация находися в данный момент, каково положение дел?

Где организация она хочет находиться?

Какие есть способы туда попасть?

Дальше начинается сам консалтинг, в ходе которого определяются возможные шаги и способы преодоления препятствий на пути к заветной цели. Иногда выявляются проблемы, о которых заказчик не знает, либо думает, что их нельзя решить, и смиренно воспринимает как неизбежное зло….

Анекдот в тему:

Приходит мужик в магазин, чтобы купить попугая.  Попугаев в магазине нет, но продавец видит, что того можно обмануть, и предлагает ему совенка.

— Это особый вид попугаев! Он вырастет большим и сильным, но его нужно кормить мясом.

— Редкий большой попугай? Круто! Он научится говорить?

-Конечно!  Надо только повторять ему одно и то же слово, пока он его не запомнит.

Мужик берет совенка, расплачивается и уходит.

Через год он проходит мимо магазина, продавец его узнает, и спрашивает:

— Ну как ваш попугай? Все в порядке?

— Да, все как вы говорили! Он подрос, он очень сильный, и ест много мяса!

— А говорить научили?

— О, все отлично! Обучение идет полным ходом! Я продолжаю повторять ему одно и тоже слово, и он слушает меня с ОГРОМНЫМ вниманием!

«… и он слушает меня с ОГРОМНЫМ вниманием»

Благодаря консультантам Аналитических Лабораторий, удается выявить такие скрытые проблемы, и обозначить пути их решения, и выхода на уровень бизнес-идеи с ее реализацией.

Лаборатории существуют нескольких видов – от однодневного семинара, показывающего принципы работы исследователей, до интенсивного консалтингового проекта в несколько недель. Подробно можно узнать на сайте http://www.greenplum.com/products/greenplum-analytics-lab

Кстати, 4 октября в Москве проходит Саммит Исследователей Данных.

Проводят его Исследовательский Университет «Высшая Школа Экономики» и EMC Россия и СНГ в партнерстве с Открытым университетом Сколково.

Будет много интересного, о чем, я надеюсь Вам сообщить в ближайшее время 🙂

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s