В последнее время специалистов по анализу данных часто называют дата сатанистами, и в принципе, есть в этом что-то про правду. С позиции бизнеса работа с большими данными воспринимается как что-то сложное, непонятное, модное и наверное нужное. Компании наращивают штат data science, воюют за выпускников престижных вузов, пытаются перекупить «звезду» и затащить ее в свой штат. С позиции бюджета 1 «дата сатанист» - это человек с небанальными задачами, очень интересной работой и затратами в районе 300-500 тысяч рублей в месяц. И самое важное - с абсолютным отсутствием гарантии результата его работы. Среднестатистический специалист прочитает и позавидует.
А теперь попробуем прикинуть. Чтобы у аналитика по работе с данными появилась возможность работать, вы потратили от 15 млн руб. на построение EDWH, столько же на построение имиджа прогрессивного работодателя и подготовку красивой инфраструктуры рабочего места, а гарантии результата нет.
На самом деле основная часть трудозатрат при решении практически любой задачи анализа данных и построения мало-мальской модели - предобработать данные, найти, что связано с нужной целевой метрикой и подобрать такую конфигурацию модели, которая с пригодным результатом оценит/ спрогнозирует целевую метрику.
При этом в работе каждого аналитика есть повторяющиеся паттерны, и если встроить этот пользовательский опыт в автоматизированную систему, то получим сразу несколько новых кейсов:
- Весь предварительный анализ (exploratory) можно сделать непрерывным и автоматизированным. А это доступ дорогих аналитиков сразу до карты значимости данных и скрытых взаимозависимостей, а значит снижение трудозатрат и ускорение получения результата;
- Весь цикл построения моделей может выполнить любой бизнес-пользователь без знаний в области кодинга. С автоматизированной аналитикой построить модель все равно что посчитать маржинальноссть на калькуляторе. Кроме того, внедрение инструмента позволит непрерывно и без ожиданий и объяснений внешним специалистам прототипировать модели, а аналитиков привлекать уже имея понятный бизнес-кейс.
Таким образом, внедряя автоматизированную систему дата аналитики, мы сразу решаем несколько задач:
- Выстраиваем непрерывный процесс аналитики данных;
- Снижаем нагрузку на дорогих и дефицитных на рынке специалистов;
- Увеличиваем скорость разработки ML-решений;
- Повышаем прозрачность процесса разработки моделей;
- Повышаем доступность функции аналитики данных для бизнес-подразделений
- И в конечном счете - перестаем инвестировать в данные и начинаем на них зарабатывать, тем самым снижая риски и повышая устойчивость бизнеса.
А теперь приятный бонус - систему автоматизации ML не нужно придумывать и разрабатывать с нуля, у нас есть для вас готовое решение, сопровождение которого сопоставимо с затратами на ОДНОГО внутреннего специалиста.