Стартап. Как начать с нуля и изменить мир. Александр Горный
Читать онлайн книгу.target="_blank" rel="nofollow" href="https://www.jellyvision.com/">https://www.jellyvision.com/
Snowflake предлагает своим клиентам Data Warehouse в облаке. Через красивый веб-интерфейс в систему можно загружать любые свои данные от excel-файлов до многогигабайтных таблиц, ну а если счет идет на терабайты (и гонять их через браузер – идея странная), то можно использовать готовые утилиты командной строки.
Следующий шаг после загрузки – собственно анализ. Предполагается, что большинство клиентов будут использовать встроенный SQL через всё тот же красивый веб-интерфейс, но и командная строка опять же никуда не делась. Для тех, кто не очень понимает, а зачем это вообще может понадобиться, несколько примеров (остальные могут три абзаца пропустить).
Пример 1. Выгружаем из своего магазина данные по всем заказам, загружаем их в Snowflake и начинаем делать всякие запросы, пытаясь найти какие-нибудь закономерности или что-то интересное. Это можно было бы сделать в excel, но excel может и не переварить наш объем; это мог бы сделать программист, но программисты всегда чем-то заняты; это можно было бы сделать в своем аналогичном интерфейсе, но его делать надо, а программисты всегда чем-то заняты.
Пример 2. Выгружаем из своего сайта все логи, загружаем их в Snowflake и вечно там храним, а при каких-то авариях-расследованиях смотрим, что же этот пользователь или эта группа пользователей делали на сайте месяц назад. Или, например, статистику по уникам за определенный период в определенном разделе считаем. Это всё мог бы делать сисадмин с помощью grep/awk/sort, но хранить достаточно большие логи на Snowflake, пожалуй что, и дешевле, чем у себя, SQL работает быстрее grep, да и искусство утрачено, не все уже руками считать умеют.
Пример 3. С двух разных сайтов выгружаем их базы и смотрим на пересечения по пользователям, пытаясь увидеть, чем такие люди и их поведение отличаются от остальных. Опять же если аналитик знает SQL, то ему можно программиста не отвлекать, это всегда эффективнее выходит.
По сравнению с традиционными решениями облако дает свое главное классическое преимущество – оплата только за потребленные ресурсы, что во многих задачах может означать практически ноль. Хранение данных стоит 40 долларов в месяц за терабайт – это, конечно, дороже себестоимости (Амазон S3 – 23 доллара), но для разумных объемов полностью компенсируется отсутствием беспокойства. Цена вычислений зависит от тарифного плана, масштаб – несколько долларов в час. Для случая аналитика, работающего в интерактивном режиме, оплата за решение без следа растворится в зарплате специалиста.
От конкурентов-клонов Snowflake защищен технической сложностью – попробуйте сделать SQL, который хоть как-то будет переваривать терабайты информации без лицензионных отчислений и профессионального DBA, думающего отдельно о каждой таблице.
Тема модная, красивые графики все рисовать любят, аналитики в любой американской компании есть, сервис им нравится, выручка растет, инвестиции тоже растут. В последней сделке стартап получил 100 миллионов долларов по оценке около полумиллиарда.
Казалось,