Основы нейросетей. Константин Константинович Берлинский
Читать онлайн книгу.SM или MSQRD. Ну или которые смогут отличить кошку от собаки, написать новую шутку или предсказать курс $ на неделю вперед.
В любом случае интересны проекты, основанные на легко доступных больших данных. Это данные в личном смартфоне (звонки, микрофон, геопозиция, камера), на своем ПК (файлы, почта, интересы), Интернет (вики, карты, анекдоты, ютуб, соцсети?), массовая литература. Какие еще открытые бигдата есть?
Что точно не интересно – делать проект, заточенный под данные или API определенной компании. Это телекомы, банки, логистика, магазины, интернет-холдинги или соцсети.
Бигдата у них, конечно, есть, но:
1) Фиг они ими поделятся (если это вообще законно – выдавать наружу данные, даже обезличенные).
2) Фиг они что-то у тебя купят. Как-то не принято это здесь. Да и бизнес-смысла в этом нет. Проще тупо украсть наработки, сделать свой велосипед или максимум предложить работу команде. Даже в случае успешного пилота с корпорацией это довольно слабая переговорная позиция – когда данные у компании, а у тебя лишь обученная на их основе нейросеть (алгоритм обработки данных) и проведенный кастдев. Они без тебя жить смогут, а ты без них нет.
Есть конечно кейс – знать, что нужно большой компании, сделать это на стороне и продать наработки компании. Бобук говорил, что он так сделал механизм распознавания людей на фотках и продал это VK/OK. Им это нужно чтобы автоматически тэгать людей. Это повышает вовлечение юзеров и время зависания на сайте. Но это скользкий путь:
1) Неясно, что нужно корпам.
2) Не факт, что они прямо сейчас не делают такую штуку.
3) Не факт, что эту штуку сможешь сделать ты.
4) Не факт, что готовое решение купит корп. Они любят тянуть время (приходите через год, на сегодня все бюджеты освоены).
Думаю, по деньгам у Григория получилось так. Команда 5 чел, ЗП 4 тыс $/мес, делать такую штуку ~10 мес. Себестоимость 200 тыс $. Продать корпорации с премией 3-5х можно за 0.6-1 млн $.
Какие курсы по data science и нейронным сетям нагуглил и рассматриваю:
1) Машинное обучение и анализ данных – Яндекс, МФТИ, Курсера, 5500 руб/мес, 250 часов.
2) Data science – SkillFactory, 120 тыс руб, 12 мес.
3) Data scientist – Нетология, 200 тыс руб, 8 мес.
4) Введение в машинное обучение – Яндекс, ВШЭ, Курсера, бесплатно, 35 часов.
5) Introduction to Machine Learning – Google, бесплатно, 15 часов.
https://developers.google.com/machine-learning/crash-course
6) Ваш вариант?
Месяца 4 назад начинал проходить курс #5 от Гугл, но через 2 недели бросил. Все-таки, мне нужен кто-то, кто будет пинать и мотивировать продолжать обучение.
Что посоветуете?
Также, см. https://en.wikipedia.org/wiki/Applications_of_artificial_intelligence
2 Венчурная аналитика AI-проектов
Насчет выбора курса по AI (см. предыдущий пост). При выборе темы учебного проекта, думаю, стоит ориентироваться на AI-проекты, получившие инвестиции в последнее время. Ниже последние AI-проекты ФРИИ, YC, 500 Startups и TechStars.
Т.к. дальше будет лонгрид и много описаний проектов, вынесу наверх мысли насчет проектов YC:
1) США новый Вавилон. В последнем наборе Summer 2019 – 175 компаний 27 стран. США, Европа, Азия, ЛатАм, даже Африка. России нет, но есть Украина. Никаких других центров стартапов как-будто нет.
2) Идея брать 7% за $120К от 175 потенциально прорывных компаний каждые полгода может быть невероятно прибыльной. Чисто по статистике 3-5 единорогов у них получится. Похоже, у YC нет никаких проблем со сбором $$$ на финансирование очередного набора фонда. Возможно в РФ с венчуром проблема не в рынке, недостатке инвесторах, политике и др, а тупо просто нет столько людей-предпринимателей кто хочет сделать свой проект.
3) Похоже, венчур в России в глубокой ж. 11 vs 175 стартапов (ФРИИ vs YC) в последнем наборе. Много стартапов во ФРИИ – унылые локальные проекты без полета фантазии, которые никогда не выйдут на внешний рынок и не станут единорогами. Онлайн ГИБДД, Помощник в исполнении 149-ФЗ по безопасности данных, оборудование для соляных пещер :-( Зачем это вообще?
4) Очень крутые проекты YC с миллионной выручкой, понятной бизнес-моделью, не боятся испачкать руки. Многие проекты для узкой аудитории – мигранты-айтишники, венесуэльцы, наркоманы, женщины,