ТОП-25 лучших курсов Data Science: обучение онлайн, бесплатные и платные в 2024 году

Data Science – это интердисциплинарная область, которая использует методы и техники из статистики, машинного обучения, искусственного интеллекта и баз данных для извлечения знаний из данных. Она широко применяется в различных областях, таких как бизнес, наука, медицина и технологии.

На курсах Data Science можно научиться работать с данными различных типов и размеров, понимать основные методы статистики и машинного обучения, уметь выбирать и настраивать алгоритмы для решения конкретных задач, а также знакомиться с основными инструментами анализа данных, такими как Python, R, SQL и т.д. Важная часть курсов по Data Science также связана с практическими заданиями и проектами, которые позволяют студентам получить опыт работы с реальными данными и развить свои навыки анализа и моделирования.

Содержание статьи:

1 место. Курс «Профессия Data Scientist PRO от Skillbox»

Цена: Рассрочка на 31 месяц – 7 245 ₽ / мес

Ссылка на сайт: https://skillbox.ru/course/profession-data-scientist/

Освойте Data Science с нуля. Попробуйте силы в аналитике данных, машинном обучении, дата-инженерии и решите, какое направление вам нравится больше. Через год сможете работать Junior-специалистом, а через два — станете профессионалом уровня Middle.

  • Через 6 месяцев можно устроиться на стажировку
  • Авторы курса эксперты из Сбера, ЮMoney, Visa
  • Гарантируем трудоустройство — или вернём деньги
  • 3 специализации на выбор
  • Обновили содержание в 2021 году.

Перейти на официальный сайт →

Работа с данными — процесс, в котором каждый участник команды выполняет свою задачу. Аналитик помогает принимать бизнес-решения, ML-инженер обучает модели, а Data-инженер делает так, чтобы всё работало.
Независимо от роли все программируют на Python, разбираются в математике, статистике и говорят на языке данных. Поэтому иногда таких специалистов называют просто Data Scientist.

Кому подойдёт этот курс:

  • Новичкам
    С нуля освоите Python, SQL, научитесь собирать и анализировать данные, получите необходимый теоретический минимум по математике, теории вероятности и статистике. Знания закрепите на практике — решите задачи на основе реальных кейсов и добавите проекты в портфолио. Устроитесь на стажировку по выбранной специальности уже во время обучения.
  • Программистам
    Подтянете математику, статистику, аналитическое и алгоритмическое мышление, научитесь выявлять потребности бизнеса. Получите опыт работы с моделями машинного обучения, будете применять Python для решения задач с данными. Пройдёте процесс от сбора данных до деплоя модели.
  • Начинающим аналитикам
    Вы научитесь выдвигать гипотезы и делать выводы на основе данных, писать эффективный код на Python и превращать сырые данные в полезную информацию для компании. Сможете обучать модели и прогнозировать результаты. Отшлифуете знания, увеличите скорость своей работы и добьётесь повышения.

Кем вы станете после курса?

Вариант 1. Специалист по Machine Learning
Будете анализировать большие объёмы информации, создавать модели для прогнозирования в бизнесе, медицине, промышленности. Обучать нейросети, создавать аналитические системы и рекомендательные сервисы на основе алгоритмов машинного обучения. Продолжите профессиональное развитие в сфере обработки естественного языка или Computer Vision.

Вариант 2. Дата-инженер
Будете разворачивать программную инфраструктуру для организации сбора, обработки и хранения данных. Вам предстоит решать сложные, но интересные задачи: создавать отказоустойчивые системы для работы с Big Data, писать эффективный код на Python и SQL-запросы, автоматизировать рутину, «общаться» с базами данных, работать с облачными платформами.

Вариант 3. Аналитик данных
Будете помогать бизнесу принимать верные решения на основе данных. Собирать информацию и анализировать её, находить аномалии в метриках. На основе исследований будете выявлять закономерности, строить гипотезы и проверять их жизнеспособность с помощью моделирования. Научитесь визуализировать результаты работы в виде графиков и диаграмм.

Содержание курсов:

Вас ждут 100+ тем с различным уровнем сложности, видеоматериалы и практика.
100+ практических заданий, 3 итоговых проекта

Первый уровень: базовая подготовка
Среднее время прохождения — 6 месяцев.

  1. Введение в Data Science
  • Познакомитесь с основными направлениями Data Science, узнаете, какие задачи решают дата-аналитики, дата-инженеры и специалисты по машинному обучению.
  • Пройдёте все этапы работы с данными. Научитесь выявлять проблемы, собирать бизнес-требования. Будете выгружать данные из различных источников, проводить разведочный анализ и готовить датасет к дальнейшему использованию. Обучите и внедрите готовую ML-модель, попробуете себя в роли продуктового и маркетингового аналитика. Узнаете, как формулировать и проверять гипотезы. Освоите базовые инструменты для работы: Python, SQL, Excel, Power Bi, Airflow.
  1. Основы статистики и теории вероятностей
    Поймёте принципы работы со случайными величинами и событиями. Познакомитесь с некоторыми видами распределений и статистическими тестами, которые пригодятся при составлении моделей и проверке гипотез.
  2. Основы математики для Data Science
    Получите базовые знания по математике для работы с машинным обучением. Поймёте, что такое аппроксимация, интерполяция, функции, регрессии, матрицы и вектора. Научитесь работать с математическими сущностями в Python-библиотеке SymPy.
  3. Возможность стажировки
    Базовых знаний и навыков хватит, чтобы устроиться на стажировку, — сможете продолжить учиться на курсе и в компании одновременно.

Второй уровень: специализация и трудоустройство
Среднее время прохождения — 6 месяцев.

  1. Специализация 1: Machine Learning
    Machine Learning. Познакомитесь с алгоритмами машинного обучения для решения задач регрессии, классификации и кластеризации. Построите и обучите свою первую нейронную сеть. Научитесь подбирать параметры модели, оценивать качество и улучшать её, а также выводить результат в Production.
  2. Специализация 2: Data Engineer
    Data Engineer. Будете собирать сложные наборы данных, подготавливать витрины данных, разворачивать DS-проекты с нуля, тестировать код, выстраивать пайплайны для работы с данными и работать в команде.
  3. Специализация 3: Data Analyst
    Data Analyst. Познакомитесь с базовыми методами анализа на примере анализа продаж. Пройдёте основы маркетинговой, BI и продуктовой аналитики. Прокачаете навыки работы в Excel, Python и Power BI. Будете уметь формулировать и тестировать гипотезы и презентовать результаты заказчику.
  4. Трудоустройство с помощью Центра карьеры
  • Карьерный консультант поможет подготовиться к собеседованию в компании-партнёре. Разберёте частые вопросы и научитесь меньше переживать на интервью.
  • Напишете сопроводительное письмо и грамотно оформите резюме.
  • Будете готовы пройти собеседование — карьерный консультант организует встречу с работодателем.
  • На интервью презентуете проекты, над которыми вы работали на курсе, а знания и навыки пригодятся для выполнения тестовых задач.

Третий уровень: повышение квалификации
Среднее время прохождения — 1 год.

  1. Специализация 1: Machine Learning PRO
  • Machine Learning. Advanced. Освоите алгоритмы для построения рекомендательных систем и прогнозирования временных рядов. Научитесь применять ансамблевые методы, стекинг, бустинг, а также лучшие практики кросс-валидации, мониторинга и пайплайна ML-разработки.
  • Deep Learning. Научитесь работать с нейросетями: подробно узнаете, как они устроены, будете обучать модели, строить и тестировать архитектуры, передавать данные в нейросеть и настраивать параметры.
  • Трек 1. NLP. Научитесь применять алгоритмы машинного обучения и нейронные сети для обработки естественного языка. Узнаете, как анализировать тональность текстов, классифицировать их, распознавать речь.
  • Трек 2. Computer Vision. С помощью алгоритмов машинного обучения и нейросетей будете распознавать объекты, лица и эмоции, классифицировать и сегментировать изображения. Научитесь применять и адаптировать готовые модели CV для своих целей.
  1. Специализация 2: Data Engineer PRO
    Data Engineer. Научитесь пользоваться типовыми средствами мониторинга, настраивать алерты. Будете выбирать архитектуру для хранения данных и работать со сложными типами архитектуры хранилищ. Выстраивать инфраструктуру и пайплайны для обучения ML-моделей.
  2. Специализация 3: Data Analyst PRO
  • Трек 1. Product Analytics. Будете обрабатывать данные, исследовать взаимодействие пользователей с продуктом, интерпретировать собранную информацию. Полученные результаты помогут решить задачи бизнеса.
  • Трек 2. Marketing Analytics. Узнаете, как настраивать веб- и сквозную аналитику, создавать воронки продаж, анализировать поведение пользователей на сайте.
  • Трек 3. BI Analytics. Научитесь создавать хранилища данных, проектировать базы данных на языке SQL и работать с таблицами на продвинутом уровне. Будете решать бизнес-задачи с помощью аналитики, чистить данные, правильно их хранить и визуализировать.

Итоговые проекты
Подготовите и презентуете 3 проекта по выбранной специальности — вводный, Junior- и Middle-уровня — и добавите их в портфолио.

  1. Введение в Data Science
    Закрепите новые знания на индивидуальном проекте — пройдёте путь от загрузки данных до внедрения модели. Решите задачи дата-инженера, ML-инженера и дата-аналитика, чтобы определиться со специализацией.
  2. Machine Learning
  • Итоговый проект уровня Junior. Соревнование в Kaggle. Самостоятельно построите модель для решения задачи. Проведёте сбор и разведочный анализ данных, выберете ML-алгоритм и обучите свою модель, оцените её качество и поработаете над улучшениями.
  • Командный проект по Deep Learning.
  • Проект по Computer Vision или Natural Language Processing.
  1. Data Engineer
  • Итоговый проект уровня Junior. Проведёте когортный анализ и выгрузите справочники по API. Построите дашборды по полученным данным.
  • Итоговый проект уровня Middle — хакатон.
  1. Data Analyst
  • Junior-уровень. Product Analytics: проанализируете итоги А/B-тестирования для продукта и решите, что необходимо развивать в первую очередь.
  • Junior-уровень. Marketing Analytics: подготовите данные, посчитаете конверсии и LTV. Сделаете выводы о об эффективности рекламных кампаний.
  • Junior-уровень. BI Analytics: построите план-факт. Создадите дашборды, которые позволят понять, какие подразделения больше всего влияют на показатели компании.
  • Middle-уровень. Командный проект по выбранному треку.

Бонусные курсы

  1. Карьера разработчика: трудоустройство и развитие
  2. Система контроля версий Git
  3. Английский для IT-специалистов.

Спикеры:

  • Кирилл Шмидт
    Автор профессии Data Analyst, Product analyst Team Lead в корпорации Citrix (США), Wrike
  • Юлдуз Фаттахова
    Автор курса Machine Learning. Senior Data Scientist, Team Lead в SberData, Сбер. 5+ лет в профессии
  • Евгений Виноградов
    Руководитель отдела разработки хранилищ данных и аналитических сервисов в ЮMoney. 5 лет разрабатывает системы поддержки принятия решений
  • Владимир Ершов
    Автор курса Machine Learning, Data Solutions Manager, VISA. В Data Science больше 7 лет
  • Артур Самигуллин
    Автор профессии Data Analyst, SberDevices
  • Вячеслав Архипов
    Автор курса «Статистика и теория вероятностей». Математик, Banuba development. В Data Science больше 7 лет.

Отзывы об обучении в Skillbox доступны на сайте.

Подробнее о курсе Data Science →

2 место. Курс «Data Scientist: с нуля до middle от Нетология»

Цена: 156 000 ₽ или рассрочка на 24 месяца – 6 500 ₽ / мес

Ссылка на сайт: https://netology.ru/programs/prodatascience

Постройте карьеру в анализе данных и обучении нейронных сетей.
Начните работать по специальности уже через полгода обучения.

  • Видеолекции, вебинары, домашние задания, хакатон
  • Участие в конкурсах под руководством Kaggle-masters
  • Диплом о профессиональной переподготовке установленного образца.

Перейти на официальный сайт →

Data Scientist создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей, помогая бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы.

Вы научитесь не только работать с аналитикой, нейронными сетями, Big Data и помогать компаниям и продуктам расти с помощью технологий, но и освоите ключевые «мягкие навыки»: коммуникацию в команде, целеполагание и эмоциональный интеллект.

Обучение на курсе поможет вам

  • Перейти в профессию с высоким окладом, которая не устареет через 10 лет
    Положите начало своему развитию в востребованной во всех отраслях бизнеса профессии
  • Освоить ключевые технологии и опередить запрос рынка
    Станете востребованным специалистом уже в процессе обучения и не растеряете накопленные знания и навыки
  • Прожить опыт 2-3 лет самостоятельного изучения сферы Data Science
    Получите знания в концентрированном формате и с обратной связью от экспертов-практиков ведущих компаний.

Кому будет полезен этот курс:

  • Новичкам в Data Science
    С нуля овладете знаниями и навыками, необходимыми для работы Data Scientist, и получите новую востребованную профессию.
  • Разработчикам
    Курс даёт хорошую базу для перехода из программирования в Data Science и анализ больших данных. Вас ждёт много практической работы, разбор кейсов и новые полезные знакомства.
  • Аналитикам
    Вы научитесь извлекать максимум из больших массивов данных для быстрой проверки гипотез и построения прогнозов. Освоите новые инструменты и перейдёте на новый уровень в сфере Data Science.

Чему вы научитесь:

  • Работать с SQL
    Научитесь писать запросы, работать с данными в базе без переноса в таблицы, загружать данные и сохранять историю, работать с разными форматами файлов
  • Использовать Python и библиотеки
    Автоматизировать работу с большими массивами, получать данные из внешних источников, обосновывать выводы, полученные при анализе данных
  • Проверять данные и определять проблемы
    Обрабатывать текстовые данные, чтобы передавать их в алгоритмы машинного обучения, генерировать новые значимые признаки
  • Обучать многослойные нейронные сети и строить модели машинного обучения
    Быстро строить модели и проверять гипотезы, строить рекомендательную систему и нейронную сеть, выявлять скрытые аномалии в данных
  • Применять математику в алгоритмах
    Освоите необходимый математический аппарат для продуктивной работы с моделями данных, машинным обучением и нейронными сетями
  • Лидировать Data-проекты, работать в команде и находить общий язык с заказчиком
    Структурировать результаты, формулировать гипотезы, выявлять потребности, находить области применения машинного обучения.

Программа курса:

1 ступень. Погружение
В первом модуле вы разберётесь, что такое аналитическое мышление, и узнаете, откуда берутся данные. Научитесь определять ключевые продуктовые метрики и создавать дашборды.

  1. Аналитическое мышление
    Научитесь думать, как аналитик и формулировать гипотезы для проверки. Поймёте, что аналитика строится вокруг данных. Познакомитесь с базовым инструментом аналитика и сможете проводить в нём простой анализ данных.
  • Что такое аналитическое мышление
  • Введение в Google-таблицы
  • Продвинутые Google-таблицы
  • Основы статистики
  • Откуда берутся данные
  • Продвинутая визуализация данных
  • Python как инструмент анализа данных
  • Машинное обучение для жизни
  1. Основы визуализации данных
    Поймёте, как создавать наглядные визуализации, откуда берутся данные для визуализации и как с ними работать. Узнаете, как создавать истории с помощью данных.
  • Как донести информацию с помощью изображений
  • Инструменты, источники и предподготовка данных
  • Исследование данных и основы статистики
  • Продвинутая визуализация данных
  • Сторителлинг в визуализации.

2 ступень. SQL, Python и Big Data
Вы получите ключевые навыки специалиста в Data Science для старта в профессии и сможете искать стажировку в новой сфере уже после прохождения первой ступени.

  1. SQL и получение данных
    В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.
  • Архитектура и структура баз данных (БД)
  • Простые запросы, join`ы, агрегаты
  • Базовые команды в SQL и встроеные аналитические функции
  • Импорт и экспорт данных посредством SQL и ETL программ
  • Принципы работы с различными БД
  • Основные библиотеки для подключения к БД из Python
  • Функции SQL и их аналоги в pandas
  • Консоль (знакомство, основные операторы, утилита psql)
  • Архитектура и проектирование
  • Нормализация
  • Зависимости
  • Подготовка и сдача итогового проекта
  1. Аналитика больших данных
    Узнаете, как собрать и управлять командой Big Data-проекта. Освоите подход CRISP-DM, определите компетенции и состав команды. Определите, сколько данных вам нужно для нахождения инсайтов. Найдёте задачи под Big Data в своей компании. Поймёте, как и по каким правилам хранить данные. Сможете обосновывать влияние на сбор данных, мониторинг и отчётность.
  • Что такое большие данные
  • Монетизация больших данных
  • Характеристики и источники данных
  • Культура сбора данных
  • Основы реализации проектов больших данных. Кейс-стади
  • Основные характеристики больших данных и виды анализа данных. Продвинутые методы анализа больших данных
  • NoSQL-подход
  • MapReduce-подход
  • Введение в Hadoop
  • Практическое задание (лабораторная работа) по аналитике данных и его разбор
  1. Python для анализа данных
    Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python.
  • Базовые типы данных и циклы
  • Функции и классы
  • Продвинутые типы данных: массивы, множества, словари
  • Библиотеки для анализа данных: NumPy, Pandas, Matplotlib
  • Визуализация в Python
  • Базовые понятия статистики
  • Случайные события. Случайные величины
  • Логистическая регрессия и дискриминационный анализ
  • Корреляция и корреляционный анализ
  • Доверительные интервалы. Статистическая проверка гипотез
  1. Математика для анализа данных
    Изучите основные операции с векторами, матричными операциями. Рассмотрите генетические алгоритмы, алгоритм дифференциальной эволюции. Узнаете, что такое математическое ожидание, дисперсия и моменты старших порядков. Изучите закон больших чисел.
  • Линейная алгебра. Вектора
  • Линейная алгебра. Матрицы
  • Продвинутая линейная алгебра
  • Математический анализ. Производная
  • Производная функции нескольких аргументов
  • Теория оптимизации
  • Теория вероятности. Дискретные и непрерывные случайные величины
  • Центральная предельная теорема и закон больших чисел.

3 ступень. Машинное обучение, Deep Learning и нейронные сети
Получите расширенные знания в профессии и научитесь работать с нейронным сетями, обучать модели и реализовывать NLP. Начнёте повышать свою квалификацию. После окончания этой ступени сможете претендовать на позицию Junior Data Scientist и совмещать учёбу с работой.

  1. Машинное обучение
    Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, как сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Узнаете, как использовать Random Forest в задачах классификации.
  • Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия
  • Классификация: логистическая регрессия и SVM
  • Функции потерь и оптимизация
  • Оценка точности модели, переобучение, регуляризация
  • Проблема качества данных
  • Работа с пропусками и переменными
  1. Рекомендательные системы
    В этом и следующих блоках вы будете применять полученные знания в разных областях машинного обучения. Во время этого блока научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.
  • Неперсонализированные рекомендательные системы
  • Сontent-based-рекомендации
  • Collaborative Filtering
  • Гибридные алгоритмы
  1. Временные ряды
    Вы изучите элементарные алгоритмы обработки временных рядов, модели ARIMA и GARCH, прогнозирование значений на их основе. Узнаете, что такое марковские случайные процессы и марковские модели для временных рядов.
  • Знакомство с временными рядами
  • Элементарные методы анализа временных рядов
  • Модели ARMA
  • Модели авторегрессии условной гетероскедастичности
  • Сингулярный спектральный анализ
  • Случайные марковские процессы
  • Нейронные сети в анализе временных рядов
  • Поиск изменений во временном ряде
  1. Нейронные сети
    Научитесь строить простые полносвязанные сети уровня LeNet и AlexNet и экспериментировать с их обучением. Получите теоретическую и практическую базу для использования НС в блоках CV и NLP.
  • Введение в нейронные сети и библиотеку Keras
  • Углубление в нейронные сети и библиотеку Keras
  • Введение в свёрточные нейронные сети
  • Введение в рекуррентные сети
  • Автокодировщики
  • Введение в генеративно-состязательные сети
  1. Компьютерное зрение
    Вы освоите основные техники машинного зрения — извлечение признаков, поиск по картинкам, сегментирование, детекция объектов.
  • Выделение признаков и поиск похожих изображений
  • Сегментация и детекция объектов
  • Свёрточные нейронные сети
  • Обучение свёрточной сети на практике
  • Задачи детекции и сегментации
  • Рекуррентные нейронные сети в задачах компьютерного зрения (Image Captioning)
  • Порождающие модели
  1. Обработка естественного языка
    Вы освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты.
  • Введение в автоматическую обработку текста
  • Структура слова. Морфология
  • Синтаксический анализ
  • Дистрибутивная семантика
  • Извлечение ключевых слов
  • Словари. Подкрепление знаний
  • Тематическое моделирование
  • Информационный поиск
  • Классификация в АОТ
  • Языковые модели
  • Извлечение информации
  1. Deep Learning
    Научитесь работать с многомерными свёртками, овладеете конкурентным преимуществом в задачах с использованием Beam-Search и Teacher Forcing, сможете реализовывать NLP с нуля. Сможете отличать дескриминатор от генератора и обучать генератор выбирать данные из линейной регрессии. Реализуете сеть генерации покемонов и обучите её.
  • Регрессия и персептрон
  • Многослойная нейронная сеть: регуляризация, градиентный спуск, ускорение обучения
  • Свёрточные сети: свёрточные архитектуры, многомерные свертки, сегментация
  • Рекуррентные сети: RNN, GRU и LSTM, Encoder-Decoder архитектура
  • Внимание: Dense Attention и Beam search
  • Компьютерное зрение: SSD, Region Based CNN, Faster R-CNN, Masked R-CNN, UNet, перенос стиля и FCN
  • Работа с текстом: языковые модели, Embeddings, Word2Wec, FastText, NER, Transformer, BERT и Elmo
  • GAN’ы: дискриминатор, генератор, продвинутые архитектуры.

4 ступень. Soft Skills и управление проектами
Сочетание хард- и софт-скиллов поможет вам быстрее расти по карьерной лестнице и добиваться больших результатов. Пройдя все ступени программы, вы сможете претендовать на должность Middle Data Scientist.

  1. Менеджмент data-проектов
    Овладеете методологиями управления Data Science-проектами. Научитесь формулировать идеи и гипотезы, выбирать подходящие методы и алгоритмы, планировать решение задачи.
  • Требования в data-проектах
  • Методология ведения data-проектов
  • Разработка отчётов по исследованию
  • Сохранение результатов эксперимента
  1. Эффективные коммуникации и эмоциональный интеллект
    Научитесь понимать картину мира окружающих и на основе этого строить коммуникацию. Разберётесь, как управлять своими эмоциями, как реагировать на эмоции окружающих в процессе общения и развивать эмоциональный интеллект. Узнаете, как управлять эмоциями в переговорах. Научитесь заводить полезные связи и деловые знакомства и правильно презентовать себя.
  • Фасилитация
  • Личная эффективность
  • Планирование
  • Расстановка приоритетов
  • Управление временем
  • Делегирование
  • Концентрация и восстановление ресурсов
  • Самомотивация
  • Эмоциональный интеллект. Модель и этапы развития
  • Распознавание эмоций
  1. Переговоры
    Научитесь грамотно организовывать деловые встречи и эффективно проводить переговоры, добиваясь взаимовыгодных договорённостей.
  • Нетворкинг
  • Как вести неравные переговоры
  • Возражения и аргументы
  • Подготовка к переговорам
  • Уверенное ведение переговоров
  • Управленческие поединки
  • Манипуляции в переговорах
  • Сила переговоров
  • Структура переговоров
  • Переговоры онлайн и офлайн
  • Внутренние переговоры
  1. Публичные выступления
    Узнаете, как презентовать идею или отчёт. Научитесь получать удовольствие от выступлений и перестанете их бояться.
  • Подготовка к публичному выступлению
  • Типовые структуры выступления
  • Выступление перед коллегами
  • Взаимодействие с аудиторией и подача
  1. Финальный хакатон и Kaggle Competitions
    В составе мини-команды за ограниченное время и на основе датасетов крупных игроков рынка вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.
    Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.

Итоговый проект — реальный кейс от Dodo Brands
В рамках дипломного проекта вы сможете построить ML-модель для решения своих текущих профессиональных задач:

это может быть система прогнозирования продаж, распознавание объектов на фото или видео, анализ временных рядов, анализ больших объёмов текста и т. д.
Если у вас нет идей для своего проекта (или доступа к необходимым данным), мы предложим вам учебный кейс в интересной вам области на основе реального датасета других компаний.
Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.

Преподаватели — эксперты ведущих компаний

  • Денис Волк
    EX-senior Data Scientist в KPMG
  • Алексей Миронов
    Data Scientist в ДомКлик.ру
  • Михаил Васильковский
    Machine Learning Engineer в Snap Inc.
  • Егор Конягин
    Научный сотрудник в Сколтехе
  • Алексей Кузьмин
    Технический директор и Data Scientist в ДомКлик.ру
  • Олег Булыгин
    IT-аудитор в Сбербанке
  • Константин Башевой
    Аналитик-разработчик в Яндекс.

И др.

Отзывы об обучении доступны на сайте.

Подробнее о курсе Data Science →

3 место. Курс «Профессия Data Scientist от SkillFactory»

Цена: Рассрочка на 24 месяца – от 7 575 ₽ / мес

Ссылка на сайт: https://skillfactory.ru/data-scientist-pro

Освойте самую востребованную профессию 2021 года и станьте специалистом.

  • длительность 24 месяца
  • уровень: с нуля.

Перейти на официальный сайт →

За два года обучения по 10 часов в неделю вы погрузитесь в Data Science, начнете понимать основные принципы работы, освоите необходимые навыки и соберете портфолио проектов. Вот что будет в вашей учебной программе:

  • Кейсы
    Вы будете практиковать решение реальных бизнес-задач. Самостоятельно напишете и обучите модели разной сложности: от линейных регрессий и классификаторов до гибридных рекомендательных систем или моделей с использованием нейронных сетей. Выведете вашу модель в Production с помощью написания сервиса на Flask.
  • Уроки
    Уроки в форме практикума помогут закрепить на практике теоретический материал и отработать в нюансах подходы к решению задач машинного и глубинного обучения. Вы наработаете и прокачаете навыки машинного обучения, построите рекомендательную систему с использованием алгоритмов и научитесь работать с временными рядами.
  • Soft Skills
    Перевод технических задач на простой и понятный бизнесу язык. Постановка задач и их декомпозиция. Навыки эффективных коммуникаций с клиентами и стейкхолдерами. Управление проектом в Data Science.

Программа обучения:

Семестр 1. Foundation

  1. Основы программирования на Python + Python для анализа данных
  • Введение в программирование на Python
  • Анализ данных в Pandas и NumPy
  • Визуализация, очистка данных и Feature Engineering
  • Работа c файлами, HTML-страницами и API
  1. Подгрузка данных
  • Выгрузка данных из разных источников с помощью Python
  • Выгрузка баз данных с помощью SQL
  • Выбор подходящих данных для решения задач
  1. Разведывательный анализ данных
  • Разведывательный анализ с помощью Pandas, Numpy
  • Основы статистики и проверка статистических гипотез
  • ML-эксперименты
  • Использование ML-Flow
  • Feature Engineering.

Семестр 2. Machine Learning & Математика

  1. Введение в машинное обучение
  • Задачи классификации, регрессии и кластеризации
  • Отбор и селекция признаков
  • Валидация данных
  • Оптимизация гиперпараметров и улучшение качества модели.
  1. Математика и углубленное машинное обучение
  • Линейная алгебра
  • Матанализ и методы оптимизации
  • Основы теории вероятности
  • Основные модели машинного обучения
  • Оценка качества алгоритмов.
  1. ML в бизнесе
    Проект на выбор: временные ряды или рекомендательные системы
  • Математические и ML-модели временных рядов
  • Рекомендательные системы
  • Мachine Learning в Production
  • Оценка эффективности моделей в реальных бизнес-задачах.

Семестр 3-4. Специализация по выбору

  1. Специализация ML-разработчик
  • Введение в Deep Learning
  • Основы Data Engineering
  • Дополнительные главы Python и ML
  • Экономическая оценка эффектов
  • и разработка MVP
  • ML в Production
  • Углубленное изучение
  • ML-разработки и выпускной проект по выбранной теме.
  1. Специализация CV-разработчик
  • Введение в Deep Learning
  • Математика нейронных сетей для CV
  • Задачи Computer Vision: от распознавания объектов до улучшения качества изображений и работы с видео
  • Нейронные сети в Production
  • Углубленное изучение CV-разработки и выпускной проект по выбранной теме.
  1. Специализация NLP-разработчик
  • Введение в Deep Learning
  • Математика нейронных сетей для NLP
  • Hard & Software для решения задач NLP
  • Задачи и алгоритмы NLP
  • Нейронные сети в Production
  • Углубленное изучение NLP-разработки и выпускной проект по выбранной теме.

+ Выбор 2 майноров (дополнительных специализаций) помимо основного трека обучения: Advanced SQL или Advanced Python (3 семестр), Data Engineering (4 семестр)!

+ индивидуальные консультации с экспертами.

Преподаватели:

  • Андрей Зимовнов
    Ведущий преподаватель специализации, старший разработчик в Яндекс.Дзен
  • Дмитрий Коробченко
    Deep Learning R&D Engineer, NVIDIA
  • Эмиль Магеррамов
    COO Data Lab, компания EORA
  • Антон Киселев
    Head of R&D, компания EORA
  • Полина Полунина
    Ex-руководитель Data Science в группе «М.Видео — Эльдорадо», куратор в SkillFactory.

И др.

Рекомендации и отзывы:

Надежда Кириллина
«Спасибо за курс по Data Science! Мне понравилось, что в ходе курса я решала практические задачи и могла в любой момент задать вопрос куратору.
Я получила от курса то, что хотела. Прокачалась в Python и анализе данных.»

Карим Аминов
«Приятно, когда есть материал и он отфильтрован. Ничего лишнего. Если курс в рамках онлайн урока, то много «мусора» (вопросы от других участников, заминки и т. п.).
Учёба получилась не ради знаний, а ради решения реальных насущных задач. Спасибо.»

Подробнее о курсе Data Science →

Курс «Факультет Искусственного интеллекта от GeekBrains»

Цена: Рассрочка до 36 месяцев – от 4 384 ₽ / мес

Ссылка на сайт: https://gb.ru/geek_university/data-science

Получите одну из самых востребованных IT-профессий. Машинное обучение от профессиональных преподавателей.

  • 18 месяцев, 2 занятия в неделю
  • Диплом, 14 работ в портфолио
  • Трудоустройство после обучения.

Перейти на официальный сайт →

За два года спрос на Data Scientist-ов вырос в два раза, по данным HeadHunter. Применяя методы машинного обучения, они строят прогнозы и повышают эффективность бизнес-процессов в любой отрасли. Мы поможем стать таким специалистом с нуля и найдем вам работу.

Программа обучения:

Наша программа одна из самых объёмных и содержательных. В то же время её легко понять, потому что знания даются постепенно: от базы к продвинутым инструментам.
380 часов обучающего контента и практики, 14 проектов в портфолио, 2 вебинара в неделю.

Подготовительный блок

  1. Видеокурс: как учиться эффективно
  2. Основы математики
  3. Основы программирования
  4. Основы языка Python
  5. Базовый курс.

Программирование
Научитесь работать в Linux и создавать сервера в облачных сервисах AWS, проводить поиск информации и основные операции с файлами, выполнять мониторинг работы сервера. Научитесь использовать язык запросов SQL, создавать и оптимизировать сложные запросы. Освоите библиотеки языка Python, предназначенные для Data Science: Numpy, Pandas, Matplotlib, SciKit-Learn.

  1. Встреча декана со студентами
  2. Основы языка Python
  • Знакомство с Python
  • Встроенные типы и операции с ними
  • Функции
  • Полезные инструменты
  • Работа с файлами
  • Объектно-ориентированное программирование
  • ООП. Продвинутый уровень
  • ООП. Полезные дополнения
  1. Рабочая станция
  • Введение. Установка ОС
  • Настройка и знакомство с интерфейсом командной строки
  • Пользователи. Управление Пользователями и группами
  • Загрузка ОС и процессы
  • Устройство файловой системы Linux. Понятие Файла и каталога
  • Введение в скрипты bash. Планировщики задач crontab и at
  • Управление пакетами и репозиториями. Основы сетевой безопасности
  • Введение в docker
  1. Основы реляционных баз данных и MySQL
  • Вебинар. Установка окружения. DDL – команды
  • Видеоурок. Управление БД. Язык запросов SQL
  • Вебинар. Введение в проектирование БД
  • Вебинар. CRUD-операции
  • Видеоурок. Операторы, фильтрация, сортировка и ограничение. Агрегация данных
  • Вебинар. Операторы, фильтрация, сортировка и ограничение. Агрегация данных
  • Видеоурок. Сложные запросы
  • Вебинар. Сложные запросы
  • Видеоурок. Транзакции, переменные, представления. Администрирование. Хранимые процедуры и функции, триггеры
  • Вебинар. Транзакции, переменные, представления. Администрирование. Хранимые процедуры и функции, триггеры
  • Видеоурок. Оптимизация запросов. NoSQL
  • Вебинар. Оптимизация запросов
  1. Библиотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn
  • Введение в курс
  • Вычисления с помощью Numpy. Работа с данными в Pandas
  • Визуализация данных в Matplotlib
  • Обучение с учителем в Scikit-learn
  • Обучение без учителя в Scikit-learn
  • Обучение без учителя в Scikit-learn и введение в итоговый проект
  • Консультация по итоговому проекту.

Сбор данных и статистическое исследование
Познакомитесь с теорией вероятностей и математической статистикой. Изучите методы проведения корреляционного, дисперсионного и регрессионного анализа. Научитесь работать с RESTful/SOAP-сервисами, форматами XML и JSON в Python, а также познакомитесь с особенностями открытых данных (OpenData).

  1. Библиотеки Python для Data Science: продолжение
  • Введение в задачу классификации. Постановка задачи и подготовка данных
  • Анализ данных и проверка статистических гипотез
  • Построение модели классификации
  • Оценка и интерпретация полученной модели. Обсуждение курсового проекта
  1. Методы сбора и обработки данных из сети Интернет
  • Основы клиент-серверного взаимодействия. Парсинг API
  • Парсинг HTML. BeautifulSoup, MongoDB
  • Системы управления базами данных MongoDB и SQLite в Python
  • Парсинг XPath
  • Scrapy
  • Парсинг фото и файлов
  • Selenium в Python
  • Работа с данными
  1. Введение в математический анализ
  • Вводный урок
  • Множество. Последовательность. Часть 1
  • Множество. Последовательность. Часть 2
  • Предел функции. Часть 1
  • Предел функции. Часть 2
  • Производная функции одной переменной. Часть 1
  • Производная функции одной переменной. Часть 2
  • Производная функции нескольких переменных. Часть 1
  • Производная функции нескольких переменных. Часть 2
  • Интеграл. Ряды. Часть 1
  • Интеграл. Ряды. Часть 2
  1. Теория вероятностей и математической статистике
  • Случайные события. Вероятные события. Условная вероятность. Формула Байеса
  • Дискретные случайные величины. Закон распределения вероятностей. Биноминальный закон распределения. Распределение Пуассона
  • Основы математической статистики. Количественные характеристики популяции. Графическое представление данных
  • Непрерывные случайные величины. Функция распределения и функция плотности. Нормальное распределение. Центральная предельная теорема
  • Проверка статистических гипотез. P-значения. Доверительные интервалы
  • Взаимосвязь величин. Показатели корреляции. Корреляционный анализ. Проверка на нормальность
  • Линейная регрессия. Двухвыборочный t-тест. A/B-тестирование
  • Дисперсионный анализ. Метод главных компонент. Логистическая регрессия.

Математика для Data Scientist
Рассмотрите математические аспекты алгоритмов, применяемых в Data Science: линейная и логистическая регрессия, градиентный спуск, метод ближайших соседей, кластеризация, деревья решений, случайный лес, градиентный бустинг. Поймете, как устроены алгоритмы на уровне математики.

  1. Линейная алгебра
  • Линейное пространство
  • Матрицы и матричные операции
  • Линейные преобразования
  • Системы линейных уравнений
  • Сингулярное разложение матриц
  1. Алгоритмы анализа данных
  • Алгоритм линейной регрессии. Градиентный спуск
  • Масштабирование признаков. L1- и L2-регуляризация. Стохастический градиентный спуск
  • Логистическая регрессия. Log Loss
  • Алгоритм построения дерева решений
  • Случайный лес
  • Градиентный бустинг (AdaBoost)
  • Классификация с помощью KNN. Кластеризация K-means
  • Снижение размерности данных

Машинное обучение
Освоите Python: от основ программирования до автоматизации, сбора, обработки, анализа и визуализации данных.

  1. Машинное обучение в бизнесе
  • Data-driven-подход на примере задачи маршрутизации заявок в helpdesk
  • Профилирование пользователей. Сегментация: unsupervised learning (clustering, LDA/ARTM), supervised (multi/binary classification)
  • Связь бизнес-показателей и DS-метрик
  • Uplift-моделирование
  • Задача оттока: варианты постановки, возможные способы решения
  • Задача look-alike
  • Интерпретация прогнозов модели (SHAP): объясняем поведение модели на отдельных наблюдениях
  • Проверяем работу модели на практике: A/B-тестирование
  • Интеграция. Итоговый проект
  1. Рекомендательные системы
  • Введение, примеры задач, бизнес- и ML-метрики
  • Бейзлайны и детерминированные алгоритмы item-item
  • Коллаборативная фильтрация
  • Рекомендательные системы на основе контента
  • Поиск похожих товаров и пользователей. Гибридные рекомендательные системы
  • Двухуровневые модели рекомендаций
  • Рекомендательные системы в бизнесе
  • Консультация к курсовому проекту
  1. Видеокурс от Мегафон + курсовой проект
  • Видеотеория
  • Курсовой проект.

Нейронные сети
Научитесь решать задачи Machne Learning с данными из соцсетей, геоданными, применением графов, а также познакомитесь с нейронными сетями. На практике познакомитесь с фреймворками для разработки нейронных сетей: Tensorflow, Keras, PyTorch.

  1. Введение в нейронные сети
  • Основы обучения нейронных сетей
  • Keras
  • TensorFlow
  • Сверточные нейронные сети
  • Рекуррентные нейронные сети
  • Сегментация
  • Детектирование объектов
  • GAN
  1. Введение в компьютерное зрение от Nvidia
  • Обработка изображений и компьютерное зрение
  • Свёрточные нейронные сети
  • Продвинутые архитектуры свёрточных нейросетей
  • Семантическая сегментация
  • Детектирование объектов
  • Metric learning
  • Обработка видео
  • Синтез изображений.

Задачи искусственного интеллекта
Изучите продвинутые архитектуры сверточных нейронных сетей, обработку естественного языка и компьютерное зрение.

  1. Введение в обработку естественного языка
  • Предобработка текста
  • Создание признакового пространства
  • Embedding word2vec fasttext
  • Тематическое моделирование. EM-алгоритм
  • Part-of-Speech разметка, NER, извлечение отношений
  • Классификация текста. Анализ тональности текста
  • Сверточные нейронные сети для анализа текста
  • Рекуррентные нейронные сети RNN LSTM GRU
  • Языковое моделирование
  • Машинный перевод. Модель seq2seq и механизм внимания
  • Модель Transformer-1
  • Модель Transformer-2
  • Модель BERT и GPT
  • Transfer learning
  • Консультация по курсовому проекту. Создание чат-бота в Telegram
  1. Фреймворк PyTorch для разработки искусственных нейронных сетей
  • Введение в PyTorch
  • CNN and LSTM for human action recognition
  • Generative adversarial networks (GAN): генеративные сети
  • Image Segmentation
  • Face Detection and Emotion Recognition.

Предметы с индивидуальным выбором даты старта

  • Подготовка к поиску работы
  • История развития искусственного интеллекта
  • Алгоритмы и структуры данных на Python
  • Введение в высшую математику
  • Спортивный анализ данных. Платформа Kaggle
  • Язык R для анализа данных
  • Визуализация данных в Tableau
  • Сверточные нейронные сети в компьютерном зрении.

 

Вас будут обучать топовые эксперты

Сергей Ширкин
Data Scientist в Dentsu Aegis Network Russia, декан факультета
Применял технологии машинного обучения и искусственного интеллекта в Сбербанке и Росбанке, компаниях Equifax и Dentsu Aegis Network Russia.

Дмитрий Коробченко
Deep Learning R&D инженер и руководитель направления в NVIDIA
Эксперт в области нейронных сетей и машинного обучения, спикер на образовательных и научно-популярных мероприятиях. Опыт в Deep Learning – с 2012 года. Закончил ВМиК МГУ. Ранее работал в исследовательском центре Samsung.

Алексей Петренко
Python Developer, фрилансер
Разрабатывает IT-решения по автоматизации процессов учёта наличия и движения людей и технических средств для Министерства обороны РФ. За 20 лет в IT писал программы на более чем 30 языках программирования.

Подробнее о курсе Data Science →

Курс «Профессия Data Scientist от OTUS»

Цена: 144 000 ₽

Ссылка на сайт: https://otus.ru/lessons/prof-ds/

Научитесь решать задачи машинного обучения и нейронных сетей с нуля до Junior.

  • 13 месяцев
  • Онлайн.

Перейти на официальный сайт →

  • Погружение в профессию
    Вы попробуете себя в разных направлениях Data Science: классическое машинное обучение, нейронные сети, компьютерное зрение, языковые модели, рекомендательные системы, графовые методы.
  • Два проекта в портфолио
    Во время обучения вы выполните собственные проекты по машинному обучению и нейронным сетям
  • Помощь с трудоустройством
    Комплексная система, которая поможет получить выгодные офферы в перспективных проектах.

Для кого?
Для тех, кто хочет освоить арсенал навыков для старта в Data Science и попробовать себя в разных направлениях.

Какой результат вы получите?
Обучение состоит из 2-х ступеней, где вы будете параллельно осваивать разные навыки, необходимые Data Scientist.

Ступень 1
Длительность: 4 месяца с проектом
Результат: освоите математическую базу и работу с Python; разберете основы машинного обучения и сможете претендовать на стажерские позиции.

  • Освоите Python для Data Science
  • Изучите все необходимые разделы математики и научитесь использовать ее для работы с моделями
  • Сможете строить основные и продвинутые модели машинного обучения
  • Начинаете знакомство с нейронными сетями.

Ступень 2
Длительность: 7 месяцев с проектом
Результат: освоите продвинутые методы машинного обучения, основы работы с нейросетями, выберете траекторию развития и сможете претендовать на позиции Junior Data Science.

  • Осваиваете анализ временных рядов
  • Разбираетесь в разных типах нейронных сетей: сверточные нейросети и компьютерное зрение, рекомендательные системы, языковые модели, обучение с подкреплением
  • Собираете портфолио проектов и проходите карьерную консультацию.

Трудоустройство
Мы оказываем помощь в вопросах карьеры на протяжении всего обучения и спустя полгода после его завершения.

  • Получите помощь с составлением резюме, портфолио и сопроводительного письма
  • Разместите свое резюме в базе OTUS и сможете получать приглашения на собеседования от партнеров
  • Пройдете карьерную консультацию с нашим HR-специалистом.

Программа обучения:

  1. Математика для DS: Алгебра
  2. Введение в программирование на Python
  3. Математика для DS: матан и матстат
  4. Python для ML
  5. Основы машинного обучения
  6. Продвинутые методы классического ML
  7. Deep Learning I. Знакомство с нейронными сетями
  8. Консультация по проекту + 2 недели на выполнение
  9. Защита проектных работ по классическим методам ML
  10. Deep Learning II. Сверточные нейронные сети и компьютерное зрение
  11. Анализ временных рядов
  12. Рекомендательные системы
  13. Natural Language Processing
  14. Reinforcement Learning
  15. Консультация по проекту + 2 недели на выполнение
  16. Защита проектных работ по нейронным сетям.

Проектные работы
Каждый семестр завершается финальным проектом, который предстоит защитить перед командой преподавателей. Практический опыт и портфолио проектов помогут вам произвести впечатление на собеседовании.
Вы можете выбрать одну из предложенных преподавателем тем или реализовать свою идею.

Преподаватели
Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания.

Мария Тихонова
Senior Data Scientist Сбер, преподаватель ВШЭ
Работает специалистом по анализу данных в команде AGI NLP в Сбере. Занимается нейросетевыми языковыми моделями и их применением в реальных задачах. Считает, что работа в области Data Science дает уникальную возможность заниматься безумно крутыми вещами on the edge of science, которые меняют мир здесь и сейчас.
Преподает в Высшей Школе Экономики дисциплины по анализу данных, машинному обучению и data science.
Мария закончила механико-математический факультет МГУ и школу анализа данных Яндекса. В настоящий момент Мария обучается в аспирантуре ВШЭ на факультете компьютерных наук. Среди ее научных интересов такие области data science, как natural language processing и тематическое моделирование.

Антон Витвицкий
BOOST INC., Head of Computer Vision
С 2012 по 2017 занимался распознаванием лиц в компании WalletOne, чьи решения поставлялись для бизнеса в странах Южной Африки и Европы. Участвовал в стартапе Mirror-AI, где руководил командой компьютерного зрения. В 2017 стартап прошел Y-combinator и получили инвестиции для создания приложения, в котором пользователь может реконструировать свой аватар по селфи. В 2019 участвовал в британском стартапе Kazendi Ltd., в проекте HoloPortation. Цель проекта – реконструкция 3D-аватаров для очков дополненной реальности HoloLens. C 2020 руководит командой компьютерного зрения в американском стартапе Boost Inc., который занимается видеоаналитикой в баскетболе для NCAA.

Глеб Карпов
Skoltech Computational Intelligence Laboratory
В данный момент работает исследователем в Skoltech Computational Intelligence Laboratory: пишет научные статьи в составе международной коллаборации, занимается коммерческими проектами по темам машинного обучения и вычислительной линейной алгебры.
Профессиональные интересы: оптимизация, линейная алгебра, статистика, uncertainty quantification, обучение с подкреплением, регрессионный анализ, планирование эксперимента.
Нравится учиться, преподавать, доносить сложные вещи понятным языком, взаимодействовать с людьми, размышлять о природе вещей, явлений и концепций.

Подробнее о курсе Data Science →

Курс «Специалист по Data Science от НИУ ВШЭ»

Цена: 465 000 ₽

Ссылка на сайт: https://cs.hse.ru/dpo/datascientist

Перейти на официальный сайт →

«Специалист по Data Science» — это программа по анализу данных и машинному обучению, которая охватывает все разделы современного анализа данных, в том числе глубинное обучение и его применения.
Программа начинается с самых основ — изучения программирования и базовых разделов математики — и переходит к разделам по машинному обучению, прикладной статистике и обработке данных, работе с большими данными, глубинному обучению, его применениям к изображениям, текстам и сигналам. При разработке программы мы сделали акцент на практическую работу.
По итогам программы вы получите самые актуальные знания в одной из самых востребованных областей 21 века, проекты в портфолио и диплом о профессиональной переподготовке установленного НИУ ВШЭ образца.

Программа:

  1. Python для автоматизации и анализа данных
  • Введение в язык Python. Знакомство со средой программирования. Базовые операции. Интерпретация ошибок.
  • Строки и списки в Python.
  • Понятие управляющих конструкций. Условные операторы.
  • Циклы for и while.
  • Устройство функций в Python. Поиск ошибок в коде и отладка.
  • Итераторы, генераторы, генераторы списков. Рекурсия.
  • Работа с файлами. Продвинутая работа со словарями.
  • Библиотеки для хранения и работы с данными в табличном формате: pandas.
  • Сбор данных: web-scraping с
  • Сбор данных: Selenium, работа с сервисами через API.
  • Объектно-ориентированное программирование. Классы.
  • Введение в numpy.
  • Введение в pandas.
  • Работы с пропущенными данными.
  • Визуализация для презентации данных: matplotlib. Основные виды графиков. Основные ошибки при создании визуализаций.
  • Создание интерактивных визуализаций: plotly.
  • Разведывательный анализ данных. Особенности исследования текста.
  1. Математика для анализа данных
  • Дискретная математика
  • Математический анализ
  • Линейная алгебра
  • Теория вероятностей
  1. Прикладная статистика для машинного обучения
    Теория оценивания. Оценивание параметров распределения. Метод моментов и метод максимального правдоподобия. Сравнение оценок.
  2. Алгоритмы и структуры данных
  • Асимптотический анализ.
  • Базовые структуры данных.
  • Сортировки.
  • Бинарные деревья поиска.
  • Хеш-таблицы.
  • Алгоритмы на графах.
  • Алгоритмы на строках.
  • Динамическое программирование.
  1. Машинное обучение
  • Введение и основные задачи.
  • Линейная регрессия.
  • Градиентные методы обучения.
  • Линейная классификация и метрики качества классификации.
  • Логистическая регрессия и SVM.
  • Многоклассовая классификация, работа с категориальными признаками и текстами.
  • Решающие деревья.
  • Бэггинг и случайные леса.
  • Градиентный бустинг.
  • Градиентный бустинг: имплементации.
  • Отбор признаков и понижение размерности.
  • Кластеризация.
  • Поиск аномалий.
  • Рекомендательные системы.
  • Ранжирование.
  1. Промышленное машинное обучение на Spark
  • Введение: как работают и где находятся большие данные.
  • Среда Spark RDD / Spark SQL.
  • Advanced SQL.
  • Spark ML / Spark TimeSeries.
  • Advanced ML и проверка результатов качества моделей.
  • Spark GraphX /Spark Streaming.
  • Экосистема Spark (MLFlow, AirFlow,H2O AutoML).
  • Spark в архитектуре проекта / Spark CI/CD.
  1. Глубинное обучение
  • Введение в глубокое обучение. От линейной регрессии к нейронной сети. Смотрим на базовые возможности tensorflow/pytorch, собираем первую нейросеть.
  • Обучение нейронных сетей. Алгоритм обратного распространения ошибки.
  • Свёрточные нейронные сети. Классификация изображений.
  • Оптимизация. Эвристики для обучения нейронных сетей. Нормализация по батчам, инициализация и др.
  • Архитектуры свёрточных сетей. Что видят свёрточные сети. Transfer learning.
  • Обзор задач компьютерного зрения. Детекция, сегментация, перенос стиля, распознавание лиц.
  • Автокодировщики и генеративные модели (Generative Adversarial Networks).
  • Глубокое обучение для NLP. Векторные представления текстов: word2vec, fasttext.
  • Рекуррентные нейронные сети, работа с последовательностями. ELMO-эммбеддинги.
  • Sequence2sequence, архитектуры с механизмом внимания. Трансформеры. BERT.
  1. Прикладные задачи анализа данных
  • Введение в цифровую обработку сигналов и классификация звуков.
  • Автоматическое распознавание речи.
  • Преобразование текста в речь.
  • Введение в обработку текстов и классификация текстов.
  • Языковое моделирование.
  • Машинный перевод.
  • Распознавание лиц и метрическое обучение.
  • Семантическая сегментация изображений.
  • Детекция объектов на изображениях.
  • Глубинное обучение в производстве: обслуживание и ускорение.

Преподаватели:

  • Ян Пиле
    Руководитель группы аналитики в VK
  • Анастасия Максимовская
    Data Scientist в Сбербанке
  • Елена Кантонистова
    Доцент факультета компьютерных наук
  • Валентин Промыслов
    Преподаватель факультета компьютерных наук
  • Сергей Абдуракипов
    Data Science Team Lead в SAP Labs
  • Ксения Лисицина
    DL-разработчик в Яндекс Go
  • Ильдар Сафило
    Руководитель группы по рекомендательным системам в МТС.

И др.

Эксперты:

Евгений Соколов
Научный руководитель

Элен Теванян
Lead Data Scientist в X5 Retail Group

Артем Филатов
Разработчик-исследователь, направление беспилотных автомобилей в Яндекс.Такси.

Подробнее о курсе Data Science →

Курс «Профессия Data Scientist от ФПМИ МФТИ»

Цена: 195 000 ₽

Ссылка на сайт: https://fpmi-edu.ru/datascience

Освойте самую востребованную профессию. Постройте свою карьеру с новой специальностью.

  • Онлайн вебинары с преподавателем
  • Длительность обучения – от 9 месяцев 8 ак.ч. в неделю.

Перейти на официальный сайт →

Кому подойдет обучение:

  • Людям без опыта в IT
    Вы получите основные навыки в написании кода, аналитике, статистике и математике, которые необходимы в начале пути к карьере в Data Science и Machine Learning.
    Сможете пользоваться знаниями на практике практически сразу
  • Программистам
    Вы значительно повысите уровень своих знаний и умений в кодинге на Python, прокачаете понимание математики и умение мыслить аналитически, будете пользоваться алгоритмами машинного обучения для решения задач бизнеса
  • Начинающим аналитикам
    Вы сможете выставлять гипотезы и делать выводы на основании данных, писать качественный код на Python, трансформировать неструктурированные данные в полезную информацию для компании, понимать математику на основе статистики, обучать машины и делать прогнозы результатов. Информация и навыки помогут вам углубить познания, существенно увеличить скорость работы и добиться повышения.

Программа:

  1. «Python и инструменты машинного обучения»
  • Основы языка Python
  • Модули для первичного анализа данных
  • Функции и ООП в Python
  • Введение в Linux и Git
  • Знакомство с модулями для машинного обучения
  1. “Математика для анализа данных”
  • Дискретную математику
  • Математический анализ
  • Линейную алгебру и аналитическую геометрию
  • Теорию вероятностей
  • Математическую статистику и элементы аналитики
  1. “Методы анализа данных и машинного обучения”
  • Принципы математических алгоритмов
  • Современные библиотеки
  • Оценка моделей
  • Основы нейронных сетей.

Чем занимается Data Scientist:

  • Сбор большого количества неуправляемых данных и преобразование их в более удобный формат
  • Решение бизнес-задач с использованием данных
  • Работа с различными языками программирования
  • Работа со статистикой, включая статистические тесты и распределения
  • Использование аналитических методов, таких как машинное обучение, глубокое обучение и текстовая аналитика
  • Сотрудничество с ИТ и бизнесом в равной мере
  • Поиск порядка и шаблонов данных, а также выявление тенденций, которые могут помочь в достижении конечного бизнес-результата.

Преподаватели:

Иван Иванович Цитович
Доктор физико-математических наук, профессор кафедры “Алгоритмов и технологий программирования” МФТИ. Преподаватель курса “История и методология прикладной математики и информатики” в МФТИ

Максим Жуковский
Доктор физико-математических наук, доцент кафедры дискретной математики МФТИ, бывший исследователь отдела теоретических и прикладных исследований Яндекса

Александр Дайняк
Кандидат физико-математических наук, выпускник МГУ имени М.В.Ломоносова (2007) и и школы анализа данных Яндекса (2010), доцент кафедры дискретной математики МФТИ.
Автор нескольких онлайн-курсов по дискретной математике и информатике.

И др.

Что говорят о программе наши клиенты:

Анна Кузнецова
работает в финансовой сфере

«Меня зовут Кузнецова Анна. Мои профессиональный опыт включает позиции финансового бизнес-партнера и бизнес-контролера в ряде брендовых зарубежных и некоторых российских компаниях. Мое образование – бакалавриат, магистратура и аспирантура экономического факультета МГУ им. М.В. Ломоносова. Мне 42 года.
С мая 2021 года я обучаюсь на программе Data scientist в ФПМИ МФТИ, которая состоит из трех блоков-курсов: Python для анализа данных, Математика для анализа данных, Методы анализа данных и машинное обучение (МАДМО). Раньше никакого опыта программирования или навыков работы в машинном обучении и анализе данных у меня не было.
Я решила пойти на данную программу, чтобы изучить современные подходы в обработке данных и улучшить навыки прогнозирования, а главное – скорость обработки финансовых данных с целью дальнейшего использования в управленческом учете.
Оказалось, что машинное обучение и анализ данных – это потрясающе интересно!!! Я учусь с удовольствием. Из плюсов курса можно отметить:
– Основное – курс составлен ОЧЕНЬ КАЧЕСТВЕННО, поскольку направлен на понимание, смысл, содержание и умение создавать самому, что бесценно, а не на поверхностное и бездумное применение чьих-то готовых решений.
– Курс является оптимальной комбинацией теории и практики. В частности, блок математики охватывает 5 предметов и разбор всех необходимых типов задач. Программирование содержит хорошо структурированные по сути дела буквари и примеры применения по всем основным темам языка python. На курсе МАДМО Вы не только пройдете теорию, но и сами сделаете не менее 9 обработок данных различных форматов для различных отраслей. Курс, по мнению преподавателя, содержит все необходимые знания для позиции Data Scientist.
– Курс отличается хорошо продуманной и структурированной программой: математика и программирование в Питоне, на их основе – МАДМО. При условии КАЧЕСТВЕННОЙ проработки первых двух этапов, полученных знаний вполне достаточно, чтобы пройти МАДМО.
– Удобная система сдачи домашних заданий: любое д/з можно доработать и досдать, преподаватели всегда в контакте с учениками, можно получить ответ на любой вопрос в процессе выполнения работ. И в принципе преподаватели действительно оказывают помощь, дают подробные ответы на вопросы и нацелены на то, чтобы Вы знали.
– Курс содержит много дополнительных материалов и визуализаций, помогающих хорошо усвоить программу. Преподаватели очень конструктивные, все подробно объяснят, даже если вы по три раза спросите, правда ли, что дважды два четыре)))
– Все материалы курса остаются в личном кабинете в виде видео и ссылок на презентационные материалы и статьи. На эти материалы всегда можно опереться при решении своих текущих задач на работе.
– Ценовая политика предусматривает мотивацию для прохождения всех трех блоков курса.
– Если вам что-то в курсе не нравится, Вы можете дать обратную связь, к ней довольно быстро прислушиваются.
И несколько небольших советов, если Вы решитесь пойти учиться на курс Data Scientist в ФПМИ МФТИ:
1. Пожалуйста, сразу настройтесь, что для обучения нужно будет потрудиться и системно выделять время. Почитать раз в пару недель чего-нибудь и как-нибудь и при этом все сдать не получится.
2. Задавайте как можно больше вопросов и проясняйте все, что Вам не понятно. Вам обязательно ответят.
3. Перед прохождением курса по математике, пожалуйста, не игнорируйте совет обновить знания школьной программы. Пожалуйста, имейте в виду, что если вы учились в школе более 10 лет назад, уровень школьной математики стал выше.
4. Если Вы не решаетесь пойти на этот курс потому, что у Вас нет профильного образования, Вы думаете Вам много лет, Вам мало лет, в МФТИ все очень умные, а Вы не из МФТИ, Вы думаете, что разбираться в МО – это как слетать на Луну и т.д., то имейте, пожалуйста, в виду, что это не имеет никакого значения. У меня непрофильное образование, мне 42 года и серьезно училась я последний раз в 2007 году. Главное – это намерение потрудиться и интерес к предмету. Ведь Вы будете не одни, а в группе единомышленников!!!)))
Желаю правильного выбора пути и удачи всем, кто читает этот отзыв!»

Подробнее о курсе Data Science →

Курс «Специалист по Data Science, машинному обучению и искусственному интеллекту от Центр компьютерного обучения «Специалист» при МГТУ им.Н.Э.Баумана»

Цена: 108 890 ₽ – 149 990 ₽

Ссылка на сайт: https://www.specialist.ru/track/t-datascience

Перейти на официальный сайт →

Уровень подготовки: программа для подготовленных специалистов.

В процессе деятельности любая компания накапливает большое количество данных из разных источников. Грамотный анализ этой информации, выведение скрытых закономерностей приводят к неожиданным открытиям, которые повышают конкурентоспособность компании и могут сделать ее лидером рынка.
Для этого компаниям и нужен data scientist. Это уникальный специалист, обладающий знаниями сразу в нескольких областях: математика и статистика, программирование, машинное обучение, работа с базами данных, визуализация. Data scientist не просто извлекает и анализирует данные с помощью самых современных методов и технологий – он строит математические модели, делает прогнозы, а затем находит их подтверждение или опровержение с помощью цифр. Нужным сочетанием компетенций сегодня обладают единицы, что делает data scientist невероятно ценным сотрудником на рынке труда.

Пройдя дипломную программу, вы научитесь:

  • применять на практике знания по математической статистике, необходимые для статистического анализа;
  • превращать разнородные данные в стройные отчеты, понятные диаграммы и графики;
  • пользоваться современными базами данных, использовать язык запросов SQL для анализа данных и построения отчетов;
  • проводить анализ и визуализацию данных с помощью языка статистической обработки данных R;
  • применять технологии Big Data и машинного обучения для анализа;
  • масштабировать аналитические решения (облако, вычислительный кластер) в корпоративной среде.

В дипломную программу «Data Science: профессиональная обработка и анализ данных» входят курсы:

  1. Основы работы с большими данными (Data Science) (тестирование по курсу)
  2. Введение в статистику
  3. Microsoft Excel 2019/2016. Уровень 3. Анализ и визуализация данных (тестирование по курсу)
  4. Анализ данных на языке SQL
  5. Программирование на языке R. Уровень 1. Базовые знания (тестирование по курсу)
  6. Программирование на языке Python. Уровень 1. Базовый курс (тестирование по курсу)
  7. Data Science. Уровень1. Инструменты и технологии
  8. Data Science. Уровень 2. Применение машинного обучения
  9. Итоговая аттестация (дипломные программы)

После успешной итоговой аттестации слушателям выдается престижный диплом с указанием профессии – «Специалист по Data Science, машинному обучению и искусственному интеллекту».

Подробнее о курсе Data Science →

Курс «Data Scientist от Школа анализа данных»

Бесплатно

Ссылка на сайт: https://academy.yandex.ru/dataschool/course/data-science

Перейти на официальный сайт →

Решение задач по сбору и анализу данных, возникающих в большинстве современных сервисов: от Алисы до Яндекс.Погоды.

Для кого
Для тех, кто хочет ставить задачи с помощью анализа данных, предлагать решения и оценивать их эффективность не только в синтетическом эксперименте, но и в реальных условиях.

Чему мы учим
Статистике, машинному обучению и работе с разными типами данных.

Где применять эти знания
Данные лежат в основе большинства современных сервисов и продуктов: от приложений по предсказанию погоды до беспилотных автомобилей. Data Scientist проводит эксперименты, строит метрики, умеет оптимизировать работу сервисов и понимает, где находятся их точки роста.

Программа:

В течение семестра каждый учащийся должен успешно пройти как минимум три курса. Например, если в основной программе их два, то необходимо выбрать какой-нибудь из спецкурсов.
Знания проверяются в первую очередь с помощью домашних заданий — экзамены и контрольные проводятся только по некоторым предметам.

Первый семестр

  • Алгоритмы и структуры данных, часть 1
  • Язык Python
  • Машинное обучение, часть 1

Второй семестр

  • Основы статистики в машинном обучении
  • Машинное обучение, часть 2

Третий семестр

  • Автоматическая обработка текстов
  • Компьютерное зрение

Четвёртый семестр

  • Глубинное обучение
  • Обучение с подкреплением
  • Self Driving Cars.

Подробнее о курсе Data Science →

Курс «Специалист по Data Science от Школа анализа данных»

Цена: 112 000 ₽

Ссылка на сайт: https://practicum.yandex.ru/data-scientist/

Поможем обрести новую профессию с нуля за 8 месяцев.

  • Можно заниматься онлайн из любой точки мира
  • Python и его библиотеки, Jupyter Notebook и SQL
  • 75% курса — практика
  • После обучения помогаем трудоустроиться
  • 16 проектов в портфолио: исследования и задачи для бизнеса
  • Команда сопровождения поддержит вас в обучении.

Перейти на официальный сайт →

Что вы будете делать, когда станете специалистом по Data Science

  • Анализировать большие объёмы данных.
  • Применять машинное обучение, чтобы предсказывать события, прогнозировать значения и искать неочевидные закономерности в данных.
  • Помогать создавать и улучшать продукты в бизнесе, промышленности и науке.

Программа курса:

  1. Основы Python и анализа данных: бесплатный вводный курс
  2. Введение в профессию «Специалист по Data Science»
  3. Базовый Python
  4. Предобработка данных
  5. Исследовательский анализ данных
  6. Статистический анализ данных
  7. Теория вероятностей. Дополнительный курс
  8. Итоговый проект первого модуля
  9. Каникулы
  10. Введение в машинное обучение
  11. Обучение с учителем
  12. Машинное обучение в бизнесе
  13. Итоговый проект второго модуля
  14. Линейная алгебра
  15. Численные методы
  16. Временные ряды
  17. Машинное обучение для текстов
  18. Каникулы
  19. Базовый SQL
  20. Компьютерное зрение
  21. Обучение без учителя
  22. Каникулы
  23. Выпускной проект.

Что вы получите в Практикуме

  • Диплом о повышении квалификации
  • Портфолио из 13 учебных и реальных проектов, сделанных во время обучения
  • Выпускники Практикума создают совместные проекты, нанимают студентов, проводят мастер-классы и помогают друг другу во время и после обучения.
  • Навыки: python и основные библиотеки, SQL, Tableau, решение бизнес-кейсов, умение учиться и взаимодействовать с командой, задавать вопросы и работать с ошибками.

Отзывы о курсе:

Владислав Ивченко
Студент пятнадцатого потока на программе «Специалист по Data Science»
«
Недолго я искал себе школу для получения образования. При первом взгляде на бесплатную часть программы понял, что мне это подходит. Тренажер очень удобный, материал подается с юмором и в понятной форме. Пройдя бесплатную часть я уже начал испытывать ломку без новых знаний и перешел на платный курс.
Спустя полгода обучения хочу сказать, что я не только узнал много нового и интересного, я научился на практике строить прогнозы и обучать модели. Впереди еще финальные испытания и я чувствую силы в себе закончить курс и найти себе работу по специальности 🙂
Спасибо преподавателям и кураторам за то, что сделали процесс обучения мега френдли.»

Екатерина Щиголь
Студентка тринадцатого потока на программе «Специалист по Data Science»
«
Всем привет! Сейчас я учусь на первом курсе технического университета. Про Яндекс.Практикум я услышала ещё летом между 10 и 11 классом, но решила попробовать пройти бесплатный модуль курса «Специалист по Data Scienсe» только весной в 11 классе. Честно говоря, у меня очень много положительных эмоций. Сам курс в тренажёре проработан до мелочей, выглядит очень красиво, очень понятный интерфейс. Отдельную благодарность хочу выразить техподдержке. Я обращалась туда раза 4 по различным вопросам: тренажёр подвис (что бывает кстати очень редко) или вообще по поводу выполнения какого-то задания из тренажёра – они отвечают минут за 10-15, причём общаются очень вежливо и любезно, не важно какой курс вы проходите, бесплатный или платный. Потом через некоторое время я посоветовалась с семьёй и мы решили купить полный курс. Могу заявить со всей ответственностью, что я ни грамма не пожалела. В платной версии в каждом спринте предусмотрены проекты на закрепление пройденного материала. Их отправляют на проверку ревьюерам. Кстати могу сказать, что они очень милые и любезные ребята. Причём, что очень важно, проверяют они проект очень тщательно. Часто пишут какое-то рекомендации, даже не совсем относящиеся к теме, по поводу ещё лучшего и качественного оформления проекта или выполнения какого-либо задания.»

Подробнее о курсе Data Science →

Курс «Data Science от SF Education»

Цена: 37 500 ₽

Ссылка на сайт: https://sf.education/ds

Сделаем из вас профессионала в области анализа данных и машинного обучения.

Перейти на официальный сайт →

Чему Вы научитесь:

  • Работе с данными
    Вы освоите полный цикл работы с данными для решения прикладных задач: выгрузку, обработку, анализ и интерпретацию результатов.
  • Программированию
    С помощью языка Python вы сможете самостоятельно обрабатывать и анализировать данные для решения прикладных задач и получать наглядные результаты в текстовом или графическом виде.
  • Математическим расчётам
    Вы получите фундаментальные знания в области линейной алгебры, теории вероятностей, статистики, математического анализа и методов оптимизации. Научим всему, что нужно для эффективного анализа данных.
  • Методам машинного обучения
    Расскажем, что такое машинное обучение и какие типы задач можно решать с его помощью. Покажем, какие ошибки присущи каждому типу задач, и научим их избегать.

Программа курса:

4 модуля за 7 месяцев

  1. Анализ данных с помощью Python
  • Синтаксис Python: типы данных, операции, функции, циклы и списки
  • Чтение, запись и изменение данных из файлов
  • Базовые библиотеки для работы с данными и машинного обучения
  • Вывод результатов анализа в текстовом и графическом виде
  1. Общая математика
  • Вектор (определение, нулевой вектор, коллинеарность, длина)
  • Сложение, вычитание и умножение векторов
  • Координаты векторов (сложение, вычитание, умножение)
  • Единичные вектора
  • Линейная комбинация и линейное преобразование векторов, скалярное произведение
  • Матрица
  • Операции над матрицами
  • Транспонирование матрицы
  • Ранг и определитель матрицы
  • Метод Гаусса
  • Генеральная совокупность. Выборка
  • Типы данных
  • Среднее арифметическое / Мода / Медиана
  • Дисперсия / Стандартное отклонение / Коэффициент вариаций
  • Нормальное распределение
  • Центральная предельная теорема
  • t-критерий Стьюдента (p-value)
  • Z-статистика
  • Квартили
  • Доверительный интервал
  • Мера различий (Нулевая гипотеза)
  • А/B тесты
  • Ковариация
  • Корреляция
  • Практическая работа №3: “Линейная алгебра + математическая статистика”
  • Финальный тест
  1. Data Science
  • Практическое применение машинного обучения
  • Типы задач, алгоритмы и методы их решения
  • Способы машинного обучения: обучение с учителем
  • Способы машинного обучения: обучение без учителя
  1. Решение проблем при работе с данными
  • Борьба с переобучением и недообучением
  • Оценка качества алгоритма и метрики качества
  • Несбалансированные выборки и отбор признаков
  • Визуализация и интерпретация данных.

Информация о преподавателях доступна на сайте.

Отзывы:

Анна Николаева
«Курс очень насыщенный и интересный! Помог приобрести навыки программирования и заполнил некоторые пробелы в знаниях по финансам! Все преподаватели объясняют очень доходчиво очень сложные темы. И главное-то, что бесценно в курсах SF, это куча практических примеров. После закрепления полученных знаний безусловно буду пробовать найти новую работу, где можно было бы эти знания применять! Так как все это ооочень востребовано сейчас на рынке!
Спасибо вам огромное! Вы лучшие ❤»

Андрей Титов
«Этот курс сочетает в себе всё то, что необходимо в современном мире финансов: минимум теории и максимум практики, которую можно применить в жизни. Качество материала на высшем уровне, всё структурировано, четко, интересно. Огромный плюс, что все материалы остаются в доступе, в любой момент можно повторить, освежить, особенно радует поддержка после курса. Думаю, еще не раз придется обратиться за советом к гуру финансов.
Большое спасибо всем, кто читали курс! The Best!»

Подробнее о курсе Data Science →

Курс «Data Science с нуля от Skillbox Программирование»

Бесплатно

Ссылка на сайт: https://www.youtube.com/playlist?list=PLmEQTfkM_pfkVyU8BGamAPSdYYYe1e6PZ

Перейти на официальный сайт →

Видеоуроки:

  1. Как стать Python-программистом с нуля
  2. Чем занимаются на обучении Data Science
  3. Data Science с нуля. Обучение ML-модели
  4. Data Science с нуля. Подведение итогов
  5. Курс программирования Python. Изучаем основы
  6. Курс программирования на Python. Основы
  7. Онлайн-курс Python. Работа с сетью
  8. Как после курсов программирования устроиться в Facebook
  9. Обучение по Data Science. Ревью работ и подведение итогов
  10. Как стать программистом. Финал онлайн-конференции «Найди себя в Digital»
  11. Программирование на Python. Интенсив по Data Science
  12. Обучение по аналитике данных. Интенсив по Data Science
  13. Обучение программированию на Python: экспресс-введение. Интенсив
  14. Обучение программированию на Python: пишем модель машинного обучения. Интенсив
  15. Обучение программированию на Python: как оценить качество модели. Интенсив
  16. Обучение программированию на Python: аналитика данных. Интенсив
  17. Обучение программированию на Python: исследуем данные. Интенсив
  18. Интенсив от Skillbox: знакомимся с Data Science и разбираемся в основах моделей машинного обучения
  19. Знакомимся с Python и Data Science
  20. Обучение программированию на Python: разбор кейсов. Интенсив
  21. Обучение программированию на Python: техники исследования данных. Интенсив
  22. Обучение аналитике данных на Python. Знакомимся с языком. Интенсив
  23. Обучение аналитике данных на Python: техники исследования. Интенсив
  24. Аналитика в Data Science с помощью Python. Интенсив по программированию
  25. Анализ данных в Data Science. Интенсив по программированию
  26. Аналитика в Data Scientist. Интенсив по программированию
  27. Обучение машинной модели. Интенсив по Data Science.
  28. Оценка качества модели. Интенсив по Data Science
  29. Алгоритмы в Data-анализе. Интенсив по Data Science
  30. Создаем первую модель машинного обучения. Интенсив по машинному обучению
  31. Исследование данных. Интенсив по Data Science
  32. Обзор кейсов Data Science. Интенсив по Data Science
  33. Как заработать на Data Science. Интенсив по анализу данных
  34. Модель данных на Python. Интенсив по анализу данных
  35. Чем занимается Data Scientist. Интенсив по анализу данных.
  36. Как сделать машинное обучение. Интенсив по Data Science
  37. Как использовать аналитические функции SQL. Интенсив для аналитиков
  38. Что такое Data Science. Интенсив для разработчиков
  39. Как построить модель данных. Интенсив для новичков в программировании
  40. С чего начать обучение Data Science. Интенсив для новичков в программировании
  41. Зачем нужно машинное обучение? Интенсив по аналитике данных на Python
  42. Как анализировать данные? Интенсив по Data Science
  43. Как управлять данными с помощью статистических методов. Интенсив по Python
  44. Частые ошибки начинающих Data-аналитиков. Интенсив по аналитике
  45. Инструменты и методы анализа данных в Data Science. Интенсив по аналитике
  46. Машинное обучение в Data Science. Марафон по Data Science
  47. Основы Data Science. Марафон по Data Science
  48. Data Science для «чайников». Марафон по Data Science
  49. Python в Data Science. Интенсив по программированию
  50. Статистические методы Python в Data Science. Интенсив по программированию
  51. Как стать Data Scientist. Марафон по программированию
  52. Анализ данных в Data Science: подводим итоги
  53. Что такое Data Science. Интенсив по программированию
  54. Частые ошибки в анализе данных. Интенсив по аналитике
  55. Как стать Data Scientist? Марафон по IT-профессиям
  56. Как работать в Google Colab? Интенсив по Data Science
  57. Как провести обучение модели машинного обучения? Интенсив по Data Science
  58. Как использовать алгоритмы градиентного спуска? Интенсив по Data Science
  59. Python в Data Science. Интенсив по программированию
  60. Ошибки новичков в Data Science. Интенсив по программированию
  61. Используем статистические методы Python для работы с данными. Интенсив по программированию
  62. Как провести машинное обучение? Марафон для программистов
  63. Как стать Data Scientist? Марафон по профессиям
  64. Как построить модель данных? Интенсив по Data Science
  65. Зачем нужно машинное обучение? Интенсив по Data Science
  66. Как связаны машинное обучение и искусственный интеллект? Марафон по Data Science
  67. Статистические методы Python в Data Science. Интенсив по программированию
  68. Python в Data Science. Интенсив по программированию
  69. Как стать Data Scientist. Марафон по программированию
  70. Ошибки новичков в data science. Интенсив по программированию
  71. Ошибки новичков в Data Science. Интенсив по Data Science
  72. Data Science с чего начать? Интенсив по Data Science
  73. Статические методы Python. Интенсив по Data Science
  74. Как стать Data Scientist? Марафон по программированию
  75. Data Science с чего начать? Интенсив по Data Science
  76. Статические методы Python. Интенсив по Data Science
  77. Ошибки новичков в Data Science. Интенсив по Data Science
  78. Машинное обучение Python для начинающих. Интенсив по машинному обучению с нуля
  79. Машинное обучение и анализ данных. Интенсив по машинному обучению с нуля
  80. Алгоритмы градиентного спуска. Интенсив по машинному обучению с нуля.

Подробнее о курсе Data Science →

Курс «Data Scientist от ProductStar»

Цена: 64 896 ₽

Ссылка на сайт: https://productstar.ru/analytics-datascience-course

Освойте ключевые технологии, научитесь работать с большими данными, расширьте знания в аналитике и перейдите на новый уровень в профессии

  • Длительность – 6 месяцев
  • Онлайн в удобное время
  • Обучение на практике
  • Доступ к курсу навсегда.

Перейти на официальный сайт →

Чему вы научитесь:

  • Работать SQL
    Научитесь писать запросы, работать с данными в базе без переноса в таблицы, загружать данные и сохранять историю, работать с разными форматами файлов
  • Использовать Python и библиотеки анализа данных
    Автоматизировать работу с большими массивами, получать данные из внешних источников, обосновывать выводы, сделанные на основании данных
  • Строить модели машинного обучения
    Подготавливать данные и быстро строить на них ML-модели. Проверять гипотезы, строить рекомендательную систему и нейронную сеть, выявлять скрытые аномалии в данных
  • Использовать сложную математику для Data Science
    Освоите необходимый математический аппарат для продуктивной работы с моделями данных, машинным обучением и нейронными сетями.

Программа курса:

60 лекций и воркшопов

Блок 1: “Получение и подготовка данных: SQL”

  • Введение в блок SQL
  • Извлечение и фильтрация данных
  • Преобразование и сортировка данных
  • Группировка данных
  • Введение в базы данных
  • Объединение таблиц
  • Вложенные запросы
  • Обновление, добавление и удаление данных
  • Создание, изменение и удаление таблиц
  • Advanced
  • Обзор основных программ

Блок 2: “Python для анализа данных”

  • Введение в Python
  • Типы данных, функции, классы, ошибки
  • Строки, условия, циклы
  • Списки и словари в Python
  • Пакеты, файлы, Pandas – начало
  • Pandas: продолжение
  • Визуализация данных
  • Базы данных и статистика
  • Многопоточность
  • Веб-сервер flask и контроль версий GIt
  • Итоговый проект

Блок 3: “Построение Machine Learning моделей”

  • Знакомство с машинным обучением
  • Линейная регрессия
  • Бинарная классификация
  • Построение надежных стратегий валидации – важность локальной валидации
  • Решающие деревья
  • Бутстрап, Бэггинг и случайный лес
  • Feature Engineering, Feature SelectionГрадиентный бустинг
  • Воркшоп: предсказание оттока и прогноз продаж
  • А/B тестирование
  • Обучение без учителя
  • Воркшоп: скоринг кредитного портфеля

Блок 4: “Нейронные сети и NLP”

  • Введение в нейронные сети
  • Обучение нейросетей
  • Глубокое обучение на практике
  • Дополнительные возможности Tensorflow + Keras
  • Свёрточные нейронные сети
  • Введение в NLP, понятие ембеддинга
  • Рекурентные нейронные сети
  • Нейросети с вниманием, трансформеры
  • Metric learning, обучение без учителя
  • Обучение с подкреплением в нейросетях
  • Итоговый проект

Блок 5: “Рекомендательные системы”

  • Введение
  • Метрики и бейзлайны
  • Матричное разложение
  • Рекомендации через поиск ближайших соседей
  • Гибридные рекомендательные системы
  • Итоговый проект

Блок 6: Дипломная работа и помощь с трудоустройством

  • Работа над дипломным проектом для портфолио
  • Подготовка резюме
  • Подготовка к собеседованию
  • Финальная защита и консультации.

Цифровой сертификат
Выпускники получают сертификат об успешном прохождении курса — что, вместе с дипломным проектом, будет хорошим аргументом при трудоустройстве.

Спикеры курса:

  • Денис Соболев
    Skyeng
  • Илья Чухляев
    OWOX
  • Чайзат Ховалыг
    Точка банк
  • Анна Морозова
    Яндекс
  • Андрей Менде
    Product Owner, Booking.com
    Основатель тренажера ProductDo
  • Василий Сабиров
    Devtodev
  • Михаил Карпов
    ex-Skyeng, VK/Яндекс
  • Николай Башлыков
    Wheely.

Подробнее о курсе Data Science →

Курс «Машинное обучение и анализ данных от ООО “ФРОО”»

Цена: нет информации

Ссылка на сайт: https://datasciencecourse.ru/

Перейти на официальный сайт →

Для кого эта специализация:

  • Для выпускников и студентов
    инженерных, технических и естественно-научных факультетов, которые не изучали анализ данных, но хотят получить востребованную специальность и хорошо зарабатывать.
  • Для профессиональных аналитиков
    которые хотят решать новые, более сложные задачи или оптимизировать существующие.
  • Для директоров компаний
    которые понимают важность анализа данных и хотят обучить сотрудников, чтобы повысить их эффективность.

Программа подходит людям, незнакомым с анализом данных. Серия курсов постепенно, от простого к сложному, погружает в предмет. В первом курсе рассказывается о математическом аппарате и основах программирования на Python.
Вам будет намного легче учиться, если вы уже знакомы с математической статистикой (программа алгебры старших классов — теория вероятности, линейные уравнения), а также с синтаксисом языка Python.

В финальном проекте вы сможете применить полученные знания к реальным данным в электронной коммерции, социальных медиа, информационном поиске, бизнес-аналитике. Вы пройдете все этапы анализа данных — от подготовки до построения финальной модели и оценки её качества. В результате в портфолио появится проект, который смело можно указать в резюме и показать работодателю на собеседовании.

Лекторы:

  • Константин Воронцов
    Доктор физико-математических наук, профессор РАН, заведующий отделом Интеллектуальных систем ФИЦ ИУ РАН, преподаватель ШАД.
  • Вадим Стрижов
    Доктор физико-математических наук, доцент МФТИ, ведущий научный сотрудник ФИЦ ИУ РАН.
  • Евгений Рябенко
    Research scientist в Был аналитиком в Yandex Data Factory.
  • Евгений Соколов
    Руководит разработкой системы рекомендаций в Яндекс.Дзене.
  • Виктор Кантор
    Эксперт по машинному обучению, консультант Яндекс.Такси.
  • Эмели Драль
    Chief Data Scientist в Mechanica AI. Раньше руководила анализом больших данных в Yandex Data Factory.

Программа обучения:

1 КУРС «МАТЕМАТИКА И PYTHON ДЛЯ АНАЛИЗА ДАННЫХ»
Анализ данных и машинное обучение опираются на результаты из математического анализа, линейной алгебры и теории вероятностей. Без фундаментальных знаний по этим наукам невозможно понять методы анализа данных.
Первый курс сформирует этот фундамент. Мы без сложных формул и доказательств раскроем смысл математических понятий и объектов.

  • Введение.
  • Библиотека Python и линейная алгебра.
  • Оптимизация и матричные разложения.
  • Случайность

2 КУРС «ОБУЧЕНИЕ НА РАЗМЕЧЕННЫХ ДАННЫХ»
Обучение на размеченных данных или обучение с учителем — это возможность предсказать величину для любого объекта, имея конечное число примеров. Например, уровень пробок на участке дороги, возраст пользователя по его действиям в интернете, цену на подержанную машину. На этом курсе вы научитесь формулировать и решать такие задачи.

  • Машинное обучение и линейные модели.
  • Линейные модели и оценка качества.
  • Решающие деревья и композиции моделей.
  • Нейронные сети и обзор методов.

3 КУРС «ПОИСК СТРУКТУРЫ В ДАННЫХ»
Из курса вы узнаете об алгоритмах кластеризации данных, с помощью которых можно искать группы схожих клиентов мобильного оператора. Вы научитесь строить матричные разложения и решать задачу тематического моделирования, понижать размерность данных, искать аномалии и визуализировать многомерные данные.

  • Методы кластеризации.
  • Понижение размерности и матричные разложения.
  • Визуализация данных и поиск аномалий.
  • Тематическое моделирование.

4 КУРС «ПОСТРОЕНИЕ ВЫВОДОВ ПО ДАННЫМ»
Влияет ли знание методов анализа данных на уровень заработной платы? Работает ли система оценки кредитоспособности клиентов банка? Действительно ли новый баннер лучше старого? Чтобы ответить на такие вопросы, нужно собрать данные. 99% данных содержат “шум”, поэтому выводы на их основе не верны, а только вероятны. На этом курсе вы научитесь строить корректные выводы, оценивать параметры, проверять гипотезы и устанавливать причинно-следственные связи.

  • Основы статистики и проверка гипотез.
  • АБ-тесты: основы планирования, дизайн и интерпретация результатов.
  • Анализ зависимостей.
  • Скоринг, биоинформатика.

5 КУРС «ПРИКЛАДНЫЕ ЗАДАЧИ АНАЛИЗА ДАННЫХ»
В этом курсе мы разберем прикладные задачи из различных областей анализа данных: анализ текста и информационный поиск, коллаборативная фильтрация и рекомендательные системы, бизнес-аналитика, прогнозирование временных рядов.
Вы научитесь сводить задачу заказчика к формальной постановке задачи машинного обучения и поймёте, как проверять качество построенной модели на исторических данных и в онлайн-эксперименте. На каждой задаче мы изучим плюсы и минусы пройденных алгоритмов машинного обучения.

  • Бизнес-задачи.
  • Анализ медиа.
  • Анализ текстов.
  • Рекомендации и ранжирование.

ФИНАЛЬНЫЙ КУРС «АНАЛИЗ ДАННЫХ: ФИНАЛЬНЫЙ ПРОЕКТ»
Финальный проект даст вам возможность проверить свои силы и применить полученные в рамках специализации знания к задаче из реального мира. Вы самостоятельно сможете поработать над актуальным проектом в одной из областей: электронная коммерция, социальные медиа, информационный поиск и бизнес-аналитика.
Проекты:

  • ИДЕНТИФИКАЦИЯ ИНТЕРНЕТ-ПОЛЬЗОВАТЕЛЕЙ
  • ПРОГНОЗИРОВАНИЕ ОТТОКА КЛИЕНТОВ
  • ПРОГНОЗИРОВАНИЕ ВРЕМЕННЫХ РЯДОВ НА КАРТЕ
  • АНАЛИЗ ТОНАЛЬНОСТИ ОТЗЫВОВ.

Отзывы студентов доступны на сайте.

Подробнее о курсе Data Science →

Курс «Data Science от Бруноям »

Цена: 29 900 ₽

Ссылка на сайт: https://brunoyam.com/kursy-analitika-dannyh/data-science

Практический курс по Data Science: от основ Python, NumPy, SciPy, pandas до работы с нейронными сетями.
Научим структурировать и анализировать большой объём данных, прогнозировать события и находить неочевидные закономерности с помощью машинного обучения, составлять выводы и тестировать гипотезы.
Цель курса – профессия Junior Data Scientist.

Перейти на официальный сайт →

Data Science — это работа с большим объёмом информации, которая требуется почти во всех сферах. По данным HeadHunter количество вакансий Data Scientist выросло в 7 раз за последние 2 года.
Наши преподаватели – действующие специалисты по Data Science / Data Analysis. Они совмещают основную работу и преподавание. В процессе обучения они делятся собственным опытом и только актуальной информацией в сфере Data Science.
Группы 5-10 человек позволяют работать над проектами в команде, а преподавателю – уделять внимание каждому ученику.

Для кого этот курс:

  • Новичкам в Data Science
    С нуля получите все знания и навыки, которые необходимы для работы Junior Data Scientist
  • Аналитикам
    Вы научитесь извлекать максимум из больших массивов данных для быстрой проверки гипотез и построения прогнозов.

Вы научитесь:

  • Основам Python-программирования
  • Построению моделей машинного обучения
  • Работать с библиотекой NumPy
  • Работать с библиотекой pandas
  • Визуализировать данных с помощью matplotlib
  • Работать с базами данных и SQL
  • Использовать математику для обработки данных
  • Работать с нейронными сетями
  • Использовать machine learning в работе
  • Проводить A/B-тестирования.

Преподаватели курса
Действующие специалисты Москвы и Санкт-Петербурга.

  • Дмитрий Сафонов
    Data Scientist в компании Quantum Brains. Kaggle expert. Выпускник прикладной математики СПБГЭУ (с отличием). Более 3х лет занимается коммерческой разработкой на Python.

Программа курса:

  1. Основы Python
  • Основы Python. Настройка IDE. Базовый синтаксис
  • Базовые типы данных и циклы
  • Функции и классы
  • Продвинутые типы данных: массивы, множества, словари
  • Python для анализа данных: numpy и scipy
  • Python для анализа данных: pandas
  • Лабораторная работа по Python
  • Основы линейной алгебры и теории множеств и их реализация в Python
  • Методы математической оптимизации и их реализация в Python
  • Основы описательной статистики и их реализация в Python
  • Статистический анализ данных и их реализация в Python.
  1. Библиотеки для анализа данных
  • Библиотека NumPy: методы анализа массивов
  • Библиотека NumPy: способы преобразования массивов
  • Библиотека pandas: индексация и выбор данных
  • Библиотека pandas: применение функций, группировка, сортировка
  • Визуализация данных с помощью matplotlib.
  1. База данных и SQL
  • Введение в базы данных: необходимость, принципы работы
  • Основы работы с базами данных на декларативном языке SQL
  • Альтернативные виды баз данных и их различия
  • Современные возможности баз данных
  • Принципы работы с разными конкретными БД
  • Основные библиотеки для подключения к БД из Python.
  1. Математическая статистика и теория вероятностей
  • Математика для Data Science
  • Дискретные и непрерывные случайные величины
  • Центральные предельные теоремы и закон больших чисел
  • Производная. Векторы. Матрицы
  • Случайные события. Условная вероятность. Формула Байеса. Независимые испытания
  • Дискретные случайные величины. Закон распределения вероятностей. Биномиальный закон распределения. Распределение Пуассона
  • Описательная статистика. Качественные и количественные характеристики популяции
  • Графическое представление данных
  • Непрерывные случайные величины. Функция распределения и плотность распределения вероятностей. Равномерное и нормальное распределение. Центральная предельная теорема
  • Проверка статистических гипотез.
  • Доверительные интервалы.
  • Взаимосвязь величин. Параметрические и непараметрические показатели корреляции Корреляционный анализ
  • Многомерный статистический анализ. Линейная регрессия
  • Дисперсионный анализ. Логистическая регрессия.
  1. Основные модели Machine Learning
  • Задача обучения с учителем. Постановка задачи классификации и регрессии
  • Линейная регрессия для задач классификации и регрессии
  • Оценка качества модели для задач классификации и регрессии
  • Проблема переобучения. Регуляризация. Отбор признаков
  • Другие модели классификации: логистическая регрессия, наивный байесовский классификатор, деревья решений
  • Бустинг и стекинг.
  1. Работа с неразмеченными данными
  • Задача обучения без учителя
  • Задача кластеризации. Модели k-means, DBSCAN
  • Задача понижения размерности. Метод главных компонент.
  1. Работа с разными типами данных
  • Обработка временных рядов, особенности работы
  • Обработка изображений, особенности работы
  • Обработка текстов, особенности работы.
  1. Нейронные сети
  • Сверточные нейронные сети
  • Рекурентные нейронные сети и LSTM
  • Генеративные нейронные сети GAN.
  1. Хорошие практики Data Science
  • Проблема воспроизводимости вычислений
  • Инструменты построения конвейеров данных
  • Как презентовать проведенное исследование.

Подробнее о курсе Data Science →

Курс «Data Science от DataWorkshop »

Цена: 298 евро – 850 евро

Ссылка на сайт: https://dataworkshop.ru/kurs/data-science

  • Обучение на примерах, без сложных и запутанных (математических) деталей.
  • Узнай за 4 недели, как реализовать ML решение от начала до конца.

Перейти на официальный сайт →

Для кого подойдет онлайн-курс:

  • Для желающих войти в IT
    Все, кому интересна тема машинного обучения (даже если нет опыта в IT)
  • Для программистов
    Кто нуждается в новых задачах, хочет сменить направление развития, найти лучшую работу и добиться новых успехов в IT.
  • Для BI
    Кто хочет решать новые, более сложные проблемы или оптимизировать существующие. Больше, чем просто работа в Excel.
  • Для менеджеров и директоров
    Которые хотят эффективно управлять командой, понимая возможности и проблемы машинного обучения.

Твой наставник:

Владимир Алексейченко
Создатель авторских курсов по машинному обучению / CEO DataWorkshop.

Программа онлайн-курса:

Модуль 1: Основы машинного обучения
Выучишь:

  • признаки, целевую переменную, объекты
  • разработку функций, выбор функций, выбор модели
  • поработаешь с регрессией на практике
  • первое знакомство с поиском признаков
  • первое знакомство с кривой обучения

Модуль 2: Погружение в машинное обучение
Выучишь:

  • познакомишься с библиотекой sklearn и с работой алгоритмов, такими как деревья решений (анг. decision trees), случайный лес (анг. random forest) и другие
  • поймешь почему так важна правильная проверка модели, например, перекрестная проверка (cross-validation) или другие
  • почему визуализация – Твой друг и Ты узнаешь простые советы, как это сделать

Модуль 3: Gradient Boosting
Выучишь:

  • Познакомишься с семьей алгоритмов (Gradient) Boosting
  • Ознакомишься с некоторыми из лучших реализаций: CatBoost, XGBoost, LightGBM
  • Поработаешь с оптимизацией гиперпараметров прагматичным образом

Модуль 4: Feature Engineering
Выучишь:

  • методы инженерии признаков
    … для непрерывных значений
    … для категориальных значений
    … для данных и прочего.

Истории выпускников:

Bartłomiej Zduńczyk
Business Intelligence w Ryanair

«Очень практичный курс, основанный на действительно полезных алгоритмах, используемых в бизнесе. Хотя я уже участвовал в других очень хороших онлайн-курсах ML/AI, где я изучил много теории, только здесь я построил модели целиком «от начала до конца» и получил уверенность в том, что действительно могу это сделать. Использование лучших алгоритмов, используемых в бизнесе, множество практических задач из различных областей, вся среда, настроенная и доступная в Интернете, сообщество в Slack и, прежде всего, потрясающая активность преподавателя на протяжении всего курса (вебинары, дополнительные объяснения, реакции на проблемы, индивидуальная помощь) – все это делает этот курс абсолютно уникальным и очень эффективным. Искренне рекомендую!»

Radosław Cichocki
Team Leader w Deviniti

«Я получил солидную часть знаний, и мое представление о том, как ML выглядит на практике, подтвердилось. Я узнал, насколько важна разработка функций, как выглядит правильный конвейер и как проверять гипотезы, которые мы тестируем. Консультации под руководством Владимира были для меня чрезвычайно важны, так как я смог добиться прогресса в решении проблемы, с которой столкнулся профессионально. Курс дал мне не только знания, но и опыт работы с реальными проблемами, а также возможность изучить основы конкретного образа мышления, который должен характеризовать специалиста по данным. Я рекомендую этот курс особенно людям, которые уже знают, как программировать, и которые хотят от своей профессиональной работы чего-то большего, чем создание новых CRUD или исправление ошибок, и в то же время любят анализировать зависимости в данных и имеют определенную научную предвзятость.»

Подробнее о курсе Data Science →

Курс «Big Data Science от Сетевая Академия “ЛАНИТ”»

Цена: разная стоимость

Ссылка на сайт: https://academy.ru/catalog/big-data-science/

Перейти на официальный сайт →

Data Scientist — это специалист в области исследовании данных, который разбирается в статистике лучше, чем любой инженер-программист и намного лучше в программировании, чем любой статистик.

В рамках данной специализации мы предлагаем:

  • курсы по изучению R-языка программирования для статистической обработки данных и работы с графикой;
  • курсы для администраторов и пользователей платформы Hadoop;
  • курсы по методам Data Mining;
  • курсы по аналитике больших данных для менеджеров.

Специализация Big Data Science позволяет получить и расширить необходимые навыки для работы в области аналитики больших данных как для специалистов, имеющих опыт, так и для начинающих. Специализация Big Data Science предполагает наличие у слушателей знания статистических методов и инструментария аналитики, умение работать с большими структурированными и не структурированными данными и обладание практическими навыками использования компонент экосистемы Hadoop.
Каждый курс Big Data предусматривает практические лабораторные работы на локальных системах и удаленном кластере Hadoop.

Курсы:

Big Data для руководителей и архитекторов

  • Аналитика Больших Данных для Руководителей
  • Архитектура Данных.

Apache Hadoop для инженеров данных и администраторов кластера

  • Безопасность озера данных Hadoop на платформе CDP
  • Использование Apache Zeppelin
  • Администрирование кластера Hadoop
  • Hadoop для инженеров данных
  • Основы Hadoop.

Apache Kafka

  • Apache Kafka для разработчиков
  • Администрирование кластера Kafka.

Apache Spark

  • Потоковая обработка в Apache Spark
  • Анализ данных с APACHE SPARK STREAMING, SPARK SQL, MLLIB И GRAPHX
  • Основы Apache Spark для разработчиков
  • Машинное обучение в Apache Spark
  • Графовые алгоритмы в Apache Spark.

Курсы администрирования и разработки NoSQL и SQL-on-Hadoop

  • Администрирование кластера HBase
  • Интеграция Hadoop и NoSQL
  • Greenplum для инженеров данных
  • Hadoop SQL Hive администратор
  • Cloudera Impala Data Analytics.

Курсы разработчиков Data Flow и обучение дата-инженеров

  • Практический курс Data Pipeline на Apache Airflow и Apache Hadoop
  • Apache NiFi для инженеров данных
  • Кластер Apache NiFi.

Big Data Scienсe и Machine Learning

  • Введение в машинное обучение на Python
  • Нейронные сети на Python
  • Графовые алгоритмы. Бизнес-приложения.
  • Разработка и внедрение ML-решений.
  • Визуализация данных на языке Python
  • Подготовка данных для Data Mining на Python
  • NLP – обработка естественного языка с Python
  • Computer vision на Python.

Онлайн-марафоны

  • Онлайн-марафон «Искусственный интеллект для менеджеров»
  • Онлайн-марафон «Создай свой чат-бот за 4 урока».

Microsoft Power Platform

  • Анализ данных в Power BI

Big Data и Искусственный интеллект (AI)

  • Эксперт графовых баз данных
  • Основы решений с использованием искусственного интеллекта в Azure
  • Анализ данных в Power BI

Microsoft SQL Server 2016

  • Анализ данных в Power BI

Основы технологий Microsoft

  • Основы решений с использованием искусственного интеллекта в Azure.

Подробнее о курсе Data Science →

Курс «Data Science / Machine Learning Fundamentals от ITEA»

Цена: 305 EUR

Ссылка на сайт: https://onlineitea.com/course/ds-and-ml/

Обучение Data Science/Machine Learning — это современные методы машинного обучения и практика работы с большими данными. Ты изучишь основы науки о данных и машинного обучения, научишься обрабатывать и анализировать большие данные, а также узнаешь, как работать с ключевыми концепциями сбора, подготовки и визуализации данных.

  • 7 занятий / 1 месяц

Перейти на официальный сайт →

На курсе ты научишься:

  • Разбираться в основных понятиях и задачах Data Science
  • Использовать в работе современные методы машинного обучения
  • Применять ключевые концепции сбора, подготовки, исследования и визуализации данных
  • Обрабатывать и анализировать большие данные.

Data Science / Machine Learning: обучение по этапам:

  1. Введение в Data Science и Machine Learning
  • Базовые понятия Big Data, Business Intelligence, Data Mining, Data Science, Machine Learning, Artificial Intelligence
  • История развития Data Science, современные перспективы
  • Кто такой Data Science-специалист и какими навыками он обладает. Вопросы на собеседовании
  • Обзор процесса Data Science проекта
  • Сценарии использования и применения ML в современном мире
  • Обзор успешных проектов по Big Data и Machine Learning
  1. Data Science process and frameworks
  • Планирование и подготовка работы
  • Исторический обзор методологий ведения Data Science решений
  • Детальный обзор современного Data Science процесса и его этапов
  • Команда и роли специалистов в проектах Data Science
  • Обзор популярных фреймворков и инструментов для Data Science решений
  • Workshop 1: Этап Business Understanding
  • Основы работы с системой контроля версий
  1. Предварительная обработка данных
  • Загрузка исходных данных для анализа в систему (ETL)
  • Data cleansing and transformation
  • Data Sampling and Quantization
  • Workshop 2: Подготовка данных для проекта
  • Подходы и методики для визуализации данных
  • Практика: Визуализация данных с помощью Power BI и R
  1. Прогнозирование и классификация
  • Теоретический обзор проблемы и основных методов
  • Введение в искусственные нейронные сети для решения различных задач
  • Процесс создания реальных программных моделей для прогнозирования и классификации
  • Оценка точности обученных моделей, выбор лучшей
  • Workshop 3: Создание моделей прогнозирования и классификации
  1. Кластеризация и рекомендационные алгоритмы
  • Теоретический обзор проблемы и основных методов
  • Процесс создания реальных программных моделей для кластеризации, рекомендационных алгоритмов
  • Оценка точности обученных моделей, выбор лучшей
  • Введение в обработку естественного языка
  • Workshop 4: Создание моделей кластеризации и рекомендационных моделей
  1. Имплементация моделей машинного обучения
  • Временные ряды и прогнозирование событий
  • Имплементация моделей машинного обучения для дальнейшего использования
  • Обсуждение результатов выполнения домашних заданий
  • Примеры архитектур полноценного проекта
  • Workshop 5: Имплементация моделей машинного обучения
  • Подведение итогов курса, презентация проектов
  • Рекомендуемые материалы и шаги для дальнейшего изучения.
  1. Защита курсового проекта.

После завершения курса:

  • Сертификат после окончания обучения в соответствии с успеваемостью
  • Доступ к материалам и записям занятий в течение года в личном кабинете на удобной платформе
  • Возможность присоединиться к ITEA community (более 16 000 выпускников)
  • Портфолио с проектами и работами
  • Поддержка с трудоустройством
  • Яркий опыт работы с профессиональными инструментами.

Подробнее о курсе Data Science →

Курс «Основы Data Science от Образовательный центр программирования и высоких технологий»

Цена: 3 599 BYN (110 250 ₽)

Ссылка на сайт: https://www.it-academy.by/course/osnovy-data-science/osnovy-data-science/

Курс по Data Science в Минске направлен на приобретение знаний, навыков и умений по извлечению, структурированию и использованию полезной информации из неструктурированных, а также разрозненных источников. Он охватывает основные современные средства Data Mining, Machine Learning и Big Data. Использование указанных технологий дает неоспоримое преимущество не только организациям на рынке товаров и услуг, но и людям на рынке труда.

  • Длительность 216 уч.ч (шесть месяцев)

Перейти на официальный сайт →

Для кого этот курс:

  • для разработчиков, желающих расширить свои компетенции;
  • для студентов старших курсов и выпускников технических ВУЗов, которые хотят повысить свои шансы на трудоустройство;
  • для аспирантов и соискателей научных степеней, желающих приобрести навыки решения научных и исследовательских задач с использованием современных информационных технологий;
  • для специалистов, желающих повысить свою компетенцию в области Data Mining, Big Data и Data Science.

Курс предназначен для:

  • приобретения знаний в областях Machine Learning/Data Science/Big Data;
  • формирования устойчивых навыков и умений по постановке и решению задач с использованием математической статистики и современных информационных технологий;
  • приобретения навыков для решения бизнес задач при помощи технологий глубокого обучения и нейронных сетей;
  • приобретения умений интерпретировать данные на язык бизнеса и доносить инсайты до бизнес пользователей.

Вы будете уметь:

  • осуществлять сбор, очистку и исследование исходных данных;
  • находить инсайты и зависимости в структурированных и неструктурированных данных;
  • доносить ключевые идеи с языка данных на язык бизнеса;
  • графически интерпретировать данные;
  • осуществлять постановку и решение задач машинного обучения согласно современному стандарту CRISP-DM;
  • применять основные алгоритмы машинного обучения и математического программирования;
  • пользоваться основными инструментами и фреймворками для решения задач в области Data Science;
  • разбираться в современных архитектурах нейронных сетей и применять их на практике для решения задач;
  • решать задачи Computer Vision / Natural Language Processing / Time Series;
  • применять концепции и инструменты при работе с большими объемами данных;
  • разрабатывать высококачественные рекомендательные системы;
  • определять и выяснять требования для проектов у заказчика;
  • определять качество построенных решений на реальных данных;
  • разворачивать модели в production.

Программа курса:

  1. Введение в Data Science
  2. Математические основы для Data Science
  3. Введение в машинное обучение Часть 1
  4. Введение в машинное обучение Часть 2
  5. Рекомендательные Системы
  6. Обработка естественного языка. Natural Language Processing
  7. Основы глубокого обучения. Нейронные сети
  8. Работа с большими данными
  9. Машинное зрение в задачах машинного обучения
  10. Временные ряды
  11. Подготовка моделей для интеграции
  12. Подведение итогов. Подход к реализации проектов в области Data Science
  13. Защита итогового проекта.

Преподаватели курса:

Роман Сидоренко
Опыт работы: 8 лет
Специальность: Data Science

Николай Кухальский
Опыт работы: c 2015 года
Специальность: Data Science

Марат Мовламов
Опыт работы: с 2016 года
Специальность: Data Science.

Отзывы на курс от выпускников:

Евгения Ткаченко
«
Вы откроете для себя целый новый мир
Это непростой курс, но от этого только интереснее. На занятиях дается много материала по разным темам и рассказывается о множестве технологий. Очень понравилось то, что теоретический материал сразу подкрепляется практикой.»

Анна Жуковец
«
Я выбрала этот курс, потому что уверена: за наукой о данных будущее. Курс составлен хорошо и полезен как новичкам в Data Science, так и тем, кто уже работает в отрасли. Приятно, что ты сама выбираешь, как тебе заниматься: онлайн или оффлайн.
Хотелось бы отметить поддержку 24/7 нашего тренера Николая Кухальского. Ваша помощь бесценна. Всем рекомендую пройти курс, особенно у Николая Геннадьевича. Огромное спасибо IT-Academy за новых друзей и полезные знания.»

Подробнее о курсе Data Science →

Курс «Data Science. Уровень 1: Основные технологии. Python для анализа данных от Образовательный центр МГТУ им. Н.Э. Баумана»

Цена: 36 090 руб.

Ссылка на сайт: http://edu.bmstu.ru/napravleniya-obucheniya/biznes-analitika/datascience1

Перейти на официальный сайт →

Data Science сегодня — это одно из самых востребованных направлений подготовки в бизнес-аналитике. В основе data science лежит работа с большими данными (Big Data).
Большие данные — это действительно огромные массивы неструктурированной информации, для работы с которыми используются методы машинного обучения и математическая статистика. Основное отличие data science от классических методов бизнес-аналитики — это поиск связей и закономерностей в массивах информации, для разработки моделей, предсказывающей результат.
Данный курс специально разработан для знакомства с основными технологиями и подходами анализа данных.

Чему вы научитесь:

  • основам Big Data и Data Science
  • основам работы с SQL — самым популярным языком структурированных запросов
  • как использовать язык программирования Python для анализа данных
  • как работать с данными, основы визуализации и описательного анализа
  • разовьете пространственное, статистическое и функциональное мышление.

Программа курса:

7 тематических модулей, 40 академических часов.

  1. ВВЕДЕНИЕ В DATA SCIENCE
  • Введение в Big Data и Data science.
  • “Разумная” постановка и приемка задач.
  • Data science в различных секторах экономики.
  • Необходимые навыки для работы с Big Data и Data science.
  • Данные и их источники – характеристики, полнота, взаимная корреляция, причинно-следственные связи, признаки искажения.
  • Типы данных. Базы данных. Способы хранения данных.
  • Математические приемы, используемые при работе с данными: матричные операции, введение в статистику и проверку гипотез.
  1. ОСНОВЫ SQL
  • SQL – язык структурированных запросов.
  • Общий подход.
  • Базовая концепция, фильтрация, функции.
  • Функционал PgAdmin.
  • Подзапросы, Join, Табличные операции.
  1. PYTHON ДЛЯ АНАЛИЗА ДАННЫХ
    Введение в язык программирования Python. Знакомство с Google colaboratory. Знакомство с функционалом Google Colaboratory, обзор основных возможностей. Язык программирования – Python. Основные функции. Базовые конструкции и структуры. Стандартные функции языка. Логические выражения. Условные операторы. Списки, словари, кортежи. Циклы и условия. Функции и классы. Примеры реализации Решение практических задач с использованием Python.
  2. РАБОТА С ДАННЫМИ
    Библиотека NumPy, типы данных, массивы и операции с ними, Матричные операции, семплирование, чтение файлов.
    Библиотека SciPy. Научные вычисления. Практическое применение. Работа с данными. Тестирование данных. Библиотека Pandas, загрузка и запись данных, срезы данных, мультииндексация, groupby, datetime, статистические функции.
  3. ВИЗУАЛИЗАЦИЯ
    Библиотека Matplotlib, варианты отрисовки графиков и изображений.
    Библиотека Seaborn, визуализация парных взаимосвязей, heatmap, диаграммы. Библиотека Plotly. Продвинутая визуализация. Динамические графики. Библиотека Dash. Обзор фреймворка для создания дэшбордов (аналитические BI инструменты)
  4. ОПИСАТЕЛЬНЫЙ АНАЛИЗ
    Pipeline описательного анализа от загрузки датасета, до извлечения полезных метрик и агрегирование. Совместное решение бизнес-задачи с использованием ранее освоенных инструментов.
  5. ИТОГОВАЯ АТТЕСТАЦИЯ.

Подробнее о курсе Data Science →

Курс «Data Science от PyMagic»

Цена: 95 000 руб.

Ссылка на сайт: https://pymagic.ru/

Реальные задачи и проекты, разбор алгоритмов и методов машинного обучения, пробное собеседование.

  • 6 месяцев
  • С нуля.

Перейти на официальный сайт →

Для кого:
Подойдет для начинающих, кто только хочет освоить машинное обучение, не важно, в какой сфере вы работали. Также нужны знания школьной математики, базовых принципов

Что получаете:

  • Знания, как работают алгоритмы машинного обучения
  • Практика на реальных данных
  • Собственный pet-project

Трудоустройство

  1. Помогаем грамотно составить резюме
  2. Проведем тестовое собеседование
  3. Рекомендуем выпускников компаниям-партнерам.

Преподаватели:

  • Никулина Анастасия
    CEO & Founder PyMagic
    Senior Data Scientist ПАО Росбанк
    Автор канала про машинное обучение на YouTube
  • Ильдар Сафило
    Expert Data Scientist МТС (Recommender systems, A/B testing)
    HSE Lector, ex-Lead DS Tinkoff
  • Петр Ермаков
    Руководитель школы машинного обученияru
    Senior Data Scientist Lamoda
  • Евгений Разинков
    Приглашенный эксперт
    AI-евангелист, к.ф.-м.н.
    директор по науке в компании Pr3vision
    преподает ML с 2015 года
  • Юлия Морозова
    HR Manager QIWI
    Опыт IT подбора 4 года, проводит карьерные консультации, обучает сорсингу.

Программа:

  1. Основы Python
  2. SQL
  3. Математический анализ
  4. Линейная алгебра
  5. Статистика
  6. А/Б тестирование
  7. Теория вероятностей
  8. Методы оптимизации
  9. Машинное обучение. Введение
  10. Линейные алгоритмы
  11. Способы борьбы с переобучением
  12. Деревья
  13. Метрические алгоритмы
  14. Байесовские модели
  15. Кластерный анализ
  16. Ансамблирование, стекинг и блендинг
  17. NLP
  18. Deep Learning
  19. Трудоустройство.

Отзывы участников доступны на сайте.

Подробнее о курсе Data Science →

Курс «Data Scientist от Level UP»

Цена: 48 990 руб.

Ссылка на сайт: https://levelp.ru/courses/data-science/data-scientist/

  • Продолжительность – 4,5 месяца (60+ ак. часов)

Перейти на официальный сайт →

Курс ориентирован на начинающих разработчиков, знакомых с основами разработки на Python.

Программа обучения Data Science содержит большое количество практических задач на закрепление знаний, а также мини-проекты на протяжении курса.
Целью курса является понимание и умение применять на практике все необходимые технологии связанные с Data Science.
При успешном прохождении курса студент может претендовать на должность Junior Data Scientist или Junior Data Analyst.
Каждая из тем курса содержит практические примеры, а каждое занятие сопровождается домашним заданием для закрепления материала. В конце курса разберем самые популярные вопросы для собеседования.

Программа:

  1. Введение. Терминология.
  • Рассмотрение различных ролей в AI-team и их навыков.
  • Различия/Сходства программирования и науки о данных.
  • Цикл разработки AI продукта.
  • Полезные ресурсы.
  1. Python + Git
  • Вспоминаем
  • Закрепляем
  • Решаем задачки
  • JupyterLab + MarkDown
  1. Математика для DS
  • Статистика (hypothesis testing, bias/variance tradeoffs, mean, variance, and mode).
  • Теория вероятностей (distributions, conditional probabilities, independence, Bayes theorem).
  • Математический анализ (derivatives, integrals)
  • Линейная алгебра (matrix vector operations, eigenvalues, eigenvectors, and combinatorics).
  • Математические функции (min/max/argmin/argmax…).
  • Математика для анализа данных (preprocessing, visualization and metrics such as accuracy, R-squared, residuals, precision, and recall).
  1. Data Engineering
  • Подготовка данных для обучения (feature engineering).
  • Способы сбора/поиска данных для обучения.
  • Анализ данных (в том числе визуализация).
  • Анализ того, что получилось на графиках (корреляция, среднее…).
  • Что такое ETL?
  • Базы данных
  • Знакомство с экосистемой Hadoop
  • Знакомство с Apache Spark | Apache Hive
  1. Modeling
  • ML (Classic models)
  • Пакеты/Фреймворки для работы
  • Methods to train (initialization, optimization, regularization, and hyperparameter tuning).
  • Анализ результатов моделей, рекомендации.
  • Deep Learning
  • Methods to train (initialization, regularization, optimization, and transfer learning).
  • Анализ результатов моделей, рекомендации.
  1. Infrastructure & Deployment
  • Что такое рефакторинг. Основные подходы.
  • Unit & Functional tests
  • Обзор AWS, Azure и аналогов.
  • CI / CD
  • Docker
  • Подготовка к деплойменту
  1. Разбор классических вопросов на собеседовании.

Преподаватель:

Вера
Аспирант (PhD) в CERN
Закончила бакалавриат и магистратуру физического факультета НГУ.
С младших курсов начала заниматься анализом данных физических экспериментов, и решила дальше развиваться в этой области.
Получила ещё одну магистерскую степень, в этот раз по data science, во французском ВУЗе.
В настоящее время ведёт научную деятельность, разрабатывая эффективные алгоритмы обработки данных для задач компьютерного зрения.

Руслан
Аналитик-разработчик в компании BIA Technologies.
Закончил МФТИ, работал по научным направлениям в области моделирования сложных физических процессов.
Работал в нескольких крупных IT-компаниях Москвы и Санкт-Петербурга, занимался различными по размеру и сложности задачами, от генерирования картин, распределения физических величин и чат-ботов до интегрированного комплекса ГИС для картографии и разработки IaaS (Infrastructure as a Service) AWS-подобной системы предоставления облачных услуг.
В настоящее время работает аналитиком-разработчиком в области систем автоматического решения задач управления перевозками. Python изучал для автоматизации рутинных действий, однако впоследствии язык показал себя как крайне гибкий и мощный инструмент. Его можно применять в системах произвольной сложности, и он позволяет максимально быстро получить работающее решение.

Евгений
DevOps Engineer в Сбере
Никогда не думал, что стану DevOps инженером, но мир заставил меня администрировать и автоматизировать процессы, и я не смог остановится:)
В сфере уже более 5-ти лет, из интересного:

  • Был архитектором облачно-ориентированного приложения в AWS для REISS DIGITAL LLC.
  • Занимался автоматизации процессов в отделе процессинга для Яндекс.Денег.

Подробнее о курсе Data Science →

Курс «Интенсив по BigData: быстрый старт в Data Science от Академия АйТи»

Цена: 24 900 ₽

Ссылка на сайт: https://academyit.ru/courses/bigdata/

Перейти на официальный сайт →

Специалист по Big Data – это программист, который работает с большими массивами данных разной степени разрозненности и структурированности: банковские счета, запросы пользователей в поисковых системах, поведение пользователей социальных сетей, публикации СМИ, открытые фото- и видеофайлы, данные сейсмической активности планеты, метеорологические сводки и другие данные, которые занимают терабайты памяти, превосходят возможности типичных баз данных и доступны для обработки только компьютером.

Чем занимается специалист по Big Data и специалист по машинному обучению:

  • Постановка целей анализа совместно с заказчиком
  • Составление технического задания на анализ неструктурированного массива данных
  • Сбор и исследование массива данных, выявление существенных признаков, поиск закономерностей
  • Компьютерное моделирования процесса анализа / машинного обучения на небольших объемах данных
  • Оптимизация процесса анализа, корректировка алгоритмов
  • Применение алгоритмов ко всему объему данных
  • Оценка результатов
  • Составление отчетов с прогнозами и презентацией данных

Управление большими данными предполагает создание и применение информационных технологий нового поколения, обеспечивающих экономически эффективное извлечение, статистическую обработку и визуализацию полезной информации из больших объемов разнообразных данных. Высокую скорость сбора, обработку и анализ.

Целевая аудитория:

  • Программисты
    Подтянете аналитическое и алгоритмическое мышление, научитесь выявлять потребности бизнеса. Получите опыт работы с моделями машинного обучения, будете применять Python для решения задач с данными.
  • Начинающие аналитики
    Научитесь выдвигать гипотезы и делать выводы на основе данных. Сможете превращать сырые данные в полезную информацию, понимать математику на основе статистики, обучать машины и прогнозировать результаты.

Цель курса
Получение компетенций в области создания и применения технологий больших данных.

После изучения курса слушатели будут:

  • знать методы анализа больших данных на всех этапах жизненного цикла методологической и технологической инфраструктуры в организации;
  • уметь загружать данные из разных источников;
  • собирать, очищать, подготавливать и объединять полученные данные;
  • производить сцепление и наложение данных, слияние и замену значений;
  • работать с пропущенными значениями, повторами, объединением и переформированием данных;
  • осуществлять фильтрацию, группировку, агрегацию и выполнять описательную статистики
  • вычислять центральную тенденции, среднее, медиану и моду;
  • выполнять разведывательный анализ, вычислять дисперсию, стандартное отклонение, ковариации, корреляции, строить распределение и заниматься постановкой гипотез
  • применять методы и технологии исследования больших данных;
  • владеть навыками разработки продуктов, услуг и решений на основе больших данных;
  • анализировать большие данные с использованием существующей в организации методологической и технологической инфраструктуры.

Подробнее о курсе Data Science →

Курс «Data Science и Machine Learning от BigDataSchool»

Цена: разная стоимость

Ссылка на сайт: https://www.bigdataschool.ru/data-science-and-machine-learning

Практические курсы по анализу данных и машинному обучению для аналитиков, разработчиков программного обеспечения, руководителей и специалистов по работе с большими данными.

Перейти на официальный сайт →

Практические курсы по анализу данных и машинному обучению предназначены для аналитиков, разработчиков программного обеспечения, руководителей и специалистов по работе с большими данными, которые хотят получить следующие знания и навыки:

  • Понять, что такое машинное обучение, нейросети и искусственный интеллект
  • Знать, как эффективно использовать инструменты Data Science в бизнесе
  • Разобраться с математическими основами нейросетевых алгоритмов и других методов Machine Learning
  • Освоить базовые методы машинного обучения
  • Обрабатывать датасеты для подготовки к моделированию
  • Разрабатывать собственные нейросетевые алгоритмы и другие модели Machine Learning на языках программирования Python и R
  • Интерпретировать результаты моделирования.

Курсы:

  1. Аналитика больших данных для руководителей
  2. Архитектура Данных
  3. Основы Hadoop
  4. Администрирование кластера Hadoop
  5. Безопасность озера данных Hadoop на платформе
  6. Hadoop для инженеров данных
  7. Использование Apache Zeppelin
  8. Администрирование кластера Kafka
  9. Apache Kafka для инженеров данных
  10. Анализ данных с Apache Spark
  11. Core Spark – основы для разработчиков
  12. Потоковая обработка в Apache Spark
  13. Машинное обучение в Apache Spark
  14. Графовые алгоритмы в Apache Spark
  15. NOSQL Интеграция Hadoop и NoSQL
  16. Hadoop SQL администратор Hive
  17. Администрирование кластера HBase
  18. Cloudera Impala Data Analytics по запросу
  19. Greenplum для инженеров данных
  20. Apache NiFI для инженеров данных
  21. Администрирование кластера Apache NiFi
  22. Data Pipeline на Apache Airflow и Apache Hadoop
  23. Разработка и внедрение ML-решений
  24. Графовые алгоритмы. Бизнес-приложения
  25. Подготовка данных для Data Mining на Python
  26. Машинное обучение на Python
  27. Визуализация данных на языке Python
  28. Нейронные сети на Python
  29. NLP с Python
  30. Computer vision на Python
  31. Администрирование кластера Arenadata Hadoop + сертификация
  32. Основы Arenadata Hadoop + сертификация
  33. Администрирование Arenadata Streaming Kafka + сертификация
  34. Эксплуатация Arenadata DB + сертификация
  35. Arenadata DB для разработчиков + сертификация
  36. Эксплуатация Arenadata QuickMarts + сертификация
  37. Cертификация Arenadata
  38. Data pipeline на Apache AirFlow и Arenadata Hadoop.

Подробнее о курсе Data Science →

Курс «Математика для Data Science от Stepik»

Цена: 15 000 руб. – 65 000 руб.

Ссылка на сайт: https://academy.stepik.org/math-for-data-science

Разберитесь, как работают технологии машинного обучения, и научитесь пользоваться ими осознанно.
Сдавайте задачи и получайте советы, общаясь с преподавателем 1 на 1.

  • 15 недель
  • Теория онлайн
  • Индивидуальные занятия
  • Интерактивный тренажер.

Перейти на официальный сайт →

Математика для DS – программа из 3 курсов, которая поможет:

  • Разобраться в теории
  • Подготовиться к собеседованию
  • Читать научные статьи
  • Полюбить математику.

Содержание программы:

Курс 1. Математический анализ

  1. Одномерный математический анализ
  • Зачем в машинном обучении нужен математический анализ
  • Множества и функции
  • Пределы последовательностей
  • Пределы функций и непрерывные функции
  • Производные
  • Одномерный градиентный спуск.
  1. Многомерный математический анализ
  • R^n: расстояния и векторы
  • Дифференциал и частные производные
  • Производная по направлению и градиент
  • Градиентный спуск
  • Модификации градиентного спуска (Momentum, RMSProp, Adam).

Курс 2. Линейная алгебра

  • Векторные пространства и линейные отображения
  • Матрицы
  • Нейронные сети
  • Подпространства, базис, размерность
  • Ранг матрицы и метод Гаусса
  • Определитель, обратные матрицы, замена базиса
  • Скалярное произведение, углы, расстояния
  • Ортогональные матрицы
  • Матричные разложения
  • Собственные векторы и SVD

Курс 3. Теория вероятностей

  1. Дискретная теория вероятностей
  • Вероятностное пространство, события, исходы
  • Равновероятные исходы
  • Условная вероятность, независимые события, теорема Байеса
  • Перестановки и биномиальные коэффициенты
  • Дискретная случайная величина, распределение, математическое ожидание, дисперсия
  • Ряды и счётное пространство исходов.
  1. Непрерывная теория вероятностей
  • Интеграл и непрерывное пространство исходов.
  • Непрерывная случайная величина, распределение, плотность распределения, математическое ожидание, дисперсия
  • Закон больших чисел
  • Центральная предельная теорема
  • Основы статистики: статистические тесты.

Создатели программы – Михаил Миронов и Екатерина Минеева.
Михаил – человек из мира науки, а Екатерина работает в индустрии. Вместе они придумали и написали программу, которая сбалансирована по практике и теории.

Отзывы выпускников:

Игорь
«
Очень понравился преподавательский состав и оперативные обратные связи в комментариях на степике и в tg. Чувствуется, что команда курса вовлечена в процесс, это очень приятно и мотивирует :)»

Мария
«Прекрасно организовано обучение: необходимость решать задачи делает обучение очень эффективным. Практически самостоятельная работа также очень положительно сказывается на усвоении. Все, что осталось непонятным, можно спросить у куратора. Теоретическая часть по большей части изложена хорошо»

Родион
«Отточил технику работы с пределами. Полезный курс для закрепления не самых уверенных знаний. Отличная подача материала, с понятными примерами/ассоциациями/интуицией и строгим доказательством»

Подробнее о курсе Data Science →

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Прокрутить вверх