• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Программа помогает получить базовые компетенции аналитика данных, среди которых адекватный выбор метода для решения конкретной задачи анализа данных, предобработка данных, настройка параметров метода анализа и интерпретация полученных результатов.  В ходе обучения слушатели также знакомятся с программными продуктами Weka, Orange и библиотекой scikit-learn. Содержание программы охватывает основные устоявшиеся разделы современного машинного обучения (Machine Learning) и майнинга данных (Data Mining). 
Теоретический материал подкрепляется большим количеством практических занятий, домашних заданий и соревнованиями на Kaggle.

Итоговая аттестация будет проводиться в форме защиты проекта по анализу реальных данных.

Поступление

Целевая группа

Лица, уже имеющие высшее или среднее профессиональное образование или получающие высшее образование.

Документы для приема

Оригинал и копия паспорта или документа, заменяющего его

Оригинал и копия документа об образовании и квалификации или справка об обучении для лиц, получающих высшее образование

Оригинал и копия документа об изменении фамилии, имени, отчества (при необходимости)

Содержание программы

  • Введение в машинное обучение и разработку данных
  • Свободно-распространяемые системы машинного обучения и разработки данных
  • Методы классификации
  • Методы регрессии
  • Методы кластеризации
  • Отбор признаков и снижение размерности
  • Работа с выбросами и пропущенными значениями
  • Работа с текстовыми и категориальными данными
  • Обучение линейных моделей на больших данных, vowpal wabbit
  • Apache Spark
  • Статистический взгляд на машинное обучение
  • Машинное обучение и майнинг  больших данных (Big Data) 

Преподаватели

Соколов Евгений Андреевич

Заместитель руководителя Департамента больших данных и информационного поиска

Заместитель руководителя Департамента больших данных и информационного поиска факультета компьютерных наук НИУ ВШЭ. Руководитель группы анализа неструктурированных данных Yandex Data Factory. Разработал и читает ряд курсов по машинному обучению по программе "Прикладная математика и информатика". Со-автор онлайн-специализации "Машинное обучения и анализ данных" на платформе Coursera.
Шестаков Андрей Владимирович

Департамент больших данных и информационного поиска: Старший преподаватель

Преподаватель и аспирант факультета компьютерных наук. Работает в Mail.Ru Group в группе машинного обучения
Подать заявку

Вас могут заинтересовать

  • Очно-заочная форма
  • 76 академических часов, в том числе 56 аудиторных
  • Очно-заочная форма
  • 608 академических часов, в том числе 414 часов лекций и семинаров.
  • Очно-заочная форма
  • 46 академических часов