• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Программа повышения квалификации

Практический анализ данных и машинное обучение

Стоимость
130 000

Новый год — время узнать что-то новое, и даже если вы уже закончили вуз, никогда не поздно снова сесть за парту. А узнать что-то в столь популярной и востребованной сейчас области, как машинное обучение, полезно вдвойне. Данная программа ориентирована на тех, кто уже имеет опыт программирования, но хотел бы получить дополнительные, востребованные сейчас компетенции. 
 

И если сейчас слова "Data Mining", "Deep Learning" и "Text Mining" вы воспринимаете как далекие и недостижимые термины, которые не изучались в университетах, то этот учебный год может все исправить. Учебный курс начнется с повторения математических основ, требуемых для освоения методов анализа данных. Затем слушатели перейдут к изучению основных и продвинутых методов машинного обучения, анализу социальных сетей, узнают, как обрабатывать данные на естественном языке, познакомятся с методами глубинного обучения. Данная программа — результат совместной работы преподавателей Высшей школы экономики и практиков из ведущих ИТ-компаний. В основе обучения — интенсивное освоение навыков, необходимых для решения различных задач в ИТ-компаниях, банковской сфере, ритейле и телеком-операторах. Используя академическую и практическую составляющую, мы создали наполненный курс, в котором изучается как фундаментальная база, которая находит применение в практических методах анализа данных, так и освоение современных инструментов работы с данными. Курс ориентирован на практику и охватывает большинство задач, с которыми аналитик данных регулярно сталкивается в своей работе.

Поступление

Документы для приема

Оригинал и копия паспорта или документа, заменяющего его

Оригинал и копия документа об образовании и квалификации или справка об обучении для лиц, получающих высшее образование

Оригинал и копия документа об изменении фамилии, имени, отчества (при необходимости)

Содержание программы

Основные темы программы

Адаптационные математические курсы

  • Математический анализ
  • Линейная алгебра
  • Теория вероятностей
  • Математическая статистика
  • Методы оптимизации

Основы машинного обучения

  • Обучение с учителем. Задачи классификации и регрессии
  • Оценка качества алгоритмов машинного обучения
  • Обучение без учителя и задача кластеризации
  • Поиск выбросов и аномалий в данных

Индивидуальный проект по анализу данных

  • Ваши личные либо общедоступные данные и задачи
  • 1.5 месяца работы по четкому плану под руководством преподавателей
  • Презентации и обсуждение проектов

Продвинутые методы машинного обучения

  • Ансамбли алгоритмов классификации и регрессии. Градиентный бустинг
  • Смешивание моделей классификации и регрессии. Стекинг моделей классификации и регрессии
  • Соревнования по анализу данных, обзор решений

Поиск зависимостей в данных

  • Поиск часто покупаемых товаров (Frequent Itemset Mining). Алгоритм Apriori. Алгоритм FP-growth
  • Признаковые зависимости в данных. Импликации и ассоциативные правила (Association Rules)
  • Компактное представление закономерностей. Замкнутые и максимальные частые множества. Алгоритмы GenMax и Charm (или Close-by-One)
  • Анализ частых последовательностей. Примеры из демографии. Библиотека SPMF
  • Меры качества закономерностей. Корреляция как мера связи признаков. Статистическая оценка качества

Анализ социальных сетей

  • Введение в анализ социальных сетей. Модели формирования социальных сетей
  • Анализ структуры социальных связей. Каскады в сетях
  • Сообщества в социальных сетях
  • Распространение информации в социальных сетях

Автоматическая обработка текстов

  • Введение в анализ текстов. Частотный анализ текстов
  • Морфологический анализ. Выделение ключевых слов и словосочетаний
  • Выявление скрытых тем. Введение в корпусную лингвистику
  • Синтаксический анализ. Визуализация текстов

Масштабируемое машинное обучение и анализ больших данных с Apache Spark

  • Парадигма MapReduce в машинном обучении
  • Онлайн-обучение
  • Концепции вычислений в памяти и устойчивых распределенных наборов данных
  • Введение в Apache Spark для анализа данных
  • Машинное обучение с библиотекой MLLib Apache Spark

Нейронные сети и глубинное обучение

  • Введение в нейронные сети
  • Обучение сетей прямого распространения
  • Сверточные нейронные сети
  • Сети прямого распространения в анализе текстов
  • Рекуррентные нейронные сети
  • Модели сопоставления последовательностей (sequence to sequence)
Подать заявку

Вас могут заинтересовать

  • Очно-заочная форма
  • 76 академических часов, в том числе 56 аудиторных
  • Очно-заочная форма
  • 44 академических часа
  • Очно-заочная форма
  • 114 академических часа, в том числе 88 часов лекций и семинаров
  • Очная форма
  • 01.10.2018 - 31.05.2019