• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

С развитием мобильных устройств и видео технологий задачи компьютерного зрения становятся особенно актуальными. Сегодня компьютерное зрение активно применяется в таких областях, как медицина, картография, поиск, видеонаблюдение и беспилотные автомобили.

В данном курсе будут подробно разобраны решения основных задач компьютерного зрения: классификация изображений, распознавание и детекция объектов и сегментация изображений. Также мы затронем темы поиска изображений и распознавание рукописного ввода. В первой части курса слушатели познакомятся с классическими алгоритмами компьютерного зрения и разберут практические примеры с использованием библиотеки OpenCV.  Вторая часть курса посвящена сверточным нейронным сетям. В этой части мы уделим особое внимание практическому применению нейронных сетей для задач компьютерного зрения.Также  познакомимся с популярной библиотекой PyTorch для работы с нейросетями.

Поступление

Документы для приема

Оригинал и копия паспорта или документа, заменяющего его

Оригинал и копия документа об образовании и квалификации или справка об обучении для лиц, получающих высшее образование

Оригинал и копия документа об изменении фамилии, имени, отчества (при необходимости)

Содержание программы

  • Базовая теория: форматы, преобразование изображений с помощью фильтров, знакомство с библиотекой OpenCV.- Б

  • Извлечение признаков, PCA разложение, гистограммы цвета и градиента, особые точки.

  • Сегментация изображений, детекция объектов на изображении - классические подходы.

  • Сверточные сети для обработки изображений. Основные блоки.  Знакомство с фреймворком PyTorch.

  • Архитектуры для классификации изображений. Аугментация данных, тюнинг обученных сетей.

  • Проблемы при обучении нейронных сетей и как их решать.

  • Сегментация изображений, детекция объектов на изображении c помощью нейросетей.

  • Распознание лиц. Две постановки задачи - классификация и верификация. Задача Metric Learning.

  • Латентное представление изображений. Autoencoders и Variational Autoencoders.

  • Генеративно-состязательные модели.

  • Рекуррентные сети. Архитектура RNN, LSTM, GRU. Генерация описания по изображению.

Преподаватели

Руслан Рахимов

Разработчик-исследователь в команде компьютерного зрения в компании Huawei. Окончил МФТИ, Сколковский Институт Науки и Технологий.

Подать заявку

Вас могут заинтересовать

  • Очно-заочная форма
  • 2 зач.ед., 76 академических часов, в том числе 72 часа лекций и семинаров
  • 24 академических часов
  • Очно-заочная форма
  • 114 академических часов, в том числе 76 часов лекций и семинаров
  • Очно-заочная форма
  • 44 академических часа