• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Открыт набор групп на 2019 год!

Программа “Компьютерная лингвистика”  дает возможность слушателям, имеющим гуманитарное образование, овладеть современными инструментами автоматического анализа текста, освоить ключевые методы лингвистических технологий, обучиться использованию и оценке лингвистических парсеров, созданию корпусов, словарей и онтологий. Студенты программы получают новую востребованную специальность. Программа предполагает стажировку в профильных компаниях.

Куратор и разработчик программы - Анастасия Бонч-Осмоловская, кандидат филологических наук, академический руководитель магистерской программы “Компьютерная лингвистика”.

Чему вы научитесь?

  • Писать скрипты на Питоне для обработки текстов
  • Создавать и обрабатывать собственные корпуса текстов
  • Использовать статистические методы для анализа и визуализации текстовых параметров с помощью языка R
  • Использовать алгоритмы машинного обучения для классификации и кластеризации текстов, а также алгоритмы “deep learning”
  • Работать с лексикографическими инструментами, инструментами создания онтологий, параллельными двуязыковыми корпусами
  • Создавать правила, позволяющие автоматически извлекать информацию из массивов текста

Что вы узнаете?

  • Чем занимается современная компьютерная лингвистика?
  • Что включает в себя лингвистическая обработка текста?
  • Какие существуют полезные ресурсы и инструменты и как с ними работать?
  • Как измерять качество работы модулей лингвистического анализа?
  • Как ранжировать слова по значимости в текстах, по связанности между собой?
  • Какие подходы используются для машинного перевода?
  • Как автоматически определить “тональность” текста?
  • Как получить структурированные данные из неструктурированного текста?

​​​​​​​Что будет необычного?

  • Программа построена в виде тематических блоков из интегрированных курсов
  • Каждый тематический блок завершается небольшим индивидуальным проектом, опирающимся на изученный материал
  • Две гостевые лекции
  • Стажировка в профильных компаниях

Для того чтобы записаться на курс, нажмите на кнопку подать заявку внизу страницы и заполните форму заявки.

Поступление

Целевая группа

Категория слушателей: лица, имеющие высшее или среднее профессиональное образование; лица, получающие высшее образование.

Документы для приема

Оригинал и копия паспорта или документа, заменяющего его

Оригинал и копия документа об образовании и квалификации или справка об обучении для лиц, получающих высшее образование

Оригинал и копия документа об изменении фамилии, имени, отчества (при необходимости)

1 фотография (3×4)

Условия поступления

  • Приём заявок на обучение: август-сентябрь.
  • Оформление документов начинается в двадцатых числах сентября.
  • Начало занятий – с октября, по мере формирования группы (не менее 20 слушателей).
  • По окончании программы выдается диплом НИУ ВШЭ установленного образца о профессиональной переподготовке.

Содержание программы

Программа включает в себя четыре интегрированных курса:

  1. Компьютерная лингвистика
  2. Программирование
  3. Прикладные программы и инструменты
  4. Индивидуальные проекты

Программа предусматривает работу над исследовательским проектом и стажировку в профильных коммерческих компаниях и научно-исследовательских институтах.

Общий  тематический план:

декабрь: 
Введение в компьютерную лингвистику
Создание и разметка собственного корпуса 
Знакомство с основами программирования на Питоне

январь - февраль:
Основы статистического анализа и его применение в тексте
Работа с языком R
Частотный анализ собственного корпуса. Работа с готовыми инструментами

март:
Классификация текстов с помощью машинного обучения
Создание правил для извлечения данных из текста (Томита-парсер) 
Компьютерная лексикография

апрель:
Машинный перевод
Онтологии
Определение тональности текста

май:
Финальная аттестация и защита проекта

июнь-июль:
Стажировка в профильной компании

Преподаватели

Толдова Светлана Юрьевна

Школа лингвистики: Доцент

Мещерякова Евгения Игоревна

Выпускница МФТИ и магистратуры НИУ ВШЭ по компьютерной лингвистике, разработчик в лингвистическом старт-апе DC-Systems

Мороз Георгий Алексеевич

Школа лингвистики: Преподаватель

Рыжова Дарья Александровна

Школа лингвистики: Преподаватель

Иомдин Леонид Лейбович

кандидат филологических наук,ведущий научный сотрудник Лаборатории №15 Института проблем передачи информации РАН

Подать заявку

Вас могут заинтересовать