.jpg)
По словам эксперта, главный сдвиг последних полутора лет – это переход от «чат-бота, который отвечает на вопросы» к агентным системам, которые сами ставят себе задачи, выполняют действия, контролируют результат и двигаются дальше. Однако у этого прогресса есть теневая сторона: ИИ совпал по времени с культурой «публикуйся или умри», и вместо того чтобы улучшить науку, во многих случаях просто ускорил производство текстов низкого качества.
К этому добавляется проблема неравенства: разные страны, поколения ученых, университеты имеют разный доступ к качественным инструментам, навыки и желание работать с ними. А галлюцинации – выдуманные ссылки и несуществующие публикации – никуда не исчезли: они продолжают попадать в научные тексты просто потому, что часть исследователей использует устаревшие или слабые модели.
При этом большинство ученых по-прежнему остаются на базовом уровне – работа с текстом: перевод, обзор литературы. А вот использование ИИ для анализа данных и производства нового знания пока доступно меньшему числу исследователей, но именно здесь происходит главный прорыв. Именно этот «следующий уровень» (работа не с текстами, а с корпусами данных) Иван и показал на встрече.
Один воскресный день и 16 000 стихотворений
Самый яркий момент вебинара – демонстрация авторского проекта Ивана, который он назвал «Лабораторией русской поэзии». И построил ее за один день!
В основе проекта довольно простой, но принципиальный сдвиг в логике поиска. Обычные поэтические базы работают на уровне слов. Но современные ИИ-системы позволяют искать иначе – по смыслу и образности. Текст можно представить в виде математического вектора, то есть числовой модели его содержания. И тогда сравниваются уже не слова, а то, о чем текст на самом деле.
Первым делом Иван попросил ИИ найти подходящий массив данных, и тот нашел коллекцию из 16 000 стихотворений 200 русских поэтов. Дальше с помощью другого сервиса он выбрал нужную модель и базу данных, преобразовал весь корпус в векторы и построил интерактивный интерфейс – инструмент, который позволяет находить «смысловые двойники» стихотворений, строить сети связей между текстами и видеть неожиданные переклички между авторами.

На вебинаре Иван показал несколько примеров. Пушкинский «Памятник» притягивает Державина, Ломоносова, Бродского, стихотворение Есенина «Пушкину». «Бычок» Барто оказывается неожиданно близок Хармсу и Сологубу. А самое эффектное – китайский гимн (в оригинале), вставленный в поиск, выдает «Священную войну» Лебедева-Кумача, «Скифов» Блока и Хлебникова. Модель сравнивает смыслы поверх языкового барьера и умеет работать не только с целыми стихами, но и их фрагментами.
В том же режиме Иван проверил и современный материал – текст песни «Матушка земля» Татьяны Куртуковой. Система сопоставила ее с корпусом русской поэзии и выдала неожиданные смысловые пересечения, которые сложно было бы зафиксировать при обычном «чтении вручную» – именно потому, что речь идет не о словах, а о глубинных образах и мотивах. Также стало возможным рассчитать для каждого поэта усредненный вектор и построить полную карту близости русскоязычных поэтов по образности и мотивам.

Если раньше такие проекты требовали многих месяцев разработки и разнообразные компетенции от векторных баз до создания внешних интерфейсов веб-сайтов, то теперь рабочую систему визуализации и анализа полноценного корпуса русской поэзии один человек строит за один день.
Что это значит для вас
Сейчас мы находимся в моменте перехода, в котором задачи, раньше требовавшие команды и технической поддержки, становятся доступными одному человеку. Но это не означает, что ИИ работает сам по себе: каждый из показанных примеров требовал четкой постановки задачи, контроля на каждом шаге и критической оценки результата. Инструмент стал мощнее, но не автономнее.
Развитию именно этих навыков – от работы с литературой до анализа данных и этики использования ИИ – посвящен курс «ИИ для науки: как эффективно работать с данными», который стартует 18 мая в Центре научной интеграции НИУ ВШЭ.