Руководство пользователя личного кабинета
Скачать
Каталог
ВойтиЗарегистрироваться
ВойтиЗарегистрироваться
ВойтиЗарегистрироваться
Войти Зарегистрироваться
ВойтиЗарегистрироваться

Как ИИ делает за один день то, на что раньше уходили годы

На открытом вебинаре Центра научной интеграции НИУ ВШЭ эксперт в наукометрии и исследователь Иван Стерлигов показал, как искусственный интеллект меняет саму логику научной работы. Сейчас ИИ перестает быть помощником в написании текстов и превращается в полноценную исследовательскую инфраструктуру.

Что сейчас происходит с ИИ в науке

По словам эксперта, главный сдвиг последних полутора лет – это переход от «чат-бота, который отвечает на вопросы» к агентным системам, которые сами ставят себе задачи, выполняют действия, контролируют результат и двигаются дальше. Однако у этого прогресса есть теневая сторона: ИИ совпал по времени с культурой «публикуйся или умри», и вместо того чтобы улучшить науку, во многих случаях просто ускорил производство текстов низкого качества.

К этому добавляется проблема неравенства: разные страны, поколения ученых, университеты имеют разный доступ к качественным инструментам, навыки и желание работать с ними. А галлюцинации – выдуманные ссылки и несуществующие публикации – никуда не исчезли: они продолжают попадать в научные тексты просто потому, что часть исследователей использует устаревшие или слабые модели.

При этом большинство ученых по-прежнему остаются на базовом уровне – работа с текстом: перевод, обзор литературы. А вот использование ИИ для анализа данных и производства нового знания пока доступно меньшему числу исследователей, но именно здесь происходит главный прорыв. Именно этот «следующий уровень» (работа не с текстами, а с корпусами данных) Иван и показал на встрече.

Один воскресный день и 16 000 стихотворений

Самый яркий момент вебинара – демонстрация авторского проекта Ивана, который он назвал «Лабораторией русской поэзии». И построил ее за один день!

В основе проекта довольно простой, но принципиальный сдвиг в логике поиска. Обычные поэтические базы работают на уровне слов. Но современные ИИ-системы позволяют искать иначе – по смыслу и образности. Текст можно представить в виде математического вектора, то есть числовой модели его содержания. И тогда сравниваются уже не слова, а то, о чем текст на самом деле.

Первым делом Иван попросил ИИ найти подходящий массив данных, и тот нашел коллекцию из 16 000 стихотворений 200 русских поэтов. Дальше с помощью другого сервиса он выбрал нужную модель и базу данных, преобразовал весь корпус в векторы и построил интерактивный интерфейс – инструмент, который позволяет находить «смысловые двойники» стихотворений, строить сети связей между текстами и видеть неожиданные переклички между авторами.

На вебинаре Иван показал несколько примеров. Пушкинский «Памятник» притягивает Державина, Ломоносова, Бродского, стихотворение Есенина «Пушкину». «Бычок» Барто оказывается неожиданно близок Хармсу и Сологубу. А самое эффектное – китайский гимн (в оригинале), вставленный в поиск, выдает «Священную войну» Лебедева-Кумача, «Скифов» Блока и Хлебникова. Модель сравнивает смыслы поверх языкового барьера и умеет работать не только с целыми стихами, но и их фрагментами.

В том же режиме Иван проверил и современный материал – текст песни «Матушка земля» Татьяны Куртуковой. Система сопоставила ее с корпусом русской поэзии и выдала неожиданные смысловые пересечения, которые сложно было бы зафиксировать при обычном «чтении вручную» – именно потому, что речь идет не о словах, а о глубинных образах и мотивах. Также стало возможным рассчитать для каждого поэта усредненный вектор и построить полную карту близости русскоязычных поэтов по образности и мотивам. 

Если раньше такие проекты требовали многих месяцев разработки и разнообразные компетенции от векторных баз до создания внешних интерфейсов веб-сайтов, то теперь рабочую систему визуализации и анализа полноценного корпуса русской поэзии один человек строит за один день.

Что это значит для вас

Сейчас мы находимся в моменте перехода, в котором задачи, раньше требовавшие команды и технической поддержки, становятся доступными одному человеку. Но это не означает, что ИИ работает сам по себе: каждый из показанных примеров требовал четкой постановки задачи, контроля на каждом шаге и критической оценки результата. Инструмент стал мощнее, но не автономнее.

 

Развитию именно этих навыков – от работы с литературой до анализа данных и этики использования ИИ – посвящен курс «ИИ для науки: как эффективно работать с данными», который стартует 18 мая в Центре научной интеграции НИУ ВШЭ.