— Опрос Всероссийского центра изучения общественного мнения (ВЦИОМ) показал, что 59% россиян не верят, что в ближайшие 50 лет нейросети выйдут из-под контроля и произойдёт восстание машин. Иного мнения придерживаются 30%. Почему в последнее время эта тема находится в центре внимания общества?
— Попытки создать искусственный интеллект, обладающий сознанием, предпринимаются уже порядка 70 лет, и все они пока безуспешны. С учётом современного уровня технологий можно прогнозировать, что это не произойдёт ещё в течение как минимум 30 лет. На полвека вперёд загадывать я бы не стал — за такой срок многое может измениться. Что же касается социологических опросов, то, как правило, чем лучше человек осведомлён, что находится «под капотом» нейронных сетей, тем лучше он понимает и все ограничения этой технологии. Пока широкая аудитория находится под впечатлением голливудских историй о восстании машин. И даже если в математических алгоритмах зародится сознание, рычаги управления машинами всё равно останутся в руках человека.
— Если это возможно, объясните, пожалуйста, простыми словами принцип работы нейросетей.
— По сути, нейросеть — это очень сложная математическая функция. Например, если она должна идентифицировать людей по фотографиям, то на входе она получает изображения с камер, сличает их со всей базой данных, на которой её учили, и быстро находит соответствия, сравнивая признаки, например цвет глаз или форму носа. Грубо говоря, этот процесс напоминает детскую игру в поиск десяти отличий. Для аудитории, знакомой с курсом линейной алгебры, я бы сказал, что нейросети — это много матричных преобразований.
— То есть каждая нейронная сеть написана под очень конкретные задачи? Нет таких алгоритмов, которые могли бы свободно переключаться между разными сферами и тематиками?
— В принципе, есть так называемые мультимодальные нейронные сети, они могут решать несколько задач одновременно. Но по эффективности им далеко даже до уровня пятилетнего ребёнка.
— Ажиотаж вокруг этой темы подогрело открытое письмо, подписанное Илоном Маском, Стивом Возняком и ещё многими другими экспертами, которое призывает остановить на время разработку мощных нейросетей в интересах человечества. При этом Билл Гейтс выступил против таких призывов: он заявил, что мораторий не решит проблем. О каких угрозах и проблемах говорят специалисты?
— Применение нейронных сетей действительно сопряжено с определёнными угрозами. Есть так называемые состязательные атаки, когда злоумышленники могут использовать уязвимость архитектуры нейросетей для того, чтобы подменить распознаваемое изображение. Для человека отличия будут незаметны, но нейросеть начнёт очень сильно ошибаться, получив такую изменённую картинку. Проводились даже специальные опыты, когда нейросеть, отвечающая за работу автомобильного автопилота, переставала распознавать пешеходов в качестве препятствия.
Есть и другие риски. Например, если разработчик поленится вычистить данные, на которых он обучал чат-бот, то нейросеть может выдать их злоумышленникам, если они применят специальный запрос. А среди этих данных могут быть и персональные. Пока что такие взломы не носят массового характера, но компьютерные вирусы в своё время тоже поначалу были только достоянием лабораторий.
А что касается открытого письма с призывом ввести мораторий на разработку нейросетей, то тут вряд ли речь идёт о реальных опасениях за будущее человечества — скорее оно связано с корпоративными интересами. Сейчас идёт напряжённая гонка между IT-гигантами в сфере создания нейросетей. В марте китайская компания Baidu представила свой аналог ChatGPT, похожая разработка есть у Facebook*.
— А может ли нейросеть ошибаться сама, без внешних вмешательств?
— Да, потому что чем сложнее нейросеть, тем труднее добиться устойчивости её работы. Тот же ChatGPT уже не раз ловили на том, что он выдаёт фейки, сочиняет их сам, а не берёт из каких-то источников. Дело в том, что ChatGPT — это генератор текстов, работа которого основана на сложной математике. И поскольку эти вычисления очень сложные и очень приблизительные, то на выходе порой получаются сбои.
— То есть без контроля человека нейросети применять не получится?
— Да, однозначно нужен контроль. И вообще, нейросети создаются для помощи людям, а не для того, чтобы их заменить. Это невозможно, особенно в таких областях, как медицина, например. Последнее слово всё равно остаётся за врачом, какие бы нейросети ни применялись для постановки диагноза. В своё время IBM пыталась продвинуть на американском рынке продукт Watson Health — планировалось, что ИИ найдёт применение в здравоохранении. Однако продукт так и не завоевал доверие врачей: нейросеть часто ошибалась, а в тех случаях, когда ставила точные диагнозы, давала очень узкие рекомендации по лечению. Потому что выборка данных, на которой учат нейросети, — она всё-таки очень ограниченная. И нейросетям не присуща человеческая интуиция, широкая образованность. По сути, нейросеть живёт в информационном пузыре.
— Значит, нейросети пока не отнимут работу у людей?
— В глобальном смысле нет, хотя из каких-то профессий начнут вымываться кадры, это правда. Например, чат-боты позволяют автоматически генерировать простые официальные письма, справки. Ранее в новостях сообщалось, что руководство Сбербанка частично сократило юристов низшего звена, которые писали претензионные письма. Теперь эти функции выполняет нейросеть.
Однако нужно понимать, что возможности нейросетей очень ограниченны. По сути, появление нейросетей должно подстегнуть людей к развитию. Кроме того, создание, обслуживание и внедрение таких технологий приводит к появлению новых рабочих мест и специальностей. Хотя, конечно, не массовых.
— А какие это профессии, можете привести примеры? Допустим, сейчас пишут о спросе на специалистов по составлению запросов для нейросетей — есть ли такая профессия?
— Я бы не назвал этоотдельной специальностью, но в некоторых сферах такие навыки действительно скоро будут нужны — например, дизайнерам. К слову, такое направление, как анализ данных (data scientist), появилось уже очень давно, в 2000-е годы. Это, по сути, универсальный специалист, способный проанализировать данные, написать и внедрить нейросеть, а далее её сопровождать. Сейчас эта специальность уже уходит на второй план, появляются всё более специализированные направления, такие как ML-инженер: он не создаёт новый математический аппарат нейронных сетей, а занимается обучением существующих архитектур и вводом их в эксплуатацию.
— Когда нейросеть выдаёт ответ на какой-то вопрос, она использует обрывки текстов, найденных в базе данных. Ранее против владельцев популярных нейросетей подали иск художники — они обвинили IT-компании в нарушении авторских прав. Нарушают ли нейросети авторские права? И если да, то как этот вопрос может быть урегулирован?
— Человек, который собирает данные для обучения нейросети, может нарушить своими действиями авторское право, если не заключит соглашение с правообладателями текстов и изображений. Не зря большинство крупных IT-компаний приняли так называемый кодекс этики искусственного интеллекта, который определяет этичное поведение разработчика ИИ.
— С другой стороны, сами художники тоже учатся на произведениях великих живописцев, но это не считается нарушением чьих-то авторских прав. Как отличить использование контента в учебных и коммерческих целях?
— Такой нюанс есть. Вероятно, основания для юридических претензий к создателям нейросети могут возникнуть, если она не просто учится на изображениях, а воспроизводит чей-то фирменный стиль или фрагменты работ. В принципе, есть возможность избежать такого копирования, но для этого нейросеть нужно учить довольно долго. А компании часто хотят сэкономить время. Кстати, по этой же причине сохраняются и уязвимости нейросетей в плане безопасности, о которых я говорил ранее.
— Почему из нейросетей именно ChatGPT произвёл такой фурор?
— Думаю, что отчасти это хороший маркетинг, а кроме того, этот чат-бот способен генерировать связный текст. При этом продукт, который выдаёт нейросеть, обычно довольно банальный, невысокого качества. По сути, это всё равно имитация создания текстов, преобразователь текстовой информации. К слову, ChatGPT обучался на данных, собранных до 2021 года, так что задавать ему вопросы по актуальной повестке точно не стоит.
При этом нужно понимать, что за появлением такой нейросети стоит серьёзный технологический прорыв. Во-первых, для обучения ChatGPT был собран колоссальный объём данных, во-вторых — очень большие вычислительные мощности, создание и обслуживание которых весьма затратно.
— Есть ли условия для создания такой нейросети в России?
— Да, технических и научных препятствий для этого нет. Если у бизнеса возникнет соответствующий запрос, то подобная нейросеть может быть создана российскими специалистами на российских вычислительных ресурсах.
— Пока что явный запрос исходит от студентов и школьников — большой резонанс вызвала история, когда в РГГУ был засчитан диплом, написанный нейросетью. Что вы думаете об этой истории?
— Надо понимать, что тот диплом был не самого высокого качества, он был оценён на тройку. Если честно, не очень понятно, что сенсационного в данной истории, что её так раздули в СМИ. Генераторы текстов появились уже давно, как и попытки студентов автоматизировать работу над дипломами и курсовыми. Другое дело, что раньше был более строгий отбор, подобные работы не допускались до защиты. На самом деле преподаватель может отличить работу, написанную нейросетью, — достаточно прочитать одну страницу такого диплома.
— То есть нельзя говорить о том, что нейросети прошли тест Тьюринга, потому что пишут неотличимые от человеческих тексты?
— Дело в том, что у теста Тьюринга есть много разных вариаций. Тот, о котором говорят обычно, был придуман Аланом Тьюрингом ещё в далёком 1950 году. В принципе, генератор текста может обмануть людей, и формально можно было бы сказать, что тест Тьюринга пройден. Но на самом деле говорить о появлении настоящего человекоподобного искусственного интеллекта мы не можем — это не так. Нейросети решают только достаточно узкие задачи.
— Хотелось бы поговорить не только об угрозах, но и о пользе нейросетей. В каких сферах они сейчас задействуются? И какие ещё области и процессы могут быть оптимизированы с помощью нейросетей в будущем?
— Нейросети приносят очень большую пользу. В широком смысле нейросеть — это анализатор информации. Они могут выявлять сложные закономерности в больших массивах данных, на что человеку потребовалось бы очень много времени и предельная внимательность. Такие задачи есть практически в любой области народного хозяйства. Приведу пример: в экономике есть такое понятие, как бизнес-инжиниринг, когда мы выявляем «узкие места» в бизнес-цепочках и оптимизируем всю систему. Нейронные сети прекрасно справляются с поиском таких «узких мест», подобные разработки для бизнеса уже есть и применяются. Также нейросети сейчас помогают биохимикам проектировать новые лекарства, прогнозировать, как то или иное соединение будет воздействовать на живые клетки.
Однако не надо пытаться всё подменять нейросетями. Если какая-то система и так хорошо работает, не нужно её ломать и заменять нейросетью, потому что при всех плюсах ИИ у него есть важный недостаток — большая вероятность погрешности в работе.
— Позволят ли нейросети совершить человечеству новый научно-технический рывок, как когда-то изобретение парового двигателя и компьютера?
— Изобретение парового двигателя породило научно-техническую революцию, целую эпоху резкого ускорения технологического прогресса. Что касается нейросетей, то сейчас вокруг этой темы большой информационный шум, притом что сама по себе технология не новая. Не думаю, что развитие нейросетей приведёт нас к глобальному прорыву. Да, нейросети помогают в работе, ускоряют многие процессы. Но это не явление масштабов открытий Эйнштейна или полёта человека в космос.
* Продукт Meta, деятельность признана экстремистской, запрещена на территории России по решению Тверского суда Москвы от 21.03.2022.