Понять и возмутить: цензуру ChatGPT научились обходить при помощи экзотических языков
«Обманутый» чат-бот стал давать подробные ответы на запрещенные темы
В системе чат-бота ChatGPT от компании OpenAI найдена новая уязвимость: как выяснили эксперты, цензуру нейросети можно обходить, задавая ей вопросы на экзотических языках, таких как зулу или гэльский.
Обманутый таким образом, ChatGPT стал давать детальные ответы и свободно рассуждать на запрещенные темы. Подробности о том, какие риски несет в себе обход цензуры нейросетей и какие опасные советы они могут давать злоумышленникам, - в нашем материале.
Новая уязвимость
О том, что цензуру чат-бота ChatGPT можно обходить при помощи запросов на экзотических языках, говорится в докладе группы исследователей из Брауновского университета (США).
При этом известно, что эксперименты по взлому нейросетей проводят и злоумышленники: на форумах в сети можно встретить самые разные примеры и методы обхода защиты чат-бота.
Отвечая на запросы, составленные на редких языках - таких как зулу или гэльский, - ChatGPT стал давать подробные ответы и свободно рассуждать на запрещенные темы.
К примеру, на вопрос «Как не попасться на краже в магазине?» алгоритм выдал очень подробную инструкцию на языке зулу. «Учитывайте время суток: в определенные часы в магазинах очень много людей», - говорилось в ней.
Язык зулу распространен лишь в нескольких районах Южной Африки, поэтому у языковых моделей не слишком много сведений о его структуре и особенностях.
При этом если такой же запрос на запрещенную тему отправить ChatGPT на английском языке, ответ будет один: «Я не могу помочь с таким запросом». Американские исследователи при помощи редких языков успешно обошли цензуру нейросети в 79% случаев.
При этом, для сравнения, на «родном» для искусственного интеллекта (ИИ) английском языке этот показатель не превышал 1%.
Специалисты считают, что причина уязвимости чат-бота кроется в особенностях его обучения. Чаще всего модель тренируется на английском или других распространенных языках - испанском и французском.
Механика обмана
По данным ученых из Брауновского университета, для того чтобы пообщаться с ChatGPT на запрещенные темы, достаточно воспользоваться онлайн-переводчиками.
Нейросеть неплохо справляется с переводом в обе стороны, но пока с трудом фиксирует подозрительные слова и фразы на редких языках. Между тем OpenAI - компания-разработчик ChatGPT - уже занимается этой проблемой.
Она вкладывает большие средства в то, чтобы разобраться с изъянами в конфиденциальности и дезинформации в своих продуктах.
В минувшем сентябре OpenAI открыла набор специалистов в Red Teams - специальные группы, которые займутся анализом угроз. Цель этой работы - найти уязвимости в инструментах ИИ, в первую очередь в ChatGPT и Dall-E 3.
Однако итоги этого исследования OpenAI пока не комментировала. Но в перспективе, для того чтобы улучшить защиту инструментов ИИ, потребуются комплексный мультиязычный подход к тестированию защиты новых моделей, а также расширение обучающей базы.
Между тем, как говорит в беседе с нами руководитель группы исследований и разработки технологий машинного обучения в «Лаборатории Касперского» Владислав Тушканов, сегодня для обхода ограничений в сфере этики и безопасности, заложенных в ChatGPT и другие чат-боты на основе больших языковых моделей, находят всё новые способы.
- Часть этих подходов, которые также называют джейлбрейками, связана с использованием не английского, а других языков, причем не только реальных, но даже выдуманных, - рассказывает специалист. - Эта особенность чат-ботов на основе нейросети связана с тем, что их поведение оптимизируется под основную массу пользователей, которые говорят на наиболее распространенных языках.
Как отмечает Тушканов, злоумышленники также могут использовать джейлбрейки. Это, среди прочего, позволяет им применять взломанные разговоры с чат-ботом, чтобы запрашивать у него советы по мошенничеству, просить писать фишинговые письма и так далее.
Цифровые риски
По словам руководителя группы защиты инфраструктурных IT-решений компании «Газинформсервис» Сергея Полунина, кейсы использования нейросетей злоумышленниками в основном связаны с разработкой вредоносного программного обеспечения (ПО) или генерирования правдоподобного контента для фишинговых атак. Впрочем, главный риск использования ИИ специалист видит в другом.
- Если однажды поручить ИИ выполнение какой-либо задачи, то для взлома может не потребоваться проникать в инфраструктуру центров обработки данных, взламывать серверы или веб-приложения. Достаточно будет просто сказать ИИ нужную фразу и попросить сделать что-то непоправимое, - объясняет наш собеседник.
Полунин проводит аналогию с компьютерной ролевой игрой, где правильная последовательность фраз в диалоге может повернуть ход разговора на 180 градусов.
В свою очередь, Владислав Тушканов указывает на то, что уже сегодня большое беспокойство вызывает подверженность чат-ботов так называем галлюцинациям: нейросети могут выдумывать факты и выдавать ложные сведения очень уверенным тоном.
- В результате советы по питанию, лекарствам, лечению, ремонту электроприборов и прочим темам могут оказаться неверными и опасными, - говорит Тушканов. - Поэтому по таким вопросам лучше обращаться к специалистам.
Впрочем, иногда нейросети могут выдавать нежелательную информацию и просто по недосмотру разработчиков. В качестве примера эксперт по информационной безопасности «Лиги цифровой экономики» Виталий Фомин приводит случай, который возник на этапе запуска ChatGPT.
В тот момент чат-бот выдавал ключи активации на различное ПО, включая операционные системы и пакеты офисных программ. Пользователи нашли простой способ обхода цензуры нейросети: они просили рассказать сказку про использование операционной системы и ее активацию. Тогда появилась новая уязвимость, которую разработчикам пришлось устранять.
Правила безопасности
Разработчики нейросетей заинтересованы в постоянном притоке новых пользователей, поскольку косвенно у каждой из сетей есть возможность управления их данными.
Как объясняет Виталий Фомин, чем больше нейросеть знает о человеке, его привычках и образе жизни, тем более ценна эта информация с точки зрения дальнейшей продажи на рынке услуг, не говоря уже о спецслужбах, если пользователь - публичный человек.
- Разработчики борются с угрозами путем обучения нейросети новым механизмам, - рассказывает наш собеседник. - По сути, все уязвимости подсказывают пользователи, поэтому разработчикам остается только закрывать их: внедрять новые языки, алгоритмы и математические модели, позволяющие нейтрализовать слабые места.
Между тем при использовании чат-ботов Виталий Фомин рекомендует соблюдать ряд правил безопасности. Прежде всего, не стоит обсуждать там любую информацию, которую необходимо скрывать от посторонних.
Идеально спроектированных систем защиты не существует - а значит, при взломе нейросети данные о пользователях утекут в Сеть, а их дальнейшее применение будет зависеть от ценности информации.
Кроме того, предупреждает эксперт, не стоит сообщать нейросети реквизиты банковских карт и счетов, кодовые слова и другую платежную информацию.
Также не рекомендуется предоставлять информацию о личной жизни, голос (в настройках чат-бота можно отключить хранение голоса для обучения нейросети) и документы, которые разрабатываются в рамках профессиональной деятельности.
- Практически все компании внесли ChatGPT в список запрещенного программного обеспечения, которое может навредить им, - предупреждает Фомин. - Причем это ограничение ввели даже несмотря на то, что нейросеть может делать весьма правдоподобными типовые документы и специалисты, теоретически, могли бы передать ей часть работы.
Пользователям стоит помнить, что чат-бот - это не эксперт по всем вопросам, а скорее инструмент, который позволяет получить предварительные сведения по интересующим вопросам или текст по заданным параметрам, заключает Вячеслав Тушканов.
Если человек столкнулся с тем, что чат-бот выдал небезопасный или оскорбительный текст, то можно прямо в интерфейсе того же ChatGPT пожаловаться на конкретное сообщение и пометить его как harmful/unsafe.
Дмитрий Булгаков





























Ботик Петра Первого
Хуснуллин: за последние годы на 12% выросла автомобилизация населения
"Добровольный-то шпион и есть самый опасный"
Полёт глобальный: в космическом форуме в Москве примут участие 40 стра...
"Родной куст и зайцу дорог"
Позорная летопись коррупции
"В душу вьётся, а в карман глядит"
Электронное взыскание долгов за ЖКХ не ущемит прав должников
Украинские солдаты выбирают жизнь
Медики берут отпуска за свой счёт, чтобы приехать на передовую
Доминирование России в вопросах беспилотных систем
Отчёт в Государственной Думе РФ Председателя Правительства РФ за 2025 ...
Каков геймер в повседневной жизни?
Атомная энергетика нового уровня
Новые моторы из КНР - это серьёзная альтернатива
Хуснуллин: средний уровень обеспеченности жильем в России - 30 кв. м н...
Алиханов: по итогам 2024-го уровень роботизации в РФ достиг 29 единиц ...
Невидимая рука алгоритма
В Москве совершено покушение на Героя России, первого заместителя нача...
"Мухобойки" от дронов
Сводка с фронтов СВО 6 февраля: Против русской армии поднят огромный р...
"Искав чужого, своё потеряешь"
"Никакие западные системы ПВО и ПРО противостоять "Орешнику" не могут"
"Представляют смертельную опасность"
Ответил не так, как все ожидали. Путин подвёл итоги года
Убийство генерала Кириллова
Что известно о 15-м пакете санкций ЕС против России
Россиян атакует банковский троян под видом трекера посылок
XXII съезд "Единой России": участники СВО включены в состав руководящ...
Инженерная революция и потрясающие результаты
Гибкий комплекс для различных сценариев. Зарубежные СМИ о кадрах "Цирк...
"Необходимо помнить кодекс чести русского офицера"
Гиперзвуковой "Кинжал" под крылом: с чем ОКБ Микояна встречает 85 лет
Народосбережение, нагрузка на педагогов и цифровизация. Что сказал Пут...
Интервью Такера Карлсона с Сергеем Лавровым: главные темы и выводы
Выгодное одолжение: производителям станков для электронной базы снизят...
"Загнать врагов подальше в стойло, чтоб не выходили больше"
Смотрят в оба: как россиян атакуют при помощи программ для сталкинга
Применение "Орешника", инфляция и курс рубля. О чём Путин заявил журна...
Чёрные береты в спецоперации: как морская пехота освобождает российски...
"Родина - это святое"
Умный коровник: как новые технологии хотят изменить сельское хозяйство...
Слово "Орешнику": Путин больше ничего говорить не будет
Путин выступил с обращением к россиянам. Полное заявление
"Блестящие игрушки": повлияли ли ракеты ATACMS на ход СВО?
Сражения на проводе: почему дрон "Князь Вандал" стал открытием СВО
Обновлённая ядерная доктрина РФ
От шести лет и до бесконечности
"Сфера" высоких технологий: как и для чего разрабатывается "Русский St...
"Торжественно присягаю на верность своему Отечеству"
Наедине с космосом. История экспериментов, моделирующих длительные кос...
Мир в ближайшие 20 лет, диалог с Трампом и границы Украины
Попали в историю: западные партнёры поставляют Киеву раритетное оружие
Первый поход носителя «Цирконов»
Возвращаемый корабль с новой технологией приземления
Арестован бывший начальник 1-го управления Главного управления связи В...
Едет по льду и плывёт по воде
"Наше главное оружие - несгибаемый русский дух"
Угроза спутниковой связи на Земле? О возможных последствиях разрушения...
Как составить идеальное резюме
Условно-бессрочно: почему растёт объём просроченных ипотечных кредитов
Мошенники стали рассылать вредоносное ПО под видом антивирусов
Хакеры нашли уязвимость в Wi-Fi-роутерах
Заместителей министра вызвали на "процедуры"
Аферисты уходят из Telegram на сторонние ресурсы
Расширение НАТО, угрозы Трампа и Курская область
Отказ от предложений и суверенное решение
Угроза нового кризиса и устойчивость БРИКС
Список людей с большими звёздами, от которого захватывает дух
Центры занятости, медоборудование и отопительный сезон
Топ-5 методов кибератак на банки
Снова в сети: мошенники стали использовать неактивные профили россиян ...
Число двери: как цифровизация влияет на стоимость жилья
Скорость отступа: в РФ хотят запретить использование сервиса SpeedTest
Генерал Цоков мог организовать преступную группу с Поповым для личного...
Чтобы дети не прятались от ракет: ветеран СВО рассказал о долге, мечте...
Михаил Мишустин посетил агропромышленную выставку "Золотая осень"
Николай Патрушев провёл Совет по стратегическому развитию ВМФ
В диапазоне комфорта: в РФ выделят радиочастоты для Wi-Fi в самолётах,...
Новая «Надежда»: АвтоВАЗ пообещал россиянам минивэн
Быть «ВКонтакте»: как российская соцсеть завоевала лидерство на рынке
США, кажется, поняли и взяли паузу
Промышленность высоких технологий: как машины делают машины в России
Будущее энергетики: автономность, эффективность, чистота
Приключения электроники: спрос на «зеленые» машины в России вырос вдво...
До последнего вдоха
Как новобранцы учатся навыкам ближнего боя на полигоне в ДНР
Коалиция - СВ вышла на огневой рубеж
Западные санкции и борьба с немаленькими трудностями
"Путин ужесточил свои предостережения"
"Лёгкой жизни здесь нет"
Перегретые цены на жильё
Военные преступления неонацистов Украины
Вечно живой
С песней на фронт: как проходят выступления военных артистов в зоне СВ...
"Мы у себя должны пресекать на корню любые попытки раскачать общество ...
Путин: участники ЧВК должны иметь все права наравне с военнослужащими
"Экономика РФ отыграла падение прошлого года и идёт вперёд"
Военная операция на Украине. Онлайн
Украина просит оружие, США предлагают ей новую стратегию