🔥 Исследователи NTU сняли цензуру чат-ботов с помощью другого ИИ
опубликовано 28 дек 2023
Исследователи из Наньянского технологического университета Сингапура (NTU Singapore) обнаружили способ обхода цензуры некоторых чат-ботов на основе искусственного интеллекта, таких как ChatGPT и Google Bard. Для этого они разработали собственное ИИ-приложение, которое генерирует подсказки, позволяющие обходить ограничения.
Для обучения собственного чат-бота разработчики использовали специальные данные, ранее доказавшие свою эффективность в обходе цензуры. Результаты исследования они передали разработчикам компаний, чтобы те смогли закрыть обнаруженные слабые места и усилить защиту от потенциального неправомерного использования.