🔥 Meta выпустила Llama 3
опубликовано 19 апр 2024
Компания Meta выпустила две новые большие языковые модели из линейки Llama 3 с различными конфигурациями параметров (8B/70B) и открытым исходным кодом. Разработчики призывают сообщество активно подключаться к тестированию, а программистов со всего мира — помочь найти любые недостатки или критические ошибки.
В ближайшие месяцы мы выпустим несколько моделей с новыми возможностями, включая мультимодальность, способность общения на нескольких языках, более длинное контекстное окно и более мощные общие возможности,— говорится в заявлении компании.
По словам разработчиков, им удалось снизить количество отказов, повысить креативность ответов и улучшить генерацию кода. Модели также проверялись не только стандартными синтетическими тестами, но и с использованием повседневных запросов обычных пользователей, продемонстрировав положительные результаты (см. изоб. 2).
Результаты тестирования. Источник: официальный сайт Meta.
Набор данных для обучения новых моделей, собранный исключительно из открытых источников, превышает показатели Llama 2 в семь раз. Кроме того, около 5% информации взято из неанглоязычных источников, чтобы подготовить модели к использованию в разных странах мира. Протестировать Llama 3 уже можно в официальных приложениях Meta.