🔥 Meta випустила Llama 3
опубліковано 19 квіт 2024
Компанія Meta випустила дві нові великі мовні моделі з лінійки Llama 3 з різними конфігураціями параметрів (8B/70B) і відкритим вихідним кодом. Розробники закликають спільноту активно долучатися до тестування, а програмістів з усього світу — допомогти знайти будь-які недоліки або критичні помилки.
Найближчими місяцями ми випустимо кілька моделей із новими можливостями, включно з мультимодальністю, здатністю спілкування кількома мовами, довшим контекстним вікном та потужнішими загальними можливостями,— йдеться в заяві компанії.
За словами розробників, їм вдалося знизити кількість відмов, підвищити креативність відповідей і поліпшити генерацію коду. Моделі також перевірялися не тільки стандартними синтетичними тестами, а й з використанням повсякденних запитів звичайних користувачів, продемонструвавши позитивні результати (див. мал. 2).
Результати тестування. Джерело: офіційний сайт Meta.
Набір даних для навчання нових моделей, зібраний винятково з відкритих джерел, перевищує показники Llama 2 усемеро. До того ж близько 5% інформації взято з неангломовних джерел, щоб підготувати моделі до використання в різних країнах світу. Протестувати Llama 3 вже можна в офіційних додатках Meta.