AMD выпустила собственную большую языковую модель с открытым кодом

14.11.2024

1977 прочтений

Модель обучена с помощью кластеров на графических процессорах AMD Instinct.

Бросая вызов лидерам рынка оборудования для систем искусственного интеллекта Nvidia, Intel и Qualcomm, компания AMD выпустила большую языковую модель с открытым кодом OLMo, обученную на ее собственном «железе», — кластере серверных графических процессоров AMD Instinct MI250.

Открытость OLMo означает, что у сторонних разработчиков есть доступ к учебным данным модели, весовым коэффициентам, методам обучения и коду, который для него использовался. Модель можно развертывать как в центрах обработки данных, так и на ПК с процессорами AMD Ryzen, имеющими ускоритель задач ИИ, отмечают в AMD.

Модель прошла три этапа обучения: предварительное обучение для освоения основных шаблонов языка, обучение с учителем и доводку для обретения «способностей» к математике и программированию и оптимизацию на основе пользовательских отзывов.

Как заявляют в AMD, по результатам внутреннего тестирования модель продемонстрировала преимущество по производительности по сравнению с аналогичными моделями, доступными на условиях Open Source.

В дальнейшем в компании планируют продолжить выпуск больших языковых моделей серии OLMo.

AMD выпустила собственную большую языковую модель с открытым кодом

Проблемы автоматизации аналитики: как избежать распространенных ошибок