FlagAI
FlagAI — открытый расширяемый инструментарий для обучения и инференса крупномасштабных моделей искусственного интеллекта. Разрабатывается Пекинской академией искусственного интеллекта (BAAI) — китайской некоммерческой исследовательской лабораторией в области искусственного интеллекта[1]. FlagAI ориентирован на поддержку обучения, дообучения и внедрения масштабных моделей для различных задач с мультимодальностью; реализован полностью с открытым исходным кодом и включает ряд крупных предобученных моделей. Проект FlagAI одобрен как инкубационный проект на «sandbox»-уровне Linux Foundation[2].
Также встречается написание «Пекинская академия искусственного интеллекта» для всей организации-разработчика. Помимо разработки моделей и инфраструктуры ИИ, академия занимается продвижением сотрудничества между академическими кругами и индустрией[3], организацией ежегодной международной конференции и подготовкой специалистов высокого уровня[4]. Среди учредителей BAAI — ведущие компании, университеты и исследовательские институты Китая[5].
Что важно знать
| FlagAI | |
|---|---|
| Тип | некоммерческая организация |
| Основание | 2018 |
| Основатели | Чжан Хунцзян (англ. Zhang Hongjiang) |
| Расположение | Удаоку, Пекин, Китай |
| Отрасль | искусственный интеллект |
| Продукция | крупные языковые модели; инструментарии для ИИ; вычислительные платформы; имитационные модели |
| Число сотрудников | около 100 (2023) |
| Сайт | baai.ac.cn |
Продукты и приложения
По состоянию на 2023 год исследования академии сосредоточены на больших предобученных моделях (LLM) и открытой инфраструктуре искусственного интеллекта.
WuDao[6] — крупная мультимодальная предобученная языковая модель[7][8]. Версия WuDao 2.0 была анонсирована 31 мая 2022 года[9][1] и сравнивалась по размеру с GPT-3. В то время как GPT-3 содержит 175 млрд параметров, WuDao — 1,75 трлн параметров[10], что делало её крупнейшей предобученной моделью в мире на момент запуска[9][11]. Обучение проходило на 4,9 ТБ изображений и текстов (включая 1,2 ТБ китайских и 1,2 ТБ английских текстовых данных)[9][12]. По словам руководства BAAI, WuDao создавалась как «самая крупная и мощная ИИ-модель»[13], однако простое сравнение количества параметров не всегда соответствует качеству модели[10].
WuDao способна к обработке естественного языка, распознаванию изображений, генерации текста и изображений[1]. Модель может писать эссе, поэзию и куплеты на традиционном китайском, создавать текст на основе статических изображений и почти фотореалистичные изображения по описанию на естественном языке. Помимо этого, WuDao применяется для виртуальных чат-агентов и моделирования 3D-структур белков, как AlphaFold[1].
FlagAI — открытый программный пакет для масштабного обучения и инференса моделей, поддерживающий мультимодальность и включающий публичный репозиторий с исходным кодом и наборами предобученных крупных моделей. Проект одобрен для инкубации на «sandbox»-уровне Linux Foundation[2].
Jiuding — вычислительная платформа для поддержки инноваций в области ИИ. По состоянию на сентябрь 2022 года система обеспечивает производительность 1000P с высокоскоростным соединением до 400 Гбит/с на сервер, а также поддерживает разные архитектуры ИИ-чипов. Платформа включает собственные компиляторы кода под различные архитектуры[14].
MetaWorm — вычислительная модель нематоды Caenorhabditis elegans, симулирующая работу нервной системы червя, соединённую с цифровым «телом» в реальном времени[15]. Версия MetaWorm 1.0 демонстрирует поведение, сходное с реальным C. elegans[14].
BAAIWorm — интегративная модель нематоды Caenorhabditis elegans, сочетающая две подсистемы: модель мозга и модель взаимодействия тела и окружающей среды[16].
Emu3 — набор мультимодальных ИИ-моделей, обученных исключительно методом предсказания следующего токена на токенизированных изображениях, текстах и видео[17].
BGE (BAAI General Embedding) — серия embedding-моделей, разработанных и опубликованных Пекинской академией искусственного интеллекта[18].


