Meta AI

Meta AI — подразделение компании Meta Platforms (ранее — Facebook), занимающееся разработкой технологий искусственного интеллекта, а также дополнённой и виртуальной реальности. Meta AI позиционируется как исследовательская лаборатория академического типа, ориентированная на создание новых знаний для научного сообщества в области ИИ, и не должна смешиваться с подразделением прикладного машинного обучения (AML, Applied Machine Learning) Meta, сосредоточенным на практических продуктах.

Что важно знать
Meta AI
Тип Дивизион
Основание 2015
Основатели Ян Лекун (англ. Yann LeCun); Марк Цукерберг (англ. Mark Zuckerberg); Роб Фергус (англ. Rob Fergus)
Расположение Астор-Плейс, Нью-Йорк, Нью-Йорк, США
Отрасль искусственный интеллект
Продукция LLaMA
Владелец Meta Platforms
Материнская компания Meta
Сайт ai.meta.com

История

Лаборатория была основана под названием Facebook Artificial Intelligence Research (FAIR) с офисами в Менло-Парке (Калифорния), Лондоне (Великобритания) и новым подразделением на Манхэттене. FAIR был официально объявлен в сентябре 2013 года[1]. Первым руководителем FAIR стал Ян Лекун, профессор глубокого обучения Нью-Йоркского университета и лауреат премии Тьюринга[2]. В сотрудничестве с Центром наук о данных Нью-Йоркского университета первоначальная задача FAIR заключалась в исследовании науки о данных, машинном обучении и искусственном интеллекте — «понять природу интеллекта, открыть его фундаментальные принципы и сделать машины существенно умнее»[3]. Исследования FAIR легли в основу технологий распознавания лиц, автоматического тегирования фотографий и рекомендаций пользовательских лент[4]. В 2014 году к FAIR присоединился пионер статистического обучения Владимир Вапник, одним из главных достижений которого стали метод опорных векторов и теория Вапника—Червоненкиса[5].

Центр FAIR был открыт в Париже (Франция) в 2015 году[6]. Впоследствии лаборатории были открыты в Сиэтле, Питтсбурге, Тель-Авиве, Монреале и Лондоне[7]. В 2016 году FAIR вместе с Google, Amazon, IBM и Microsoft основала Альянс по этике искусственного интеллекта — Partnership on AI, поддерживающий открытость исследований, этические практики и обсуждение принципов инклюзивности и прозрачности.

В 2018 году руководителем FAIR был назначен Жером Пезенти, бывший директор по технологиям по большим данным IBM, а Ян Лекун стал главным научным сотрудником по ИИ[8]. FAIR заняла 25-е место в мировом рейтинге ИИ-исследований 2018 года[9], поднялась на 8-е место в 2019[10] и сохранила эту позицию в 2020 году[11]. К 2018 году в FAIR работало около 200 сотрудников; к 2020 планировалось удвоить коллектив[12].

В числе ранних достижений FAIR — исследования по сетям с памятью, самосупервизированному обучению, генеративно-состязательным сетям, классификации и переводу текстов, а также компьютерное зрение[3]. В 2017 году лаборатория представила модули глубокого обучения Torch и PyTorch, открывший новые возможности для промышленного применения глубоких нейросетей, включая автопилот Tesla и фреймворк Pyro от Uber[13]. В том же году FAIR прервала проект, когда ИИ-боты разработали собственный, неинтерпретируемый для человека язык[14], вызвав волну опасений по поводу возможного выхода ИИ из-под контроля[15]. FAIR разъяснила, что эксперимент был остановлен ввиду достижения научных целей, а не из-за риска.

После ребрендинга Facebook, Inc. в Meta Platforms Inc. FAIR получила название Meta AI[16].

В 2022 году Meta AI предсказала 3D-структуру для 600 млн вероятных белков всего за две недели[17].

Характеристики и возможности

Meta AI разработан как многофункциональный ассистент с широким набором возможностей:

  • Генерация текста: может создавать различные форматы творческих текстов — стихи, код, сценарии, музыкальные произведения, электронные письма, письма и т. д.
  • Перевод на другие языки: способен переводить текст между множеством языков.
  • Ответы на вопросы: может отвечать на вопросы по самым разным темам, используя свои знания о мире.
  • Резюмирование информации: умеет кратко пересказывать объёмные тексты.
  • Интеграция с платформами Meta: Meta AI встроен в приложения Meta (WhatsApp, Instagram, Messenger, Facebook), позволяя пользователям генерировать контент и выполнять задачи изнутри приложений.
  • Генерация изображений (Emu): в ряде версий Meta AI реализована генерация изображений по текстовому описанию с помощью моделей Emu (Expressive Media Universe)[18][19].

Критика и вопросы

Как и другие крупные ИИ-модели, Meta AI сталкивается со следующими проблемами:

  • Смещение: риск отражения предвзятости, присутствующей в тренировочных данных.
  • Конфиденциальность данных: вопросы сбора и использования пользовательской информации в ИИ-интерфейсах.
  • Неверная информация: возможность генерации ошибочных или вводящих в заблуждение данных, что требует постоянного мониторинга и совершенствования[20].

Современные исследования

Обработка естественного языка и диалоговые ИИ

Эффективная коммуникация с ИИ требует, чтобы система понимала естественный язык и могла его генерировать. Meta AI ведёт разработки для улучшения таких технологий, чтобы сделать общение безопасным и эффективным независимо от родного языка пользователя[21]. Значимая задача — расширение применения обработки естественного языка (NLP) на другие языки, включая автоматический бессупервизированный перевод[22][23]. Meta AI исследует развитие диалоговых систем — обработку повторов, конкретизации, связи между репликами, формулировок вопросов[24], внедряет индивидуальность в подписывание изображений[25] и творческие формы генерации текста[26].

В ноябре 2022 года Meta AI представила Galactica — большая языковая модель для генерации научных текстов[27], которая была удалена из-за ошибок и неоднозначных высказываний[28]. Перед этим разрабатывалась версия Galactica Instruct, ориентированная на работу с LaTeX-документами на платформе Overleaf.

LLaMA

В феврале 2023 года Meta AI представила модели LLaMA (Large Language Model Meta AI) с масштабом от 7 до 65 миллиардов параметров[29]. Все модели обучались исключительно на публичных датасетах и сопоставимы по уровню с такими системами, как GPT-3 и PaLM.

Аппаратная платформа

До 2022 года Meta AI использовала для вычислений в основном CPU и собственные чипы, позже перешла на GPU Nvidia, что потребовало полной перестройки дата-центров: возросла пропускная способность сети и появились новые системы жидкостного охлаждения.

MTIA v1

MTIA v1 — первое специализированное железо Meta AI для инференса и тренировки ИИ под рекомендательные нагрузки компании. Чип произведён с применением 7-нм техпроцесса TSMC и работает на частоте 800 МГц, обеспечивая 102,4 TOPS (INT8) и 51,2 TFLOPS (FP16) при TDP 25 Вт[30].

Пользователи могут настраивать взаимодействие с функциями Meta AI: отключать бот в таких приложениях, как Facebook, Instagram, WhatsApp, или скрывать его элементы интерфейса. Для этих действий предусмотрены инструкции и настройки внутри платформ.

Доказательство математических теорем

В 2022 году Meta AI с помощью метода HyperTree Proof Search (HTPS) впервые автоматически сформировала доказательства для 10 задач Международной математической олимпиады на языке Lean[31].

С мая 2024 года чат-бот Meta AI стал кратко пересказывать новости СМИ без ссылок на оригинальные статьи, включая Канаду, где размещение медиа-контента ограничено законом. Такое использование новостей без компенсации вызвало этические и правовые споры, поскольку Meta постепенно уменьшает видимость новостей на своих площадках[32].

Применение

Meta AI предустановлен на второй версии умных очков Ray-Ban Meta с 27 сентября 2023 года как голосовой ассистент[33]. 23 апреля 2024 года объявлено о поддержке мультимодального ввода на очках Meta AI через компьютерное зрение[34]. 23 июля 2024 года компания анонсировала интеграцию Meta AI с функцией Vision в операционной системе Horizon OS на Meta Quest 3 и Quest Pro для распознавания физических объектов в режиме passthrough, заменив старый голосовой ассистент[35]. Базовая версия Meta AI работает и на Quest 2.

География доступности

Перспективы

Meta Platforms продолжает инвестировать в исследования и разработку ИИ, стремясь сделать Meta AI более мощным, безопасным и доступным для разных пользователей. Ожидаются более глубокая интеграция с оборудованием Meta (например, AR/VR-гарнитурами), усиление понимания контекста и развитие рассуждающих способностей[38].

Примечания