Groq

Groq, Inc. — американская компания в области искусственного интеллекта, разрабатывающая специализированные ускорители ИИ — интегральные схемы специального назначения (ASIC), которые компания называет Language Processing Unit (LPU, «языковой процессор»), а также сопутствующее аппаратное обеспечение для ускорения вывода (inference) ИИ-нагрузок.

К типам ИИ-задач, которые выполняются на LPU Groq, относятся: большие языковые модели (LLM), классификация изображений, обнаружение аномалий и предиктивная аналитика.

Штаб-квартира Groq расположена в Маунтин-Вью, Калифорния, офисы также находятся в Сан-Хосе, Калифорния, Либерти-Лейк, Вашингтон, Торонто, Канада, Лондон, Великобритания, а также есть удалённые сотрудники по всей Северной Америке и Европе.

История

Groq была основана в 2016 году группой бывших инженеров Google во главе с Джонатаном Россом, одним из разработчиков Tensor Processing Unit (TPU), ускорителя ИИ на базе ASIC, и Дугласом Уайтманом, предпринимателем и бывшим инженером Google X (ныне X Development), который стал первым генеральным директором компании.

Компания получила стартовое финансирование от фонда Social Capital Чамата Палихапитии — 10 млн долларов США в 2017 году, а вскоре привлекла и дополнительные инвестиции.

В апреле 2021 года Groq привлекла 300 млн долларов США в раунде C, который возглавили Tiger Global Management и D1 Capital Partners. Среди инвесторов также: The Spruce House Partnership, Addition, GCM Grosvenor, Xⁿ, Firebolt Ventures, General Global Capital, Tru Arrow Partners, а также последующие инвестиции от TDK Ventures, XTX Ventures, Boardman Bay Capital Management и Infinitum Partners. После этого раунда стоимость Groq превысила 1 млрд долларов США, что позволило компании получить статус «единорога».

1 марта 2022 года Groq приобрела компанию Maxeler Technologies, известную своими технологиями потоковой обработки данных (dataflow systems).

16 августа 2023 года Groq выбрала фабрику Samsung Electronics в Тейлор, Техас для производства своих чипов следующего поколения по 4-нм техпроцессу Samsung. Это был первый заказ на новом заводе Samsung.

19 февраля 2024 года Groq запустила платформу для разработчиков GroqCloud, чтобы привлечь разработчиков к использованию Groq API и аренде доступа к своим чипам. 1 марта 2024 года Groq приобрела Definitive Intelligence, стартап, предлагающий бизнес-решения на базе ИИ, для поддержки своей облачной платформы.

В августе 2024 года Groq привлекла 640 млн долларов США в раунде D под руководством BlackRock Private Equity Partners, что оценило компанию в 2,8 млрд долларов США[1].

В мае 2025 года Groq сообщила на своём сайте о привлечении 1,5 млрд долларов инвестиций от Королевства Саудовская Аравия (KSA)[2] и заключении соглашения с Bell Canada о расширении национальной инфраструктуры ИИ[3][4]. В сентябре 2025 года компания привлекла ещё 750 млн долларов США в новом инвестиционном раунде под руководством инвестиционной фирмы Disruptive из Далласа при участии BlackRock, Neuberger Berman, Deutsche Telekom Capital Partners и других, что увеличило оценку Groq до 6,9 млрд долларов США[5].

По состоянию на 2025 год Groq развернула десятки центров обработки данных в США, Канаде, на Ближнем Востоке и в Европе с использованием собственной технологии[6].

25 декабря 2025 года стало известно, что NVIDIA приобретёт активы Groq за $20 млрд. В самой компании Groq заявили, что компания «заключила неисключительное лицензионное соглашение с NVIDIA на технологии инференса» и что основатель и генеральный директор Groq Джонатан Росс (Jonathan Ross), а также президент компании Санни Мадра (Sunny Madra) и другие высокопоставленные сотрудники «присоединятся к NVIDIA, чтобы помочь продвижению и масштабированию лицензированной технологии». При этом Groq продолжит свою деятельность как независимая компания под руководством Саймона Эдвардса (Simon Edwards)[7].

В марте 2026 года Groq увеличил заказ на производство ИИ-чипов у Samsung более чем в 1,5 раза[8].

Language Processing Unit

undefined

Изначально собственная ASIC Groq называлась Tensor Streaming Processor (TSP, «тензорный потоковый процессор»), но позднее была переименована в Language Processing Unit (LPU, «языковой процессор»)[9].

LPU характеризуется функционально разделённой микроархитектурой, в которой модули памяти чередуются с векторными и матричными вычислительными блоками. Такой подход позволяет эффективно использовать локальность потоков данных в вычислительных графах ИИ, повышая производительность и эффективность. Архитектура LPU основана на двух ключевых принципах:

  1. ИИ-нагрузки обладают значительным параллелизмом данных, который можно эффективно реализовать на специализированном оборудовании, что приводит к росту производительности.
  2. Детерминированная архитектура процессора в сочетании с моделью программирования производитель–потребитель позволяет точно управлять аппаратными компонентами и оптимизировать производительность и энергопотребление.

Помимо функционально разделённой микроархитектуры, LPU также отличается однопроцессорной, детерминированной архитектурой. Достижение детерминированного исполнения обеспечивается отказом от традиционных реактивных аппаратных компонентов (предсказатели переходов, арбитры, буферы переупорядочивания, кэши) и передачей полного управления исполнением компилятору, что гарантирует детерминизм выполнения программ на LPU.

Первое поколение LPU (LPU v1) обеспечивает вычислительную плотность более 1 TeraOp/с на квадратный миллиметр кристалла для чипа размером 25×29 мм, изготовленного по 14-нм техпроцессу и работающего на частоте 900 МГц. Второе поколение LPU (LPU v2) будет выпускаться по 4-нм техпроцессу Samsung.

Производительность

Groq стала первым поставщиком API, преодолевшим порог генерации 100 токенов в секунду при работе с моделью Meta Llama2-70B.

В настоящее время Groq предоставляет публичный доступ к различным открытым большим языковым моделям, работающим на её LPU. Доступ к демо-версиям возможен через сайт компании. Производительность LPU при работе с этими LLM была независимо протестирована ArtificialAnalysis.ai и сравнена с другими поставщиками LLM. Измеренные показатели приведены в таблице ниже:[10]

Производительность LPU Groq на LLM
Название модели Токенов/сек (T/s) Задержка (сек)
Llama 4 Maverick 520 T/s 0,2
Llama 4 Scout 433 T/s 0,2
Llama 3.3 70B 369 T/s 0,2
Gemma 2 9B 926 T/s 0,2
Llama 3.1 8B 667 T/s 0,2
Kimi K2 0905 360 T/s 0,3
Kimi K2 322 T/s 0,3
GPT-OSS 20B 1116 T/s 0,2
GPT-OSS 120B 484 T/s 0,2
Qwen3 32B 443 T/s 0,2
DeepSeek R1

Distill Llama 70B

271 T/s 0,2

Примечания

Ссылки