Groq
Groq, Inc. — американская компания в области искусственного интеллекта, разрабатывающая специализированные ускорители ИИ — интегральные схемы специального назначения (ASIC), которые компания называет Language Processing Unit (LPU, «языковой процессор»), а также сопутствующее аппаратное обеспечение для ускорения вывода (inference) ИИ-нагрузок.
К типам ИИ-задач, которые выполняются на LPU Groq, относятся: большие языковые модели (LLM), классификация изображений, обнаружение аномалий и предиктивная аналитика.
Штаб-квартира Groq расположена в Маунтин-Вью, Калифорния, офисы также находятся в Сан-Хосе, Калифорния, Либерти-Лейк, Вашингтон, Торонто, Канада, Лондон, Великобритания, а также есть удалённые сотрудники по всей Северной Америке и Европе.
История
Groq была основана в 2016 году группой бывших инженеров Google во главе с Джонатаном Россом, одним из разработчиков Tensor Processing Unit (TPU), ускорителя ИИ на базе ASIC, и Дугласом Уайтманом, предпринимателем и бывшим инженером Google X (ныне X Development), который стал первым генеральным директором компании.
Компания получила стартовое финансирование от фонда Social Capital Чамата Палихапитии — 10 млн долларов США в 2017 году, а вскоре привлекла и дополнительные инвестиции.
В апреле 2021 года Groq привлекла 300 млн долларов США в раунде C, который возглавили Tiger Global Management и D1 Capital Partners. Среди инвесторов также: The Spruce House Partnership, Addition, GCM Grosvenor, Xⁿ, Firebolt Ventures, General Global Capital, Tru Arrow Partners, а также последующие инвестиции от TDK Ventures, XTX Ventures, Boardman Bay Capital Management и Infinitum Partners. После этого раунда стоимость Groq превысила 1 млрд долларов США, что позволило компании получить статус «единорога».
1 марта 2022 года Groq приобрела компанию Maxeler Technologies, известную своими технологиями потоковой обработки данных (dataflow systems).
16 августа 2023 года Groq выбрала фабрику Samsung Electronics в Тейлор, Техас для производства своих чипов следующего поколения по 4-нм техпроцессу Samsung. Это был первый заказ на новом заводе Samsung.
19 февраля 2024 года Groq запустила платформу для разработчиков GroqCloud, чтобы привлечь разработчиков к использованию Groq API и аренде доступа к своим чипам. 1 марта 2024 года Groq приобрела Definitive Intelligence, стартап, предлагающий бизнес-решения на базе ИИ, для поддержки своей облачной платформы.
В августе 2024 года Groq привлекла 640 млн долларов США в раунде D под руководством BlackRock Private Equity Partners, что оценило компанию в 2,8 млрд долларов США[1].
В мае 2025 года Groq сообщила на своём сайте о привлечении 1,5 млрд долларов инвестиций от Королевства Саудовская Аравия (KSA)[2] и заключении соглашения с Bell Canada о расширении национальной инфраструктуры ИИ[3][4]. В сентябре 2025 года компания привлекла ещё 750 млн долларов США в новом инвестиционном раунде под руководством инвестиционной фирмы Disruptive из Далласа при участии BlackRock, Neuberger Berman, Deutsche Telekom Capital Partners и других, что увеличило оценку Groq до 6,9 млрд долларов США[5].
По состоянию на 2025 год Groq развернула десятки центров обработки данных в США, Канаде, на Ближнем Востоке и в Европе с использованием собственной технологии[6].
25 декабря 2025 года стало известно, что NVIDIA приобретёт активы Groq за $20 млрд. В самой компании Groq заявили, что компания «заключила неисключительное лицензионное соглашение с NVIDIA на технологии инференса» и что основатель и генеральный директор Groq Джонатан Росс (Jonathan Ross), а также президент компании Санни Мадра (Sunny Madra) и другие высокопоставленные сотрудники «присоединятся к NVIDIA, чтобы помочь продвижению и масштабированию лицензированной технологии». При этом Groq продолжит свою деятельность как независимая компания под руководством Саймона Эдвардса (Simon Edwards)[7].
В марте 2026 года Groq увеличил заказ на производство ИИ-чипов у Samsung более чем в 1,5 раза[8].
Language Processing Unit
Изначально собственная ASIC Groq называлась Tensor Streaming Processor (TSP, «тензорный потоковый процессор»), но позднее была переименована в Language Processing Unit (LPU, «языковой процессор»)[9].
LPU характеризуется функционально разделённой микроархитектурой, в которой модули памяти чередуются с векторными и матричными вычислительными блоками. Такой подход позволяет эффективно использовать локальность потоков данных в вычислительных графах ИИ, повышая производительность и эффективность. Архитектура LPU основана на двух ключевых принципах:
- ИИ-нагрузки обладают значительным параллелизмом данных, который можно эффективно реализовать на специализированном оборудовании, что приводит к росту производительности.
- Детерминированная архитектура процессора в сочетании с моделью программирования производитель–потребитель позволяет точно управлять аппаратными компонентами и оптимизировать производительность и энергопотребление.
Помимо функционально разделённой микроархитектуры, LPU также отличается однопроцессорной, детерминированной архитектурой. Достижение детерминированного исполнения обеспечивается отказом от традиционных реактивных аппаратных компонентов (предсказатели переходов, арбитры, буферы переупорядочивания, кэши) и передачей полного управления исполнением компилятору, что гарантирует детерминизм выполнения программ на LPU.
Первое поколение LPU (LPU v1) обеспечивает вычислительную плотность более 1 TeraOp/с на квадратный миллиметр кристалла для чипа размером 25×29 мм, изготовленного по 14-нм техпроцессу и работающего на частоте 900 МГц. Второе поколение LPU (LPU v2) будет выпускаться по 4-нм техпроцессу Samsung.
Groq стала первым поставщиком API, преодолевшим порог генерации 100 токенов в секунду при работе с моделью Meta Llama2-70B.
В настоящее время Groq предоставляет публичный доступ к различным открытым большим языковым моделям, работающим на её LPU. Доступ к демо-версиям возможен через сайт компании. Производительность LPU при работе с этими LLM была независимо протестирована ArtificialAnalysis.ai и сравнена с другими поставщиками LLM. Измеренные показатели приведены в таблице ниже:[10]
| Название модели | Токенов/сек (T/s) | Задержка (сек) |
|---|---|---|
| Llama 4 Maverick | 520 T/s | 0,2 |
| Llama 4 Scout | 433 T/s | 0,2 |
| Llama 3.3 70B | 369 T/s | 0,2 |
| Gemma 2 9B | 926 T/s | 0,2 |
| Llama 3.1 8B | 667 T/s | 0,2 |
| Kimi K2 0905 | 360 T/s | 0,3 |
| Kimi K2 | 322 T/s | 0,3 |
| GPT-OSS 20B | 1116 T/s | 0,2 |
| GPT-OSS 120B | 484 T/s | 0,2 |
| Qwen3 32B | 443 T/s | 0,2 |
| DeepSeek R1
Distill Llama 70B |
271 T/s | 0,2 |