Nvidia Drive
Nvidia Drive — компьютерная платформа компании Nvidia, предназначенная для реализации функций автономного управления автомобилем и систем помощи водителю, основанных на глубоком обучении[1][2]. Платформа была представлена на выставке Международной выставке потребительской электроники (CES) в Лас-Вегасе в январе 2015 года[3]. Улучшенная версия, Drive PX 2, была представлена на CES год спустя, в январе 2016 года[4].
Близкая к платформе программная экосистема-референс в определённый момент получила бренд NVIDIA DRIVE Hyperion с указанием номера ревизии, что позволяло сопоставить её с поколением аппаратного обеспечения и заказывать готовые комплекты по этим названиям. Ранее использовались термины Nvidia Drive SDK (набор для разработчиков) и включаемый в него Nvidia Drive OS (системное программное обеспечение), распространявшийся с отладочными платформами или доступный для загрузки с целью обновления и смены операционной системы.
Аппаратное обеспечение и полупроводники
Первый автономный чип Nvidia был представлен на выставке CES 2015 и основывался на графической архитектуре Maxwell[5]. Линейка платформ включала два решения:
Drive CX базировалась на одном Tegra X1 SoC и предназначалась как компьютер цифровой кабины, предоставляя расширенный функционал отображения приборов, навигации и мультимедиа. Ранние пресс-релизы Nvidia сообщали, что плата Drive CX могла комплектоваться либо Tegra K1, либо Tegra X1[6].
Первая версия Drive PX основана на двух SoC Tegra X1 и являлась начальной платформой для разработки систем (полу-)автономного вождения.
Платформы Drive PX на базе графической архитектуры Pascal были анонсированы на CES 2016 года[7]. В этот раз была представлена только новая версия Drive PX, но в нескольких конфигурациях.
Платформа Nvidia Drive PX 2 основана на одном или двух SoC Tegra X2, в каждом из которых реализованы 2 ядра Denver, 4 ядра ARM A57 и графический процессор поколения Pascal[8]. Существуют две основные конфигурации:
- AutoCruise: 1× Tegra X2 + 1 GPU Pascal
- AutoChauffeur: 2× Tegra X2 + 2 GPU Pascal
Для полной автономности, по замыслу Nvidia, предусматривается объединение нескольких плат AutoChauffeur с помощью интерфейсов UART, CAN, LIN, FlexRay, USB, Ethernet 1/10 Гбит/с и др. Также для кастомных PCB можно связать процессоры Tegra X2 посредством PCIe-бриджа, согласно открыто доступным схемам.
Все автомобили Tesla Motors, выпущенные с середины октября 2016 года, оснащаются Drive PX 2, который используется для машинного обучения нейронных сетей, управляющих функциями автопилота Tesla и полностью автономного вождения[9]. Drive PX 2 применялся также в Roborace[10]. Анализ блока управления Tesla выявил использование модифицированной однокристальной Drive PX 2 AutoCruise с отдельным графическим процессором GP106 в виде MXM-модуля. Маркировка чипа указывала на CPU SoC Tegra X2 Parker[11][12].
Системы на базе Volta и Turing были впервые представлены на CES 2017[13]. Изначально название платформы оставалось Drive PX, но затем её переименовали в DRIVE AGX.
Первая система Drive PX с архитектурой Volta была представлена на CES 2017 как Xavier AI Car Supercomputer[13]. На CES 2018 она была переименована в Drive PX Xavier[14][15]. Предполагалось, что SoC Xavier иметь сопоставимую вычислительную мощность с Drive PX 2 Autochauffeur[16], однако позже производительность была скорректирована — на 50 % выше Drive PX 2 Autochauffeur[13]. Drive PX Xavier выдаёт 30 INT8 TOPS при энергопотреблении 30 Вт[17]. Это распределяется между двумя блоками: iGPU на 20 INT8 TOPS и специализированный DLA на 10 INT8 TOPS.
В октябре 2017 года Nvidia и партнёры представили систему Drive PX Pegasus — на ней два CPU/iGPU Xavier и два дискретных ускорителя поколения Turing. Эта версия позиционировалась как решение для автономии 5 уровня, с совокупной мощностью 320 INT8 TOPS ИИ-вычислений и TDP 500 Вт[18][19].
Линейка плат Drive AGX Orin была анонсирована 18 декабря 2019 года на конференции GTC China 2019[20]. 14 мая 2020 года Nvidia официально объявила о переходе Orin на микроархитектуру Ampere и начале отгрузки для производителей в 2021 (с серийным выпуском в 2022 году)[21]. В перспективе ожидаются варианты на SoC семейства Tegra Orin.
О выпуске SoC под кодовым названием Atlan Nvidia объявила 12 апреля 2021 года на GTC 2021[22].
20 сентября 2022 года компания сообщила об отмене Atlan, который должен был комплектоваться CPU Grace-Next и GPU на базе архитектуры Ada Lovelace; новым флагманом стал SoC Thor[23].
Платформа Nvidia DRIVE AGX Thor анонсирована 20 сентября 2022 года[24]. DRIVE AGX Thor оснащена CPU Arm Neoverse V3AE[24] и GPU на архитектуре Blackwell, официально представленной 18 марта 2024 года[25]. Поддерживается 8-битная плавающая точка (FP8), производительность составляет 1000 Sparse INT8 TOPS, 1000 Sparse FP8 TFLOPS или 500 Sparse FP16 TFLOPS[26]. Два SoC Thor можно объединять через NVLink-C2C[24].
Платформу DRIVE AGX Thor собираются использовать китайские автопроизводители BYD, Hyper, XPENG, Li Auto и ZEEKR[27]. Первый серийный автомобиль с SoC DRIVE AGX Thor — Lynk & Co 900[28].
Программное обеспечение и комплектация
С брендом Hyperion[29] Nvidia продвигает массовые референс-решения, позволяющие другим производителям быстро тестировать комплекс и строить собственные автомобильные продукты на его базе. Особое значение имеет богатое ПО базовой системы, ускоряющее разработку прикладных решений сторонними компаниями: например, DeepRoute.ai публично заявила о выборе этой платформы[30]. Вся система строится вокруг UNIX/Posix-совместимых сред (Linux[31], Android[32], QNX/DRIVE OS), со специализированной поддержкой аппаратных интерфейсов и драйверов (CUDA, Vulkan, камеры, лидары, CAN и др.). Основной набор ПО разработчика объединён под названием Drive SDK, включающим DRIVE OS, DriveWorks, DRIVE AV и DRIVE IX[33].
| Версия Hyperion |
Анонсировано | Последний чип |
Начало испытаний |
Целевой кейс | Полупроводники | Референс-платформы/наборы разработчика | Версия DRIVE OS | Поддержка датчиков |
|---|---|---|---|---|---|---|---|---|
| 7.1[34] | 2020 | Автономное вождение уровня 2+ | Xavier, Turing GPU | DRIVE AGX Xavier, DRIVE AGX Pegasus |
внешние: 7 камер, 8 радаров; внутри салона: 1 камера | |||
| 8[35][31] | 2020 | Xavier, Turing GPU | DRIVE AGX Xavier, DRIVE AGX Pegasus |
5.0.13.2 (linux) | внешние: 12 камер, 9 радаров, 1 лидар | |||
| 8.1[35] | 2022 | ожидается в 2024 | Orin, Xavier, Turing GPU | DRIVE AGX Orin, DRIVE AGX Pegasus, DRIVE Hyperion 8.1 Developer Kits[36] |
Orin: 6.0 (до 6.0.4) Xavier/Pegasus: 5.2.6[33] |
внешние: 12 камер, 9 радаров, 1 лидар | ||
| 9[35][37] | март 2022 | 2024 | ожидается в 2026 | Atlan (отменено) | внешние: 14 камер, 9 радаров, 3 лидара, 20 ультразвуковых; внутренние: 3 камеры, 1 радар |
Сравнение наборов разработчика
| Платформа Nvidia | Drive CX | Drive PX | Drive PX 2 AutoCruise | Drive PX 2 (Tesla HW2) | Drive PX 2 AutoChauffeur | Drive PX 2 (Tesla HW2.5) | DRIVE AGX Xavier[15] | DRIVE AGX Pegasus[18] | DRIVE AGX Orin[38][20] | DRIVE AGX Pegasus OA (отменено)[39] | DRIVE Atlan (отменено) | DRIVE AGX Thor |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Граф. архитектура | Maxwell (28 нм) | Pascal (16 нм) | Volta (12 нм) Turing (12 нм) |
Ampere (8 нм[40]) | Ada Lovelace (TSMC 4N) | Blackwell (TSMC 4NP[41]) | ||||||
| Анонсировано | Январь 2015 | Сентябрь 2016[42] | Октябрь 2016[43] | Январь 2016 | Август 2017[44] | Январь 2017 | Октябрь 2017 | Декабрь 2019 | Апрель 2021[45] | Сентябрь 2022[46] | ||
| Выпуск | ? | ? | ? | ? | ? | ? | Октябрь 2018[47] | ? | 2022[48] | Отменено | Отменено[23] | 2025[46] |
| Чипы | 1× Tegra X1 | 2× Tegra X1 | 1× Tegra X2 (Parker) + 1× Pascal dGPU |
2× Tegra X2 (Parker) + 2× Pascal dGPU |
2× Tegra X2 (Parker) + 1× Pascal dGPU[49] |
1× Xavier[50] | 2× Xavier + 2× Turing T4 dGPU |
1× Orin | 1× Orin + 1× A100 dGPU |
?× Grace-Next CPU[45] + ?× Ada Lovelace GPU[23] |
1× Neoverse V3AE CPU[24] + 1× Blackwell GPU[25] | |
| CPU | 4 Cortex A57 4 Cortex A53 |
2×4 Cortex A57 2×4 Cortex A53 |
2 ядра Denver 4 Cortex A57 |
2×2 Denver 2×4 Cortex A57 |
2×2 Denver 2×4 Cortex A57 |
8 ядер Carmel[50] | 2×8 Carmel | 12 Cortex A78AE | ?-ядер Grace-Next[45] | 14 ядер Neoverse V3AE[24] | ||
| iGPU | 1× 2 SMM Maxwell iGPU (256 CUDA ядер) | 2× 2 SMM Maxwell iGPU (256 CUDA ядер) | 1× Parker iGPU (256 CUDA ядер)[11] | 2× Parker iGPU (256 CUDA ядер) | 2× Parker iGPU (256 CUDA ядер)[44][49] | 1× Volta iGPU (512 CUDA ядер)[50] |
2× Volta iGPU (512 CUDA ядер) |
1× Ampere iGPU (2048 CUDA ядер) |
?× Ada Lovelace GPU[23] | 1× Blackwell iGPU[25] (2560 CUDA ядер) | ||
| dGPU | н/д | н/д | 1× 2 SM Pascal dGPU (1280 CUDA ядер) на MXM[11] | 2× 2 SM Pascal dGPU (1280 CUDA ядер) на MXM[51] | 1× 2 SM Pascal dGPU (1280 CUDA ядер)[44][49] | н/д | 2× Turing dGPU (2560 CUDA ядер) |
н/д | 1× Ampere dGPU | н/д | ||
| NPU | н/д | н/д | н/д | н/д | н/д | н/д | 1× DLA | 2× DLA | 1× DLA | ? | н/д | |
| Визион-ускоритель | н/д | н/д | н/д | н/д | н/д | н/д | 1× PVA[50] | 2× PVA | 1× PVA | ? | 1× PVA | |
| Память | ? | ? | 8 ГБ LPDDR4 4 ГБ GDDR5 (dGPU)[52] |
2×8 ГБ LPDDR4 2×4 ГБ GDDR5 (dGPU)[52] |
2×8 ГБ LPDDR4 4 ГБ GDDR5 (dGPU) |
16 ГБ LPDDR4[50] | 2×16 ГБ LPDDR4 2×16 ГБ GDDR6 (dGPU) |
32 ГБ LPDDR5 | 32 ГБ LPDDR5 80 ГБ HBM2e (dGPU) |
? | 128 ГБ LPDDR5X | |
| Хранилище | ? | ? | 64 ГБ eMMC[52] | ? | 128 ГБ eMMC[52] | ? | ? | ? | 256 ГБ | ? | ? | |
| Sparse производительность | н/д | н/д | н/д | н/д | н/д | н/д | н/д | н/д | 167 INT8 TOPS (iGPU) 87 INT8 TOPS (DLA) |
900 INT8 TOPS (dGPU) 167 INT8 TOPS (iGPU) 87 INT8 TOPS (DLA) |
1000 INT8 TOPS (всего)[23] | 1000 INT8 TOPS, 1000 FP8 TFLOPS, 500 FP16 TFLOPS (всего)[46] |
| Dense производительность | 1 FP16 TFLOPS (iGPU) | 2× 1 FP16 TFLOPS (iGPU) | 10-12 INT8 TOPS (всего) 4 FP32 TFLOPS[53][54] |
20-24 INT8 TOPS 16 FP16 TFLOPS 8 FP32 TFLOPS[53][54] |
10-12 INT8 TOPS 4 FP32 TFLOPS[53][54] |
20 INT8 TOPS, 1,3 FP32 TFLOPS (iGPU) 10 INT8 TOPS, 5 FP16 TFLOPS (DLA) 1,6 TOPS (PVA)[55][50] |
2×130 INT8 TOPS (dGPU) 2×20 INT8 TOPS (iGPU) 2×10 INT8 TOPS (DLA) 2×1,6 TOPS (PVA)[56] |
83,5 INT8 TOPS (iGPU) 43,5 INT8 TOPS (DLA) |
450 INT8 TOPS (dGPU) 83,5 INT8 TOPS (iGPU) 43,5 INT8 TOPS (DLA) |
500 INT8 TOPS[23] | 500 INT8 TOPS, 500 FP8 TFLOPS, 250 FP16 TFLOPS (всего)[46] | |
| Энергопотребление | ? | 20 Вт[54] | 40 Вт SoC: 10 Вт[42] |
80 Вт[57][58][54][59] SoC: 20 Вт[42] |
60 Вт[57][58][54] SoC: 20 Вт[42] |
30 Вт[50] | 500 Вт[56] | 100 Вт | ? | ? | ? | |
Примечание: dGPU и память — отдельные чипы; остальные блоки (ARM CPU, iGPU, DLA, PVA) интегрированы в основной процессор. Tesla 2.0 и 2.5 — товарные модификации, а не комплекты разработчика.