DeepSeek — китайская лаборатория искусственного интеллекта[2], специализирующаяся на разработке открытого программного обеспечения для различных языковых моделей. Финансирование осуществляется через хедж-фонд High-Flyer, основанный и управляемый Лян Вэньфэном[3]. Штаб-квартира расположена в Ханчжоу, провинция Цзянсу, Китай.
Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd. была образована в мае 2023 года[6]. Основателем компании является Лян Вэньфэн, который ранее учредил хедж-фонд High-Flyer в 2015 году[7]. Одним из основных спонсоров стала китайская инвесткомпания Huanfang[8].
В 2021 году у High-Flyer накопилось около 10 тыс. графических процессоров (GPU), именно они использовались для тренировки и анализа больших данных[9]. В условиях международных санкций против китайских технологий в 2023 году Лян Вэньфэн выделил направление искусственного интеллекта как самостоятельное подразделение. Как говорят эксперты, DeepSeek была создана для разработки доступных и эффективных решений в области ИИ, модель компании основывается на использовании существующих вычислительных мощностей и открытого исходного кода[10].
Первой самостоятельной моделью DeepSeek, представленной в ноябре 2023 года, стал DeepSeek Coder[11]. Код модели был выпущен под лицензией MIT. Позже DeepSeek предложила конкурентоспособные цены на услуги API и привлекла интерес стартапов и разработчиков.
В феврале 2025 года китайский автопроизводитель Dongfeng Motor пообещал постепенно установит приложение DeepSeek на некоторые модели своих автомобилей, такие, как Dongfeng Mengshi, Dongfeng Yipai, Dongfeng Fengshen и Dongfeng Nano[12].
8 февраля 2025 года китайские информационные агентства сообщили, что автопроизводитель Dongfeng Motor снабдит часть своих моделей ассистентом DeepSeek. Приложение появится в модельных линейках Mengshi (M-Hero), Yipai (eπ), Fengshen (Aeolus) и Nano (Nammi)[13].
В 2025 году Nissan N7 укомплектовали ассистентом DeepSeek. По данным издания Cnevpost, электрокар стал первой на рынке КНР моделью иностранного бренда, в которую интегрировали эту технологию[14].
В марте 2025 года стало известно, что основатель компании Лян Вэньфэн отказался от привлечения внешних вложений, чтобы избежать влияния инвесторов на политику DeepSeek и «сохранить дух научного проекта». По информации The Wall Street Journal, ранее руководство компании вело переговоры о возможном сотрудничестве с такими крупными китайскими технологическими компаниями как Tencent и Alibaba[15].
В марте 2025 года DeepSeek начали встраивать в китайские автомобили: в мультимедийную систему кроссоверов Zhiyin марки Voyah, с апреля 2025 года аналогичные возможности получит внедорожник M-Hero 917[16].
В 2025 году DeepSeek представила новые версии своих моделей, включая DeepSeek V3, которая основана на концепции «жюри экспертов». Этот подход обеспечивает высокую производительность за счёт активного взаимодействия нескольких моделей, каждая из которых вносит свой вклад в окончательный ответ. Использование «жюри экспертов» позволяет более точно и быстро решать задачи, требующие глубокого анализа и многослойного подхода. Кроме того, новые модели демонстрируют улучшенную эффективность использования вычислительных ресурсов, что способствует снижению затрат на обучение и эксплуатацию.
DeepSeek применяет несколько ключевых технологий и архитектур в своих решениях[17]:
Многоуровневая внимательность Multi-head Latent Attention (MLA), такая архитектура позволяет значительно сократить затраты на обучение моделей, повышая их производительность.
Модели с множеством экспертов (Mixture of Experts, MoE). Использование этой концепции позволяет моделям более эффективно обрабатывать запросы путём активации только части параметров, что делает их более экономичными.
DeepSeek конкурирует на рынке искусственного интеллекта с крупными компаниями, такими как OpenAI (ChatGPT), Google, Microsoft и Anthropic[18]. С момента своего основания в 2023 году компания предложила модели, которые обеспечивают высокую производительность при минимальных затратах. Использование концепции «жюри экспертов» и архитектуры многоуровневого внимания позволило DeepSeek улучшить обработку сложных запросов. В 2025 году DeepSeek достигла рекордов по количеству скачиваний своих приложений в США[19], что привело к падению акций компаний, таких как Nvidia[20], и вызвало обеспокоенность среди инвесторов. Не исключено, что OpenAI и Google вскоре придётся сильно снижать цены на свои услуги[21].
28 января 2025 года акции технологических компаний и ведущие индексы в Азии продолжили падение с учетом новостей о запуске новой модели ИИ китайской компании DeepSeek. Токийский индекс Nikkei упал на 1,4 %, наибольшие потери понесли акции SoftBank (более 5,2 %). Акции других японских производителей микропроцессоров также снизились. В то же время в Гонконге китайские технологические компании несколько подросли, за исключением SMIC, акции которого упали на 0,4 %. Индекс Hang Seng увеличился на 0,2 %, благодаря росту акций Tencent, Alibaba и Baidu[22].
20 мая 2025 года стало известно, что китайская компания DeepSeek, разработчик больших языковых моделей, стала объектом внимания российского IT-гиганта «Яндекс»[23]. В годовом отчете за 2024 год, опубликованном 30 апреля, «Яндекс» впервые включил разработки DeepSeek в список потенциальных рисков для своего бизнеса. Компания отметила, что модель DeepSeek, выпущенная с открытым исходным кодом и отличающаяся низкими затратами на вычислительные ресурсы, может существенно повлиять на конкурентную среду, особенно в области дообучения ИИ-моделей. Несмотря на успешное развитие собственных решений, таких как YandexGPT 5, «Яндекс» допустил, что появление новых моделей конкурентов может привести к отставанию и переходу пользователей к альтернативным платформам[24].
Несмотря на успех, DeepSeek сталкивается с критическими замечаниями[25]:
Предвзятость. Сообщения о том, что модели не всегда могут ответить на вопросы, касающиеся политических аспектов или чувствительных тем, вызывают опасения по поводу их нейтральности.
Поддержка государства. Существуют подозрения, что проект может получать косвенную поддержку со стороны правительства Китая, что поднимает вопросы о независимости его разработки.
Находящаяся в Нью-Йорке компания по кибербезопасности Wiz заявила, что сканирование инфраструктуры DeepSeek показало, что компания случайно оставила более миллиона строк данных незащищенными. В их число вошли цифровые программные ключи и журналы чатов, которые, по-видимому, фиксировали подсказки, отправляемые пользователями бесплатному помощнику искусственного интеллекта[26].
В феврале 2025 года власти США инициировали расследование в отношении DeepSeek. В США выясняют, могла ли китайская компания получить полупроводники Nvidia Corp. через Сингапур, чтобы обойти ограничения США на продажу чипов[27].
По данным агентства ANSA, к конце января чат-бот DeepSeek заблокировали власти Италии. Ограничение принято для защиты данных итальянских пользователей[28].
В начале февраля 2025 года правительство Австралии запретило госслужащим использовать чат-бот DeepSeek, чиновникам предписано удалить приложение со всех выданных государственными учреждениями устройств[29].
В марте 2025 года президиум Фолькетинга (парламента Дании) запретил сотрудникам пользоваться чат-ботом с искусственным интеллектом DeepSeek на устройствах, предоставляемых парламентом[30].
16 апреля 2025 года газета The New York Times сообщила, что администрация президента США Дональда Трампа рассматривает меры по блокировке доступа американцев к чат-боту китайской компании DeepSeek. Также изучается возможность запрета для DeepSeek на приобретение американских технологий, включая чипы для искусственного интеллекта. Кроме того, власти США проверяют, не нарушала ли DeepSeek действующие ограничения на покупку американских микросхем. По данным NYT, эти действия связаны с опасениями по поводу конкурентоспособности китайского чат-бота DeepSeek R1, который, по заявлениям разработчиков, превосходит ChatGPT и был создан с использованием меньших ресурсов[31].
10 февраля 2025 года в Роспатент были поданы заявки от Hangzhou DeepSeek Artificial Intelligence Co. на товарные знаки. DeepSeek решил зарегистрировать свой бренд в России в двух вариантах — словесном и изобразительном[32].