Китайская DeepSeek выпускает новую ИИ-модель V4 на фоне ускорения гонки ИИ
Китайская компания в сфере искусственного интеллекта DeepSeek представила предварительную версию своей новой крупной языковой модели V4 по мере того, как мировая гонка ИИ набирает обороты.

В прошлом году DeepSeek стала одной из наиболее пристально отслеживаемых компаний в сфере ИИ после того, как в январе 2025-го выпустила модели, которые, по всей видимости, обеспечивали высокую производительность при меньших затратах, чем многие американские конкуренты, передает euronews.com
Стартап из Ханчжоу выпустил модель в двух вариантах: DeepSeek V4-Pro и DeepSeek V4-Flash. V4-Pro — более крупная модель, рассчитанная на более требовательные задачи, тогда как V4-Flash — облегчённая версия, разработанная для более быстрого отклика и снижения затрат на её работу.
«В тестах на знания о мире DeepSeek V4-Pro существенно опережает другие открытые модели и лишь немного уступает топовой закрытой модели Gemini-3.1-Pro», — заявили в DeepSeek.
В компании сообщили, что новая модель ИИ поддерживает «контекст длиной в один миллион токенов», то есть способна воспринимать гораздо более объёмные запросы — например, длинные документы или код — перед тем, как сформировать ответ.
В сфере ИИ «длина контекста» означает объём текста, измеряемый в токенах, который модель может учитывать за один раз. Более широкое окно контекста позволяет модели обрабатывать более длинные запросы и включать больше информации в каждый ответ, поясняют в IBM.
«Добро пожаловать в эпоху экономичного контекста на 1 млн токенов», — заявили в компании в анонсе на платформе открытого ИИ Hugging Face.
В DeepSeek добавили, что V4 обеспечивает «мировой уровень при работе с длинным контекстом при резко сниженных затратах на вычисления и память».
Компания сравнила V4-Pro с конкурирующими моделями OpenAI, Anthropic и Google, хотя в ряде тестов более высокие результаты показала Gemini-3.1-Pro от Google.
Новую модель можно использовать с популярными ИИ-агентами, такими как Claude Code, OpenClaw и OpenCode, что позволяет разработчикам применять её для задач по разработке программного обеспечения за пределами фирменного чат-бота DeepSeek.
Известная более открытым подходом по сравнению с конкурентами, использующими закрытые модели ИИ, DeepSeek также выложила V4 на Hugging Face — модель можно свободно скачивать, тестировать и адаптировать.
Китайский стартап привлёк внимание в конце 2024 года благодаря своей открытой модели V3, которая удивила индустрию ИИ высокой производительностью при более низкой стоимости и работе на менее мощных чипах, чем у многих американских конкурентов, включая OpenAI и Google.
Глобальная гонка ИИ
Компания привлекла внимание во всём мире в январе 2025 года, когда выпустила R1 — модель ИИ для логических рассуждений, которая, по её утверждению, была дешевле и не уступала по качеству крупным языковым моделям ChatGPT от конкурирующей OpenAI.
Однако в ряде стран в прошлом году госучреждениям запретили пользоваться DeepSeek, в их числе Италия, США и Южная Корея, сославшись на соображения национальной безопасности.
В 2025 году Германия также запретила DeepSeek в магазинах приложений Apple и Google, указав на незаконную передачу пользовательских данных в Китай.
Выход V4 состоялся спустя день после того, как американский гигант ИИ OpenAI представил свою новейшую модель GPT-5.5, которую назвал «самой умной и интуитивной» на сегодняшний день.
Запуск также последовал спустя день после того, как Белый дом обвинил Китай в краже интеллектуальной собственности американских лабораторий ИИ в промышленных масштабах с использованием тысяч подставных аккаунтов.
OpenAI, Anthropic и Google предупредили в этом году, что китайские компании в сфере ИИ, включая DeepSeek, осуществляют атаки по извлечению моделей (model extraction attacks, MEA), иначе называемые «дистилляцией».
Этот метод подразумевает, что более крупной модели задают тысячи вопросов, собирают её ответы и используют их, чтобы обучить новую, более компактную модель «думать» аналогичным образом.