Китайский стартап в области искусственного интеллекта DeepSeek пока не определился со сроками выпуска своей модели R2, поскольку генеральный директор Лян Вэньфэн недоволен ее результатами.
Ранее в этом году агентство Reuters сообщало, что DeepSeek R2, преемник чрезвычайно популярной модели рассуждений R1 компании DeepSeek, планировалось выпустить в мае с целью повышения качества кодирования и рассуждений на языках, отличных от английского.
По данным The Information, в течение последних нескольких месяцев инженеры DeepSeek работали над усовершенствованием R2. Однако быстрое внедрение R2 может быть затруднено из-за нехватки серверных чипов Nvidia в Китае из-за экспортных правил США, о чем говорится в статье со ссылкой на сотрудников ведущих китайских облачных компаний, которые предлагают модели DeepSeek корпоративным клиентам.
Потенциальный всплеск спроса на R2 может оказаться непосильным для китайских провайдеров облачных услуг, которым необходимы передовые чипы Nvidia для запуска моделей искусственного интеллекта. DeepSeek не сразу отреагировала на просьбу Reuters прокомментировать ситуацию.
В мае 2025 года DeepSeek выпустил обновление модели R1 (версия R1-0528), которое, по данным независимого рейтинга LiveCodeBench, приблизило её по производительности в генерации кода к флагманским моделям OpenAI, превзойдя Grok 3 mini (xAI) и Qwen 3 (Alibaba) (2025-05-29).
В феврале сервис привлёк 524,7 млн новых посещений, обогнав ChatGPT, и занял 12,12% рынка чат-ботов.