🪴 Pustoe

Last updated Jan 22, 2025 Edit Source

https://www.deepseek.com

DeepSeek — китайская компания, специализирующаяся на разработке передовых моделей искусственного интеллекта, включая DeepSeek-V3 и DeepSeek-R1, которые конкурируют с ведущими мировыми аналогами.

DeepSeek, основанная в 2023 году в Ханчжоу, Китай, занимается созданием крупных языковых моделей (LLM) с открытым исходным кодом.

В декабре 2024 года компания представила DeepSeek-V3 — модель с 671 миллиардами параметров, использующую архитектуру Mixture-of-Experts (MoE). Эта модель демонстрирует производительность, сопоставимую с GPT-4o и Claude-3.5-Sonnet, и превосходит Llama 3.1 и Qwen 2.5.

В ноябре 2024 года DeepSeek выпустила DeepSeek-R1-Lite, ориентированную на задачи, требующие логических рассуждений и математического мышления. Модель показала результаты, сопоставимые с OpenAI o1 на бенчмарках AIME и MATH.

Компания также разработала DeepSeek Coder — инструмент, помогающий разработчикам создавать React-приложения с использованием естественного языка, что упрощает процесс разработки и повышает производительность.

Инновации DeepSeek направлены на демократизацию искусственного интеллекта, делая передовые модели доступными для широкого круга пользователей и способствуя развитию технологий с открытым исходным кодом.

DeepSeek

🪴 Pustoe

Backlinks

Interactive Graph