К списку моделей

R1 Distill Qwen 32B

4.4

От DeepSeek

Open Source
CTX33K
Релиз: 2025-01-29
StandardGeneralText
Официальный сайт

Краткое описание

DeepSeek R1 Distill Qwen 32B is a distilled large language model based on [Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). It outperforms OpenAI's o1-mini across various benchmarks, achieving new...

Стоимость API

$0.29 / $0.29 за 1M токенов

Профиль модели

MMLU82.1%Code83.7%Math89.6%GPQA62.7%SWE53.7%

Бенчмарки

Arena Elo (LMSYS)1365
MMLU (Общие знания)82.1%
HumanEval (Кодинг)83.7%
MATH (Математика)89.6%
GPQA (Экспертные знания)62.7%
SWE-bench (Разработка)53.7%

Другие модели семейства DeepSeek