К списку моделей

R1 Distill Llama 70B

4.5

От DeepSeek

Open Source
CTX131K
Релиз: 2025-01-23
StandardGeneralText
Официальный сайт

Краткое описание

DeepSeek R1 Distill Llama 70B is a distilled large language model based on [Llama-3.3-70B-Instruct](/meta-llama/llama-3.3-70b-instruct), using outputs from [DeepSeek R1](/deepseek/deepseek-r1). The model combines advanced distillation techniques to achieve high performance across...

Стоимость API

$0.70 / $0.80 за 1M токенов

Профиль модели

MMLU85.4%Code86.4%Math91.3%GPQA69.3%SWE58.1%

Бенчмарки

Arena Elo (LMSYS)1405
MMLU (Общие знания)85.4%
HumanEval (Кодинг)86.4%
MATH (Математика)91.3%
GPQA (Экспертные знания)69.3%
SWE-bench (Разработка)58.1%

Другие модели семейства DeepSeek