К списку моделей

Llama 3.2 11B Vision Instruct

4.8

От Meta

Open Source
CTX131K
Релиз: 2024-09-25
StandardGeneralMultimodal
Официальный сайт

Краткое описание

Llama 3.2 11B Vision is a multimodal model with 11 billion parameters, designed to handle tasks combining visual and textual data. It excels in tasks such as image captioning and...

Стоимость API

$0.24 / $0.24 за 1M токенов

Профиль модели

MMLU86.3%Code88.2%Math87.9%GPQA63.4%SWE61.8%

Бенчмарки

Arena Elo (LMSYS)1416
MMLU (Общие знания)86.3%
HumanEval (Кодинг)88.2%
MATH (Математика)87.9%
GPQA (Экспертные знания)63.4%
SWE-bench (Разработка)61.8%

Другие модели семейства Llama