Updated minutes ago· Sources: GPU Pricing, API Token Pricing, Model Registry

RTX 4090

nvidia · ada · 24 GB GDDR6X · 450W TDP

VRAM

24 GB

BF16 TFLOPS

165

Bandwidth

1008 GB/s

From

$0.39/hr

Calculate ROI with this GPU →

Spec Sheet

VRAM24 GB GDDR6X

Memory Bandwidth1008 GB/s

BF16 TFLOPS165

FP16 TFLOPS165

FP8 TFLOPS330

INT8 TOPS330

TDP450W

InterconnectPCIE

Max per Node4

PCIe Gen4

CUDA Compute Capability8.9

Tensor CoresYes

Pricing by Provider

Provider	On-Demand	Reserved	Spot	Badge
fluidstack	$0.59/hr	-	$0.39/hr	Cheapest
vast_ai	$0.74/hr	-	$0.44/hr
tensordock	$0.69/hr	-	$0.44/hr
runpod	$1.10/hr	-	$0.79/hr
lambda	$0.89/hr	-	-

Pricing History

runpod

$1.10/hr→ 0.0%

2024-01-012025-03-01

Low: $1.10High: $1.44

vast

$0.54/hr→ 0.0%

2024-01-012025-03-01

Low: $0.54High: $0.89

Training Capabilities

Estimated GPU count for full fine-tuning (AdamW, BF16) and QLoRA

Model Size	Full Fine-Tune	QLoRA
7B model	6 GPUs	1 GPU
13B model	11 GPUs	1 GPU
70B model	55 GPUs	2 GPUs

Train on this GPU →

Energy Efficiency

Estimated tokens/second per Watt for popular models

Mistral 7B

0.31 t/s/WFP8

Qwen 2.5 7B

0.29 t/s/WFP8

Llama 3.1 8B

0.28 t/s/WFP8

Llama 3.1 70B

0.03 t/s/WFP8

Qwen 2.5 72B

0.03 t/s/WFP8

Similar GPUs

GPU	VRAM	BF16 TFLOPS	BW (GB/s)	From
L4	24 GB	121	300	$0.29/hr
RTX 4080	16 GB	97	717	$0.32/hr
RTX 4060 Ti 16GB	16 GB	44	288	$0.30/hr
RTX 4070 Ti	12 GB	93	504	$0.25/hr
RTX 4070 Super	12 GB	55	504	$0.22/hr