Intelligence

Compute efficiency by workload · MLPerf benchmarks × market pricing · 2026-07-18

Generative text inference — tokens produced per second per GPU.

tok/$ · best on-demand

Nebius · NVIDIA B200-SXM-180GB

Extractive language understanding — queries answered per second per GPU.

samp/$ · best on-demand

Nebius · NVIDIA H100-SXM-80GB

Image classification throughput — images classified per second per GPU.

samp/$ · best on-demand

Lambda Labs · NVIDIA H200-SXM-141GB

Recommendation inference — user-item scoring queries per second per GPU.

samp/$ · best on-demand

Nebius · NVIDIA H100-SXM-80GB

Medical Imaging

3D medical image segmentation — volumes processed per second per GPU.

samp/$ · best on-demand

Nebius · NVIDIA H100-SXM-80GB