AI Model Compare Engine

Benchmark and compare leading AI models across reasoning, coding, vision, speed, and cost.

Select Models to Compare (max 6)

Benchmark Comparison

Sort by:

Model	Provider	Overall	Reasoning	Coding	Vision	Math	Speed	Efficiency	Context	Input Cost	Output Cost	Latency
GPT-4o	OpenAI	88	94BEST	93	96BEST	91	78	72	128K	$2.50/1M	$10.00/1M	142ms
Claude 3.5 Sonnet	Anthropic	87	93	95BEST	91	90	82	78	200K	$3.00/1M	$15.00/1M	187ms
DeepSeek V3	DeepSeek	92BEST	89	88	78	92	85	88	128K	$0.27/1M	$1.10/1M	156ms
Gemini 2.0 Flash	Google	88	90	92	94	94BEST	95BEST	92	1M	$0.35/1M	$0.70/1M	89ms
Llama 3.1 70B	Meta	86	86	84	75	85	90	95BEST	128K	Free/1M	Free/1M	112ms

GPT-4o

OpenAI · ~1.8T

May 2024

Overall

MultimodalEnterpriseVision

Reasoning

Coding

Vision

Math

Speed

Efficiency

Claude 3.5 Sonnet

Anthropic · ~175B

Jun 2024

Overall

CodingAnalysisLong-context

Reasoning

Coding

Vision

Math

Speed

Efficiency

DeepSeek V3

DeepSeek · ~671B

Dec 2024

Overall

MathCost-efficientCoding

Reasoning

Coding

Vision

Math

Speed

Efficiency

Gemini 2.0 Flash

Google · ~100B

Dec 2024

Overall

SpeedLong-contextCost-efficient

Reasoning

Coding

Vision

Math

Speed

Efficiency

Llama 3.1 70B

Meta · 70B

Jul 2024

Overall

Open-sourceLocalFine-tuning

Reasoning

Coding

Vision

Math

Speed

Efficiency