apis.resumesparser.com — Free LLM APIs — live status, side-by-side, with code

Free LLM APIs
live status, side-by-side

Free LLM APIs — live status, side-by-side, with code. We probe every provider every 5 minutes and publish uptime, latency, and free-tier limits — so you can pick one in 60 seconds.

TL;DR

10 free LLM APIs that are actually usable in 2026. Sorted by inference speed by default. Live status, free-tier limits, and quick-start code on every provider page. For raw speed: Groq and Cerebras. Most generous free volume: Mistral (1B tok/mo). Try every model with one key: OpenRouter. Free GPT-4o: GitHub Models. Free Llama 3.1 405B: SambaNova.

Last checked: —

Provider	Status	Latency	Uptime 24h	Free limits	Top model
Groq	…	—	—	30 RPM · 14,400 RPD	llama-3.3-70b-versatile
Cerebras Inference	…	—	—	30 RPM	llama-3.3-70b
Together AI	…	—	—	60 RPM	meta-llama/Llama-3.3-70B-Instruct-Turbo
Google AI Studio (Gemini)	…	—	—	15 RPM · 1,500 RPD	gemini-2.0-flash
OpenRouter	…	—	—	20 RPM · 200 RPD	meta-llama/llama-3.3-70b-instruct:free
SambaNova Cloud	…	—	—	10 RPM	Meta-Llama-3.3-70B-Instruct
Mistral La Plateforme	…	—	—	60 RPM	mistral-large-latest
Cohere	…	—	—	20 RPM · 1,000 RPD	command-r-plus-08-2024
Hugging Face Inference	…	—	—	1,000 RPD	meta-llama/Llama-3.3-70B-Instruct
GitHub Models	…	—	—	15 RPM · 150 RPD	gpt-4o

Provider

Status

Latency

Uptime 24h

Free limits

Top model

Groq

…

—

30 RPM · 14,400 RPD

llama-3.3-70b-versatile

Cerebras Inference