#	Host	Context	Input $/MTok	Output $/MTok	Blended	Uptime 30m	Quant
1	Chutes	203k	$0.39	$1.75	$0.62	100.00%	bf16
2	Google AI Studio	200k	$0.60	$2.20	$0.87	100.00%	—
3	Cerebras	131k	$2.25	$2.75	$2.33	100.00%	fp16
4	DeepInfra	203k	$0.40	$1.75	$0.63	99.86%	fp4
5	Venice	198k	$0.55	$2.65	$0.90	99.66%	fp4
6	Phala	131k	$0.85	$3.30	$1.26	99.60%	—
7	Parasail	203k	$0.45	$2.10	$0.72	99.10%	fp8
8	AtlasCloud	203k	$0.52	$1.85	$0.74	98.15%	fp8
9	Novita	205k	$0.54	$1.98	$0.78	95.13%	fp8
10	Nebius	203k	$0.40	$2.00	$0.67	93.90%	fp8
11	Z Ai	203k	$0.60	$2.20	$0.87	92.85%	fp4
12	StreamLake	200k	$0.48	$1.76	$0.69	91.49%	fp8
13	Fireworks AI	—	$0.60	$2.20	$0.87	—	—
14	DekaLLM	203k	$0.38	$1.74	$0.61	—	fp4
15	SiliconFlow	205k	$0.45	$2.20	$0.74	—	fp8

Most reliable GLM 4.7 API providers

What would GLM 4.7 cost you?