Available Models

HuggingFace: huggingface.co/zenlm
Ollama: ollama run zen4
Formats: SafeTensors, GGUF, MLX

List Models

GET https://api.hanzo.ai/v1/models

Returns all available Zen models.

The latest generation. Flagship, reasoning, and code models.

Multimodal, vision, safety, and embedding models.

Task	Recommended Model
General chat	zen4
Maximum reasoning	zen4-ultra
Deep reasoning (CoT)	zen4-thinking
Code generation	zen4-coder
Fast code iteration	zen4-coder-flash
Premium code accuracy	zen4-coder-pro
Image understanding	zen3-vl
Multimodal (text+vision+audio)	zen3-omni
Content moderation	zen3-guard
Text embeddings	zen3-embedding
Edge / mobile	zen3-nano
Budget-friendly	zen4-mini
Extended context docs	zen4-max
High capability	zen4-pro

Budget	Recommended
Free tier ($5)	zen4-mini, zen3-nano
Low cost	zen4-mini, zen3-vl, zen4-coder-flash
Standard	zen4-pro, zen4-coder, zen4-thinking
Premium	zen4, zen4-ultra, zen4-coder-pro

All Zen models are also available as open weights for self-hosting:

Cloud API via Hanzo gives you managed infrastructure, usage tracking, and pay-per-token billing without running your own GPUs.