zen3-embedding-medium

Balanced Retrieval Embeddings

A 4B embedding model delivering strong semantic search quality at a cost-effective price point. Optimized for retrieval workloads where both accuracy and throughput matter.

Specifications

Property	Value
Model ID	`zen3-embedding-medium`
Parameters	4B
Architecture	Embedding
Context Window	40K tokens
Tier	pro
Status	Available
HuggingFace	zenlm/zen3-embedding-medium

Capabilities

Semantic search over long documents (40K context)
RAG pipeline retrieval with balanced cost
Document clustering and deduplication
Classification feature generation
Multi-lingual embedding support

API Usage

curl https://api.hanzo.ai/v1/embeddings \
  -H "Authorization: Bearer $HANZO_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "zen3-embedding-medium",
    "input": "Zen LM is a family of frontier AI models"
  }'

from hanzoai import Hanzo

client = Hanzo(api_key="hk-your-api-key")

response = client.embeddings.create(
    model="zen3-embedding-medium",
    input=["Hello world", "Zen LM models"],
)

for embedding in response.data:
    print(f"Vector dim: {len(embedding.embedding)}")

HuggingFace Usage

from transformers import AutoModel, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("zenlm/zen3-embedding-medium")
model = AutoModel.from_pretrained("zenlm/zen3-embedding-medium")

inputs = tokenizer("Zen LM is a family of frontier AI models",
                   return_tensors="pt", truncation=True)
outputs = model(**inputs)
embeddings = outputs.last_hidden_state[:, 0, :]  # CLS token

Try It

Open in Hanzo Chat

zen3-embedding-medium

zen3-embedding-medium

Specifications

Capabilities

API Usage

HuggingFace Usage

Try It

Resources

See Also

On this page