Run many local models. One simple workspace.

Local-first privacy. Unified chat. OpenAI-compatible API. Zero-cloud by default.

Free and open source • No account required

How it works

Choose from local models via Ollama, llama.cpp, or MLX

Unified chat interface with streaming responses

Drag and drop files for local RAG capabilities

Designed for local-first workflows; familiar like LM Studio, flexible like AnythingLLM.

🚀 We're Live!

Help us reach more developers who value local-first AI tools. Your support means everything to our community.

Takes just 30 seconds • Helps us reach more developers

Made for developers, researchers, and privacy-conscious teams.