CLI Reference

thon - Unified CLI (Recommended)

Synopsis

thon COMMAND [OPTIONS]

The thon CLI provides a unified entry point for interactive setup, configuration, and instance management. It reads from a single thon.yaml config file.

Commands

Command	Description
`thon init`	Interactive setup wizard (creates `thon.yaml`)
`thon setup`	Install prerequisites + configure from `thon.yaml`
`thon run`	Start VS Code instances from `thon.yaml`
`thon config show`	Display current config
`thon config env`	Export config as `.env` file
`thon config validate`	Validate `thon.yaml`
`thon cleanup`	Tear down all resources

Global Options

Option	Default	Description
`--config PATH`	./thon.yaml	Path to `thon.yaml` config file

init

python -m thon init [OPTIONS]

Interactive guided setup wizard that walks through every THON feature with sensible defaults, validates choices, and writes a thon.yaml config file.

Option	Default	Description
`--non-interactive`	false	Generate config with defaults (no prompts)
`--config PATH`	./thon.yaml	Output path for config file

setup

python -m thon setup [OPTIONS]

Installs system prerequisites and configures all components from thon.yaml:

System prerequisites (setup.sh)
SSL directory
Lemonade Server (if lemonade.enabled)
AI Gateway (if gateway.enabled)
.env file generation
Summary

run

python -m thon run [OPTIONS]

Starts VS Code instances from thon.yaml. Delegates to scripts/main.py.

Option	Default	Description
`--group GROUP`	(all)	Run only this group
`--config PATH`	./thon.yaml	Path to config file

config show

python -m thon config show [OPTIONS]

Displays the full resolved config as YAML.

config env

thon config env [OPTIONS]

Exports configuration as a .env file.

Option	Default	Description
`--output PATH`	.env	Output `.env` file path

config validate

thon config validate [OPTIONS]

Validates thon.yaml for common errors (missing groups, auth without providers, etc.).

cleanup

python -m thon cleanup

Tear down all resources: nginx configs, Lemonade server, and AI Gateway.

Examples

# Interactive setup wizard
python -m thon init

# Non-interactive (CI-friendly)
python -m thon init --non-interactive

# Install prerequisites and configure
python -m thon setup

# Start instances
python -m thon run

# Start only one group
python -m thon run --group alpha

# Validate config
python -m thon config validate

# Export .env file
python -m thon config env --output .env

# Clean up all resources
python -m thon cleanup

main.py - VS Code Instance Orchestrator

Synopsis

python ./scripts/main.py [OPTIONS]

Options

Core Options

Option	Type	Default	Description
`--groups FILE`	string	(none)	Path to groups.yaml file
`--group GROUP`	string	(all)	Run only this group (works with `--groups` or `--from-db`)
`--from-db`	flag	false	Read groups/users from the database instead of a YAML file
`--port PORT`	int	8443	Starting port for code-server instances
`--timeout MIN`	int	0	Timeout in minutes (0 = no timeout)

Server Connection

Option	Type	Default	Description
`--domain DOMAIN`	string	localhost:8080	Sandbox server domain
`--api-key KEY`	string	(none)	Sandbox API key

Docker Options

Option	Type	Default	Description
`--image IMAGE`	string	waterpistol/thon:latest	Docker image for sandbox
`--python-version VER`	string	3.11	Python version in sandbox

Security

Option	Type	Default	Description
`--secure`	flag	false	Enable per-user password authentication

Network

Option	Type	Default	Description
`--external-ip IP`	string	(auto-detect)	External IP for SSL cert and URLs
`--ssl-dir DIR`	string	/etc/nginx/ssl	SSL certificate storage directory
`--no-nginx`	flag	false	Disable nginx, use direct HTTP access

Workspace

Option	Type	Default	Description
`--workspace-dir DIR`	string	(none)	Host dir for persistent bind mounts

Lemonade Integration

Option	Type	Default	Description
`--lemonade KILO_JSON`	string	(none)	Path to kilo.json for LLM config injection
`--vscode-settings JSON`	string	(none)	VS Code settings file to inject

AI Gateway

Option	Type	Default	Description
`--gateway`	flag	false	Enable APISIX AI Gateway with rate limiting
`--gateway-per-group`	flag	false	One consumer per group (shared API key) instead of per user
`--gateway-redis-host HOST`	string	(none)	Redis host for shared rate limiting
`--gateway-rate-limit N`	int	500	Token limit per consumer per time window
`--gateway-time-window N`	int	60	Rate limit time window in seconds

Maintenance

Option	Type	Default	Description
`--cleanup`	flag	false	Remove all nginx configs and exit

Examples

Basic Usage

# Single instance (no groups)
python ./scripts/main.py

# All groups with nginx SSL
python ./scripts/main.py --groups groups.yaml --external-ip 1.2.3.4

# Single group
python ./scripts/main.py --groups groups.yaml --group alpha --external-ip 1.2.3.4

# Start instances from database instead of YAML
python ./scripts/main.py --from-db --external-ip 1.2.3.4

# Start a specific group from database
python ./scripts/main.py --from-db --group beta --external-ip 1.2.3.4

With Security

# Per-user passwords
python ./scripts/main.py --groups groups.yaml --secure --external-ip 1.2.3.4

With Persistence

# Persistent workspace bind mounts
python ./scripts/main.py --groups groups.yaml --workspace-dir /thon-workspace --external-ip 1.2.3.4

With Lemonade

# Local LLM inference
python ./scripts/main.py --groups groups.yaml --external-ip 1.2.3.4 --lemonade kilo.json

With AI Gateway

# Per-user rate limiting (each user gets own API key)
python ./scripts/main.py --groups groups.yaml --external-ip 1.2.3.4 --gateway

# Per-group rate limiting (shared API key per group)
python ./scripts/main.py --groups groups.yaml --external-ip 1.2.3.4 --gateway --gateway-per-group

# With Redis-backed rate limiting
python ./scripts/main.py --groups groups.yaml --external-ip 1.2.3.4 \
    --gateway --gateway-redis-host 127.0.0.1

Custom Settings

# Custom VS Code settings
python ./scripts/main.py --groups groups.yaml --external-ip 1.2.3.4 \
    --vscode-settings vscode-settings.jsonc

No Nginx

# Direct HTTP access
python ./scripts/main.py --groups groups.yaml --no-nginx

Cleanup

# Remove nginx configs
python ./scripts/main.py --cleanup

setup-lemonade.sh - Lemonade Server Setup

Synopsis

bash ./scripts/setup-lemonade.sh [OPTIONS]

Options

Option	Default	Description
`--groups FILE`	(none)	groups.yaml for user count
`--group GROUP`	(all)	Filter to single group
`--num-users N`	1	Override parallel user count
`--port PORT`	13305	Server port
`--host HOST`	0.0.0.0	Bind address
`--backend BACKEND`	auto	llama.cpp backend: auto, vulkan, cpu
`--ctx-size SIZE`	262144	Per-user context size
`--model MODEL`	unsloth/gemma-4-31B-it-GGUF:Q8_K_XL	HuggingFace checkpoint
`--model-name NAME`	gemma-4-31b-it	Short model name
`--mmproj FILE`	mmproj-BF16.gguf	Vision mmproj filename
`--external-ip IP`	(auto)	External IP for kilo.json
`--generate-keys`	false	Generate API keys
`--no-prefer-system`	(system)	Use bundled llama.cpp
`--llamacpp-bin PATH`	/usr/local/bin/llama-server	System binary path
`--kilo-config PATH`	./kilo.json	Output path for kilo.json
`--embedding`	true	Enable embedding model for semantic indexing
`--no-embedding`	false	Disable embedding model
`--embedding-model MODEL`	SuperPauly/harrier-oss-v1-0.6b-gguf:harrier-oss-v1-0.6B-BF16	Embedding model HuggingFace checkpoint
`--embedding-model-name NAME`	harrier-oss-v1-0.6b	Short name for embedding model
`-h, --help`		Show help message

Environment Variables

Variable	Description
`LEMONADE_PORT`	Server port
`LEMONADE_HOST`	Bind address
`LEMONADE_BACKEND`	llama.cpp backend
`LEMONADE_CTX_SIZE`	Per-user context size
`LEMONADE_MODEL`	HuggingFace checkpoint
`LEMONADE_MODEL_NAME`	Short model name
`LEMONADE_EXTERNAL_IP`	External IP
`LEMONADE_GENERATE_KEYS`	Generate API keys (true/false)
`LEMONADE_NUM_USERS`	Parallel user count
`LEMONADE_KILO_CONFIG`	kilo.json output path
`LEMONADE_PREFER_SYSTEM`	Prefer system binary (true/false)
`LEMONADE_LLMACPP_BIN`	System binary path
`LEMONADE_MMPROJ`	mmproj filename
`LEMONADE_EMBEDDING`	Enable embedding model (true/false)
`LEMONADE_EMBEDDING_MODEL`	Embedding model HuggingFace checkpoint
`LEMONADE_EMBEDDING_MODEL_NAME`	Short name for embedding model

Examples

Basic Setup

bash setup-lemonade.sh --generate-keys --external-ip 1.2.3.4

With Groups

bash setup-lemonade.sh --groups groups.yaml --generate-keys --external-ip 1.2.3.4

Without Embedding Model

bash setup-lemonade.sh --generate-keys --external-ip 1.2.3.4 --no-embedding

Custom Embedding Model

bash setup-lemonade.sh \
    --embedding-model some-org/embedding-model-GGUF:Q8_0 \
    --embedding-model-name my-embedding \
    --generate-keys \
    --external-ip 1.2.3.4

Custom Model

bash setup-lemonade.sh \
    --model Qwen/Qwen2.5-Coder-7B-Instruct-GGUF:Q4_K_M \
    --model-name qwen-coder-7b \
    --generate-keys \
    --external-ip 1.2.3.4

Custom Binary

bash setup-lemonade.sh \
    --llamacpp-bin /opt/llama.cpp/llama-server \
    --generate-keys \
    --external-ip 1.2.3.4

lemonade_server.py - Python CLI Wrapper

Synopsis

python ./lemonade_server.py COMMAND [OPTIONS]

Commands

Command	Description
`install`	Install lemonade-server via PPA
`configure`	Configure server settings
`start`	Start the server
`stop`	Stop the server
`restart`	Restart the server
`status`	Check server status
`pull`	Pull a model to local cache
`run`	Full setup + keep alive
`count-users`	Count users from groups.yaml
`write-model-configs`	Write user_models.json and recipe_options.json
`generate-kilo-config`	Generate kilo.json for Kilo Code
`cleanup`	Stop server and clean up

install

python lemonade_server.py install

Installs lemonade-server from PPA.

configure

python lemonade_server.py configure [OPTIONS]

Option	Default	Description
`--port PORT`	13305	Server port
`--host HOST`	0.0.0.0	Bind address
`--llamacpp-backend BACKEND`	auto	Backend: auto, vulkan, cpu
`--ctx-size SIZE`	4096	Default context size
`--max-loaded-models N`	1	Max models per type slot
`--generate-keys`	false	Generate API keys
`--prefer-system`	true	Prefer system llama.cpp
`--no-prefer-system`		Use bundled llama.cpp
`--llamacpp-bin PATH`	/usr/local/bin/llama-server	System binary path
`--kilo-config PATH`	(none)	Generate kilo.json
`--model MODEL`	(default)	Model for kilo.json
`--external-ip IP`	(auto)	External IP for kilo.json

pull

python lemonade_server.py pull --model MODEL

Option	Default	Description
`--model MODEL`	(required)	HuggingFace checkpoint

run

python lemonade_server.py run [OPTIONS]

Full setup: install + configure + start + pull model + keep alive.

Option	Default	Description
`--model MODEL`	unsloth/gemma-4-31B-it-GGUF:Q8_K_XL	HuggingFace checkpoint
`--model-name NAME`	gemma-4-31b-it	Short model name
`--groups FILE`	(none)	groups.yaml for user count
`--group GROUP`	(all)	Filter to single group
`--num-users N`	1	Override parallel user count
`--port PORT`	13305	Server port
`--host HOST`	0.0.0.0	Bind address
`--llamacpp-backend BACKEND`	auto	Backend: auto, vulkan, cpu
`--ctx-size SIZE`	4096	Default context size
`--generate-keys`	false	Generate API keys
`--external-ip IP`	(auto)	External IP
`--kilo-config PATH`	(auto)	kilo.json output path
`--prefer-system`	true	Prefer system binary
`--llamacpp-bin PATH`	/usr/local/bin/llama-server	System binary path
`--mmproj FILE`	mmproj-BF16.gguf	Vision mmproj filename
`--skip-install`	false	Skip installation check
`--embedding`	true	Enable embedding model for semantic indexing
`--no-embedding`	false	Disable embedding model
`--embedding-model MODEL`	SuperPauly/harrier-oss-v1-0.6b-gguf:harrier-oss-v1-0.6B-BF16	Embedding model checkpoint
`--embedding-model-name NAME`	harrier-oss-v1-0.6b	Short name for embedding model

write-model-configs

python lemonade_server.py write-model-configs [OPTIONS]

Option	Default	Description
`--model MODEL`	(default)	HuggingFace checkpoint
`--model-name NAME`	gemma-4-31b-it	Short model name
`--num-users N`	1	Parallel user count
`--llamacpp-backend BACKEND`	auto	Backend
`--mmproj FILE`	mmproj-BF16.gguf	Vision mmproj filename
`--embedding`	true	Also write embedding model configs
`--no-embedding`	false	Skip embedding model configs
`--embedding-model MODEL`	SuperPauly/harrier-oss-v1-0.6b-gguf:harrier-oss-v1-0.6B-BF16	Embedding model checkpoint
`--embedding-model-name NAME`	harrier-oss-v1-0.6b	Short name for embedding model

generate-kilo-config

python lemonade_server.py generate-kilo-config [OPTIONS]

Option	Default	Description
`--model MODEL`	(default)	HuggingFace checkpoint
`--model-name NAME`	gemma-4-31b-it	Short model name
`--external-ip IP`	(auto)	External IP
`--output PATH`	kilo.json	Output path
`--api-key KEY`	(none)	API key
`--admin-api-key KEY`	(none)	Admin API key
`--embedding-model-name NAME`	harrier-oss-v1-0.6b	Embedding model name for indexing config
`--no-embedding`	false	Omit indexing section from kilo.json

Examples

# Full setup (with embedding model)
python lemonade_server.py run --groups groups.yaml --generate-keys --external-ip 1.2.3.4

# Full setup without embedding model
python lemonade_server.py run --groups groups.yaml --generate-keys --external-ip 1.2.3.4 --no-embedding

# Just configure
python lemonade_server.py configure --generate-keys --external-ip 1.2.3.4

# Write model configs only (includes embedding by default)
python lemonade_server.py write-model-configs --num-users 6

# Generate kilo.json without embedding/indexing section
python lemonade_server.py generate-kilo-config --admin-api-key YOUR_KEY --external-ip 1.2.3.4 --no-embedding

Environment Variables

Sandbox Server

Variable	Default	Description
`SANDBOX_DOMAIN`	localhost:8080	Sandbox server address
`SANDBOX_API_KEY`	(none)	Sandbox API key
`SANDBOX_IMAGE`	waterpistol/thon:latest	Docker image
`PYTHON_VERSION`	3.11	Python in sandbox

Lemonade Server

Variable	Description
`LEMONADE_API_KEY`	API key for regular endpoints
`LEMONADE_ADMIN_API_KEY`	API key for admin endpoints
`LEMONADE_EMBEDDING`	Enable embedding model (true/false)
`LEMONADE_EMBEDDING_MODEL`	Embedding model HuggingFace checkpoint
`LEMONADE_EMBEDDING_MODEL_NAME`	Short name for embedding model

AI Gateway

Variable	Description
`GATEWAY_ENABLED`	Enable AI Gateway (true/false)
`GATEWAY_ADMIN_URL`	APISIX Admin API URL
`GATEWAY_ADMIN_KEY`	APISIX Admin API key
`GATEWAY_PROXY_PORT`	APISIX proxy port
`GATEWAY_REDIS_HOST`	Redis host for rate limiting
`GATEWAY_REDIS_PORT`	Redis port
`GATEWAY_REDIS_PASSWORD`	Redis password
`GATEWAY_RATE_LIMIT_TOKENS`	Token limit per consumer per window
`GATEWAY_RATE_LIMIT_WINDOW`	Time window in seconds
`GATEWAY_MODE`	Consumer mode: per-user or per-group

Database

Variable	Description
`THON_DB_PATH`	SQLite database path (default: `~/.thon/thon.db`)
`THON_WORKSPACE_DIR`	Workspace directory for groups

Authentication

Variable	Default	Description
`AUTH_ENABLED`	`false`	Enable OIDC authentication on the REST API
`AUTH_SESSION_SECRET`	(none)	HMAC secret for signing session tokens
`AUTH_LOCAL_PASSWORD`	(none)	Single password for Streamlit dashboard access
`AUTH_GITHUB_CLIENT_ID`	(none)	GitHub OAuth App client ID
`AUTH_GITHUB_CLIENT_SECRET`	(none)	GitHub OAuth App client secret
`AUTH_GITLAB_CLIENT_ID`	(none)	GitLab OAuth App client ID
`AUTH_GITLAB_CLIENT_SECRET`	(none)	GitLab OAuth App client secret
`AUTH_LINKEDIN_CLIENT_ID`	(none)	LinkedIn OIDC client ID
`AUTH_LINKEDIN_CLIENT_SECRET`	(none)	LinkedIn OIDC client secret

apisix_gateway.py - AI Gateway Manager

Synopsis

python scripts/apisix_gateway.py COMMAND [OPTIONS]

Commands

Command	Description
`setup`	Full gateway setup: create routes + consumers from groups.yaml
`create-consumer`	Create a single consumer with API key
`delete-consumer`	Delete a consumer by username
`generate-kilo`	Generate kilo.json for a consumer
`status`	Check gateway status
`cleanup`	Remove all consumers and routes

setup

python scripts/apisix_gateway.py setup [OPTIONS]

Creates two APISIX routes:

/v1/chat/completions — chat completions via ai-proxy-multi
/v1/embeddings — embedding requests via upstream proxy (when --no-embedding is not set)

Option	Default	Description
`--groups FILE`	(none)	Path to groups.yaml
`--group GROUP`	(all)	Filter to single group
`--lemonade-url URL`	http://127.0.0.1:13305	Lemonade server URL
`--lemonade-api-key KEY`	(none)	Lemonade API key
`--lemonade-model MODEL`	user.gemma-4-31b-it	Lemonade model name
`--per-group`	false	One consumer per group with shared API key
`--admin-key KEY`	(default)	APISIX Admin API key
`--admin-port PORT`	9180	APISIX Admin API port
`--proxy-port PORT`	9080	APISIX proxy port
`--redis-host HOST`	(none)	Redis host for rate limiting
`--redis-port PORT`	6379	Redis port
`--redis-password PW`	(none)	Redis password
`--rate-limit N`	500	Token limit per consumer per time window
`--time-window N`	60	Rate limit time window in seconds
`--generate-kilo`	false	Generate kilo.json for each consumer
`--external-ip IP`	(auto)	External IP for kilo.json base URL
`--embedding-model MODEL`	user.harrier-oss-v1-0.6b	Embedding model name for Lemonade
`--no-embedding`	false	Disable embedding route creation

create-consumer

python scripts/apisix_gateway.py create-consumer --username alice [OPTIONS]

Option	Default	Description
`--username`	(required)	Consumer username
`--api-key`	(auto)	API key (auto-generated if omitted)
`--rate-limit`	500	Token limit per time window
`--time-window`	60	Time window in seconds

generate-kilo

python scripts/apisix_gateway.py generate-kilo --username alice --api-key KEY [OPTIONS]

Option	Default	Description
`--username`	(required)	Consumer username
`--api-key`	(required)	Consumer API key
`--proxy-port`	9080	APISIX proxy port
`--external-ip`	127.0.0.1	External IP for gateway URL
`--model`	user.gemma-4-31b-it	Model name for kilo.json
`--embedding-model`	user.harrier-oss-v1-0.6b	Embedding model name for indexing config
`--no-embedding`	false	Omit indexing section from kilo.json

Examples

# Full setup from groups.yaml (includes embedding route)
python scripts/apisix_gateway.py setup --groups groups.yaml \
    --lemonade-url http://127.0.0.1:13305

# Setup without embedding route
python scripts/apisix_gateway.py setup --groups groups.yaml \
    --lemonade-url http://127.0.0.1:13305 --no-embedding

# Per-group setup with Redis rate limiting
python scripts/apisix_gateway.py setup --groups groups.yaml \
    --lemonade-url http://127.0.0.1:13305 --per-group --redis-host 127.0.0.1

# Create single consumer
python scripts/apisix_gateway.py create-consumer --username alice --rate-limit 500

# Generate kilo.json (with embedding/indexing config)
python scripts/apisix_gateway.py generate-kilo --username alice --api-key KEY \
    --external-ip 1.2.3.4

# Generate kilo.json without embedding
python scripts/apisix_gateway.py generate-kilo --username alice --api-key KEY \
    --external-ip 1.2.3.4 --no-embedding

# Cleanup all gateway resources
python scripts/apisix_gateway.py cleanup

CLI Reference

On this page