- • CPU threads auto-scan
- • RAM libre → fenêtre modèle
- • GPU CUDA/Metal/ROCm détecté
- • Modèle sélectionné selon "atome hétérogène avec personnalité"
- • llama.cpp wheel GPU précompilé
- • jamais de compilation locale
- • context 32K → 131K escalade auto
- • tool-calling OpenAI-compatible
- • Ed25519 keypair (jamais exfiltré)
- • Unix permissions (pas de règles écrites)
- • Admin readonly sans mdp David
- • Service isolé (user dédié)