EN FR

Couche 2 — Pool

Backend · API universelle OpenAI · orchestration · mémoire zero-knowledge

Users / Agents Browser · OpenCode · ClawCode Cursor · aider · iamine CLI Cloudflare + nginx TLS Flexible SSL (→ Full strict TODO) :443 HTTPS · :443 WSS FastAPI — API universelle OpenAI-compatible /v1/chat/completions · /v1/models · /v1/federation/* · /v1/opencode-md SSE streaming · tool-calls · auto conv_id · admin_token Auth & Tokens email/Google login verif email (M16) iam_token par user admin_token séparé Routing coopératif déficit scoring GPU 61% / CPU 38% toujours répondre (no 503) exclusion unknown_model LLM Checker core/checker.py bench périodique skip tool-calls config DB pool_config Sub-agents auto-review (1s) cross-pool (M7a) pipeline multi-rôles SSE expose review Memory zero-knowledge (4-tier, M13) L1 messages TTL observ. JSON brut chaud L2 conversations Fernet chiffré compaction opt-in L3 embeddings pgvector faits persos RAG filtré L4 hybrid MCP server agent memory federation sync PostgreSQL + pgvector cerveau du pool · DB-first pour toute donnée persistante • users · accounts · tokens · sessions • messages · conversations · memory (L1/L2/L3/L4) • federation_state · peers · capabilities · gossip_log • revenue_ledger · disputes · slashing_events • pool_config (admin) · migrations 001 → 019+ WebSocket pool wss://cellule.ai/ws workers join/leave heartbeat · job dispatch 4 workers · 0 busy · pending 39 Admin dashboard admin.html + admin_pool.html cleanup DB · blacklist · comptes PG config LLM · tooltips FR · EN TODO auth admin_token Frontend cellule.ai trial chat (modèle 2B pinné) dashboard user · tokens · tools canvas molécule interactif wording communautaire (pas "gratuit") WORKERS (atomes) — Qwen 14B · 3B · 9B · 30B MoE · hétérogène · multi-machines · reset Trust-3 ← cliquer pour voir la couche 1 atome → Fédération (couche 3) gossip anti-entropy · merkle · quorum RAID sortant vers autres pools bondés → Économie (couche 4) revenue_ledger · settlement · slashing · token $IAMINE alimenté par chaque inférence read/write dispatch job

API universelle

  • • OpenAI-compatible (chat/completions)
  • • SSE streaming tokens + tool-calls
  • • auto conv_id (persistence L2)
  • • clients: OpenCode, Cursor, aider, ClawCode

DB-first

  • • Toute donnée persistante en PG
  • • Mémoire pool = cache
  • • pgvector pour RAG/L3
  • • Migrations versionnées 001→019+

Routing coopératif

  • • Déficit scoring (équité GPU/CPU)
  • • Doctrine "toujours répondre"
  • • Pas de 503 sortant
  • • Exclusion auto unknown_model

Sub-agents LIVE

  • • Auto-review (1s, dès phase 1)
  • • Cross-pool forward (M7a)
  • • Pipeline multi-rôles (scale N pools)
  • • SSE expose la review aux clients

Mémoire zero-knowledge

  • • L2 conversations Fernet chiffrées
  • • Opt-in utilisateur (toggle)
  • • Export + delete RGPD
  • • Pool admin ne lit pas le contenu

Agents LLM (Z2)

  • • RED Qwen3-30B-A3B (admin)
  • • Coder · Tank · Scout (dédiés)
  • • RED daemon 3h + self_update
  • • 4 workers actifs à ce jour