DevOps / SRE pro on-prem AI stack (K8s + GPU) - mezinárodní startup

3BrainAI Solutions s.r.o. logo

EU-first AI pro marketplaces. On-prem Kubernetes+GPU (A4000), ClickHouse/Vault, CI/CD s rollbacky. Validace: EY Startup Academy Frankfurt + OVHcloud Startup Program. Hledáme DevOps/SRE s ownership.

Úroveň
  • Senior
Spolupráce
  • Freelancer
  • Hybrid
  • Remote
Úvazek
  • Plný úvazek
  • Částečný úvazek
Mzda
120 000 Kč / měsíc nebo si řekni o víc
Informace

Popis pozice

CO BUDEŠ DĚLAT (ENGINEERING)
• Udržíš v chodu on-prem Kubernetes cluster (3 nody, GPU A4000) pro AI inference
• Zavedes release disciplínu: GitLab CI, Helm deploy, canary/blue-green (kde dává smysl), rychlý rollback
• Postavíš observabilitu: Prometheus/Grafana, alerty, incident flow, SLO (latence, chybovost, dostupnost)
• Nasadíš a spravuješ klíčové komponenty: ClickHouse (vč. vektorů), Vault, MLflow, logování
• Pomůžeš se sítí a bezpečností: VPN, segmentace, snapshoty/backup, „air-gapped“ režim, LUKS

TVŮJ STACK
• Kubernetes (kubeadm), Helm, GitLab CI
• Linux, bash, YAML, základní síťové prvky (VPN, firewally)
• Prometheus/Grafana, Vault, LUKS
• Výhodou: GPU runtime/NVIDIA stack, ClickHouse admin, Terraform

JAK SPOLUPRACUJEME
• Remote-first, async (Slack/GitLab/Notion), minimum zbytečných callů
• Malý core tým, jasná odpovědnost a viditelný dopad v produkci
• Nehledáme „správce YAML“ – hledáme člověka, který drží systém při životě

JAK SE PŘIHLÁSIT
• Napiš 5–10 řádků: co jsi provozoval a jeden příklad incidentu/rollbacku, který jsi dotáhl do konce

Zkušenosti Co požadujeme

  • Úroveň:
    Senior
  • Praxe:
    4 roky
  • Vzdělání:

Pozice

DevOps admin Site Reliability Engineer

Základní dovednosti

Grafana Vault Incident response SLO/SLA Networking Backup/DR

Výhodou

NVIDIA runtime Terraform ClickHouse admin GitOps (ArgoCD/Flux) Security hardening

Softskills

„asynchronní komunikace“ „ownership“ „incident leadership“

Jazyky

Česky – domluvit se Anglicky – čtení dokumentace

Práce u nás Co nabízíme

Jaké jsou benefity

BENEFITY (CO TI TO DÁ)
• On-prem GPU stack: reálný provoz, žádná „hra na cloud“
• Ownership: navrhneš a prosadíš řešení, které se hned používá
• Měřitelný dopad: latence, stabilita, rollouty – vše je vidět na metrikách
• Remote-first + async režim (šetří energii i čas)
• Přístup k celému stacku: infra, logy, CI/CD, rollback scénáře, runbooky
• Prostor pro nástroje: co funguje, to nasadíme (Terraform/Ansible/…)
• Možnost dlouhodobě růst do SRE lead / platform owner role
• Férová odměna + výkonnostní bonusy; u core role možnost podílu

Proč si vybrat tuto nabídku

1) ENGINEERING REALITA (ne buzzwordy) U nás DevOps znamená SRE odpovědnost: inference musí běžet, musí být měřitelná a musí jít bezpečně vrátit zpět. Běžíme on-prem na vlastním železe (Kubernetes + GPU). Release bez rollbacku je u nás jen „pokus“. 2) EU-FIRST STARTUP (ale s disciplínou) Nejsme korporát. Malý tým, jasné priority: produkční provoz, data, metriky, dopad. Zároveň nejsme „garáž bez pravidel“ – jedeme governance: logy, audit trail, runbooky, dvojí kontrola změn. 3) PRESTIŽ / VALIDACE / SMĚR • EY Startup Academy Frankfurt (2025) • OVHcloud Startup Program (EU-ready infrastruktura) • CzechInvest inkubace • ESA BIC CZ track (přihláška v procesu) • Doménově: marketplaces a velký e-commerce ekosystém (CZ/SK/PL + DACH) 4) PRO KOHO TO JE (a pro koho ne) Je to pro člověka, kterého baví ownership, incidenty, zlepšování SLO a „udělat to tak, aby to drželo“. Není to pro někoho, kdo chce jen klidnou správu a čekání na zadání. 5) VÝBĚR (rychle a férově) • 20 min úvod (motivace + zkušenosti) • 45 min technický rozhovor (K8s, observabilita, rollback story) • krátký mini-úkol (2–3 h) – návrh release/rollback + metriky 6) ODMĚNA Odměna podle rozsahu (freelance/part-time) + výkonnostní bonusy. Pokud se z toho stane core role, dává smysl řešit i dlouhodobou motivaci (podíl).

Informace o pozici

Mzda 60 000 - 120 000 Kč / měsíc
Typ odměny Odměna/Mzda Podíl
Vzdálená práce Hybrid Remote
Pracovní prostředí Moderní
Typ práce nebo projektu Moderní technologie Inovační projekty Transformační projekty
Typ smlouvy Freelancer
Typ pracovního úvazku Plný úvazek Částečný úvazek
Typ firmy Startup
Místo pracoviště Remote, Praha