Data Engineer pro AI projekt (TOP 300 v EU)

3BrainAI s.r.o. logo

Jsme mezi TOP 300 technologickými projekty v Evropě (OVHcloud 2025 - Francie) a stavíme AI, která obchodníkům radí, co, kolik a za kolik naskladnit. Hledáme Python/Data engineera pro ETL a doplňování atributů do DataGridu. Běžíme on-prem (PostgreSQL, ClickHouse, Docker). Remote-first, async. Data, která dýchají.

Úroveň
  • Medior
  • Senior
Spolupráce
  • Freelancer
  • Homeoffice
  • Remote
Úvazek
  • Částečný úvazek
Mzda
130 000 Kč / měsíc nebo si řekni o víc
Informace

Popis pozice

O projektu
Spouštíme ostrý AI pilot na vlastním GPU stacku. Naše data vrstva zásobuje retrievery a predikce – měříme time-to-market v hodinách, ne týdnech. Tech: Python 3.11, PostgreSQL, ClickHouse, Docker, GitHub/GitLab CI.

Co budeš dělat

  • Zpracovávat vstupní feedy (CSV/XLSX/JSON) a připravovat je pro retriever pipeline.

  • Doplňovat produktové parametry z DataGridu (šířka, materiál, barva…).

  • Psát SQL pro validaci a doplňování atributů (ClickHouse, PostgreSQL).

  • Monitorovat datovou úplnost/validitu a připravovat tabulky pro embedding a AI výstupy.

  • Spolupracovat s vývojářem a PO na zlepšování datové kvality pro predikce/pricing.

Tvůj profil (must-have)

  • Python (Pandas, SQLAlchemy), solidní SQL.

  • Zkušenost s ETL a verzováním v Gitu (GitHub/GitLab).

  • Docker; základní práce s CI (pipeline, testy).

  • Umíš psát čitelné skripty a testovat je (pytest).

Výhodou

  • dbt nebo Airflow, regexy a datové vzory.

  • ClickHouse zkušenost, příprava dat pro vektorové vyhledávání/embedding.

  • FastAPI (jednoduché integrační hooky).

 

 

Zkušenosti Co požadujeme

  • Úroveň:
    Medior Senior
  • Praxe:
    3 roky
  • Vzdělání:
    VŠ student

Pozice

Databázový developer Data developer (BI, DWH, BigData)

Základní dovednosti

Python Pandas SQL PostgreSQL ClickHouse Git (GitHub/GitLab) Docker ETL Zpracování datových souborů

Výhodou

dbt / Airflow Data Quality / completeness testing Práce s datovými vzory a regulárními výrazy Příprava dat pro embedding (ClickHouse) FastAPI

Softskills

Zodpovědnost samostatnost Technický úsudek Orientace na výsledek cit pro datovou kvalitu

Jazyky

Česky – domluvit se Anglicky – čtení dokumentace

Práce u nás Co nabízíme

Jaké jsou benefity

  • Práce na vlastním on-prem GPU stacku

  • Async režim – žádné zbytečné cally

  • Reálný dopad – AI, která ovlivní nákupní rozhodování

  • Možnost být uveden jako spoluautor pilotu (GitHub, publikace)

  • Výkonové bonusy za funkční deployment nebo rychlost inference

  • Práce v sandboxu i air-gapped režimu

  • Experimenty s LLM, retrievery, optimalizátory, auto-fallback

  • Volnost v nástrojích – rádi zkoušíme, co funguje (FastAPI, Streamlit, MLflow, Vault, Terraform...)

 

Proč si vybrat tuto nabídku

Nejsme korporát s týmem 40 analytiků, kde tvá práce skončí v tabulce, na kterou se nikdy nikdo nepodívá. Jsme AI projekt oceněný mezi TOP 300 v Evropě (OVHcloud 2025) a tvoje data budou první, která rozhýbou celý systém – od vstupního feedu až po rozhodnutí, co, kolik a za kolik naskladnit. Tohle není typický BI projekt. Nepotřebujeme další graf nebo dashboard. Potřebujeme doplnit chybějící produktové parametry, které reálně ovlivní prodeje – a to hned, ne za tři kvartály. Budeš kombinovat tabulky, texty, kategorie i struktury, a všechno poběží na ostrém systému, ne v sandboxu. Pracujeme s vlastním on-prem GPU clusterem, ne s připojením k OpenAI API. Používáme ClickHouse, MLflow, Llama-2 inference a vektorové vyhledávání. Tvůj kód se stane součástí rozhodovací pipeline, kde výsledek uvidíš – třeba v tom, že se produkt začne konečně prodávat. Pomůžeš nám zrychlit onboarding stovek SKU, snížit množství chyb, doplnit klíčové atributy (šířka, barva, materiál) a zvýšit přesnost AI modelu. Pracujeme remote-first a async – žádné zbytečné meetingy, ale přímý přístup k infrastruktuře. Pokud máš nápad, jak něco dělat líp, chceme ho slyšet. Neřešíme tituly, řešíme výsledek. A pokud se chytneš, můžeš pokračovat dál – třeba i jako spoluautor patentové přihlášky. Tvoje práce bude vidět. A hlavně – bude fungovat.

Informace o pozici

Mzda 70 000 - 130 000 Kč / měsíc
Typ odměny Odměna/Mzda
Vzdálená práce Homeoffice Remote
Pracovní prostředí Moderní
Typ práce nebo projektu Moderní technologie Inovační projekty Transformační projekty
Typ smlouvy Freelancer
Typ pracovního úvazku Částečný úvazek
Typ firmy Startup
Místo pracoviště Remote