XX
(Senior) Site Reliability Engineer / Distributed Cloud - STACKIT (m/w/d)Schwarz DigitsBaden, Lower Saxony, Germany
XX

(Senior) Site Reliability Engineer / Distributed Cloud - STACKIT (m/w/d)

Schwarz Digits
  • DE
    Baden, Lower Saxony, Germany
  • DE
    Baden, Lower Saxony, Germany

Über

  • Du hast ein abgeschlossenes Studium in Informatik oder einem verwandten Fachgebiet.
  • Mindestens 2 Jahre aktive Erfahrung als SRE/DevOps Engineer, wo du gelernt hast, dass 'Works on my machine' keine Antwort ist.
  • Fundierte Erfahrung im Betrieb von Cloud-Infrastrukturen mit Kubernetes und/oder Virtualisierungstechnologien.
  • Du hast gute Kenntnisse in der Softwareentwicklung mit Golang oder einer vergleichbaren Systemsprache und nutzt diese, um Abläufe zu automatisieren und eigene Tools zu bauen.
Einleitungstext

Schwarz Digits schafft das technologische Fundament für digitale Entscheidungsfreiheit in Europa. Als IT- und Digitalsparte der Schwarz Gruppe entwickeln und verantworten wir einerseits die IT-Infrastrukturen für die Handelssparten Lidl und Kaufland sowie die Schwarz Produktion und PreZero. Gleichzeitig agieren wir als unabhängiger Anbieter am externen Markt, um Unternehmen in ganz Europa bei ihrer digitalen Transformation zu unterstützen. Unsere Kernleistungen bündeln wir in den Bereichen Cloud, Cyber Security, Data & AI, Communication und Workspace. Trage auch du zur digitalen Entscheidungsfreiheit in Europa bei.
Bei uns arbeitest du an der Schnittstelle zwischen Agilität und Sicherheit: Du profitierst von den schnellen Entscheidungswegen, genießt echte Gestaltungsspielräume in deinen Projekten und baust dabei auf das stabile Fundament der Schwarz Gruppe.

Deine Aufgaben
  • Du betreibst und optimierst unsere hochkomplexen Plattformen (Kubernetes, KubeVirt, Cilium, Ceph, Talos) sowie die zugrundeliegende Infrastruktur mit dem Fokus auf End-to-End-Stabilität, Skalierbarkeit und Kosten.
  • Du entwickelst und pflegst unsere Monitoring- und Logging-Systeme (Metrics, Logs, Traces), um jederzeit tiefgreifende Einblicke in den Systemzustand zu gewährleisten und proaktiv Engpässe zu erkennen.
  • Du implementierst konsequentes Synthetic Monitoring und Tracetests, um die End-to-End-Funktionalität kritischer Services kontinuierlich zu validieren.
  • Du definierst und überwachst klare Service Level Objectives (SLOs) und reduzierst 'Toil' konsequent durch Code. Runbooks sind für dich nur die letzte Verteidigungslinie.
  • Du dokumentierst deine Arbeit nachvollziehbar, denn das beste System ist wertlos ohne ein gutes Markdown.
  • Baden, Lower Saxony, Germany

Sprachkenntnisse

  • German
Hinweis für Nutzer

Dieses Stellenangebot stammt von einer Partnerplattform von TieTalent. Klicken Sie auf „Jetzt Bewerben“, um Ihre Bewerbung direkt auf deren Website einzureichen.