Für drei Bundesländer, acht Kreise, 30 Verkehrsunternehmen und rund 3,67 Mio. Einwohner übernimmt der hvv das Management des öffentlichen Personennahverkehrs (ÖPNV) in der Metropolregion Hamburg. Mit rund 90 Mitarbeitenden ist die hvv GmbH die Regieorganisation und sorgt für einen leistungsfähigen sowie benutzerfreundlichen ÖPNV.
Die digitale Transformation steht auch beim hvv im Fokus. Mit Dir als Datenspezialisten (m/w/d) treiben wir das Thema Data Science voran und bauen unsere Dateninfrastruktur zukunftsfähig aus. Wir suchen Dich zum nächstmöglichen Zeitpunkt, unbefristet und in Voll- oder Teilzeit (mindestens 24 Std. / Woche) für unseren Bereich Vertrieb & digitale Prozesse als
Data Engineer (m/w/d)
- Aufbau einer modernen und branchenführenden verbundweiten Datenplattform – Single Source of Truth für alle steuerungsrelevanten Daten zur Mobilität in der Metropolregion Hamburg
- Entwicklung von verlässlichen und skalierbaren Data Processing Pipelines – Konsolidierung der Daten von diversen Verkehrsunternehmen und weiterer Datenlieferanten
- Konzeption von harmonisierten Datenmodellen zu relevanten Mobilitäts-Themenstellungen
- Austausch mit verbundweiten Fachexperten, um datenempfänger- und Use-Case-orientiert aufzubereiten
- Sicherstellung der Datenintegrität und Datensicherheit – Integration von Data-Privacy- und Data-Protection-Mechanismen
- Aufsetzen und Monitoring einer hochautomatisierten Job Orchestration
- Qualitativ hochwertige Dokumentation der Schnittstellen und Datenmodelle
- Abgeschlossenes Studium oder Berufsausbildung im Bereich Informatik, Wirtschaftsinformatik, Ingenieurwissenschaften oder eine vergleichbare Qualifikation
- Fundierte Kenntnisse in Python und branchenüblichen Libraries (Pandas, NumPy, FastAPI etc.)
- Erfahrung mit relationalen Datenbanksystemen und insbesondere SQL – Erfahrungen mit non-relationalen Datenbanksystemen von Vorteil
- Nutzung von Cloud-Infrastruktur (AWS, Azure o. Ä.) sowie Container Environments (Docker, Kubernetes)
- Praxiskenntnisse in Git als Version Control System
- Erfahrungen mit Apache Airflow (Job Orchestration), Shell Scripting (UNIX, Bash), Distributed Data Processing (Apache Spark) sowie Data Streaming (Apache Kafka) von Vorteil
- Kenntnisse über branchenübliche Dashboarding Tools (Tableau, PowerBI, Qlik etc.) sowie weiteren Data-Frontend-Tools (Streamlit etc.) von Vorteil
- Flexible Arbeitszeiten sowie Freizeitausgleich bei Mehrarbeit
- Möglichkeit, bis zu 80 % mobil zu arbeiten
- Kostenfreies hvv Deutschlandticket als Jobticket
- 30 Urlaubstage
- Eine betriebliche Altersvorsorge