Die DIN Solutions GmbH steht innerhalb der DIN-Gruppe für eine hohe technische Expertise und ist verantwortlich für die Entwicklung und den Betrieb von Software, Plattformen und Datenbanken. Unsere Aufgabe ist es, (Kunden-)Anforderungen in technische Lösungen zu übersetzen. Darüber hinaus entwickeln wir Lösungen für Normenanwender und Kooperationspartner der DIN-Gruppe.
Wir suchen ab sofort in Berlin - unbefristet -
Data Scientist (m/w/d) in den Bereichen NLP und LLM
Wir suchen einen Data Scientist (m/w/d) in den Bereichen Natural Language Processing (NLP) und Large Language Models (LLM). In dieser Rolle unterstützt Du unser Team bei der Entwicklung und Anwendung von NLP- und LLM-Technologien zusammen mit weiteren erfahrenen Kolleg*innen. Du erhältst die Gelegenheit, in einem dynamischen und kreativen Umfeld der Normung und Normen-Anwendung zu arbeiten und Dich im Bereich der natürlichen Sprachverarbeitung zu verwirklichen. Die Tätigkeit umfasst insbesondere folgende Aufgaben:
- Bewerten, Entwickeln und Produktivsetzen von Modellen und Algorithmen im Bereich Natural Language Processing (NLP) und Large Language Models (LLM)
- Erkennen und Implementieren neuer, innovativer Einsatzmöglichkeiten von NLP und LLM in unternehmerischen Kontexten (DIN Media Produkte und Lösungen).
- Planung, Installation und Betrieb von Open Source Large Language Modellen (LLM)
- Implementierung von Webanwendungen für den nutzerseitigen Zugang zu LLMs
- Bereitstellung von APIs zur Integration in eigene DIN Media Produkte und Lösungen
- Unterstützung bei Ausstattung von DIN-Plattformen durch LLMs
- Projektleitung und Projektsupport
- Mitarbeit in DIN- und KI-Netzwerken
- Entwicklung, Organisation und Durchführung von DIN-gruppenweitem Wissensaufbau
- Erstellung und Pflege von Dokumentationen
- Technischer Support für die Sicherstellung des LLM-Betriebes
- Abgeschlossenes Studium im Bereich Statistik, Data Science, Mathematik, Informatik oder verwandten Fachrichtungen
- Sicheres Verständnis von NLP- und LLM-Konzepten
- Fortgeschrittene Python Kenntnisse im Bereich Data Science
- Erfahrung mit LLM-Frameworks wie Langchain, Llamaindex sowie Vector-Datenbanken
- Kenntnisse in der Software-Entwicklung: Git, Docker, Shell, Cloud, Projektmanagement, JIRA, Confluence
- Sehr gute Deutsch- und Englischkenntnisse
- 35 Std./Woche (Vollzeit)
- Maxi-Flex-Modell: Möglichkeit der Anhebung der Wochenarbeitszeit auf bis zu 42 Std./Woche
- Flexible Arbeitszeiten (Gleitzeitmodell mit Kernarbeitszeit 10:00 - 14:00 Uhr)
- Mobiles Arbeiten möglich
- 30 Tage Jahresurlaub sowie Betriebsferien zwischen Weihnachten und Neujahr
- Ein top modernisiertes Gebäude in zentraler Lage (Wittenbergplatz/Zoologischer Garten)
- Kostenfreie Nutzung des hauseigenen Physiozentrums, Zuschuss zum VBB-Firmenticket, JobRad, Sabbatical, Betriebsrestaurant mit bezuschusstem Essen, betriebliche Altersvorsorge etc.
- Umfassende und strukturierte Einarbeitung und Betreuung
GIMED1_DE