AI Data Engineer (m / w / d)

Sei unter den ersten Bewerbenden.
Nur für registrierte Mitglieder
Leverkusen
EUR 60.000 - 85.000
Sei unter den ersten Bewerbenden.
Vor 3 Tagen
Jobbeschreibung

Die Organisation für digitale Forschung und Entwicklung (DRD) bei Covestro ist verantwortlich für innovative digitale Lösungen für die Entwicklung von chemischen Produkten und Anwendungen. Hier arbeiten unter anderem Experten für Materialsimulationen und computergestützte Chemie, Laborautomatisierung, R&D Data Science, High-Performance Computing und Quantum Computing. Die Abteilung baut ihr Team von Wissenschaftlern und Softwareentwicklern aus, um die neuen Möglichkeiten der künstlichen Intelligenz für die chemische und materialwissenschaftliche Forschung nutzbar zu machen. Insbesondere beabsichtigen wir, Large Language Models einzusetzen, um bessere Erkenntnisse aus unstrukturierten Datenquellen (wie Forschungsberichten oder regulatorischen Texten) zu gewinnen und den chemischen Forschungsprozess zunehmend mit künstlicher Intelligenz und Kreativität zu unterstützen.

Unterstützung laufender und zukünftiger Projekte im Bereich KI

Analyse von Geschäfts- / Projektanforderungen und Identifizierung relevanter Daten und Werkzeuge für die Verwendung in LLMs, KI-Modellen und Anwendungen

Entwicklung, Pflege und Automatisierung von Pipelines für chemische LLMs

Entwicklung, Pflege und Automatisierung von Modellen und Methoden für den Zugriff auf vertrauliche Informationsquellen aus bestehenden LLMs

Wartung und Betrieb von bestehenden Lösungen

Zusammenarbeit mit Cloud-Architekten zur Automatisierung, Wartung und Überwachung von Pipeline-Lösungen

Steigerung der Effizienz und Geschwindigkeit bei der Bereitstellung neuer Lösungen im Bereich der digitalen Forschung und Entwicklung. Erkundung neuer Lösungsmöglichkeiten für Probleme im F&E-Umfeld unter Verwendung von KI-Technologie

Hochschulabschluss oder abgeschlossene Ausbildung in Bereichen wie Mathematik, Informatik, Naturwissenschaften oder Technik (MINT)

Praktischer Hintergrund und Erfahrung in der Softwareentwicklung mit Python

Kenntnisse in der Implementierung von Pipelines mit Langchain oder ähnlichen Tools

Kenntnisse in der Nutzung und Konfiguration von Indexierungswerkzeugen (RAG, Vector Databases, etc.)

Erfahrung mit Frameworks im LLM-Ökosystem (Langchain, LlamaIndex, Haystack, etc.)

Praktische Erfahrung mit Containerisierung sowie Erstellung und Verwaltung benutzerdefinierter Docker-Images

Kenntnisse im Umgang mit dem Betriebssystem Linux, insbesondere Shell-Scripting und sicherer Umgang mit Linux-Bash-Befehlen

Allgemeine Kenntnisse der AWS-Cloud-Dienste wie AWS Batch, ECS Fargate, S3, RDS

Verständnis für die Grundlagen der Polymerchemie, insbesondere in Bezug auf die Datenerfassung und -verarbeitung in diesem Bereich

Beherrschung der englischen Sprache in Wort und Schrift