Fraunhofer Institute for Secure Information Technology SIT
Crew United
SIFAMO
Nordicrecruiters
Nordicrecruiters
Nordicrecruiters
Nordicrecruiters
Nordicrecruiters
Vernetze dich mit Headhuntern um dich auf ähnliche Jobs zu bewerbenH-E Parts
Husqvarna Group
Fraunhofer-Gesellschaft
DataCraft GmbH
HRIT People
Nityo Infotech
Teleperformance Portugal
CloudCommand GmbH
3C - Career Consulting Company
Masters of Marketing GmbH
Eine Forschungsinstitution in Darmstadt sucht einen engagierten Praktikanten zur Entwicklung und Evaluierung von Verfahren zur Erkennung von Hybridtexten. Der Bewerber sollte über Grundkenntnisse im Bereich Machine Learning und Natural Language Processing verfügen sowie gute Python-Kenntnisse haben. Die Tätigkeiten umfassen den Aufbau von Datensätzen, die Implementierung und Evaluation von Klassifikationsverfahren und die Anfertigung eines Projektberichts. Flexible Arbeitszeiten und Einblicke in die akademische Forschung werden geboten.
Mit dem Aufkommen leistungsfähiger Sprachmodelle (LLMs) entstehen immer häufiger Texte, die nicht ausschließlich von Menschen verfasst sind, sondern aus einer Mischung von menschlichen und maschinellen Passagen bestehen [1]. Solche sogenannten Hybridtexte stellen neue Herausforderungen dar, etwa bei der Plagiatserkennung, in der akademischen Integrität oder in der journalistischen Qualitätskontrolle [2]. Während es bereits zahlreiche Forschungsarbeiten zur Erkennung von vollständig LLM-generierten Texten gibt, ist die Identifikation von Hybridtexte deutlich schwieriger. Es fehlt an Studien, die systematisch untersuchen, wie zuverlässig Abschnitte innerhalb eines Dokuments einem Menschen oder einem LLM zugeordnet werden können [3].
Das Ziel dieser Arbeit ist es, Transformer-basierte Verfahren für die Erkennung von Hybridtexten zu entwickeln und zu evaluieren. Konkret sollen Abschnitte in Dokumenten identifiziert werden, die entweder von einem Menschen oder von einem LLM stammen. Dazu werden geeignete Datensätze aufgebaut (z. B. durch künstliche Kombination von Human- und LLM-Texten) und Modelle trainiert, die diese Segmentierungsaufgabe lösen.
Die Arbeit liefert eine erste systematische Untersuchung zur automatischen Segmentierung von Hybridtexten. Die Ergebnisse sollen zeigen, wie zuverlässig aktuelle Verfahren in der Lage sind, menschliche und LLM-generierte Abschnitte voneinander zu trennen. Damit leistet die Arbeit einen Beitrag zur Entwicklung von Werkzeugen, die im Bildungsbereich, in der Plagiatserkennung und in der Medienanalyse eingesetzt werden können.
[1] https://www.educationaldatamining.org/edm2024/proceedings/2024.EDM-short-papers.55/2024.EDM-short-papers.55.pdf
[2] https://arxiv.org/abs/2310.08903
[3] https://arxiv.org/html/2310.14724v3
Wir wertschätzen und fördern die Vielfalt der Kompetenzen unserer Mitarbeitenden und begrüßen daher alle Bewerbungen – unabhängig von Alter, Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung sowie sexueller Orientierung und Identität. Schwerbehinderte Menschen werden bei gleicher Eignung bevorzugt eingestellt. Unsere Aufgaben sind vielfältig und anpassbar – für Bewerber*innen mit Behinderung finden wir gemeinsam Lösungen, die ihre Fähigkeiten optimal fördern.
Mit ihrer Fokussierung auf zukunftsrelevante Schlüsseltechnologien sowie auf die Verwertung der Ergebnisse in Wirtschaft und Industrie spielt die Fraunhofer-Gesellschaft eine zentrale Rolle im Innovationsprozess. Als Wegweiser und Impulsgeber für innovative Entwicklungen und wissenschaftliche Exzellenz wirkt sie mit an der Gestaltung unserer Gesellschaft und unserer Zukunft.
Bereit für Veränderung? Dann bewirb Dich jetzt, und mach einen Unterschied! Nach Eingang Deiner Online-Bewerbung erhältst Du eine automatische Empfangsbestätigung. Dann melden wir uns schnellstmöglich und sagen Dir, wie es weitergeht.
Fraunhofer-Institut für Sichere Informationstechnologie SIT
www.sit.fraunhofer.de
Kennziffer: 82693 Bewerbungsfrist:
* Der Gehaltsbenchmark wird auf Basis der Zielgehälter bei führenden Unternehmen in der jeweiligen Branche ermittelt und dient Premium-Nutzer:innen als Richtlinie zur Bewertung offener Positionen und als Orientierungshilfe bei Gehaltsverhandlungen. Der Gehaltsbenchmark wird nicht direkt vom Unternehmen angegeben. Er kann deutlich über bzw. unter diesem Wert liegen.