Pia Schwarz M.A.

Funktion

  • Wissenschaftliche Mitarbeiterin in der Abteilung Digitale Sprachwissenschaft

Aufgaben

Gremienarbeit

Zur Person

  • seit Nov. 2022: Wissenschaftliche Mitarbeiterin am IDS
  • 2020 - 2022: Entwicklerin für Conversational AI - DB Systel
  • 2020 - 2022: Masterstudium International Studies in Computational Linguistics - Universität Tübingen
  • 2019 - 2020: Studentische Hilfskraft im Projekt CLARIN
  • 2018 - 2020: Werkstudentin Technische Dokumentation - AVAT Automation
  • 2017 - 2020: Bachelorstudium International Studies in Computational Linguistics - Universität Tübingen
  • 2012 - 2016: Bachelorstudium International Relations and Management - OTH Regensburg

Forschungsinteressen

  • Linked Data, Maschinelles Lernen, Named Entity Recognition, Natural Language Understanding, Maschinelle Übersetzung, Korpuslinguistik, Texttechnologie, Forschungsdateninfrastrukturen

Publikationen

Aktuelle Auswahl:

Schwarz, Pia (2025):
Named entity recognition and entity linking. In: Bański, Piotr / Heid, Ulrich / Herzberg, Laura (Hrsg.): Harmonizing language data. Standards for linguistic resources. (= Digital Linguistics 4). Berlin / Boston: de Gruyter. S. 89-114.
IDS-Publikationsserver Verlag
Ecker, Jennifer / Fischer, Stefan / Schwarz, Pia / Trippel, Thorsten / Werthmann, Antonina / Wilm, Rebecca (2025):
Unlocking the Corpus: Enriching Metadata with State-of-the-Art NLP Methodology and Linked Data. In: Vandeghinste, Vincent / Kontino, Thalassia (Hg.): Selected papers from theCLARIN Annual Conference 2024, Barcelona, Spain, 15–17 October 2024. (= Linköping Electronic Conference Proceedings 216). Linköping: Linköping University Electronic Press. S. 127-140.
IDS-Publikationsserver Verlag
Ecker, Jennifer / Fischer, Stefan / Schwarz, Pia / Trippel, Thorsten / Werthmann, Antonina / Wilm, Rebecca (2024):
Unlocking the corpus: enriching metadata with state-of-the-art nlp methodology and linked data. In: CLARIN Annual Conference Proceedings 2024. 15 – 17 October 2024, Barcelona, Spain. Utrecht: CLARIN. S. 181-184.
IDS-Publikationsserver Text
Schwarz, Pia (2024):
Semiautomatic data generation for academic named entity recognition in german text corpora. In: Luz de Araujo, Pedro Henrique / Baumann, Andreas / Gromann, Dagmar / Krenn, Brigitte / Roth, Benjamin / Wiegand, Michael: Proceedings of the 20th Conference on Natural Language Processing (KONVENS 2024). Wien: Association for Computational Linguistics. S. 173-181.
IDS-Publikationsserver Text

Vorträge

Aktuelle Auswahl:

Ecker, Jennifer / Schwarz, Pia / Wilm, Rebecca:
Werkstattreihe Standardisierung: DeReKo.
18.9.2025, IDS Mannheim (online)
Schwarz, Pia:
Named Entity Recognition und Linking in deutschsprachigen Zeitungstexten – Wie können (L)LMs unterstützen?. Workshop: (Generative) KI für Kultur- und Textdaten.
4.11.2024, Klassik Stiftung Weimar, Goethe- und Schiller-Archiv
Ecker, Jennifer / Fischer, Stefan / Schwarz, Pia / Trippel, Thorsten / Werthmann, Antonina / Wilm, Rebecca:
Unlocking the Corpus: Enriching Metadata with State-of-the-Art NLP Methodology and Linked Data. Posterpräsentation: CLARIN Annual Conference 2024.
15.10.2024, Barcelona, Spanien
Ecker, Jennifer / Schwarz, Pia / Wilm, Rebecca:
Large Language Models: Eine praktische Einführung. Pre-Conference-Tutorial zum Text+ Plenary 2024.
9.10.2024, IDS Mannheim
Schwarz, Pia:
Evaluation von Entity Linkern und Entity Linking mit LLMs. IO-Lecture: Entity Linking.
18.9.2024, Online