Pia Schwarz M.A.
Funktion
- Wissenschaftliche Mitarbeiterin in der Abteilung Digitale Sprachwissenschaft
Aufgaben
- Projekt Text+
Gremienarbeit
- Mitarbeit im DIN-Normenausschuss Terminologie (NAT) NA 105-00-06 AA Sprachressourcen und Sprachtechnologie bzw. im Gemeinschaftsarbeitskreis NAT/NIA: Natural Language Processing NA 105-00-06-01 GAK.
- Mitarbeit im Arbeitskreis Forschungsdaten der Leibniz Gemeinschaft
- Mitarbeit bei nestor e.V., einem Kompetenznetzwerk für digitale Langzeitarchivierung.
- Mitarbeit in der DINI/nestor-AG Forschungsdaten.
Zur Person
- seit Nov. 2022: Wissenschaftliche Mitarbeiterin am IDS
- 2020 - 2022: Entwicklerin für Conversational AI - DB Systel
- 2020 - 2022: Masterstudium International Studies in Computational Linguistics - Universität Tübingen
- 2019 - 2020: Studentische Hilfskraft im Projekt CLARIN
- 2018 - 2020: Werkstudentin Technische Dokumentation - AVAT Automation
- 2017 - 2020: Bachelorstudium International Studies in Computational Linguistics - Universität Tübingen
- 2012 - 2016: Bachelorstudium International Relations and Management - OTH Regensburg
Forschungsinteressen
- Linked Data, Maschinelles Lernen, Named Entity Recognition, Natural Language Understanding, Maschinelle Übersetzung, Korpuslinguistik, Texttechnologie, Forschungsdateninfrastrukturen
Publikationen
Aktuelle Auswahl:
- Schwarz, Pia (2025):
- Named entity recognition and entity linking. In: Bański, Piotr / Heid, Ulrich / Herzberg, Laura (Hrsg.): Harmonizing language data. Standards for linguistic resources. (= Digital Linguistics 4). Berlin / Boston: de Gruyter. S. 89-114.
→IDS-Publikationsserver →Verlag - Ecker, Jennifer / Fischer, Stefan / Schwarz, Pia / Trippel, Thorsten / Werthmann, Antonina / Wilm, Rebecca (2025):
- Unlocking the Corpus: Enriching Metadata with State-of-the-Art NLP Methodology and Linked Data. In: Vandeghinste, Vincent / Kontino, Thalassia (Hg.): Selected papers from theCLARIN Annual Conference 2024, Barcelona, Spain, 15–17 October 2024. (= Linköping Electronic Conference Proceedings 216). Linköping: Linköping University Electronic Press. S. 127-140.
→IDS-Publikationsserver →Verlag - Ecker, Jennifer / Fischer, Stefan / Schwarz, Pia / Trippel, Thorsten / Werthmann, Antonina / Wilm, Rebecca (2024):
- Unlocking the corpus: enriching metadata with state-of-the-art nlp methodology and linked data. In: CLARIN Annual Conference Proceedings 2024. 15 – 17 October 2024, Barcelona, Spain. Utrecht: CLARIN. S. 181-184.
→IDS-Publikationsserver →Text - Schwarz, Pia (2024):
- Semiautomatic data generation for academic named entity recognition in german text corpora. In: Luz de Araujo, Pedro Henrique / Baumann, Andreas / Gromann, Dagmar / Krenn, Brigitte / Roth, Benjamin / Wiegand, Michael: Proceedings of the 20th Conference on Natural Language Processing (KONVENS 2024). Wien: Association for Computational Linguistics. S. 173-181.
→IDS-Publikationsserver →Text
Vorträge
Aktuelle Auswahl:
- Ecker, Jennifer / Schwarz, Pia / Wilm, Rebecca:
- Werkstattreihe Standardisierung: DeReKo.
18.9.2025, IDS Mannheim (online) - Schwarz, Pia:
- Named Entity Recognition und Linking in deutschsprachigen Zeitungstexten – Wie können (L)LMs unterstützen?. Workshop: (Generative) KI für Kultur- und Textdaten.
4.11.2024, Klassik Stiftung Weimar, Goethe- und Schiller-Archiv - Ecker, Jennifer / Fischer, Stefan / Schwarz, Pia / Trippel, Thorsten / Werthmann, Antonina / Wilm, Rebecca:
- Unlocking the Corpus: Enriching Metadata with State-of-the-Art NLP Methodology and Linked Data. Posterpräsentation: CLARIN Annual Conference 2024.
15.10.2024, Barcelona, Spanien - Ecker, Jennifer / Schwarz, Pia / Wilm, Rebecca:
- Large Language Models: Eine praktische Einführung. Pre-Conference-Tutorial zum Text+ Plenary 2024.
9.10.2024, IDS Mannheim - Schwarz, Pia:
- Evaluation von Entity Linkern und Entity Linking mit LLMs. IO-Lecture: Entity Linking.
18.9.2024, Online