Dr. Ngoc Duyen Tanja Tu

Funktion

Aufgaben

Gremienarbeit

Zur Person

  • Oktober 2022: Gastaufenthalt am Trier Center for Digital Humanities im Projekt "Zeta und Konsorten. Distinktivitätsmaße für die Digitalen Literaturwissenschaften" (Leitung: Prof. Dr. Christof Schöch) im Rahmen des "Young Researcher Visiting Programme" des DFG Schwerpunktprogramms SPP 2207 "Computational Literary Studies"
  • 2019-2022: Promotion im Fach "Germanistische Sprach- und Medienwissenschaft" an der Universität Mannheim; Titel der Dissertation: "Eine korpuslinguistische Untersuchung zur lexikalischen Vielfalt von direkten und indirekten Redeeinleitern" (Erstgutachter: Prof. Dr. Stefan Engelberg, Zweitgutachterin: Prof. Dr. Carolin Müller-Spitzer)
  • seit Februar 2017: Wissenschaftliche Mitarbeiterin am IDS
  • 2014-2016: Studentische Hilfskraft am Lehrstuhl für Bildungspsychologie, Universität Mannheim, DFG-Projekt "Lernen mit Animationen im Vergleich zu Standbildern: Extrahieren vs. Inferieren von Informationen über dynamische Zusammenhänge"
  • 2011-2017: Studium der Germanistik und der Informatik an der Universität Mannheim (Abschluss: 1. Staatsexamen für das Lehramt an Gymnasien)

Forschungsinteressen

  • (Quantitative) Korpuslinguistik
  • Large Language Models
  • Machine Learning
  • Natural Language Processing

Auszeichnung

Lehrveranstaltungen

Aktuelle Auswahl:

Module A3 'Modeling and representing data in Digital Lexicography', European Master in Lexicography (EMLex), Blockseminar, SoSe 2024, Universität Hildesheim

Publikationen

Aktuelle Auswahl:

Brunner, Annelen / Tu, Ngoc Duyen Tanja / Weimer, Lukas (2024):
Das kleine Wörterbuch der Redeeinleiter. In: Weiss, Joëlle / Bunout, Estelle / Haider, Thomas / Helling, Patrick (Hg.): DHd 2024 Quo Vadis DH (DHd2024). Passau: Zenodo.
Verlag
Tu, Ngoc Duyen Tanja (2024):
Eine korpuslinguistische Untersuchung zur lexikalischen Vielfalt von direkten und indirekten Redeeinleitern. (= IDSopen 6). Mannheim: IDS-Verlag.
Lang, Christian / Tu, Ngoc Duyen Tanja / Zeidler, Laura (2023):
Making Non-Normalized Content Retrievable – A Tagging Pipeline for a Corpus of Expert–Layperson Texts. In: Carvalho, Sara / Khan, Anas Fahad / Anić, Ana Ostroški / Spahiu, Blerina / Gracia, Jorge / McCrae, John P. / Gromann, Dagmar / Heinisch, Barbara / Salgado, Ana (Hg.): Language, Data and Knowledge 2023 (LDK 2023): Proceedings of the 4th Conference on Language, Data and Knowledge. CLUNL, Faculdade de Ciências Sociais e Humanas, Universidade NOVA de Lisboa. S. 239-244.
IDS-Publikationsserver Verlag
Tu, Ngoc Duyen Tanja (2023):
„Hallo ChatGPT, ist das Komma in folgendem Satz richtig?“ – Können leistungsstarke Chatbots traditionelle Sprachberatung ersetzen? In: DHd-Blog – Digital Humanities im deutschsprachigen Raum. Göttingen: Staats- und Universitätsbibliothek Göttingen. 7 S.
IDS-Publikationsserver Text
Lang, Christian / Tu, Ngoc Duyen Tanja / Schneider, Roman / Volodina, Anna (2023):
Projektvorstellung – Sprachanfragen. Empirisch gestützte Erforschung von Zweifelsfällen. In: Trilcke, Peer / Busch, Anna / Helling, Patrick (Hg.): DHd 2023 Open Humanities Open Culture. 9. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" (DHd 2023), Trier, Luxemburg. Genf: zenodo. 2 S.
IDS-Publikationsserver Text

Vorträge

Aktuelle Auswahl:

Lang, Christian / Schneider, Roman / Tu, Ngoc Duyen Tanja:
Automatic question answering for the linguistic domain – An evaluation of LLM knowledge base extension with RAG. 29th International Conference on Natural Language & Information Systems (NLDB).
25.6.2024, Universität Turin, Italien
Tu, Ngoc Duyen Tanja:
Posterpräsentation: Analyzing the impact of an acquisition model in deep active learning for a sequence labeling task. 9. Swiss Text Analytics Conference.
10.6.2024, Fachhochschule Graubünden, Schweiz
Tu, Ngoc Duyen Tanja / Lang, Christian:
Extending a knowledge graph for the automatic tagging of non-normalized texts. Kolloquium im Rahmen des European Master in Lexicography (EMLex).
13.3.2024, Universität Hildesheim
Hansen, Sandra / Lang, Christian / Schneider, Roman / Tu, Ngoc Duyen Tanja:
“Alter, sprich mich bloß nicht an!”
Modalpartikeln in Popsongs – Kontextabhängige Detektion mit selbstlernenden Algorithmen.
(Kurzvortrag im Rahmen der Projekt- und Methodenmesse)
. , 60. Jahrestagung des Leibniz-Instituts für Deutsche Sprache, "Gesprochenes Deutsch: Struktur, Variation, Interaktion".
6.3.2024, Rosengarten, 68161 Mannheim
Brunner, Annelen / Tu, Ngoc Duyen Tanja / Weimer, Lukas:
Posterpräsentation: Das kleine Wörterbuch der Redeeinleiter. 10. Tagung des Verbands Digital Humanities im deutschsprachigen Raum (DHd 2024).
29.2.2024, Universität Passau