KI-Assistent für Geoanthropologie
Das Projekt zielt darauf ab, einen KI-Assistenten zu entwickeln, der die Forschung auf dem aufstrebenden, stark interdisziplinären Gebiet der Geoanthropologie unterstützt. Die neue Generation der generativen KI beginnt, die wissenschaftliche Praxis in allen Disziplinen zu verändern. Insbesondere große Sprachmodelle (Large Language Models, LLMs) werden immer besser im Verstehen von Text und in der schnellen Generierung präziser Antworten, wodurch diese Technologie in vielen Bereichen, auch in der Wissenschaft, breit anwendbar wird. Auch wenn die Auswirkungen auf die Wissenschaft noch nicht in vollem Umfang bekannt sind und die Grenzen noch diskutiert werden, steht fest, dass Forschende die neue Technologie bereits in großem Umfang in ihren wissenschaftlichen Arbeitsabläufen einsetzen, von einfachen Aufgaben wie dem Korrekturlesen von Texten bis hin zu integralen Bestandteilen wissenschaftlicher Routinen wie der Zusammenfassung oder Abfrage wissenschaftlicher Literatur. LLMs haben zweifellos das Potenzial, die wissenschaftliche Forschung effizienter, effektiver und zugänglicher zu machen, und werden in den nächsten Jahren sicherlich die Art und Weise verändern, wie wir Wissenschaft konsumieren und schaffen.
Unser KI-Assistent basiert auf einem großen Sprachmodell für Fachleute, Geacop. Es gibt einen Prototyp von Geacop, der anhand von etwa 5000 Büchern, Buchkapiteln und Artikeln von den aktiven Teilnehmenden der Eröffnungskonferenz des Instituts, "The Anthropocene - Crossing Boundaries", feinabgestimmt wurde. Zukünftige Versionen des Modells werden auf einen weitaus größeren Korpus an Literatur zum Thema Geoanthropologie trainiert werden. Das LLM ist in eine digitale Umgebung namens Kantropos eingebettet, die Geacop und den damit interagierenden Forschenden einen direkten Zugang zu relevanten wissenschaftlichen Erkenntnissen ermöglicht. Gemeinsam mit Krishna Gummadi und seiner Gruppe am Max-Planck-Institut für Softwaresysteme untersuchen wir, wie bestehende KI-Technologien so angepasst werden können, dass sie den Anforderungen, die sich aus ihrem Einsatz in Forschungskontexten ergeben, besser gerecht werden.