Aus unstrukturierten «Datenhalden» wertvolles Wissen gewinnen
Seit diesem Semester herrscht noch mehr Betrieb an der FH Graubünden: Die ersten Studierenden haben das anspruchsvolle technische Bachelorstudium «Computational and Data Science» in Angriff genommen, in dessen Verlauf sie die Datenanalyse und -simulation in so unterschiedlichen Bereichen wie Finanzen, Naturwissenschaften und Medizin kennenlernen werden. Dieses neue Bachelorangebot wurde ihm Zuge der Umsetzung der Forschungsstrategie des Kantons Graubünden konzipiert und entwickelt.
Text: Heiko Rölke / Bilder: FH Graubünden
Datenanalyse, Visualisierung und wissenschaftliches Rechnen sind heute längst nicht mehr den reinen Informatikerinnen und Informatikern vorbehalten. Nahezu alle Bereiche wenden diese Techniken an, sodass auch immer Anwendungsexpertinnen und -experten gefragt sind. Daneben gibt es weiterhin einen grossen Bedarf, die vorhandenen und neu entwickelten Methoden auf die verschiedenen Anwendungsfelder zu übertragen, beispielsweise im rasant wachsenden Deep-Learning-Bereich, sodass immer mehr Anwendungsfelder erschlossen werden.
Um in diesen Bereichen nicht nur mithalten zu können, sondern voranzuschreiten und neue Massstäbe zu setzen, hat der Kanton Graubünden im Rahmen seiner Forschungsstrategie die Fachhochschule Graubünden in Zusammenarbeit mit dem Schweizer Institut für Allergie- und Asthmaforschung (SIAF) mit dem Aufbau eines Zentrums für Datenanalyse, Visualisierung und Simulation (Data Analytics, Simulation and Data Visualization, kurz DAViS) beauftragt. DAViS erfüllt zahlreiche Aufgaben in den Bereichen Forschung, Beratung, Infrastruktur und Dienstleistung. Ein weiterer Schwerpunkt ist die Lehre: DAViS steht für moderne, datenorientierte Themen und begeistert die Studierenden mit angewandten Themen. Im Zentrum steht dabei immer die praktische Umsetzung durch die Studierenden selbst.
Komplexe Sachverhalte sichtbar machen
Mithilfe von Visualisierungen in Form sogenannter Dashboards werden komplexe Sachverhalte sichtbar gemacht; Programmierung und Softwareentwicklung lernen und üben die Studierenden so quasi «nebenbei». Themen und Datenbestände ergeben sich aus aktuellen Thematiken und Forschungsprojekten sowie aus Vorschlägen der Studierenden selbst. Ein Beispiel hierfür ist die interaktive Visualisierung von COVID-Daten (Abbildung 1) durch ein Studierendenteam (A. Bednarzewska, S. Clavadetscher und L. Reinhold). Diese Daten wurden im Rahmen des Kurses Dynamic User Interfaces erstellt. Sämtliche Parameter wie Datengrundlage, Zeitraum usw. lassen sich interaktiv beeinflussen.
Simulationen helfen, gefährliche Situationen besser zu verstehen oder Experimente durchzuführen, die in der Realität nicht durchführbar oder nur sehr aufwändig umzusetzen sind. Dabei helfen auch qualitativ hochwertige Visualisierungen, zum Beispiel dreidimensionale Visualisierungen in einem Projektionszelt – einer sogenannten «Cave». Für Simulationen sind hohe Rechenleistungen sowie spezielle Programmiertechniken erforderlich.
Mittels Datenanalyse und insbesondere Machine Learning können aus unstrukturierten «Datenhalden» wertvolles Wissen und Information gewonnen werden. Ein Schwerpunkt im Bereich Machine Learning an der FH Graubünden ist die Verarbeitung von Textdaten, vor allem aus öffentlich zugänglichen Quellen im Internet. Die Textanalyse ist dabei sehr stark von der englischen Sprache dominiert, denn fast alle Lehr- und Übungsmaterialien sind auf Englisch. Im Rahmen des praxisorientierten Lehransatzes der FH Graubünden erarbeiten die Studierenden Lösungen für andere Sprachen und setzen diese auch selbstständig um. Oft ergeben sich aus diesen Eigenentwicklungen auch Themen für Projekte und Abschlussarbeiten – idealerweise in Kooperation mit Auftraggebern aus der Praxis. Aktuelle Beispiele für studentische Projekte sind ein «Horizon Scanning» im Bereich Tourismus, also die Erkennung neuer Trends anhand von Schlagzeilen, und die Bereitstellung von Mietpreisvergleichsdaten zur Erkennung von Gentrifizierungstendenzen.
Derzeit noch ausschliesslich im Forschungsbereich angesiedelt sind Kooperationen mit dem Partner SIAF auf dem Gebiet der Humanwissenschaften sowie weitere Projekte in der Anbahnungsphase. Schon bald wird auch dieser Anwendungsbereich in die Lehre integriert und die Partnerschaften werden so gefestigt.
Grosse Rechenleistung nötig
Die gemeinsame Anforderung fast aller Projekte, egal ob studentisch oder aus dem Bereich der Forschung, ist die Verfügbarkeit einer ausreichenden Rechenleistung auf dafür geeigneten Servern. DAViS kooperiert mit dem Schweizer Hochleistungsrechenzentrum CSCS in Lugano, baut aber auch in kleinerem Rahmen eigene Kapazitäten auf, wobei hier der Schwerpunkt auf der schnellen Speicherung grosser Datenmengen liegt. Ein wunderbarer «Nebeneffekt» dieser Entwicklung ist der aktuelle Weltrekord, der am DAViS bei der Berechnung von Nachkommastellen der Zahl Pi (siehe Kasten) erzielt wurde.
Um die gute Einbettung der Lehre an der FH Graubünden weiterhin sicherstellen zu können, ist ein kurzer Draht zur Praxis unabdingbar. Unternehmen werden aktiv angesprochen, können sich aber auch unverbindlich melden, wenn sie Fragestellungen oder Herausforderungen im Umgang mit Daten aller Art haben. Mögliche Lösungen reichen von einer Beratung über studentische Projekte bis hin zu gemeinsamen Forschungsvorhaben mit externer Finanzierung – immer angepasst an die jeweilige Fragestellung und das betreffende Vorhaben. So können die Unternehmen und die FH Graubünden Hand in Hand daran arbeiten, die Attraktivität des Arbeits- und Forschungsstandorts Graubünden zu bewahren bzw. zu steigern und den eigenen Nachwuchs praxisnah auszubilden.
Pi-Rekord
Nach 108 Tagen und 9 Stunden Rechenzeit hat das Team des DAViS-Zentrums im August 2021 den neuen Weltrekord in der Pi-Berechnung aufgestellt. Nach zwei amerikanischen Rekordhaltern ist der Rekord zurück in der Schweiz. Der frühere Weltrekord von 50 Billionen Stellen wurde um zusätzliche 12,8 Billionen neue, bis anhin unbekannte Stellen übertroffen. Die zehn letzten bekannten Stellen von Pi lauten daher nun: 7817924264.
Im Laufe der Vorbereitung und Durchführung der Berechnungen konnten im DAViS viel Know-how aufgebaut und Abläufe optimiert werden. Das kommt jetzt vor allem den Forschungspartnern der FH Graubünden zugute, mit denen rechenintensive Projekte in den Bereichen Datenanalyse und Simulation durchgeführt werden können. Infrastruktur und Know-how fliessen auch in die Lehre ein.
Die errechneten 62,8 Billionen Stellen sind seit Kurzem öffentlich zugänglich, siehe Webseite der FH Graubünden zur «Pi-Challenge»: fhgr.ch/pi
Beitrag von
Prof. Dr. Heiko Rölke, Leiter Forschung, Schweizerisches Institut für Informationswissenschaften