Infrastruktur und angrenzende Produkte

Im Zusammenhang mit dem Projekt HEX sind die folgenden Infrastrukturen und angrenzenden Produkte zu nennen:

HEX-Core

  • HEX-DB: Die PostgreSQL-Datenbank in welcher sämtliche Daten zu HEX gespeichert werden (siehe auch den Abschnitt Datenspeicherung). Die Datenbank liegt auf den Servern von SV Data (siehe unten).

  • svHEX: Ein R-Package, das die Interaktion mit der HEX-Datenbank vereinfacht. Es stehen Funktionen zum Connection-Handling, zur allgemeinen Informationsgewinnung über Tables und Views sowie zum Stellen von Queries zur Verfügung. In Zukunft soll auch das Einspielen neuer Daten über das Package möglich sein (wird derzeit manuell in R gemacht).

  • HEX-App: Eine Shiny App, die den aktuellen Datenbestand nach Keyword und/oder Suchtaxonomien mit einem Interface durchsuchbar macht. Zudem werden Aggregationsstatistiken zum Sucheintrag erstellt. Die Ansicht der gefundenen Kurseinträge funktioniert mittels Listen- oder Steckbriefansicht. Es stehen verschiedene Filtermöglichkeiten für die Suche zur Verfügung. In welchem Umfang die Applikation der Öffentlichkeit zur Verfügung gestellt werden kann, hängt zum einen von der strategischen Ausrichtung des HEX-Projektes ab und zum anderen von der Klärung der rechtlichen Situation.

  • HEX-API: Derzeit noch in Planung befindet sich eine Schnittstelle, um auch außerhalb des Stifterverbandes die HEX-Datenbank verfügbar zu machen, gegebenenfalls gegen eine Aufwandspauschale.

  • HEX-Test: Ein R-Package mit Funktionalitäten zur Datenvalidierung - derzeit noch nicht gänzlich fertiggestellt.

  • Individualauswertungen: Die Hochschulen in der Datenbank erhalten Individualauswertungen, die ihnen Steuerungswissen und Benchmark-Möglichkeiten geben sollen. Diese sollen nach einem ersten Aufschlag des Stifterverbandes mit den Hochschulen weiterentwickelt werden.

  • Projektwebsite: Die Homepage zum Projekt.

Future Skills Klassifikation

  • Future Skills Classifier: Ein auf SentenceTransformer und FewShot basierendes Modell zur Klassifizierung von Kursdaten oder anderen Texten hinsichtlich des Future Skills Frameworks von Stifterverband und McKinsey.

  • Future Skills Classifier API: Eine Schnittstelle zum Future Skill Classifier (siehe oben).

SV Data

  • SV Data: Im Stifterverband gibt es eine Funktionseinheit namens SV Data, die für Wartung, Entwicklung und Ausbau der Infrastruktur im Bereich Data Science innerhalb des Stifterverbandes zuständig ist. Das HEX Projekt nutzt einige Infrastrukturen dieser Einheit.

    • Serverinfrastruktur: SV Data betreut zwei Server innerhalb des Stifterverbands-Netzwerks, auf diesen liegen alle oben beschriebenen Infrastrukturen und Projekte. In der Regel sind alle in einzelnen Docker-Containern gekapselt.

    • Git/GitLab: Die Versionsverwaltung und Ablage von Skripten erfolgt auf der Gitlab-Instanz von SV Data.

    • svDataWarehouse: In das Data Warehouse des Stifterverbandes („Magpie“) werden alle inhaltlichen Aggregatdaten in den Bereichen Bildung, Wissenschaft, Innovation und Zivilgesellschaft eingespielt. So auch HEX-Aggregatstatistiken. Zudem sind Datenbankschemata und Aufbau des Data Warehouses in vielen Bereichen Ausgangspunkt für die HEX-Datenbank.

    • svVis: Ein R-Package für Visualisierungen im Stile des Stifterverbandes.

    • svDev: Ein R-Package für Passwortmanagement des Stifterverbandes. Es wird zur Authentifizierung und zum Nutzungsmanagement der HEX-DB genutzt, aber auch für den Umgang mit dem Proxy innerhalb des Stifterverbands beim Scraping-Prozess.