Der Einsatz von Standards unterstützt die Interoperabilität. Datenpipelines sammeln und vereinheitlichen Daten aus verschiedenen Quellen. Es gibt zwei Ansätze zur Datenstrukturierung: a priori (Benötigte Datenstruktur definieren “Top Down”) und a posteriori.
Datenmodellierung
- Konzeptionelles Datenmodell: Entity-Relationship Diagramm.
- Logisches Datenmodell: UML Klassendiagramm.
- Physisches Datenmodell: Implementierung als Datenbank.
Metadaten
- Deskriptive Metadaten: Informationen über den Urheber, eine Übersicht über den Inhalt der Daten und deren Qualität.
- Strukturelle Metadaten: Organisation der Entitäten, deren Beziehungen und Strukturen.
- Administrative Metadaten: Informationen über die Herkunft und die Verwendungsrechte der Daten.
MDR (Metadata Repository) und CMDR
Die Aufbereitung und Integration von Daten ist ein arbeitsintensiver, händischer Prozess, bei dem die Heterogenität zwischen den Datensätzen aufgelöst werden muss. Das Mapping der Daten, also das Zusammenführen von Daten, ist hierbei entscheidend, besonders wichtig ist der Master Patient Index.
Ein Beispiel für Medical Data Engineering ist die Medizininformatik-Initiative.