Die 15 Grundsätze der FAIR-Prinzipien beziehen sich auf die „(Meta-)Daten“. Was bedeutet das? Sie gelten einerseits für die eigentlichen Datenelemente (Bitsequenzen). Beispiele hierfür sind ein Text, eine Datei, ein Bild, Quellcode einer Software, ein 3D-Modell, ein Dienst oder Zeitreihen (Audiosignale). Es kann sich aber auch um ein Aggregat vieler Einheiten handeln, die ihrerseits separat adressiert werden können, wie z. B. eine Datenbank, ein digitalisiertes Buch, die digitalisierten Materialien eines Nachlasses, ein Aufzeichnungssystem, eine Software oder eine Forschungsdatenpublikation mit mehreren Komponenten.
Metadaten beschreiben die Eigenschaften anderer Daten. Sie geben Auskunft über ihren Inhalt, ihre Eigenschaften oder ihre Struktur. Sie geben an, in welchen Kontexten sie stehen oder wie sie genutzt werden können.
Im Prozess der Umsetzung der FAIR-Prinzipien nehmen Daten und Metadaten unterschiedliche Funktionen ein. Die eingesetzten Methoden, um Daten und die zugehörigen Metadaten FAIR zu machen, können sich unterscheiden. Auch der Grad der FAIRness kann für beide Komponenten unterschiedlich sein. Daher ist es zuerst notwendig, die beiden Komponenten zu identifizieren und sie als digitale Objekte (DO) zu strukturieren.
Ein digitales Objekt ist zunächst „ein Objekt, das sich aus einer Reihe von Bitsequenzen zusammensetzt“. Das bedeutet, dass jede Datei als digitales Objekt betrachtet werden kann. Einige digitale Objekte können einfach strukturiert sein, z. B. eine Textdatei. Ein Video, das sich aus mehreren Elementen zusammensetzt (Videospur, Audiospur, Containerdatei und möglicherweise weitere), kann als ein komplexes digitales Objekt betrachtet werden.
Um von maschinellen Agenten interpretiert werden zu können, muss das digitale Objekt adressierbar sein, es muss strukturiert und typisiert werden. Zu diesem Zweck wird der Bitsequenz ein Identifikator, möglichst ein global eindeutiger und persistenter Identifikator (PID), und eine Beschreibung seiner Eigenschaften in Form einer Metadateneinheit zugewiesen. Bitsequenz, PID und Metadaten sind über eindeutige Relationen zu einem erweiterten digitalen Objekt verbunden, das sich als adressierbare und auswertbare Wissenseinheit darstellt.
Im Bereich der Gedächtnisinstitutionen (Bibliotheken, Archive, Museen) wird der Begriff „Metadaten“ in der Regel für die Zusatzinformationen verwendet, mit denen die dort verwahrten, häufig physischen Objekte, Sammlungen und Ressourcen geordnet, beschrieben und verwaltet werden. Es ist daher durchaus üblich, dass Metadaten nicht-digitale Entitäten behandeln, die materiell oder immateriell, konkret wie abstrakt sein können. Statt auf eine Bitsequenz können sich Metadaten z. B. auf ein Gemälde, ein Libretto, einen Quellentext, eine Person, einen geografischen Ort, ein Ereignis oder einen Begriff der Ideengeschichte beziehen. Wenn Normdaten zu diesen nicht-digitalen Entitäten vorhanden sind, kann man sie über Normdaten-PIDs adressieren. Das digitale Objekt enthält in diesem Fall als Bitsequenz einen Datensatz in einem strukturierten Format, der seinerseits Metadaten zu einem nicht-digitalen Gegenstand enthält.
Um die Funktion von Metadaten besser zu verstehen, ist es hilfreich, sie in verschiedene Kategorien zu unterteilen. Für die FAIRness der Daten spielen sie alle eine Rolle.
Die für das digitale Objekt relevanten Metadateninformationen können je nach Datenformat und angestrebtem Nutzungskontext unterschiedlich sein. Es ist in der Regel davon auszugehen, dass Metadaten nicht nur in der für sie angelegten Dokumentation (z. B. einer Datenbank oder Tabelle), sondern auch auf der Ebene von Software- und Systemkonfigurationen oder der Prozesskontrolle (z. B. Logdateien) zu lokalisieren sind und von dort extrahiert werden müssen.
Administrative Metadaten
Deskriptive Metadaten
Der PID des digitalen Objekts führt in der Regel auf eine Landing Page, eine HTML-Seite, die Metadaten über das digitale Objekt zeigt. Diese muss für Menschen und Maschinen ausreichend Informationen enthalten, um das digitale Objekt zu identifizieren zu können. Die Landing Page muss ihnen außerdem den Zugang zur Bitsequenz selbst (Text, Bild, Video) wie auch zu eventuell vorhandenen weiteren Metadaten ermöglichen. Die Maschineninterpretierbarkeit der Metadaten kann gewährleistet werden, indem sie über schema.org in die Header der HTML-Seite eingebettet werden.