Die bibliografischen Datenbanken der Datenbanken orientieren jede Klasse von Objekten in bibliografischen Büchern, Sammlungen, Rezensionen und Zeitschriftenartikeln anhand ihrer Metadaten wie Titel , Autor, Zusammenfassung, Fachbeschreibung. Sie sind das Ergebnis der Computerisierung von Bibliothekskatalogen und ermöglichen die Suche mit Schlüsselwörtern sowie die Datenanalyse ( Bibliometrie usw.). WorldCat ist ein Beispiel für eine solche Datenbank.
Bibliografische Datenbanken oder genauer bibliografische Referenzdatenbanken wurden ab den 1960er Jahren erstellt.
In den Jahren 1960-70 ist der Begriff Datenbank privilegiert. Anschließend werden Datenbanken mit häufig bibliografischen Angaben bezeichnet, die sich auf "einen definierten Wissensbereich beziehen und so organisiert sind, dass sie den Konsultationen der Benutzer angeboten werden". Dieser Begriff ermöglichte es, diese Dokumentationssysteme von der Software selbst oder den Datenbankverwaltungssystemen (DBMS) zu unterscheiden.
Bibliografische Datenbanken haben sich insbesondere seit den 2000er Jahren entlang zweier Achsen entwickelt, die kombiniert werden können:
Der hier verwendete Begriff Datenbank sollte mit Vorsicht verstanden werden. Es handelt sich vielmehr eher um eine Sammlung von Daten oder Titelsätzen. Diese scheinbar einfache Struktur kann Komplexitätsfaktoren verbergen.
Die Struktur der Datensätze kann relativ elementar sein (einfache Sammlung von Feldern), komplexer mit MARC-Formaten (oder gemäß der Norm ISO 2709 ) und jetzt beliebig strukturiert mit XML .
Im Vergleich zu relationalen Datenbanken ergibt sich ein Komplexitätsfaktor aus der Unmöglichkeit, die Größe der Daten einzufrieren. Fast alle Felder sind unterschiedlich lang und haben Wiederholungsfaktoren, die sehr groß werden können. Beispielsweise besteht ein Autorenname im Durchschnitt aus weniger als 10 Zeichen, es gibt jedoch Autoren mit mehr als 100 Zeichen. Ein wissenschaftlicher Artikel hat durchschnittlich 2 oder 3 Autoren, aber man kann Physikartikel mit 500 Autoren finden.
Viele bibliografische Datenbanken enthalten Informationen, die den Inhalt anhand einer Liste von Indexbegriffen oder Schlüsselwörtern beschreiben. Diese Schlüsselwörter gehören häufig zu terminologischen Repositories, deren Art variabel ist: einfache Liste kontrollierter Wörter, Klassifizierungsplan, dokumentarischer Thesaurus oder Ontologie .
Zusätzlich zur Indizierung können sich viele Daten auf spezialisierte Repositories beziehen, z. B. auf periodische Titel oder Zugehörigkeiten.
Schließlich kodifizieren bestimmte Datenbanken auch die Verweise auf die Bibliographie der verarbeiteten Artikel, wie z. B. den Science Citation Index, und die bibliografische Datenbank wird dann zu einem eigenen Repository.
Bibliografische Datenbanken werden ebenfalls nach den ausgewählten Themen definiert. Sie können die Struktur der Basis erheblich beeinflussen (zum Beispiel in den Biowissenschaften die Kodifizierung von Genen).
Eine Basis wird auch durch ihre Abdeckung definiert, genauer gesagt durch die Art und Weise, wie die Basis aufgebaut ist. In vielen Fällen (Medline, Pascal) wird die Abdeckung durch eine Reihe von Überprüfungen definiert, die systematisch analysiert werden.