Das Scannen ist die Umwandlung von Informationen eines Trägers (Text, Bild, Audio, Video) oder eines elektrischen Signals in Daten, die digital als Geräte, Computer oder digitale Elektronik behandelt werden können. Numerische Daten werden als eine Reihe von Zeichen und Zahlen definiert , die Informationen darstellen. Wir verwenden manchmal den französischen Begriff Digitalisierung ( Digit bedeutet im Englischen Zahl ).
Das Scannen im Rahmen der Archivverwaltung ist die Massenkonvertierung von Computeraktendokumenten.
Die Digitalisierung konstruiert eine diskrete Darstellung eines Objekts in Form einer Sammlung einer endlichen Anzahl von Zeichen, die aus einer zählbaren Menge gültiger Zeichen entnommen werden.
Digitalisierung von Texten:Die Digitalisierung eines Textes ist seine Umwandlung in eine Zeichenfolge aus einer Liste von Zeichen, die in der geschriebenen Sprache vorhanden sind, wie ein Diktat die Laute der Sprache in eine Folge von Wörtern umwandelt, die im Wörterbuch der geschriebenen Sprache vorhanden sind.
Bilder scannen:Die Digitalisierung eines Bildes wandelt es in eine Reihe von Anweisungen um, die es ermöglichen, es zu rekonstruieren. Diese Anweisungen können aus einer Reihe von visuellen Empfindungen für jedes Element ( Pixel ) bestehen oder eine komplexere Organisation haben ( komprimiertes Bild , Vektorgrafik ).
Sofern digitale Daten nicht direkt vom Menschen erzeugt werden (dies wird als Dateneingabe bezeichnet ), umfasst die Digitalisierung typischerweise mindestens drei Phasen:
Diese drei Phasen folgen oft komplexeren Operationen, die eine effizientere Codierung ermöglichen. Dies gilt insbesondere für die Digitalisierung von Bildern in Digitalkameras und für die Digitalisierung von Texten ( Djvu- Format , optische Zeichenerkennung ).
Manchmal kann der Digitalisierungsprozess andere Formen annehmen.
Abtasten der Temperatur durch einen Datenlogger ( Datenlogger ):Die Temperatur ändert sich langsam im Laufe der Zeit . Die Digitalisierung schafft ein Tagebuch ihrer Evolution:
Bei jeder Änderung der Temperaturrundung werden die neue Temperatur sowie Datum und Uhrzeit aufgezeichnet.
Der Datenlogger führt diese Vorgänge automatisch durch, indem er zunächst die beiden Dimensionen Temperatur und Zeit in elektrische Signale umwandelt . Es zeichnet das Ergebnis in einem Code auf, den andere Computergeräte ausnutzen können.
In den meisten Fällen werden jedoch regelmäßige Schritte verwendet und eine der Größen, die das Objekt beschreiben, wird gemessen, indem die anderen inkrementiert werden . Wir erhalten somit eine endliche Anzahl von Daten.
Der Vorgang, einen Wert für jedes Inkrement einer Menge zu nehmen, wird als Abtastung bezeichnet . Beim Spatial Sampling wird entlang einer Länge diskretisiert , indem beispielsweise alle zehntel Millimeter auf jeder Raumachse ein Helligkeitswert genommen wird . Beim zeitlichen Sampling werden wir den Zeitverlauf diskretisieren, indem wir beispielsweise einen Wert für jede Mikrosekunde nehmen.
Das Runden eines Wertes auf einen anderen aus einer endlichen Liste wird als Quantisierung bezeichnet .
Das Ergebnis dieser Digitalisierung ist eine Reihe von Werten, die die entlang der gewählten Achsen gemessene Menge in einer herkömmlichen Reihenfolge darstellen, die es ermöglicht, alle Abmessungen jedes Elements des Objekts zu rekonstruieren.
Damit die digitalisierten Daten die Anfangsgrößen getreu wiedergeben, müssen immer Annahmen über das darzustellende Signal getroffen werden.
Wenn nur die Bandbreite und das Signal-Rausch-Verhältnis bekannt sind , bestimmt die Informationstheorie den digitalen Durchsatz . Das Abtasttheorem schlägt eine minimale Abtastfrequenz mit einer solchen Quantisierung vor , dass das Quantisierungsrauschen einen mit dem Hintergrundrauschen vergleichbaren Pegel hat. Durch Dekorrelation ( Dithering ) kann das Rauschen vom Signal unabhängig gemacht werden . Mehrere Kombinationen von Frequenz- und Quantisierungsskala können das gleiche Signal angemessen beschreiben.
Bei genauerer Kenntnis der darzustellenden Größen kann man dank der komprimierten Erfassungsverfahren mit weniger Stichproben arbeiten .
Das eigentliche Prinzip der Digitalisierung impliziert, dass der Benutzer (im Allgemeinen eine Maschine) die Konventionen kennt, die es ermöglichen, das dargestellte Objekt wiederherzustellen. Diese Konventionen werden als Datenformat bezeichnet . Die Digitalisierung von Informationen umfasst untrennbar
Das Objekt kann nur rekonstruiert werden, wenn die Computermaschine beide Komponenten im Speicher hat. Wenn der einer Datei oder einem Datenstrom entsprechende Algorithmus in der Maschine fehlt, können wir die Daten nicht verwenden und sprechen von einem Kompatibilitätsproblem .
Die Formate können sehr einfach sein, wie im Fall eines Rohdatenstroms zur Digitalisierung eines eindimensionalen Signals, bei dem die Abtastwerte ohne Unterbrechung aufeinander folgen und es ausreicht, ihre Größe, ihre numerische Codierung und die Rate zu kennen um das Signal zu rekonstruieren, oder komplexer, wie im Fall von Vektorbeschreibungsformaten von Dokumenten.
Datenkompressionstechniken machen es möglich , die Größe der Dateien oder die Geschwindigkeit der Ströme zu reduzieren. In diesem Fall wächst der unveränderliche Teil der Information (das Format) und wird komplexer. Wenn das durch diese Dateien oder Ströme repräsentierte Dokument verteilt werden soll, wird ein Format gesucht, bei dem die Decodierung, die an jeder Station durchgeführt wird, weniger komplex ist als die Codierung, die nur einmal durchgeführt wird.
Die Digitalisierungsprozesse unterscheiden sich je nach physischer Beschaffenheit der zu digitalisierenden Informationen:
Zu digitalisieren eine Menge , die im Laufe der Zeit, wie ein variiert Ton :
Um ein Bild zu digitalisieren, werden die Höhe und die Breite diskretisiert und die Lichtstärken für jeden Punkt entweder global oder für jede Primärfarbe konvertiert. Die Raumabtastung erfolgt auf drei verschiedene Arten:
Diese Verfahren gelten für die Schwarzweiß-Reproduktion. Für die Farbwiedergabe werden Werte für jede der drei Grundfarben benötigt. Entweder teilen wir den Lichtstrahl des Bildes in drei Teile, die den drei Grundfarben entsprechen, oder wir fügen vor jedem Sensor Filter ein, indem wir die Farben wechseln, und wir gehen nach der digitalen Umwandlung durch Interpolation vor , um die Farbe an jedem zu bewerten evaluate Pixel. Im Allgemeinen kompensieren dann andere Verfahren die Mängel des Rohbildes.
Die Digitalisierung eines zeitlich veränderlichen Bildes verbindet die beiden Verfahrensfamilien. Um ein bewegtes Bild ( Video ) zu scannen, scannen eine Digitalkamera , ein digitaler Camcorder , eine Webcam , die Zeit und digitalisieren jedes Mal ein Bild (zB mit einem Bild alle 40 Millisekunden). Der Datenstrom durchläuft dann einen Ratenreduktionsprozess.
Es ist auch möglich, ein analoges Videosignal zu digitalisieren, entweder durch Erzeugen einer Rohumwandlung dieses elektrischen Signals oder durch Wiederherstellen der gesamten oder eines Teils der Zeitdiskretisierungsinformationen aus den vertikalen Synchronisationssignalen (Frames) und dem Abstand von den horizontalen Synchronisationssignalen ( Linien).
Um einen Text zu digitalisieren, gibt entweder eine menschliche Bedienungsperson den Text ein , oder das Dokument wird als Bild digitalisiert, indem auf diesen ersten Datensatz ein optisches Zeichenerkennungsprogramm angewendet wird , das möglicherweise durch automatische oder manuelle Prüfungen ergänzt wird.
Computersysteme ermöglichen:
Die Übertragung digitaler Daten, die verarbeitet werden, um eine maximale Belegung des verfügbaren Spektrums zu erreichen, erfordert weniger Bandbreite auf den Übertragungskanälen als ihr analoges Gegenstück.
Im Gegenzug gehen Informationen, die bei der Digitalisierung oder bei Berechnungen oder Umcodierungen vernachlässigt wurden oder verloren gingen, für nachfolgende Benutzer verloren.
Spezialisierte Komponenten sorgen für die Umwandlung des zunächst von den Wandlern ( lichtempfindliche Zelle , Thermometer , Mikrofon , Funkempfänger usw.) erzeugten analogen Signals in ein digitales System .
Eine A/D-Wandlungskette ( analog zu digital ) kann in Funktionen und Schaltungen in Elemente zerlegt werden:
Die Genauigkeit der Digitalisierung hängt von der Qualität der Quantisierung des Signals und der Stabilität des Takts ab.
Ein Multiplexer (MuX) kann die unabhängigen Signale, die ihn parallel erreichen (mehrere Eingänge, aber nur ein Ausgang), in eine Folge diskreter Signale, analog oder digital, umwandeln.
Als Folge der vielen Digitalisierungsprojekte basiert die Archivierung elektronischer Inhalte auf einer Reihe von Maßnahmen, Werkzeugen und Methoden, die implementiert wurden, um elektronische Inhalte zu sammeln, zu identifizieren, auszuwählen, zu klassifizieren und auf einem sicheren Medium zu speichern, mit dem Ziel, diese zu nutzen und zu speichern machen sie im Laufe der Zeit zugänglich. Die Archivierung ist von der Speicherung und Sicherung zu unterscheiden .
Die Ziele von Projekten, die Digitalisierung und Archivierung kombinieren, sind vielfältig. In den Bereichen Elektronisches Dokumentenmanagement und Informations- und Bibliothekswissenschaften erfüllen sie mehrere Funktionen:
Die Digitalisierung ist ein Aspekt dessen, was manchmal fälschlicherweise als Dematerialisierung bezeichnet wird . Dies ist zweifellos einer der wesentlichen Schritte in jedem Projekt zur Optimierung des Managements von eingehenden Dokumenten und Post, die von Unternehmen und Verwaltungen immer noch in großem Umfang in Papierform empfangen werden.
Die explosionsartige Zunahme elektronischer Daten hat Unternehmen unweigerlich dazu veranlasst, elektronische Inhalte während ihres gesamten Lebenszyklus zu berücksichtigen, bis sie archiviert oder sogar vernichtet werden.
Französische Unternehmen und Verwaltungen müssen auch den Begriff der Berufung auf Probe in ihre Archivierungsprojekte integrieren, um die Integrität bestimmter elektronischer Inhalte und die Authentizität ihrer Herkunft (gemäß den vorgeschriebenen Anforderungen) im Laufe der Zeit nachzuweisen, durch einen rechtlichen Rahmen oder B. durch Vorschriften zu bestimmten Gewerben oder Tätigkeitsbereichen). Bei den von der Archivierung zu Probezwecken vorrangig betroffenen elektronischen Dokumenten handelt es sich somit um Rechnungen, Kunden oder Lieferanten, Lohnabrechnungen oder elektronische Korrespondenz.
Ab den 2000er Jahren wurden weltweit zahlreiche Aktionen zur Digitalisierung verschiedener Elemente des Kulturerbes gestartet. Darunter befinden sich mehrere sehr große Projekte.
"Open Content Alliance" (OCA)Das OCA-Konsortium ist ein amerikanischer Verband, der private Unternehmen wie Yahoo! , Adobe , HP , Internet Archive , Bibliotheken (BU California, BU Toronto), Archive und Verlage. Das25. Oktober 2005, Microsoft ist dieser Gruppe beigetreten.
Ziel des OCA ist es, eine für alle zugängliche, mehrjährige und mehrsprachige Datenbank (Datenbank aus Multimedia-Dokumenten) zu digitalisieren und online zu stellen. Im Gegensatz zur Google Buchsuche werden jedoch nur urheberrechtsfreie Kulturerbe-Fonds berücksichtigt . Ohne Zustimmung der Rechteinhaber erfolgt keine Digitalisierung . Letztere können zum Projekt beitragen, indem sie den Umfang der Verbreitung mit möglichen Einschränkungen festlegen.
Google BuchsucheAngekündigt am 14. Dezember 2004von den Mitbegründern des Unternehmens Google , das Programm " Google Print " ist für die Digitalisierung von 15 Millionen Büchern verantwortlich, was laut Jean-Noël Jeanneney , dem damaligen Präsidenten der französischen Nationalbibliothek , 4,5 Milliarden Seiten in 6 Jahren entspricht . Fünf Bibliotheken haben sich bereit erklärt, ihre Bestände zu digitalisieren: die Bibliotheken der Harvard University , der University of Michigan und der Stanford University , die New York Public Library und die Bodleian Library der Oxford University . Google Print wurde im November 2005 mit einer Sammlung digitalisierter Bücher im öffentlichen Bereich und von den Projektpartnern offiziell gestartet . Es wurde Mitte November in „Google Büchersuche“ („Google Buchsuche“ auf Französisch) umbenannt. Zwischen Google und anderen Universitäten wurden neue Vereinbarungen getroffen, um diese digitale Bibliothek zu bereichern.
Die Europäische Digitale BibliothekDas 22. Januar 2005, ruft der Präsident der französischen Nationalbibliothek , Jean-Noël Jeanneney , in der Tageszeitung Le Monde auf, auf die Initiative von Google zu reagieren. Ende April 2005 riefen die Nationalbibliotheken von 19 Ländern dann sechs europäische Staats- und Regierungschefs zur europäischen Zusammenarbeit zur Schaffung einer europäischen digitalen Bibliothek ( Europeana ) auf. Ein Jahr später öffnet The European Library , das mehrsprachige Portal des BNE.
Im Jahr 2016 bietet Europeana Zugang zu 53 Millionen digitalisierten Dokumenten von 3.300 europäischen Institutionen. Im Folgejahr zeigt eine von der Europäischen Kommission in Auftrag gegebene Studie , dass Europeana 700.000 Mal im Monat konsultiert wird.