Wissensextraktion

Die Extraktion von Wissen ist der Prozess der Wissensgenerierung aus strukturierten Daten ( relationale Datenbanken , XML ) und unstrukturierten (Text, Dokumente, Bilder). Die Ausgabe muss in einem Format vorliegen, das von Computern gelesen werden kann.

Die W3C-Gruppe RDB2RDF ist dabei, eine Sprache zur Wissensextraktion im RDF- Format aus Datenbanken zu standardisieren .

Auf Französisch sprechen wir von "Wissensextraktion aus Daten" (ECD).

Beschreibung

Die Wissensextraktion erfolgt in mehreren Schritten vor dem "  Data Mining  " ( Data Mining ).

Die Vorverarbeitung besteht darin, bestimmte Datenkorpora zu erstellen und die Daten entsprechend ihrem Typ (Texte, Bilder, Töne usw.) zu formatieren. Es folgt eine Phase der Datenbereinigung und -verarbeitung fehlender Daten.

Werkzeuge

Literaturverzeichnis

Siehe auch

Anmerkungen und Referenzen

  1. https://www.w3.org/2001/sw/rdb2rdf/
  2. https://www.cairn.info/revue-francaise-de-gestion-2003-5-page-59.htm
  3. "  Wissensextraktion aus Daten (ECD)  " , auf ingenieur.fr ,10. November 2002(abgerufen am 17. August 2020 ) .

Externe Links