Eine natürliche Sprache oder gewöhnliche Sprache ist eine "normale" Sprache, die von einem Menschen gesprochen wird. Es ist im Gegensatz Formensprache , wie Computersprache , sowie die kreative Sprache Von konstruierten Sprachen .
Wir bezeichnen durch natürliche Sprache die Sprache, die vom Menschen gesprochen wird und die zwischen 200.000 und 50.000 Jahren vor unserer Zeit erschien. Es wird durch die Geschichte der Sprachen detailliert . Nach 2 Millionen Jahren Schwangerschaft durch Homo erectus , die Homo habilis ablöste , erschien der moderne Mensch, Homo sapiens genannt , durch die Verbindung vieler Faktoren:
Es gibt zwei Szenarien für das Auftreten von Homo sapiens : das Szenario „ Out of Africa “ und das Szenario „Pluri-Centripetal“ (Polygenese). Neuere Forschungen in Paläo-Linguistik am Anfang des identifizierten XXI E Jahrhunderts einer Basis von 27 Worten, gemeinsam an der Wurzel aller schriftlichen terrestrischen Sprachen, die das Szenario „zu begünstigen schiebt Out of Africa “ (Monogenese). In der Tat hätten mehrere Quellen keinen Grund gehabt, dieselbe Ausgangssprache zu verwenden.
In der Folge setzte sich Homo sapiens innerhalb der menschlichen Spezies entweder aufgrund der produktivistischen Hypothese oder aufgrund der soziologischen Hypothese durch.
Seit etwa 7000 Jahren hat diese Sprache eine schriftliche Form in einer Reihe von Sprachen angenommen, die sich dann als die dominierenden Sprachen etablierten. Vor allem deshalb sind heute 6.000 Sprachen vom Aussterben bedroht.
In der Informatik ist natürliche Sprache der Computersprache entgegengesetzt :
Die Herausforderung für Suchmaschinen-Publisher besteht darin, relevante Ergebnisse für eine in natürlicher Sprache formulierte Abfrage bereitzustellen.
Alan Turing , britischer Mathematiker der ersten Hälfte des XX - ten Jahrhundert wird auch vermutet , dass künstliche Intelligenz könnte so gut vermittelt den Eindruck von „Sprechen“ es wäre schwierig , einen Menschen zu erkennen. Künstliche Intelligenztests, die menschliche Konversationen imitieren können, werden als Turing- Tests bezeichnet.
Wenn die Konsistenz eines Textes die Eigenschaft eines Textes ist, für dessen Übergang von einem Dokumentationselement zum nächsten kein Abzug erforderlich ist, verwenden wir das Beispiel von Florian Wolf et al. um diese Eigenschaft zu veranschaulichen:
Die Schlussfolgerungen zum Verständnis des Textes sind hier trivial und respektieren das Prinzip der Relevanz bei der Übermittlung von Informationen. Sie sind progressiv. Es braucht gutes Wetter, um eine Rakete zu starten, und der Ariane-Werfer kann zwei Satelliten starten. Wir müssen diese Schlussfolgerungen noch charakterisieren: "Das Wetter war gut und daher" macht die erste Schlussfolgerung explizit, und "der Ariane-Werfer […] bringt zwei Satelliten in die Umlaufbahn" macht die zweite Schlussfolgerung explizit. Es ist nicht bekannt, ob der Launcher vier Satelliten starten kann, aber das ist nicht der Punkt. Wir müssen uns der Notwendigkeit aller Wörter in diesem Text bewusst sein.
Außerdem wird der Fortschritt respektiert: Wir sprechen über das Wetter, dann den Start der Rakete und schließlich darüber, was gestartet wird.
Entfernen Sie aus diesem Text das Adjektiv Raum an das Nomen Zentrum gebunden und wir nicht mehr wissen , wie sie ihre Konsistenz zu rechtfertigen. Wir müssen dann eine weniger explizite Schlussfolgerung ziehen: Das Kourou-Zentrum ist ein räumliches Zentrum. Dazu müssen wir uns die Theorie der Pragmatik ansehen , um die Kosten dieser Folgerung zu bewerten. Es sollte beachtet werden, dass sich das Prinzip der Relevanz stark weiterentwickelt, unabhängig davon, ob wir uns in einer geschriebenen Sprache befinden, in der die vorher festgelegten schwach sind, oder in einer mündlichen Sprache, in der das vorher festgelegte wichtig ist, wenn wir wissen, dass der Autor einen Teil des Wissens seines Zuhörers kennt.
Es muss anerkannt werden, dass viele Texte diese Eigenschaft nicht erfüllen: Michel Charolles widmet daher viele Dokumente der Bestandsaufnahme dieser Mehrdeutigkeitssituationen in den Texten:
Diese Beispiele unterstreichen den Begriff der Tiefe der impliziten Behandlung, den diese Texte benötigen, um Konsistenz zu erreichen.
Typografische Konformität wird als die Eigenschaft von Texten definiert, Rechtschreibung und Typografie schriftlich zu respektieren. Wenn es akzeptabel ist zu berücksichtigen, dass "Lift-Gate" eine benannte Entität darstellt und dass "Lift-Gate" ein gebräuchlicher Name ist, führt die wörtliche Übersetzung des Wortes "Lift-Gate" in eine benannte Entität unnötiges Rauschen in die semantische Verarbeitung ein ... Es ist wünschenswert, diese Manifestationen in den morphologischen Behandlungen zu filtern.
Lexikalische Konformität besteht darin, den richtigen Begriff für ein Konzept zu wählen: Daher ist „Heckklappe“ ein explizites zusammengesetztes Wort, wobei die „Heckklappe“ auf Französisch von „Heckklappe“ übersetzt wird, auch wenn dieser Begriff auf Französisch überflüssig ist, weil „Heckklappe“ ist genug.
Die Verwendung eines Wörterbuchs ist zufriedenstellend, solange nicht nur die gefundenen Wörter durchsucht werden, sondern auch die Teile der Wörter (Lexeme), die wahrscheinlich Wörter darstellen.
Daher wurde in den ersten beiden Dokumenten des Korpus die Wahl getroffen, "Kofferraumdeckel" durch "Kofferraumdeckel" zu ersetzen, was bedeutet, dass "Kofferraumdeckel" auferlegt wurde. Wir werden diese Art von Fehler durch lexikalische Fehler in Bezug auf die Analyse zusammengesetzter Wörter bezeichnen.
Darüber hinaus müssen wir uns der Lösung der Mehrdeutigkeiten von Ausdrücken zuwenden. Wir sollten nicht bei den Wurzelspitzen zusammengesetzter Wörter stehen bleiben.
Die stilistischen Qualitäten, die zu einer besseren Kohärenz beitragen. Generische Dokumente profitieren davon, dass sie in der vorliegenden generischen Form geschrieben werden, indem negative Formen so weit wie möglich standardisiert werden. Somit nimmt eine Anforderung die aktive Form an und ist in der vorliegenden generischen Form geschrieben, und die Umwandlung passiver Formen in aktive Formen reicht aus, um die Anforderung zu befriedigen. Es kann auch nützlich sein, eine Transformation zu verwenden, um negative Texte zu verarbeiten.
Die Eigenschaften der Dokumente werden hauptsächlich im Hinblick auf die Komponenten des Kerns der Kohärenz qualifiziert:
Die Referenzen stammen unter anderem aus der Arbeit Aux Origines des Langues et du Langue, herausgegeben von Jean-Marie Hombert, Fayard , 2005