Was ist in NLP der Unterschied zwischen einem Lexikon und einem Korpus?


Antwort 1:

Dies sind mehrere Definitionen. Wählen Sie die aus, die Sie verstehen!

Korpus:

  1. Corpus ist einfach lateinisch für Körper. Ein Textkörper heißt also Korpus, und wenn Sie mehrere solcher Textsammlungen haben, haben Sie eine Korpora. Ein Textkörper aus einer bestimmten Sprache in Form von aufgezeichneten Äußerungen (Sprache) oder geschriebenen (getippten) Texten.

Lexikon:

  1. (Allgemeine Bedeutung) Ein Lexikon ist das Vokabular einer Sprache oder eines Fachs. Beispiel: "No Hitter", "Go Ahead Run" sind Teile des Baseball-Lexikons. (Linguistik) Lexikon ist der Gesamtbestand an Wörtern und Wortelementen, die Bedeutung haben (Linguistik) Der Teil der Grammatik, der die lexikalischen Einträge * für alle enthält die Wörter in der Sprache, die je nach Grammatiktheorie auch verschiedene andere Informationen enthalten können.

* In der Grammatik ist der lexikalische Eintrag der Teil des Lexikons, in dem die Eigenschaften eines einzelnen lexikalischen Elements aufgeführt sind **.

** Ein Wort, das als vergleichsweise abstraktes Objekt angesehen wird und eine mehr oder weniger konsistente Bedeutung hat. Beispiel: Hunde und Hunde sind eine besondere Form des lexikalischen Gegenstands DOG

Hier ist ein Lexikon: WordNet Search - 3.1

Ich hoffe es hilft!

Grundlagen der statistischen Verarbeitung natürlicher Sprache

Ein Wörterbuch der grammatikalischen Begriffe in der Linguistik


Antwort 2:

Ein Korpus ist eine lexikalische Ressource, die normalerweise Wörter und einige semantische Informationen zu diesen Wörtern enthält, z. B. ein Wörterbuch. Für jeden Eintrag hat das Wort auf der linken Seite der Gleichung eine starke semantische Äquivalenz mit seinem Glanz auf der rechten Seite. Es kommt mit einem etwas strukturierten Layout. Ein Korpus enthält unstrukturierten Text in natürlicher Sprache und wird verwendet, um nlp-Aufgaben anzuwenden, damit Maschinen diesen Text besser verstehen können.