Programmierübungen für den Schwerpunkt „Verarbeitung natürlicher Sprache“, Teil des Nanodegree-Programms „Künstliche Intelligenz“ von Udacity.
Sie benötigen Python 3.6+ und die in requirements.txt
genannten Pakete. Sie können sie installieren mit:
pip install -r requirements.txt
Datendateien für Übungen sind unter data/
enthalten, aber einige der NLP-Bibliotheken benötigen zusätzliche Daten für die Durchführung von Aufgaben wie PoS-Tagging, Lemmatisierung usw. Insbesondere gibt nltk
einen Fehler aus, wenn die erforderlichen Daten nicht installiert sind. Mit der folgenden Python-Anweisung können Sie den NLTK-Downloader öffnen und die gewünschten Pakete zur Installation auswählen:
nltk . download ()
Sie können auch alle verfügbaren NLTK-Datenpakete herunterladen, die auch eine Reihe von Beispielkorpora enthalten, aber das kann eine Weile dauern (10+ GB).
Um eine beliebige Skriptdatei auszuführen, verwenden Sie:
python < script.py >
Um ein Notizbuch zu öffnen, verwenden Sie:
jupyter notebook < notebook.ipynb >
Dieses Werk ist unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License lizenziert. Weitere Informationen finden Sie in den Nutzungsbedingungen von Udacity.