Natural Language Processing mit Python

64,50 €

% 129,00 €* (50% gespart)

Lieferzeit Sofort lieferbar

Lernen Sie die Methoden der automatischen Textanalyse – mit über 60 praktischen Übungen zum Mitmachen. Data-Science-Experte Christian Winkler zeigt in seinem Videokurs alle Inhalte Schritt für Schritt. Sie können direkt mitmachen und Ihr erlerntes Wissen anhand von Übungsaufgaben und Quizzes überprüfen.


  • NLP anschaulich erklärt in 95 Lektionen
  • Prüfen Sie das Gelernte in Wissenstests
  • Stellen Sie den Experten Fragen über das Q&A-Modul
  • Machen Sie mit bei praktischen Übungen
  • Inkl. 60 Jupyter Notebooks mit Praxisaufgaben
Anzahl:
Artikel-Beschreibung

In diesem Kurs lernen Sie, wie Sie natürlichsprachige Textdokumente automatisiert analysieren können. Dazu nutzen Sie die linguistische Analyse, Statistiken über Inhalte und Metadaten sowie die Vektorisierung von Dokumenten, um sich die modernen Verfahren des maschinellen Lernens (ML) zu erschließen. Sie lernen die Unterschiede zwischen überwachten und unüberwachten Verfahren kennen. Mithilfe semantischer Methoden erschließen Sie sich Wortähnlichkeiten. Die erst in den letzten Jahren erforschten Sprachmodelle und Transfer Learning nutzen Sie, um Fragen zu Texten automatisch zu beantworten und Texte generieren zu lassen.

Sie arbeiten selbst interaktiv mit: In über 60 Jupyter-Notebooks können Sie alle Übungen direkt ausprobieren und nachvollziehen – in einer lokalen Installation oder auf Google Colab. Sie haben also am Ende nicht nur jede Menge Know-how gesammelt, sondern wissen auch genau, wie Sie Ihr neues Wissen praktisch einsetzen können.

Länge:  668 Minuten





Alle Video-Lektionen im Überblick:


  • Grundlagen, Einführung und Einrichtung
    • Herzlich willkommen zu diesem Kurs
    • Intro
    • Warum sollte ich Natural Language Processing lernen?
    • Was ist Natural Language Processing?
    • Aufbau des Kurses
    • Python und Jupyter als Plattform nutzen
    • Einfache Installation mit Anaconda
    • Alternative: Google Colab
    • Erste Schritt mit Jupyter/Colab
    • Überblick über Basis-Tools: Pandas
    • Überblick über Basis-Tools: Spacy, Textacy
    • Überblick über Basis-Tools: Scikit-learn
    • Überblick über Basis-Tools: Gensim und Tools für Spezialaufgaben
    • Wissenstest
  • Akquirieren und Extrahieren der Daten
    • Intro
    • Daten finden
    • Einzelne Dateien herunterladen
    • Unterschiedliche Dateiformate
    • Struktur von HTML-Inhalten
    • Extraktion von HTML-Inhalten
    • Persistieren von Inhalten
    • Praxis: URLs generieren und herunterladen
    • Praxis: Dateien herunterladen und extrahieren
    • Wissenstest
  • Vorbereiten der Daten
    • Intro
    • Data Cleaning
    • Erklärung Tokenisierung
    • Tokenisierung mit regexp
    • Tokenisierung mit nltk und spaCy
    • Bestimmung von Landessprachen
    • Linguistische Analyse (Part-of-speech)
    • Bestimmung von Wortarten
    • Dependency Tree
    • Named Entity Recognition
    • Wissenstest
  • Textstatistik
    • Intro
    • Einführung Textacy
    • Beispiel: Synonyme
    • Bestimmung von Textlängen
    • Linguistische Analyse und Persistenz
    • Worthäufigkeiten und Anzeige von Wordclouds
    • Co-Occurrence und Keywords in Context (KWIC)
    • Nutzung von Meta-Informationen
    • Kombination von Text- und Metainformationen
    • Komplexitätsmaße
    • Wissenstest
  • Features und Vektorisierung
    • Intro
    • Vorbereitungen für das Machine Learning
    • Erklärung Features
    • Bag-of-Words-Vektorisierung
    • Anzahl Features und Skalierung
    • Bag-of-words vs. TF/IDF
    • Ähnlichkeitsmaße
    • Wissenstest
  • Topic-Modelle und Clustering
    • Intro
    • Erklärung Machine Learning-Algorithmen (unüberwacht)
    • Erklärung Topic Models
    • Berechnung NMF
    • Berechnung LDA
    • Visualisierung mit pyLDAvis
    • Andere Verfahren, Unterschiede und Gemeinsamkeiten
    • Coherence Scores
    • Zeitevolution
    • Clustering und Unterschied zu Topic Models
    • Wissenstest
  • Klassifikation mit klassischem überwachtem Machine Learning
    • Intro
    • Erklärung überwachtes Lernen
    • Trainingsdaten
    • Klassifikation mit Support Vector Machine
    • Andere Klassifikatoren
    • Testdaten und Confusion Matrix
    • Accuracy, Precision und Recall
    • Cross-Validation und Hold-Out-Verfahren
    • Hyperparameter und Grid-Search
    • Wissenstest
  • Word Embeddings
    • Intro
    • Embeddings und Ähnlichkeitsmaß für Wörter
    • Word Embeddings: word2vec
    • Alternativen: fastText und gloVe
    • Unterschiede der Verfahren anhand der Ergebnisse erklären
    • Nutzung vortrainierter Modelle
    • Semantische Transformation und doc2vec
    • Wissenstest
  • Transfer Learning und Question Answering
    • Intro
    • Einführung Transfer-Learning-Modelle
    • Berechnung von Embeddings und Klassifikation
    • Klassifikationsproblem aus vorherigem Kapitel mit BERT
    • Klassifikationsproblem aus vorherigem Kapitel mit BERT Teil 2
    • Vergleich Qualität und Rechenzeit mit SVM
    • Andere Sprachmodelle (dbmz)
    • Question Answering mit Heise und Wikipedia
    • Kaskadiertes Modell (Information Retrieval + Question Answering)
    • Textgenerierung
    • Wissenstest
    • Fazit und Kursabschluss

Über den Trainer:

Dr. Christian Winkler ist Data Scientist und Machine Learning Architect bei datanizing. Er promovierte in theoretischer Physik und arbeitet seit 20 Jahren im Bereich großer Datenmengen und Künstliche Intelligenz, insbesondere mit Fokus auf skalierbaren Systemen und intelligenten Algorithmen zur Massentextverarbeitung.


So lernen Sie mit diesem Videokurs:

In den Videokursen von heise Academy lernen Sie IT-Themen anschaulich und verständlich. In den Videos schauen Sie den Experten bei der praktischen Arbeit zu und lassen Sie sich dabei alles genau erklären. Das Wissen ist in viele kleine Lernschritte und Aufgaben unterteilt – Sie können den Kurs Lektion für Lektion durcharbeiten oder gezielt zu Themen springen, die Sie interessieren.  Die persönliche Lernumgebung der heise Academy hält viele Funktionen für Sie bereit, die Ihnen beim Lernen helfen können:


  • Flexibler Videoplayer mit vielen Steuerungsmöglichkeiten
  • Wissensquizzes zur Lernkontrolle
  • Lernhistorie und Lernfortschritt
  • Lesezeichen und Notizen 
  • Volltextsuche in den Videos
  • Frage-den-Experten-Modul
  • Übungsmaterial zum Mitmachen
  • Responsive Web-App und Videostreaming für alle Endgeräte


Technische Voraussetzungen:

Für diesen Videokurs wird lediglich ein Browser (mit eingeschalteter JavaScript-Funktionalität) und eine Internetverbindung benötigt.

Artikel-Details
Anbieter:
Heise Medien GmbH & Co. KG
Artikelnummer:
nlp-winkler-01
Veröffentlicht:
19.05.2021

0 von 0 Bewertungen

Geben Sie eine Bewertung ab!

Teilen Sie Ihre Erfahrungen mit dem Produkt mit anderen Kunden.