SpaCy po polsku – tokenizacja

spaCy_po_polsku-tokenizacja In [20]: import spacy nlp = spacy.load('pl_core_news_sm') In [21]: text = "Krzysztof Kowalski żył w latach 1954-2015." doc = nlp(text) sprawdź ilość tokenów i wypisz je¶ In [22]: print(f"Liczba tokenów: {len(doc)}") print(*doc,...

SpaCy po polsku – wprowadzenie

spaCy_po_polsku-wprowadzenie In [1]: import spacy sprawdź wersję¶ In [2]: spacy.__version__ Out[2]: '2.3.2' zaimportuj obiekt umożliwiający przetwarzanie języka polskiego¶ In [3]: from spacy.lang.pl import Polish In [4]: nlp = Polish() objekt Doc¶ In [5]: doc...

Co wpływa na niejednoznaczność w języku

Homonimia – polega na wyrażaniu różnych znaczeń za pomocą identycznej formy językowej. Wyjątki gramatyczne Koreferencja – relacja między wystąpieniami, której istotą jest odwołanie się do tego samego obiektu pozatekstowego. Szyk zdania Fleksja Wiedza i...

NLP: Typowe zadania

Analiza wydźwięku (sentiment analysis) Odpowiadanie na pytania (question answering) Ekstrakcja informacji (information extraction) Rozpoznawanie jednostek nazewniczych (named entity recognition) Rozpoznawanie znaczenia słów (sense disambiguation) Rozpoznawanie mowy...