SpaCy po polsku – lematyzacja

spaCy_po_polsku-lematyzacja In [1]: import spacy nlp = spacy.load("pl_core_news_sm") lematyzacja polega na sprowadzeniu słowa do formy bazowej¶ In [2]: doc = nlp("jem jemy jedzcie") for t in doc: print(f"{t.text:...

SpaCy po polsku – model statystyczny

spaCy_po_polsku-model_statystyczny In [2]: import spacy In [19]: nlp = spacy.load("pl_core_news_lg") In [20]: doc = nlp("Czarny kot zjadł rybę spod stołu i poszedł spać!") części mowy¶ In [21]: for token in doc:...

SpaCy po polsku – tokenizacja

spaCy_po_polsku-tokenizacja In [20]: import spacy nlp = spacy.load('pl_core_news_sm') In [21]: text = "Krzysztof Kowalski żył w latach 1954-2015." doc = nlp(text) sprawdź ilość tokenów i wypisz je¶ In [22]: print(f"Liczba tokenów: {len(doc)}") print(*doc,...

SpaCy po polsku – wprowadzenie

spaCy_po_polsku-wprowadzenie In [1]: import spacy sprawdź wersję¶ In [2]: spacy.__version__ Out[2]: '2.3.2' zaimportuj obiekt umożliwiający przetwarzanie języka polskiego¶ In [3]: from spacy.lang.pl import Polish In [4]: nlp = Polish() objekt Doc¶ In [5]: doc...

Co wpływa na niejednoznaczność w języku

Homonimia – polega na wyrażaniu różnych znaczeń za pomocą identycznej formy językowej. Wyjątki gramatyczne Koreferencja – relacja między wystąpieniami, której istotą jest odwołanie się do tego samego obiektu pozatekstowego. Szyk zdania Fleksja Wiedza i...