NLP | Data Science

SpaCy po polsku – tokenizacja

utworzone przez Przemek | gru 27, 2020 | NLP

spaCy_po_polsku-tokenizacja In [20]: import spacy nlp = spacy.load('pl_core_news_sm') In [21]: text = "Krzysztof Kowalski żył w latach 1954-2015." doc = nlp(text) sprawdź ilość tokenów i wypisz je¶ In [22]: print(f"Liczba tokenów: {len(doc)}") print(*doc,...

SpaCy po polsku – wprowadzenie

utworzone przez Przemek | gru 26, 2020 | NLP

spaCy_po_polsku-wprowadzenie In [1]: import spacy sprawdź wersję¶ In [2]: spacy.__version__ Out[2]: '2.3.2' zaimportuj obiekt umożliwiający przetwarzanie języka polskiego¶ In [3]: from spacy.lang.pl import Polish In [4]: nlp = Polish() objekt Doc¶ In [5]: doc...

Co wpływa na niejednoznaczność w języku

utworzone przez Przemek | gru 8, 2020 | NLP

Homonimia – polega na wyrażaniu różnych znaczeń za pomocą identycznej formy językowej. Wyjątki gramatyczne Koreferencja – relacja między wystąpieniami, której istotą jest odwołanie się do tego samego obiektu pozatekstowego. Szyk zdania Fleksja Wiedza i...

NLP: Typowe zadania

utworzone przez Przemek | gru 8, 2020 | NLP

Analiza wydźwięku (sentiment analysis) Odpowiadanie na pytania (question answering) Ekstrakcja informacji (information extraction) Rozpoznawanie jednostek nazewniczych (named entity recognition) Rozpoznawanie znaczenia słów (sense disambiguation) Rozpoznawanie mowy...

P	W	Ś	C	P	S	N
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

SpaCy po polsku – tokenizacja

SpaCy po polsku – wprowadzenie

Co wpływa na niejednoznaczność w języku

NLP: Typowe zadania

Ostatnie wpisy

Tagi