utworzone przez Przemek | gru 29, 2020 | NLP
Analiza morfologiczna – identyfikacja wszystkich form wyrazowych danego tokena w językach aglutynacyjnych i fleksyjnych (polski) Ujednoznacznienie fleksyjne – wybór jednej formy wyrazowej na podstawie kontekstu Forma wyrazowa – wykładnik + cechy...
utworzone przez Przemek | gru 29, 2020 | NLP
utworzone przez Przemek | gru 27, 2020 | NLP
sklearn-wektoryzacja Technika reprezentująca kolekcję dokumentów w postaci wektorów o stałej długości¶ In [4]: from sklearn.feature_extraction.text import CountVectorizer vectorizer = CountVectorizer() import spacy nlp = spacy.load('pl_core_news_sm') In [5]:...
utworzone przez Przemek | gru 27, 2020 | NLP
spaCy_po_polsku-bag-of-words Bag-of-words (BoW) – technika uproszczonej reprezentacji tekstu. Polega na przekształeceniu sekwencji segmentów do policzonego zbioru segmentów. Kolejność segmentów nie ma znaczenia. Głównym zastosowaniem jest odwzorowanie...
utworzone przez Przemek | gru 27, 2020 | NLP
nltk-bag-of-words Bag-of-words (BoW) – technika uproszczonej reprezentacji tekstu. Polega na przekształeceniu sekwencji segmentów do policzonego zbioru segmentów. Kolejność segmentów nie ma znaczenia. Głównym zastosowaniem jest odwzorowanie podobieństwa...