utworzone przez Przemek | sty 28, 2021 | NLP
sklearn-TF-IDF Tf-idf — metoda liczenia wagi terminów w oparciu o ich częstość w dokumencie (tf, term frequency) oraz ich rozkład w całym korpusie (idf, inverse document frequency). Wagi Tf-idf faworyzują słowa występujące w niewielu dokumentach, ponieważ mają większą...
utworzone przez Przemek | gru 27, 2020 | NLP
sklearn-wektoryzacja Technika reprezentująca kolekcję dokumentów w postaci wektorów o stałej długości¶ In [4]: from sklearn.feature_extraction.text import CountVectorizer vectorizer = CountVectorizer() import spacy nlp = spacy.load('pl_core_news_sm') In [5]:...
utworzone przez Przemek | sie 31, 2019 | Uczenie maszynowe
Mamy zmienną X, która jest pewnym badanym zbiorem. Jest ona charakteryzowana przez trzy parametry : X = [[181, 80, 44], [177, 70, 43], [160, 60, 38], [154, 54, 37],[166, 65, 40], [190, 90, 47],[175, 64, 39],[177, 70, 40], [159, 55, 37], [171, 75, 42], [181, 85, 43],...
utworzone przez Przemek | sie 22, 2019 | Statystyka
Mamy dane na podstawie których należy wyznaczyć prostą, która będzie przechodziła możliwie najbliżej wszystkich punktów doświadczalnych indexxy122.524103632484051060 Równanie prostej ma postać y = ax+b Wzór: S(a,b)=[2.5-(2a+b)]²+ [10-(4a+b)]² + [32-(6a+b)]² +...