Scikit-Learn: TF-IDF

sklearn-TF-IDF Tf-idf — metoda liczenia wagi terminów w oparciu o ich częstość w dokumencie (tf, term frequency) oraz ich rozkład w całym korpusie (idf, inverse document frequency). Wagi Tf-idf faworyzują słowa występujące w niewielu dokumentach, ponieważ mają większą...

Scikit-learn: wektoryzacja

sklearn-wektoryzacja Technika reprezentująca kolekcję dokumentów w postaci wektorów o stałej długości¶ In [4]: from sklearn.feature_extraction.text import CountVectorizer vectorizer = CountVectorizer() import spacy nlp = spacy.load('pl_core_news_sm') In [5]:...

Klasyfikacja : przykładowe rozwiązanie w Python

Mamy zmienną X, która jest pewnym badanym zbiorem. Jest ona charakteryzowana przez trzy parametry : X = [[181, 80, 44], [177, 70, 43], [160, 60, 38], [154, 54, 37],[166, 65, 40], [190, 90, 47],[175, 64, 39],[177, 70, 40], [159, 55, 37], [171, 75, 42], [181, 85, 43],...

Regresja liniowa. Metoda najmniejszych kwadratów : przykład

Mamy dane na podstawie których należy wyznaczyć prostą, która będzie przechodziła możliwie najbliżej wszystkich punktów doświadczalnych indexxy122.524103632484051060 Równanie prostej ma postać y = ax+b Wzór: S(a,b)=[2.5-(2a+b)]²+ [10-(4a+b)]²  + [32-(6a+b)]² +...