Scikit-learn | Data Science

Scikit-Learn: TF-IDF

utworzone przez Przemek | sty 28, 2021 | NLP

sklearn-TF-IDF Tf-idf — metoda liczenia wagi terminów w oparciu o ich częstość w dokumencie (tf, term frequency) oraz ich rozkład w całym korpusie (idf, inverse document frequency). Wagi Tf-idf faworyzują słowa występujące w niewielu dokumentach, ponieważ mają większą...

Scikit-learn: wektoryzacja

utworzone przez Przemek | gru 27, 2020 | NLP

sklearn-wektoryzacja Technika reprezentująca kolekcję dokumentów w postaci wektorów o stałej długości¶ In [4]: from sklearn.feature_extraction.text import CountVectorizer vectorizer = CountVectorizer() import spacy nlp = spacy.load('pl_core_news_sm') In [5]:...

Klasyfikacja : przykładowe rozwiązanie w Python

utworzone przez Przemek | sie 31, 2019 | Uczenie maszynowe

Mamy zmienną X, która jest pewnym badanym zbiorem. Jest ona charakteryzowana przez trzy parametry : X = [[181, 80, 44], [177, 70, 43], [160, 60, 38], [154, 54, 37],[166, 65, 40], [190, 90, 47],[175, 64, 39],[177, 70, 40], [159, 55, 37], [171, 75, 42], [181, 85, 43],...

Regresja liniowa. Metoda najmniejszych kwadratów : przykład

utworzone przez Przemek | sie 22, 2019 | Statystyka

Mamy dane na podstawie których należy wyznaczyć prostą, która będzie przechodziła możliwie najbliżej wszystkich punktów doświadczalnych indexxy122.524103632484051060 Równanie prostej ma postać y = ax+b Wzór: S(a,b)=[2.5-(2a+b)]²+ [10-(4a+b)]² + [32-(6a+b)]² +...

Scikit-Learn: TF-IDF

Scikit-learn: wektoryzacja

Klasyfikacja : przykładowe rozwiązanie w Python

Regresja liniowa. Metoda najmniejszych kwadratów : przykład

Ostatnie wpisy

Tagi