Predykcja to przewidywanie. Może być rozumiana jako wykorzystanie modelu do oszacowania/obliczenia wartości/przedziału wartości, jaką z dużym prawdopodobieństwem może mieć atrybut analizowanego obiektu. Wartością tego atrybutu może być w szczególności etykieta klasy.
Klasyfikacja i regresja są dwoma głównymi rodzajami problemów predykcyjnych
- klasyfikacja jest używana do przewidzenia etykiet klas dla wartości dyskretnych lub nominalnych,
- regresja jest używana do oszacowania za pomocą technik regresji wartości ciągłych lub uporządkowanych.
Klasyfikacja danych jest dwuetapowym procesem:
Etap 1:
• budowa modelu (klasyfikatora) opisującego predefiniowany zbiór klas danych lub zbiór pojęć
Etap 2:
• zastosowanie opracowanego modelu do klasyfikacji nowych danych
Reguła:
Predykcja – przewidywanie wartości ciągłych (technikami regresji)
klasyfikacja – przewidywanie etykiet klas