Predykcja to przewidywanie. Może być rozumiana jako wykorzystanie modelu do oszacowania/obliczenia wartości/przedziału wartości, jaką z dużym prawdopodobieństwem może mieć atrybut analizowanego obiektu. Wartością tego atrybutu może być w szczególności etykieta klasy.

Klasyfikacja i regresja są dwoma głównymi rodzajami problemów predykcyjnych

  • klasyfikacja jest używana do przewidzenia etykiet klas dla wartości dyskretnych lub nominalnych,
  • regresja jest używana do oszacowania za pomocą technik regresji wartości ciągłych lub uporządkowanych.

Klasyfikacja danych jest dwuetapowym procesem:
Etap 1:
• budowa modelu (klasyfikatora) opisującego predefiniowany zbiór klas danych lub zbiór pojęć
Etap 2:
• zastosowanie opracowanego modelu do klasyfikacji nowych danych

Reguła:

Predykcja – przewidywanie wartości ciągłych (technikami regresji)

klasyfikacja – przewidywanie etykiet klas