Automatische Klassifikation bzw. Clustering
AutoClass löst das Problem der automatischen Entdeckung von Klassen in
Daten (manchmal auch »Clustering« oder »unüberwachtes Lernen« genannt),
das sich von der Erzeugung von Klassenbeschreibungen aus gekennzeichneten
Beispielen (»überwachtes Lernen« genannt) unterscheidet.
Es soll die »natürlichen« Klassen in Daten entdecken. AutoClass kann auf
Beobachtungen von Dingen angewandt werden, die durch eine Attributmenge
ausgedrückt werden können, ohne sich auf andere Dinge zu beziehen.
Die Datenwerte der einzelnen Attribute müssen entweder Nummern oder
Elemente einer festen Menge von Symbolen sein. Bei numerischen Daten muss
ein Messfehler angegeben werden.