TY - BOOK AU - Himmelspach, Ludmila PY - 2009 DA - 2009// TI - Vergleich von Strategien zum Clustern von Daten mit fehlenden Werten T3 - 21. Workshop Grundlagen von Datenbanken PB - Rostock : Universität Rostock, Institut für Informatik, 2009 CY - Rostock AB - Die klassischen Methoden zur Clusteranalyse wurden entwickelt, um auf vollständigen Daten Analysen durchzuführen. Oft fehlen aber in Daten einzelne Werte - systematisch oder unsystematisch -, z.B. infolge der Probleme bei der Datenerfassung, Datenübertragung, Datenbereinigung oder weil Daten aus unterschiedlichen Quellen stammen. Demzufolge können die traditionellen Clusteringmethoden zur Analyse solcher Daten nicht ohne weiteres angewendet werden. Im Rahmen dieses Beitrags werden unterschiedliche Strategien zum Umgang mit fehlenden Werten in Daten für das Clusteringproblem vorgestellt, analysiert und miteinander verglichen. Dabei wird das besondere Augenmerk auf die Untersuchung der Leistungsfähigkeit dieser Verfahren in Abhängigkeit von den Ausfallmechanismen, die den fehlenden Werten zugrundeliegen, und von dem Anteil fehlender Werte in Daten gelegt. UR - http://purl.uni-rostock.de/rosdok/id00002202 UR - https://doi.org/10.18453/rosdok_id00002202 DO - 10.18453/rosdok_id00002202 LA - German N1 - Ludmila Himmelspach ID - 625489098 ER -