Clustering er en statistisk teknik, der bruges til at arrangere sager i kategorier, så at de sager i hver kategori ligner hinanden og adskiller sig fra sager i andre kategorier. Hver kategori er en klynge . Samfundsforskere bruger SPSS ( Statistical Package for Social Sciences ) at foretage klyngeanalyser . I K- Betyder klyngedannelse forskeren betegner antallet af ønskede klynger. K er antallet af klynger forskere angiver de ønsker. K- Midler clustering giver forskerne at klynge meget store datasæt. Instruktioner
Analyser data
1
Klik på "Analyze " øverst th SPSS -skærm. Vælg " Klassificere " fra drop -down menuen og "K - Midler Cluster ".
2
Vælg et udsnit af sager. I dialogboksen , klik på " variable " og fremhæve de variabler, du ønsker at bruge i den indledende K- Midler analyse. Klik på den venstre pil for at flytte de variabler ind i feltet . Indstil antallet af klynger , som regel 5 i en gennemsnitlig størrelse datasæt i feltet " Antal klynger ". Antallet af klynger skal være mere end to og ikke mere end antallet af sager. Klik på " gentage og klassificere " i dialogboksen for at få klynge centre . Klik på " Skriv endelig. "
3
Medtag hele datafil for den endelige K- Midler analyse. Klik på " Analyze" øverst SPSS skærmen . Vælg " Klassificere " fra drop -down menuen og "K - Midler Cluster . " I dialogboksen skal du vælge " Variable ", og fremhæve de variabler, du ønsker at bruge. Klik på den venstre pil. Indstil antallet af klynger ved 5 i feltet " Antal klynger ". Klik på " Klassificere " i dialogboksen . Vælg "Læs Initial " for at få klyngecentre fra prøven i trin 2 . Klik på " Gem". Klik på " Cluster medlemskab. " Klik på "Fortsæt".
Læs Output
4
anmeldelse den første tabel i output, mærket "Endelige Cluster Centers ". Den øverste del af tabellen har tallene 1 til 5 på tværs af det , hvert enkelt af de 5 klynger . Den venstre kolonne viser de " regr faktoren score " ( Regression faktor score eller hvor godt de enkelte variable forudsiger score) for hver af analyserne. Hvis du følger den linje ved siden af stillingen 1 til analyse 1 til højre, vil det give dig den faktor score for hver klynge .
5.
Læs nabobordet i output med overskriften " Antal sager i hver klynge . " Boksen til venstre viser de klynger efter nummer, 1 til 5 . Følg Cluster til højre og du vil finde antallet af sager i denne klynge.
6
Kig på den sidste tabel i output, " Cluster medlemskab ", som viser, hvilke tilfælde der er i hver klynge . De tilfælde , er opført i venstre kolonne , og klyngen nummer findes i kolonnen til højre .