? Der er to måder, du kan foretage statistiske analyser på computeren. Den ene er at bruge en dedikeret statistisk pakke som SPSS , Minitab eller SAS. Den anden er at bruge en mere generaliseret data management eller regnearksprogram , som Microsoft Excel eller Open Office regneark . Sidstnævnte har deres egne fordele , primært som følge af at være fritflydende , hvilket betyder, at der ikke er nogen fast struktur til deres regneark og data kan organiseres , men du ønsker det. Men dedikerede programmer er mere passende for dataanalyse for en række årsager . Række teknikker
Fordi statistisk analyse pakker er specielt produceret til statistisk dataanalyse , mens generelle programmer også omfatte andre procedurer ved hjælp af data såsom regnskabs formularer eller fakturering , de tilbyder en bredere vifte af teknikker, diagrammer og grafer . De omfatter også flere metoder til rengøring og screening af data , for at forberede den til senere analyse. Også, kan regnearksprogrammer kun støtte de fleste dataanalyser lige efter installation, og plug- ins kan være nødvendigt at få adgang til mere komplekse teknikker.
Data Management
Det er sandt at regnearksprogrammer giver mere kontrol over , hvor og hvordan man kan organisere dine data. Men det er også en ulempe. Selvom du ikke kan blot flytte blokke af data rundt i et program som SPSS , det er at holde data organiseret på den mest optimale måde . En række altid repræsenterer en enkelt sag, og en søjle en enkelt variabel . Dette gør analyser hurtigere , da programmet allerede ved , hvor de variable og sager er. I et regneark , skal dette defineres manuelt med hver analyse .
Organisationen af Output
dataanalyser programmer er også designet til at holde produktionen adskilt fra data selv . I et program som Excel , skal resultatet af analysen være placeret i et regneark , hvor det risikerer at overskrive andre data og udgange eller bliver overskrevet selv ved et uheld på et senere tidspunkt . Mest dedikerede analyse programmer tager det et skridt videre og gemme output i separate filer til de vigtigste data , der er sig selv.
Nøjagtighed
nøjagtighed standalone statistisk analyse pakker er generelt mere troværdige end de generelle data management -programmer. Dette er af forskellige grunde , herunder evnen til en celle i et regneark for at være både en formel og en værdi , noget der ikke er muligt i en statistik pakke. Test af Excel statistisk analyse add -on , Analysis ToolPak , har vist unøjagtige resultater i analyser som regression og multipel regression. Dette problem er særligt udtalt med mere komplekse analyser , såsom dem, der involverer kategoriske variable .