? Empiriske statistikker er processen estimere en variabel i en population baseret på kendte data fra et mindre udsnit af denne population. For nøjagtige skøn , der skal foretages , den gennemsnitlige og distribution af prøven skal være så tæt som muligt til befolkningen , hvorfra den er taget. Der er flere trin , du kan tage i denne retning. Instruktioner
1
Brug en stor stikprøve som tid og penge tillader . Hvis du bruger en mindre stikprøve , er det mere sandsynligt, at din prøve vil klynge omkring en middelværdi , der ikke repræsenterer din befolkning. Omvendt jo større din prøve er, jo større er sandsynligheden for, at det statistisk set vil matche befolkningen.
2
stikprøver . Ideelt set bør alle datapunkt i befolkningen har en lige chance for at ende i din prøve . Hvis dette ikke er tilfældet , vil dine estimater være partisk . For eksempel, hvis du ønsker at vurdere den gennemsnitlige nettoformue på mennesker i dit land , og du indsamler kun eksempeldata fra den rigeste by din prøve , vil højst sandsynligt overvurdere befolkningen.
3
Fjern outliers . En outlier er et datapunkt , der ligger langt væk fra den vigtigste klynge . Selv om de repræsenterer legitime datapunkter fra din prøve , kan du ønsker at fjerne dem i nogle tilfælde , som når din prøve størrelse er forholdsvis lille , eller når en eller anden grund , skal du bruge den gennemsnitlige stedet for en anden foranstaltning central tendens som medianen . For eksempel, hvis din nettoformue Undersøgelsen omfattede 10 personer - 9 middelklasse og Bill Gates - Deres skøn over den gennemsnitlige løn er tilbøjelige til at blive oppustet, så du kan imødegå dette ved at fjerne outlier
.