Data rengøring er processen med fastsættelse data og fjerne unødvendige data for at optimere daglige datawarehousing drift. Datawarehousing er opbevaring af data i en central database , så alle i en organisation kan få adgang til det. For datawarehousing at blive en succes , skal databasen oplysninger være korrekte. Men i betragtning af den store mængde af data, som virksomhederne arbejder med, kan disse data ikke altid rettes manuelt. Derfor er automatiseret data udrensning nødvendig. Tilgængelighed
data udrensning må gøre de mest relevante data hurtigt tilgængelige for dem, der søger efter det. Spildtid søge gennem irrelevant information kan spilde tid for medarbejderne og affald virksomhedens ressourcer . Oplysninger, som er overflødig kan spilde virksomhedens lagerplads.
Integrity
data udrensning må ikke slette eller ændre data til , hvor dataene bliver unøjagtige. Ukorrekte oplysninger kan medføre virksomheder til at lave fejl såsom at sende en regning til den forkerte adresse , hvilket kan vrede kunder og spilde penge . Data skal også opdateres hele databaser. Hvis en kunde opdaterer en faktureringsadresse , skal denne opdatering fordeles til databaser i alle relevante afdelinger.
Organisering
data udrensning bør tage relevante data fra forskellige kilder og automatisk flytte disse data til relevante steder , så data let kan findes, når det er nødvendigt. Dette eliminerer behovet for at skabe nye data, når data, der allerede eksisterer.
Fejl Correction
Fejl og uoverensstemmelser , såsom en fejlindtastet navn, bør placeres og korrigeret af data udrensning processer . Fejl især skal rettes i computer software programmering , da sådanne fejl kan forårsage edb-systemer ikke fungerer ordentligt.
Automation
Data Cleansing redskaber bør minimere mængden af manuelle input, der er nødvendig. Med andre ord bør database administratorer ikke hele tiden igangsætte processer selv, men disse processer bør ske automatisk. Der bør også være minimal programmering nødvendige indsats. Programmører bør ikke have at kode , når en rutinemæssig handling udføres .
Simplicity
Data Cleansing værktøj skal forenkle oplysninger, når det er muligt. Komplicerede data affald virksomhedens ressourcer , og også tvinger medarbejderne til at bruge mere tid på udkig efter bestemte oplysninger.
Analyse
Post- procesanalyse er en manuel undersøgelse af data , efter at dataene er blevet renset . Ligegyldigt hvor effektive data udrensning processer kan uundgåelige fejltagelser forekomme. Database administratorer stadig nødt til regelmæssigt at kontrollere data manuelt for at sikre, at dataene er korrekte. Data Cleansing værktøjer bør give administratorer at se data i en let forståelig form , således at korrektioner kan foretages hurtigt.
Efficiency
data udrensning kan være tidskrævende og dyrt. Alt, hvad der kan fremskynde langs data renselsesproces eller reducere omkostninger forbundet med data udrensning er nødvendig for at maksimere virksomhedens rentabilitet.