" ETL " står for Extract, Transform og Load - de tre grundlæggende opgaver ETL . Uddrag indebærer udtrække data fra eksterne kilder , som du ønsker at bringe ind i dine databaser. Transform indebærer manipulere de eksterne data i et format, der vil matche op med formatet af de data, der aktuelt i dine databaser . Belastningen er for import de transformerede data i den endelige database eller system, hvor det vil opholde . Nogle har fundet det lettere at indlæse data priot at omdanne det, og det er muligt at se udtrykket skrives som " ELT . " Hver opgave på egen hånd kan være kompleks , og der er software-værktøjer og systemer er bygget specielt til ETL forarbejdning. Uddrag
"Extract" Opgaven indebærer indsamling af data fra eksterne kilder , som du ønsker at bringe ind i dine systemer og databaser. I en virksomhed, kan de data, der findes i enkeltstående databaser eller regneark , der ikke er integreret med en eventuel master database. Dataene måske endda være papirbaseret eller kan være data , du køber fra en dataleverandør . Målet med denne opgave er at forstå dataformat , vurdere den samlede kvalitet af dataene og til at udtrække data fra dens udspring , så den kan manipuleres på den næste opgave .
Transform < br >
i " Transform " step , du bruger en bred vifte af software-værktøjer , og selv brugerdefinerede programmering til at manipulere data , så det kan integreres med data, du allerede har. For eksempel overveje et system, der identificerer hanner med et "M ", og hunner med et "F" Hvis du har udvundet data fra en ekstern kilde , der identificerer mænd med et " 1" og hunner med et " 2 , "du har brug for at omdanne dataene ved at konvertere " 1 "til et" M "og" 2 " til et " F " , så det passer sammen med de data, der i øjeblikket bor i dit databaser og systemer .
Load
Når du har succes forvandlet de data, du har brug for til fysisk indlæse det i dit system eller database. Før du indlæse dataene , sørg for at have en backup af dit nuværende system , eller at du kan rulle tilbage eller fortryde importen , hvis det mislykkes . Efter indlæsning af data , er det almindeligt at køre revisionsrapporter , så du kan gennemgå resultaterne af de sammenlagte databaser og systemer for at sikre de nye data har ikke medført nogen fejl eller problemer.
ELT < br >
Når " Transform " opgave i sig selv er stort og komplekst , kan du ønsker at udtrække data , indlæse den i en midlertidig tabel inde i databasen , hvor det vil have fast bopæl og udføre de handlinger " ; Transform " skridt efter du har indlæst dataene. Når de data, der er lagt i det endelige system i løbet af " Transform " step sommetider gør det nemmere at køre rapporter og afprøve resultaterne af forarbejdningsprocesser . På grund af dette, er det muligt at se udtrykket skrives som " ELT " snarere end " ETL . "