Software databaser modtage information fra en række forskellige kilder , og gemme disse oplysninger til brug for programmer og slutbrugere. Ikke alle oplysninger er præsenteret i et format, at en database kan håndtere , dataene skal gennemgå visse ændringer for at gøre den forenelig med databasen format. Udvinding, bearbejdning og læsning processer gør det muligt for information at komme fra en datakilde og blive indlæst i en database . Ekstraktion
Extraction er processen med at tage data fra en kilde filsystem eller et andet sted for eventuel integration i en database . Såfremt data forkert udvindes derefter efterfølgende processer sandsynligvis få problemer , hvis de ikke svigte helt. Ekstraktion er især vigtigt for databaser , der trækker oplysninger fra flere kilder som den fil , der bruges af hver kilde er muligvis ikke fuldt kompatible med databasen eller hinanden. Flere ekstraktionsmetoder kan være nødvendigt for at sikre korrekt udsugning fra alle kilder.
Transforming
omstillingsprocessen forbereder udtrukne data til påfyldning af en database. Afhængigt af lighederne mellem den fil , der anvendes af den datakilde , og at den database, kan en række ændringer til dataene være nødvendigt at gøre den forenelig med databasen filsystemet. Disse ændringer kan omfatte en sammenlægning af forskellige datafelter , oversættelse af data fra et format til et andet , og at foretage tilpasninger orienteringen af datafelter , så de passer til den tilsvarende format af databasen .
< br > Loading
læsningen tager data , der er blevet transformeret og genererer nye databaseposter baseret på disse data. Disse nye registreringer er i standard database format og kan tilgås af software eller brugere med korrekte legitimationsoplysninger eller database administratorrettigheder. Yderligere ændringer kan foretages til dataene fra brugere eller database -software , selv om disse ændringer ikke vil blive afspejlet i de data, der stadig tilbageholdes på den oprindelige kilde .
Anvendelse af ETL processer
ETL processer er ofte bruges i data warehousing og lignende operationer, hvor store mængder data er hentet fra en række forskellige computere eller servere . De tre processer arbejder sammen for at sikre, at data er korrekt konverteret fra dens udspring formular til en form, der kan anvendes af den centrale database uden fejl . Uden brug af ETL processer , data kan blive registreret korrekt i databasens format eller kan ende med ikke at blive optaget på alle.