ekstrakt, transformere og indlæse ( ETL ) værktøj trække data fra en ekstern kilde , transformere det eller ændre det , og derefter indlæse den i en destination database eller repository . ETL værktøjer query databaser for oplysninger, der skal udvindes , omdannes og præsenteres eller indlæst i destinationen databasen. ETL forespørgsel teknikker kan være baseret på metadata , data parametre og brugernes forespørgsler. ETL forespørgsler kører på anfordring eller med jævne mellemrum . Multi -level forespørgsler i ETL værktøjer kan køre med (online analytical processing OLAP ) motorer. Metadata
Metadataoplysninger beskriver oplysninger inden for en celle eller vedhæftet fil er gemt i databasen . Bruger forespørgsler kan være baseret på bestemte søgeord eller filnavne . ETL værktøjer kan forespørge information søger brugeren forudsat vilkår inden for metadata. Søgning en database for et bestemt tegning nummer eller dokument skabere er en metadata forespørgsel. ETL værktøjer, der anvendes til data mapping søge efter værdier i celler med et bestemt navn eller reference og kopiere dem ind i destination celler med den kortlagte navn eller reference.
Ad Hoc
Ad hoc midler specialiseret eller unikke .
Ad hoc-rapporter er tilpasset og skræddersyet af den enkelte bruger. Ad hoc rapporter kan være smalle delmængder af eksisterende rapporter eller er baseret på eksisterende rapporter med yderligere parametre . Ad hoc-rapporter kan også skabes fra bunden. Brugere køre ad hoc-rapporter efter behov.
Periodiske opdateringer
Pulling data fra en database og konvertere den til det format til brug i en anden database resultater i ETL værktøj brug i periodiske opdateringer af data mellem systemer . Periodiske opdateringer forekommer ved bestemte intervaller såsom natlige eller ugentligt. Help desk personale kan have evnen til at manuelt at udløse en periodisk opdatering efter en meddelelse eller edb-system udfald. Range partitionering opdeler data baseret på datoen . Rækkevidde partitionering bruges til at trække poster for en given tidsperiode . Data uden for det område partitioner ikke forespørges . Periodiske opdateringer er baseret på rækkevidde partitionering med datoen for den seneste opdatering indstilling partition grænse.
Kvalitetsmål
Kvalitet foranstaltninger til ETL forespørgsler kvantificere , hvor godt ETL query teknikker udføre data søgning og konvertering. Datakvalitet kan defineres ved det samlede antal fejl, der genereres af forespørgslen. Datakvalitet kan beregnes på grundlag af nøjagtigheden af et data pull baseret på foruddefinerede prøvesager. ETL forespørgsel overvågningsværktøjer spore den tid der kræves for at skabe resultater for en forespørgsel. Den gennemsnitlige data hentning tid eller forespørgsel responstid kan bruges til at overvåge databasens ydeevne og kvalitet af forespørgsler . Query teknikker, der genererer høje fejlprocenter eller tage længere end gennemsnittet , kan betragtes værre end dem, der kører hurtigt og gnidningsløst .