Et data warehouse er en relationel database , en elektronisk database, hvor data er lagret i tabeller af rækker og kolonner. Den er designet til søgning og analyse , snarere end dagligdags transaktion behandling . En transaktion er en atomar enhed af arbejde, såsom at betale en regning fra din bankkonto , som enten lykkes eller mislykkes . I modsætning til en transaktion system , er et data warehouse ikke behøver at reagere omgående på henvendelser fra brugerne og har andre unikke egenskaber. Emne Oriented
En database er designet til at hjælpe analytikere analysere data . Som sådan , er lagret efter emne , snarere end ved at anvende , med andre ord , er de data Den nøjagtige emne kan variere fra virksomhed til virksomhed , men en virksomhed kan beslutte at strukturere sine data warehouse med " emneorienteret . " salg, forsendelser eller inventar, så det kan besvare spørgsmål som : "Hvilken kunde har købt det meste af dette produkt sidste år? "
Extract, Transform og Load
et andet kendetegn ved et data warehouse er , at det skal trække på samme hammel data fra forskellige operationelle databaser , filer og data segmenter , hvorefter det præsenterer dem på en ensartet format . Det betyder , at før data flyttes ind i et data warehouse , skal det gennemgå en proces kendt som ekstrakt, transformere og indlæse. Først denne proces trækker data fra en eller flere operationelle datakilder. For det andet , det fjerner uoverensstemmelser fra alle data, endelig er det indlæser data i data warehouse . I sidste ende , effektiviteten af denne proces bestemmer kvaliteten af dataene i et data warehouse .
Nonvolatile
Når overføres til et data warehouse , data gør ikke ændre sig, og beskrives som " flygtig ". dataene er ikke beregnet til at køre dag-til -dag forretning , i modsætning til data, der opbevares i operationelle databaser , er det ikke opdateret efter hvert enkelt transaktion. I stedet overføres data til data warehouse med jævne , bestemte intervaller , såsom én gang om dagen , en gang om ugen eller en gang om måneden, afhængigt af den nøjagtige karakter af disse oplysninger .
Historiske data < br >
modsætning til en transaktion system , hvor historiske data er arkiveret for at opretholde ydeevne database, skal et data warehouse indeholde historiske data. For at identificere forretningsmæssige trends, analytikere kræver store mængder data , stikprøven over tid, så et data warehouse indeholder historiske " snapshots" af operationelle data på bestemte tidspunkter . Med andre ord er data i et data warehouse beskrevet som "tid variant ", fordi dens fokuserer primært ændre sig over tid .