Data mining er en proces, der analyserer data fra forskellige synsvinkler og producerer information sætter organiseret i en kortfattet måde. Programmer og derefter bruge denne information til en række forskellige formål. For eksempel kunne de oplysninger demonstrere metoder til at øge produktiviteten og indtægter eller reducere omkostninger og affald. Data mining finder sammenhænge eller mønstre mellem forskellige felter i databaser. Oracle bruger en proces til at høste data, der beskytter integriteten af den oprindelige information . Hvad er Data Mining
Også kendt som viden opdagelse i data , målet af data mining er at opdage mønstre , forudsige sandsynlige udfald og bruge store databaser af information til handling. Processen opnår disse mål ved hjælp af matematiske algoritmer til at dissekere eller nedbryde information . Data mining derefter vurderer sandsynligheder , der eksisterer for fremtidige begivenheder baseret på oplysningerne.
Problem Definition
Oracle DM proces begynder ved at forsøge at forstå de mål og krav et bestemt projekt og derefter udvikle en implementeringsplan . Med andre ord spørger Oracle DM processen spørgsmål om de problemer organisationen står og skaber en model, der producerer mulige udfald. Før organisationer kan bruge denne model , men de skal indsamle oplysninger om sandsynlige relationer.
Forberedelse og Gathering
forberedelse af dataindsamling kræver en forståelse af, hvad der er involveret i dataindsamling og udforskning. Dette repræsenterer den del af den proces, der gennemgår data og bestemmer, hvordan det løser problemet . På dette stadium af forberedelsen, tilføjer organisationen og fjerner data baseret på kvaliteten af oplysningerne . Processen anvender også forskellige attributter til at stille og besvare spørgsmål , der giver de ønskede resultater.
Model Building Evaluering og Deployment
modellering fase bruger små dataeksempleringer at skabe en foreløbig model. Processen derefter tester denne foreløbige model , inden du opretter den endelige model . Da den endelige model indeholder typisk en betydelig mængde data, bør organisationen kontrollere foreløbig model , før du udfører den endelige model . Organisationen bør specifikt vurdere foreløbig model og afgøre, om det opfylder de endelige mål for projektet. Under indsættelsen, vurderer organisationen oplysninger fra data for indsigt og handlingsrettede information. Indsættelsen bruges typisk til at give rapporter og implementere nye metoder til operation .