Hvad er forskellen mellem big data og data mining?

Forfatter: Judy Howell
Oprettelsesdato: 5 Juli 2021
Opdateringsdato: 23 Juni 2024
Anonim
The Third Industrial Revolution: A Radical New Sharing Economy
Video.: The Third Industrial Revolution: A Radical New Sharing Economy

Indhold

Q:

Hvad er forskellen mellem big data og data mining?


EN:

Big data og data mining er to forskellige ting. Begge vedrører brugen af ​​store datasæt til håndtering af indsamling eller rapportering af data, der betjener virksomheder eller andre modtagere. De to udtryk bruges imidlertid til to forskellige elementer i denne form for operation.

Big data er en betegnelse for et stort datasæt. Store datasæt er dem, der vokser ud af den enkle database- og databehandlingsarkitektur, der blev brugt i tidligere tider, hvor big data var dyrere og mindre gennemførlig. F.eks. Kan datasæt, der er for store til let at håndtere i et Microsoft Excel-regneark, blive omtalt som store datasæt.

Data mining betyder aktiviteten ved at gå gennem store datasæt for at se efter relevant eller relevant information. Denne type aktivitet er virkelig et godt eksempel på den gamle aksiom "på udkig efter en nål i en høstak." Ideen er, at virksomheder indsamler massive datasæt, der kan være homogene eller automatisk indsamlet. Beslutningstagere har brug for adgang til mindre, mere specifikke stykke data fra de store sæt. De bruger data mining til at afsløre de oplysninger, der vil informere lederskab og hjælpe med at kortlægge kursen for en virksomhed.


Data mining kan involvere brug af forskellige typer softwarepakker såsom analyseværktøjer. Det kan automatiseres, eller det kan i vid udstrækning være arbejdskrævende, hvor de enkelte arbejdstagere specifikt forespørger om information til et arkiv eller en database. Generelt henviser data mining til operationer, der involverer relativt sofistikerede søgefunktioner, der returnerer målrettede og specifikke resultater. F.eks. Kan et data mining-værktøj gennem flere år med regnskabsoplysninger for at finde en bestemt søjle med udgifter eller tilgodehavender for et specifikt driftsår.

Kort sagt, big data er aktivet, og data mining er den "handler" der bruges til at give positive resultater.