Dataprofilering

Forfatter: Lewis Jackson
Oprettelsesdato: 10 Kan 2021
Opdateringsdato: 25 Juni 2024
Anonim
Pandas Profiling for Data Science (Quick and Easy Exploratory Data Analysis)
Video.: Pandas Profiling for Data Science (Quick and Easy Exploratory Data Analysis)

Indhold

Definition - Hvad betyder dataprofilering?

Dataprofilering er en teknik, der bruges til at undersøge data til forskellige formål, såsom at bestemme nøjagtighed og fuldstændighed. Denne proces undersøger en datakilde såsom en database for at afdække de fejlagtige områder i dataorganisationen. Implementering af denne teknik forbedrer datakvaliteten.


Dataprofilering kaldes også dataopdagelse.

En introduktion til Microsoft Azure og Microsoft Cloud | Gennem denne vejledning lærer du, hvad cloud computing handler om, og hvordan Microsoft Azure kan hjælpe dig med at migrere og drive din virksomhed fra skyen.

Techopedia forklarer dataprofilering

Dataprofilering er metoden til at undersøge de tilgængelige data i en datakilde og indsamle statistikker og oplysninger om disse data. Sådanne statistikker er med til at identificere metadatas brug og datakvalitet. Denne metode er vidt brugt i opbevaring af virksomhedsdata.

Dataprofilering klargør strukturen, forholdet, indholdet og afledningsreglerne for data, som hjælper med til forståelsen af ​​afvigelser inden for metadata. Dataprofilering bruger forskellige former for beskrivende statistikker, herunder gennemsnit, minimum, maksimum, percentil, frekvens og andre aggregater såsom antal og sum. Den yderligere metadatainformation, der opnås under profilering, er datatype, længde, diskrete værdier, unikhed og abstrakt typegenkendelse.