Rengøring af data

Forfatter: Randy Alexander
Oprettelsesdato: 26 April 2021
Opdateringsdato: 1 Juli 2024
Anonim
Rengøring af data - Teknologi
Rengøring af data - Teknologi

Indhold

Definition - Hvad betyder datarensning?

Rengøring af data er processen med at ændre data i en given lagerresource for at sikre, at de er nøjagtige og korrekte. Der er mange måder at forfølge datarensning i forskellige software- og datalagringsarkitekturer; de fleste af dem er centreret om den omhyggelige gennemgang af datasæt og protokoller, der er knyttet til en bestemt datalagringsteknologi.


Datarensning er også kendt som datarensning eller dataskrubber.

En introduktion til Microsoft Azure og Microsoft Cloud | Gennem denne vejledning lærer du, hvad cloud computing handler om, og hvordan Microsoft Azure kan hjælpe dig med at migrere og drive din virksomhed fra skyen.

Techopedia forklarer Data Cleansing

Rengøring af data sammenlignes undertiden med rensning af data, hvor gamle eller ubrugelige data slettes fra et datasæt. Selvom datarensning kan omfatte sletning af gamle, ufuldstændige eller duplikerede data, er datarensning forskellig fra datarensning, idet rensning af data normalt fokuserer på at rydde plads til nye data, mens datrensning fokuserer på at maksimere nøjagtigheden af ​​data i et system. En data-rensningsmetode kan bruge parsing eller andre metoder til at slippe af med syntaksfejl, typografiske fejl eller fragmenter af poster. Omhyggelig analyse af et datasæt kan vise, hvordan sammenlægning af flere sæt førte til duplikering, i hvilket tilfælde datarensning kan bruges til at løse problemet.


Mange problemer, der involverer datarensning, ligner de problemer, som arkivister, databaseadministratorer og andre står overfor processer som datavedligeholdelse, målrettet data mining og ekstrakt, transformering, indlæsning (ETL) -metodik, hvor gamle data indlæses i et nyt datasæt. Disse problemer vedrører ofte syntaks og specifik brug af kommando til at udføre relaterede opgaver i database- og serverteknologier som SQL eller Oracle. Databaseadministration er en meget vigtig rolle i mange virksomheder og organisationer, der er afhængige af store datasæt og nøjagtige poster til handel eller ethvert andet initiativ.