Ikke-mærkede data

Forfatter: Laura McKinney
Oprettelsesdato: 2 April 2021
Opdateringsdato: 24 Juni 2024
Anonim
Ikke-mærkede data - Teknologi
Ikke-mærkede data - Teknologi

Indhold

Definition - Hvad betyder umærkede data?

Umærkede data er en betegnelse for data, der ikke er mærket med etiketter, der identificerer egenskaber, egenskaber eller klassifikationer. Umærkede data bruges typisk i forskellige former for maskinlæring.


En introduktion til Microsoft Azure og Microsoft Cloud | Gennem hele denne vejledning lærer du, hvad cloud computing handler om, og hvordan Microsoft Azure kan hjælpe dig med at migrere og drive din virksomhed fra skyen.

Techopedia forklarer umærkede data

I typer af maskinlæring kaldet ikke-overvåget maskinlæring, fungerer maskinlæringsprogrammet ved at evaluere sæt af umærkede data. Da dataene ikke har etiketter, skal maskinindlæringsprogrammet identificere hvert datablad om dets egenskaber og egenskaber.

En af de bedste måder at forklare dette på er ved at bruge metaforen til frugtskålen. Antag, at maskinlæringsprogrammet lærer at identificere tre forskellige slags frugter - bananer, druer og æbler. Hvis dataene i det oprindelige træningssæt er mærket, fungerer maskinlæringsprogrammet fra det perspektiv - matchende successive billeder til en af ​​disse tre kategorier.


Hvis imidlertid ingen af ​​datastykkerne er mærket med de tre frugtnavne - bananer, druer og æbler - er maskinlæringsprogrammet nødt til at arbejde ved at evaluere hvert billede og se på egenskaber som farve - gul, rød eller lilla - former - lang og tynd, rund eller klynget - og andre egenskaber.

Fra dette eksempel er det let at se, hvordan mærkede data giver meget lettere muligheder for at bruge maskinlæringsalgoritmer til beslutningsresultater. Imidlertid kan sofistikerede, uovervågede maskinindlæringsprogrammer, der beskæftiger sig med umærkede data, også give forbløffende nøjagtige og præcise resultater.