Datavidenskab eller maskinlæring? Her er hvordan man finder forskellen

Forfatter: Laura McKinney
Oprettelsesdato: 3 April 2021
Opdateringsdato: 1 Juli 2024
Anonim
Datavidenskab eller maskinlæring? Her er hvordan man finder forskellen - Teknologi
Datavidenskab eller maskinlæring? Her er hvordan man finder forskellen - Teknologi

Indhold


Kilde: Elnur / Dreamstime.com

Tag væk:

Datavidenskab og maskinlæring er forskellige på nøglemåder. På nogle måder kan den ene ses som en undergruppe af den anden. Begge er vigtige i den nuværende it-fremgang.

I denne nye verden af ​​kunstig intelligens og datastyring er det let at blive forvirret af nogle af de udtryk, der oftest bruges i IT-verdenen.

For eksempel har datavidenskab og maskinindlæring meget at gøre med hinanden. Det er ikke overraskende, at mange mennesker med kun en viden om disse discipliner ville have problemer med at finde ud af, hvordan de adskiller sig fra hinanden.

Her er den bedste måde at adskille datavidenskab fra maskinlæring, som et princip og som en teknologisk tilgang.

Data Science and Machine Learning: bred og smal terminologi

For det første er datavidenskab virkelig en bred, overordnet kategori af teknologi, der omfatter mange forskellige typer projekter og kreationer. (Se Jobroll: Data Scientist for mere information om, hvad der er involveret i et data science).


Datavidenskab er i det væsentlige den praksis at arbejde med big data. Det dukkede op som Moore's lov, og spredningen af ​​mere effektive lagerenheder førte til, at enorme mængder data blev indsamlet af virksomheder og andre parter. Derefter begyndte big data platforme og værktøjer som Hadoop at omdefinere computing ved at ændre, hvordan datastyring fungerer. Nu med sky og containerisering samt helt nye modeller er big data blevet en vigtig drivkraft for måderne, vi arbejder og lever på.

I sin enkleste form er datavidenskaben den måde, vi administrerer disse data på, fra at rense dem og foredle dem til at bruge dem i form af indsigt.

Definitionen på maskinlæring er meget smalere. I maskinlæring indtager teknologier data og sætter dem igennem algoritmer for at simulere menneskelige kognitive processer, der er beskrevet som ”læring.” Med andre ord, efter at have taget dataene ind og trænet i dem, er computeren i stand til at give sine egne resultater , hvor teknologien ser ud til at have lært af de processer, som programmører indførte.


Datavidenskab og maskinlæringsevner

En anden måde at kontrastere data videnskab og maskinlæring er at se på de forskellige færdigheder, der er mest værdifulde for fagfolk inden for et af disse områder.

Ingen fejl, ingen stress - Din trinvis vejledning til oprettelse af livsændrende software uden at ødelægge dit liv

Du kan ikke forbedre dine programmeringsevner, når ingen er interesseret i softwarekvalitet.

Der er en generel enighed om, at dataforskere drager fordel af dybe analytiske og matematiske færdigheder, praktisk erfaring med databaseteknologier og viden om programmeringssprog som Python eller andre pakker, der bruges til at analysere big data.

”Enhver, der er interesseret i at opbygge en stærk karriere inden for (datavidenskab), skal få nøgleevner i tre afdelinger: analytics, programmering og domæneviden,” skriver Srihari Sasikumar på Simplilearn. ”Når du går et niveau dybere, vil følgende færdigheder hjælpe dig med at skabe en niche som dataforsker: Stærk viden om Python, SAS, R (og) Scala, praktisk erfaring med SQL-databasekodning, evne til at arbejde med ustrukturerede data fra forskellige kilder som video og sociale medier, forstår flere analytiske funktioner (og) viden om maskinlæring. ”

På maskinlæringssiden citerer eksperter ofte datamodelleringsevner, sandsynlighed og statistikviden og bredere programmeringsevner som nyttige værktøjer i maskinlæringsingeniørens værktøjssæt.

Sådan finder du maskinlæring

Nøglen her er, at alle mulige ting omfatter datavidenskabeligt arbejde, men det er ikke maskinlæring, medmindre du har et meget strengt regime indrettet til at hjælpe computeren med at lære af dens input.

Når det er på plads, skaber det nogle overraskende dygtige systemer, der kan have vidtgående effekter på vores liv.

”Meget af det, vi gør med maskinlæring, sker under overfladen,” har Amazon-grundlægger Jeff Bezos efter sigende sagt og påpeget nogle af anvendelserne af disse typer systemer. ”Maskinlæring driver vores algoritmer til efterspørgselsprognoser, rangering af produktsøgning, produkt- og tilbudsanbefalinger, merchandising-placeringer, svigpåvisning, oversættelser og meget mere. Skønt mindre synlig, vil meget af virkningen af ​​maskinlæring være af denne type - roligt men meningsfuldt forbedre kernedrift. ”

Et af de mest nyttige eksempler her er fremkomsten af ​​det neurale netværk - det er en almindelig og populær metode til opsætning af maskinlæringsprocesser.

I sin mest basale form er det neurale netværk sammensat af lag af kunstige neuroner. Hver enkelt kunstig neuron har funktionalitet svarende til en biologisk neuron - men i stedet for synapser og dendriter, har den input, en aktiveringsfunktion og eventuelle output.

Det neurale netværk er lavet til at fungere som en menneskelig hjerne, og fagfolk i maskinlæring bruger ofte denne model til at skabe maskinlæringsresultater.

Det er dog ikke den eneste måde at gøre maskinlæring på. Nogle mere rudimentære maskinlæringsprojekter inkluderer simpelthen at vise en computer en bred vifte af fotografier (eller forsyne dem med andre rå data), indgive ideer gennem processen med at bruge overvåget maskinlæring og etiketdata og have computeren til sidst i stand til at skelne mellem forskellige former eller genstande i et visuelt felt. (Se Grundlæggende om maskinlæring ved at se Machine Learning 101.)

To skærende discipliner

Afslutningsvis er maskinlæring en værdifuld del af datavidenskaben. Men datavidenskab repræsenterer hurtigere grænse og den ulempe, hvor maskinlæring finder sted.

På en måde kan du sige, at maskinlæring aldrig ville ske uden big data. Big data i sig selv skabte dog ikke maskinlæring - i stedet for, efter at vi samlet havde samlet så meget data, at vi næsten ikke vidste, hvad vi skulle gøre med det, kom topsinderne med disse biosimulerende processer som en superladet måde at give indsigt.

En anden god ting at huske her er, at datavidenskab kan anvendes på to hovedmåder - vi kan omfatte maskinlæring og kunstig intelligens, lade computere tænke for os, eller vi kan bringe datavidenskab tilbage til en mere menneskecentreret tilgang, hvor computeren præsenterer ganske enkelt resultater, og vi som mennesker træffer beslutningerne.

Det fører til, at nogle eksperter, herunder nogle af dagens største innovatører, kræver en mere levende redegørelse for måderne, vi bruger disse teknologier på.

"(AI) er i stand til langt mere end næsten nogen kender, og forbedringsgraden er eksponentiel," er Elon Musk blevet citeret for at sige, mens han advarer om, at maskinindlæring og AI-programmer kræver tilsyn.

Under alle omstændigheder er både datavidenskab og maskinindlæring kerneelementer i de fremskridt, som vi som samfund gør inden for teknologi i dag.