Job rolle: Data Scientist

Forfatter: Roger Morrison
Oprettelsesdato: 28 September 2021
Opdateringsdato: 11 Kan 2024
Anonim
Data Scientist Job Description explained by Brillio Data Scientist
Video.: Data Scientist Job Description explained by Brillio Data Scientist

Indhold


Kilde: Sergey Khakimullin / iStockphoto

Tag væk:

Datavidenskabere har omfattende job, der varierer betydeligt efter applikationen. Men en ting, de alle har til fælles, er drevet til at udnytte data godt.

Hvad gør en dataforsker i forbindelse med kunstig intelligens og maskinlæringsarbejde? Mange professionelle, der hver dag beskæftiger sig med disse slags projekter, vil sige, at spørgsmålet er lidt svært at svare på. Et bedre spørgsmål ville være: Hvad gør dataforskere IKKE?

En dataforsker er integreret i en AI- eller ML-proces i den forstand, at alle disse projekter afhænger af big data eller komplekse input. Dataforskeren er den essentielle karriere, der ved, hvordan man arbejder med data for at producere resultater.

Der er dog nogle måder at tale om, hvad en dataforsker gør, hvilke kvalifikationer han eller hun har brug for, og hvad hans eller hendes rolle er i processen.


Læs: 6 centrale datavidenskoncepter, du kan mestre gennem online-læring

Varierede definitioner, varierede pligter

Mange eksperter, der beskriver en dataforskers arbejde, taler om det bredt.

”Hos små virksomheder, eller når man arbejder på et nyt marked, er dataforskerens rolle at konvertere relativt nye (men åbenlyse) datakilder til ting, der løser et problem for en slutbruger, hvilket ikke ville have været muligt tidligere, hvor de anvendte teknologier ikke eksisterede, ”siger Antonio Hicks, en Account Manager hos Mercury Global Partners. "Den ideelle kandidat er en person, der er en del af matematikeren, en del softwareingeniør og en del iværksætter."

Andre gentager denne grundide og nævner, hvilke data forskere har brug for for at tackle modelleringsprojekter.

"Den vigtigste egenskab, som en dataforsker har brug for, er en dyb nysgerrighed omkring verden omkring dem - uanset om de besvarer spørgsmål eller bygger modeller, er et ønske om at forstå problemet foran dem," siger Erin Akinci, Data Scientist Manager i Asana. ”Derfra vil de fleste mennesker kræve kvalifikationer inden for matematik og programmering for at finde løsninger, men de specifikke typer af matematik og programmering varierer meget afhængigt af ekspertiseområdet inden for datavidenskab.”


Ingen fejl, ingen stress - Din trinvis vejledning til oprettelse af livsændrende software uden at ødelægge dit liv

Du kan ikke forbedre dine programmeringsevner, når ingen er interesseret i softwarekvalitet.

”Fremragende videnskabeligt arbejde har mere at gøre med den måde, hvorpå en videnskabsmand tænker på et problem, end de værktøjer, de bruger til at løse det,” tilføjer Charlie Burgoyne, grundlægger og administrerende direktør for Valkyrie Intelligence. Valkyrie er et anvendt videnskabskonsulentfirma med imponerende projekter under sin fløj, såsom Mark I, et dedikeret netværksapparat, der øger neurale netværkstræning og -testning, forbedrer hvad der er muligt med foregående skybaserede maskinlæringsplatforme.

”Markedet kræver forskere, der er dygtige til at udvikle Python, neuralt netværksdesign og evnen til at omforme et dataregister til den nyeste databasearkitektur,” siger Burgoyne. ”Disse muligheder er imidlertid tabeller til en talentfuld videnskabsmand. Det, der er mindre indlysende, er en videnskabsmandes egnethed til utrygghed nysgerrighed, aggressiv opfindsomhed og en overholdelse af den videnskabelige metode. ”

Dataforskerens færdigheder

Så vidt det drejer sig om praktiske færdigheder, har dataforskere brug for en vis mængde kreativitet og kløgtige, hvad angår modellering. De kan også drage en stor fordel ved at have ”hårde færdigheder”, såsom erfaring med kodning i Python, C ++ eller andre almindelige sprog, der anvendes til ML-projekter.

"Python og C ++ er vigtige og at kunne kombinere kodningsfærdigheder med dataanalyse og behandling og statistik er kernefærdigheder, der får en datavidenskabsmand til at fremstå som en stærk kandidat eller medarbejder," siger Val Streif hos Pramp, en online mock-interviewplatform til softwareingeniører, udviklere og dataforskere. ”Selvom nogle af programmeringsfærdighederne kunne tages hånd om ved at parre en datavidenskabsmand med en udvikler, er det meget lettere, hvis du har begge færdigheder kombineret i en, set fra et virksomheds perspektiv.”

Andre eksperter tilføjer R, Hadoop, Spark, Sas og Java til listen såvel som teknologier som Tableau, Hive og MATLAB.

Alle dem sørger for et imponerende CV, men nogle af dem, der har erfaring med at rekruttere datavidenskabsmænd, siger, at den anden ”menneskelige” side også betyder noget. (En type datavidenskabsmand er borgerdata-videnskabsmand. Lær mere i rollen som borgerdataforskere i Big Data-verdenen.)

”Traditionelt gør personer med en forskellig liberal kunstuddannelse fremragende datavidenskabsmænd,” siger Burgoyne og skelner mellem ingeniører, der er på bygningssiden, og dataforsker, hvis arbejde kan være meget mere konceptuelt. Han fortsætter:

Ekspertise inden for et traditionelt STEM-felt med et komplementært fokus inden for humaniora, kunst eller forretningsområde giver de kvaliteter, der gør en fremragende brancheorienteret videnskabsmand. Det må siges, at det er lige så vigtigt for organisationens evne til at udnytte disse kvaliteter og at forme deres inderlighed og metoder på en produktiv måde. Jeg har observeret, at når et data-videnskabsinitiativ ikke lykkes, er organisationen lige sandsynligvis lige så skyldig som videnskabsmændene. Forskere er ikke ingeniører. De er ikke drevet til at henrette og bygge. De er drevet til at opdage og forstå. Organisationer, der forstår denne forskel, er godt belønnet for dyrkning af begge marker.

Med hensyn til hvilke data forskere typisk anvender sig til, har det at gøre med virksomhedens kernemål. Nogle virksomheder forfølger et decentraliseret internet - nogle leger rundt med IoT eller SaaS. Andre forsøger at banebrydende “brugervenlig” eller “etisk” eller “gennemsigtig” AI.

Under alle omstændigheder vil dataforskere sandsynligvis overbryde skillet mellem de hårde målinger på de data, de bruger, uanset hvilken teknologibunke det er i spil, og det frihjulende arbejde med at konceptualisere AI / ML-funktionalitet.

”Vi ansætter dataforskere til at styre dataindsamling og rengøring samt oversætte disse data til meningsfuld information,” siger Michael Hupp, Manager for datavidenskab og analyse hos G2 Crowd. Han uddyber:

Det betyder typisk styring af vigtige algoritmer, der driver en virksomheds datamotor og er flydende i nøgleanalyseværktøjer og sprog, men i de senere år har også inkluderet nye felter som naturlig sprogbehandling, maskinindlæring og andre former for AI-aktiveret analyse. De mest succesrige datavidenskabsmænd er dem, der kombinerer deres hårde færdigheder med en evne til hurtigt at lære og evnen til effektivt at kommunikere den indsigt, de afslører, så de får mening for deres forretning.

Med disse typer indsigt er det lettere for unge fagfolk eller studerende at finde ud af, om dataforsker ville være en god rolle for dem, og hvordan man tilegner sig færdigheder. STEM-læring bliver mere tilgængelig i skoler rundt om i landet, men der er ingen erstatning for en passion for kodning og teknologi og evnen til at lære undervejs.