12 nøgletips til læring af datavidenskab

Forfatter: Laura McKinney
Oprettelsesdato: 3 April 2021
Opdateringsdato: 1 Juli 2024
Anonim
12 nøgletips til læring af datavidenskab - Teknologi
12 nøgletips til læring af datavidenskab - Teknologi

Indhold


Kilde: Artinspiring / Dreamstime.com

Tag væk:

Dataforskere har naturligvis brug for stærke matematik- og kodningsfærdigheder, men kommunikation og andre bløde færdigheder er også vigtige for succes.

Dataforsker er det bedste job for 2019 i Amerika på Glassdoor. Med en gennemsnitlig grundløn på $ 108.000 og en jobtilfredshedsrangering på 4,3 ud af 5 plus et vist antal forventede åbninger, er det ikke overraskende. Spørgsmålet er: Hvad skal man gøre for at komme på banen for at kvalificere sig til dette job?

For at finde ud af det, ledte vi efter de råd, der blev givet til dem, der søger at komme på denne karrierebane. Meget kommer ned på de hårde færdigheder inden for kodning og matematik. Men den stærke beregning alene skærer den ikke ned. Succesrige datavidenskabere skal også være i stand til at tale med forretningsfolk på deres egne vilkår, hvilket kræver de muligheder, der er forbundet med bløde færdigheder og lederskab. (Se Jobroll: Data Scientist for at lære mere om en dataforskers opgaver).


Opbygning af uddannelsesfonden: tre primære tip

Drace Zhan, en dataforsker ved NYC Data Science Academy, understreger behovet for et uddannelsesgrundlag, der inkluderer det væsentlige ved kodning og matematiske evner:

  1. R / Python + SQL. Hvis du ikke har kodningsfærdighederne, har du brug for en masse netværkskraft og andre områder for at øge dette underskud. Jeg har set datavidenskabsmænd med svag matematik og lidt domæneerfaring, men de har altid været båret af en stærk evne til at kode. Python er ideel, men R er et godt faldende værktøj. Det er bedst at have begge i dit arsenal. SQL er også ekstremt vigtig for en dataanalytiker.

  2. Stærke matematikfærdigheder. At have meget god forståelse af nogle få af de ofte anvendte metoder: generaliserede lineære modeller, beslutningstræ, K-midler og statistiske tests er bedre end at have et bredt billede af forskellige modeller eller specialisering såsom RNN.

Dette er centrale færdigheder at bygge videre på, selvom nogle eksperter tilføjer dem. For eksempel inkluderer en KDnuggets-liste kodningskomponenterne, som Zhan nævnte, og tilføjer nogle andre nyttige ting at vide på den tekniske side, herunder Hadoop-platformen Apache Spark, datavisualisering, ustrukturerede data, maskinlæring og AI.


Men hvis vi tager vores signaler fra en undersøgelse af de mest almindeligt anvendte værktøjer, der er identificeret til brug i det virkelige liv ved en Kaggle-undersøgelse, får vi noget forskellige resultater. Som du kan se fra grafen for de 15 øverste valg nedenfor, gør Python, R og SQL let de tre bedste, men den fjerde er Jupyter-notebooks, efterfulgt af TensorFlow, Amazon Web Services, Unix shell, Tableau, C / C ++, NoSQL , MATLAB / Octave og Java, alle foran Hadoop og Spark. En yderligere tilføjelse, der kan overraske folk, er Microsofts Excel Data Mining.

Billede med tilladelse fra Kaggle

KDnuggets-listen indeholder også et tip om formel uddannelse. De fleste dataforskere har avancerede grader: 46 procent har ph.d.er og 88 procent har mindst en kandidatgrad. De bacheloruddannelser, de har, er generelt fordelt på beslægtede områder. Cirka en tredjedel er i matematik og statistik, hvilket er det mest populære for denne karrierebane. Den næste mest populære er en datalogi med 19 procent og ingeniørvidenskab, valget på 16 procent. Naturligvis studeres de tekniske værktøjer, der er specielt beregnet til datavidenskab, ikke i uddannelserne, men på specialiserede boot camps eller via onlinekurser.

Mere end kurser: To flere tip

Hank Yun, en forskningsassistent i lungeafdelingen ved Weill Cornell Medicine og studerende ved NYC Data Science Academy, råder håbende dataforskere til at planlægge, hvad de vil arbejde på og finde en mentor. Han sagde:

Ingen fejl, ingen stress - Din trinvis vejledning til oprettelse af livsændrende software uden at ødelægge dit liv

Du kan ikke forbedre dine programmeringsevner, når ingen er interesseret i softwarekvalitet.

Foretag ikke den fejl, jeg begik, ved at fortælle dig selv, at du kender datavidenskab, fordi du tog et kursus og modtog et certifikat. Det er en god start, men når du begynder at studere, skal du tage et projekt i tankerne. Find derefter en mentor i marken og start et lidenskabsprojekt med det samme! Når du er frisk, ved du ikke, hvad du ikke ved, så det hjælper, når nogen er der for at guide dig til, hvad der er vigtigt for dig og hvad der ikke er. Du ønsker ikke at bruge en masse tid på at studere med intet at vise til det!

At vide, hvilket værktøj du skal tage ud af din værktøjskasse: Tip til at holde dig foran kurven

I betragtning af forskellen i rangeringen af ​​datavidenskabelige værktøjer kan nogle føle sig forvirrede over, hvad de skal fokusere på. Celeste Fralick, chefdataforsker ved sikkerhedssoftwarevirksomheden McAfee, behandler spørgsmålet i en CIO-artikel, der ser på de væsentligste færdigheder for en dataforsker, hvor hun erklærer: ”En datavidenskabsmand skal være foran kurven inden for forskning såvel som forstå, hvilken teknologi der skal anvendes, når. ”Det betyder, at du ikke lokker af det '' sexede 'og nye, når det egentlige problem' kræver noget meget mere kørt. "At være opmærksom på beregningsomkostningerne for økosystemet, fortolkningsevne, latenstid, båndbredde og andre systemgrænsevilkår - såvel som kundens modenhed - hjælper selv dataforskeren med at forstå, hvilken teknologi der skal anvendes."

Væsentlige bløde færdigheder: Yderligere seks tip

Det punkt, Fralick bringer op, vedrører de ikke-tekniske færdigheder, som dataforskerjobbet kræver. Derfor inkluderer listen over KDnuggets disse fire: intellektuel nysgerrighed, teamwork, kommunikationsevner og forretningsskarphed. Zhan inkluderede også nøglen bløde færdigheder i sine tip til datavidenskabsmænd, idet han identificerede "kommunikationsevner" som KDnuggets, men brug af "domæneekspertise" i stedet for "forretningsfærdighed." Uanset hvad det kaldes, henviser det til praktisk anvendelse af datalogi forretning. (Se Vigtigheden af ​​kommunikationsfærdigheder for tekniske fagfolk for at lære mere om kommunikationsevner.)

Olivia Parr-Rud tilbød sin egen spin på dette og tilføjede to mere bløde færdigheder med vægt på rollen som kreativitet og hævdede: ”Jeg tænker på datavidenskab som en kunst lige så meget som en videnskab,” noget, der kræver at trække på styrkerne på begge sider af hjernen. ”Mange mennesker taler om datavidenskab som en karriere, der primært bruger venstre hjerne. Jeg har fundet ud af, at for at være en succes, skal dataforskere bruge hele hjernen. ”

Hun forklarede, at fremskridt på området ikke kun kræver teknisk kompetence, men kreativitet og den vision, der er nødvendig for lederskab:

De fleste venstre-hjerne / lineære opgaver kan automatiseres eller out-sourced. For at tilbyde en konkurrencefordel som dataforskere, må vi være i stand til at genkende mønstre og syntetisere store mængder information ved hjælp af begge sider af vores hjerne. Og vi skal være innovative tænkere. Mange af de bedste resultater er resultatet af integrationen af ​​venstre og højre hjerne.

Hun understregede også, hvorfor det klart er vigtigt at kommunikere en vision:

Som dataforskere er vores mål at bruge data til at hjælpe vores klienter med at udvide deres overskud. De fleste ledere forstår ikke, hvad vi gør, eller hvordan vi gør det. Så vi er nødt til at tænke som ledere og kommunikere vores fund og anbefalinger på sprog, som vores interessenter forstår og har tillid til.

Data dusin

De vigtigste tip indeholder et større antal tekniske værktøjer, færdigheder og kapaciteter samt mindre kvantificerbare kvaliteter som egnethed til kreativitet og lederskab. I sidste ende er det ikke kun et talespil. Da datavidenskab ikke kun handler om at skabe modeller i et vakuum, men at komme med praktiske applikationer til at løse virkelige problemer for virksomheder, er de, der vil få succes på området, ikke bare beherske teknologi, men at kende deres forretningsdømme og forstå behovene hos de forskellige medlemmer af teamet på arbejdet.