Prehľad zručností požadovaných pre vedcov údajov

V roku 2012 spoločnosť Harvard v prieskume podniku uviedla, že „Data Scientist je najsexiálnejšou prácou 21. storočia“. Aby sme vedeli, aké zručnosti sú potrebné na to, aby sme boli vedcom údajov ako prvý, pozrime sa, čo robí vedec údajov. Existuje mnoho spôsobov, ako je možné definovať vedca údajov, ale aby to bolo jednoduché, povedzme to takto: Data Scientist je niekto, kto dokáže extrahovať význam a získať cenné informácie z údajov. Práca vedca údajov zahŕňa predovšetkým zber, čistenie a manipuláciu s údajmi.

Technické a netechnické zručnosti

Teraz sa pozrime na technické a netechnické zručnosti, ktoré sú nevyhnutné na to, aby ste boli vedcom údajov.

Technické zručnosti

Technické zručnosti potrebné na to, aby bol vedcom údajov, sú uvedené nižšie.

1. Schopnosť vysporiadať sa s veľkým množstvom údajov

Počet generovaných údajov sa od posledných niekoľkých rokov exponenciálne zvyšuje a väčšina z nich sa klasifikuje ako neštruktúrované údaje. Neštruktúrované údaje sa zvyčajne označujú ako údaje, ktoré sa nenachádzajú v tradičnej databáze riadkov a stĺpcov, ktorá je presne oproti štruktúrovaným údajom. Príkladmi neštruktúrovaných údajov sú videá, fotografie a zvukové správy. Keďže hlavnou úlohou údajového vedca je získavať z údajov zmysel, malo by sa pohodlne zaoberať veľkým množstvom údajov bez ohľadu na povahu, či je štruktúrovaná alebo neštruktúrovaná.

2. Vizualizácia dát

Údaje generované v spoločnostiach musia byť preložené do formátu, ktorý je ľahko zrozumiteľný a umožňuje rozhodnutia. Ako vedec údajov musí byť možné vizualizovať údaje pomocou nástrojov ako Tableau, Plotly, Visual.ly, D3.js a Power BI. Je tiež dôležité, aby vedec údajov bol oboznámený so zásadami vizuálneho zostavovania údajov. Pre vedca údajov je to jedna z dôležitých úloh, pretože vizualizácia údajov je jedinou možnosťou, ako môžu spoločnosti priamo pracovať s údajmi.

3. Štatistika

Úloha štatistiky vo vede údajov je veľmi dôležitá. Pre vedcov údajov je štatistika matematická disciplína, ktorá poskytuje potrebné nástroje a metódy na nájdenie vzorcov a na nahliadnutie do zložitej skupiny údajov pomocou matematických výpočtov. Keďže úlohou údajového vedca je získať význam identifikáciou vzorcov v údajoch, znalosti v štatistike sú pre vedca údajov kľúčovou zručnosťou.

4. Programovacie zručnosti

S množstvom údajov vygenerovaných pred 20 rokmi by Excel stačil na to, aby sa s nimi vysporiadal, ale s množstvom štruktúrovaných a neštruktúrovaných údajov, ktoré generujú tieto dni, by vedci mali mať znalosti v programovacích nástrojoch ako Python, R, SQL as

  • Poskytujú väčší priestor na školenie súboru údajov pomocou mnohých štatistických metód
  • Zlepšujú efektívnosť procesu pri vykonávaní analýzy údajov

5. Manipulácia s údajmi

Vo väčšine prípadov budú údaje, ktoré potrebujeme, špinavé a pre vedcov údajov bude ťažké pracovať s takýmto typom údajov. Takže po získaní údajov z dátových jazier je prvým krokom riešenie týchto nedostatkov. Niektoré nedokonalosti zahŕňajú chýbajúce hodnoty, nepravidelné reťazce ako LA pre Los Angeles, formátovanie dátumu ako 10. 9. 2009 a 2009/09/10. Všetky tieto nedostatky musia byť zoradené pred začatím školenia alebo analýzy údajov.

6. Multifunkčný počet a lineárna algebra

Pochopenie koncepcií matíc (lineárna algebra) a diferenciácie (počet) je dôležitá zručnosť, ktorú by mal mať vedec údajov. V organizácii, kde existujúce údaje o ňom zohrávajú významnú úlohu pri vytváraní budúcich predpovedí, môžu malé zlepšenia v prediktívnom výkone alebo algoritmickej optimalizácii znamenať pre organizáciu veľký rozdiel. V počiatočných fázach dátového vedca pri používaní vopred kódovaných modelov nemusíte mať hĺbkové znalosti matíc alebo počtu, ale aby ste pochopili, čo sa deje pod kapotou modelov alebo aby si zostavili svoje vlastné implementácie, je určite nevyhnutné porozumieť týmto pojmom.

Netechnické zručnosti

Nižšie sú uvedené netechnické zručnosti požadované na to, aby boli vedcami údajov.

1. Intelektuálna zvedavosť

Pri analýze údajov organizácie vo väčšine prípadov nebude nikto schopný vidieť priame výsledky alebo odpovede. Čím viac otázok začnete klásť, tým viac odpovedí z údajov získate. Vo všeobecnosti je zvedavosť definovaná ako silná túžba niečo pochopiť. Z tohto dôvodu je intelektuálna zvedavosť veľmi dôležitou črtou vedca údajov.

2. Silný obchodný prielom

Bez pochopenia údajov organizácie alebo prvkov v obchodnom modeli nebudú všetky technické zručnosti, ktoré má vedec údajov, k dispozícii pre organizáciu, aby dosiahli požadované výsledky, pretože nebudú vedieť pochopiť, ktoré funkcie sú uvedené v súbore údajov. mali by mať prioritu a mali by sa považovať za posledné. Pre vedca údajov teda pochopenie obchodného modelu a údajov organizácie pomôže vyriešiť potenciálne problémy, ktoré predstavuje pre udržanie a rozvoj ich podnikania.

3. Silné komunikačné zručnosti

Ako vedec údajov by mal človek pripraviť nejakú prezentáciu o svojich technických zisteniach a prezentovať ju netechnickým tímom, ako sú obchodné oddelenia, niekedy v kariére. Ako vedec údajov by mal mať zručnosti, ako je rozprávanie príbehov (schopnosť rozprávať príbehy zo zistení), pretože celé množstvo času a energie vynaložené na skúmanie údajov, použitie štatistických techník, zisťovanie výsledkov a všetky ostatné veci budú zbytočne zbytočné. ak vedec údajov nie je schopný správne doručiť správy vedúcim pracovníkom podniku. A vo väčšine prípadov nebudú mať obchodní manažéri záujem počúvať všetky kroky, ktoré sme podnikli, aby sme dospeli k záverom, budú sa zameriavať hlavne na výsledky a prezentované hodnoty. Preto je vždy najlepšou praxou udržiavať príbeh ostrý a na mieste.

Záver - zručnosti potrebné pre vedcov údajov

Toto sú niektoré z najdôležitejších zručností, ktoré by osoba mala mať, aby mohla byť údajovým vedcom, pretože ich hlavná práca spočíva v práci na údajoch organizácie, ich analýze a prezentácii vedúcim pracovníkom v oblasti obchodu.

Odporúčané články

Toto je príručka k zručnostiam požadovaným pre vedcov údajov. Tu diskutujeme o technických a netechnických zručnostiach potrebných na to, aby ste boli vedcom údajov. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Kariéra v oblasti vedy o údajoch
  2. Jazyky vedy o údajoch
  3. Plat veľkých dát Analytics
  4. Otázky týkajúce sa rozhovoru s analytikom údajov
  5. Formát zmeny dátumu PHP

Kategórie: