Rozdiel medzi vedou o údajoch a ťažbou údajov
Dolovanie údajov je o hľadaní trendov v množine údajov. A pomocou týchto trendov identifikovať budúce vzorce. Je to dôležitý krok v procese získavania poznatkov. Často zahŕňa analýzu obrovského množstva historických údajov, ktoré boli predtým ignorované. Data Science je študijný odbor, ktorý zahŕňa všetko od analýzy veľkých dát, ťažby údajov, prediktívneho modelovania, vizualizácie údajov, matematiky a štatistiky. Data Science sa označuje ako štvrtá paradigma vedy. (ďalšie tri sú teoretické, empirické a počítačové). Academia často vykonáva exkluzívny výskum v oblasti dátovej vedy.
Historická perspektíva
Predtým, ako prejdeme k technickým opisom, pozrime sa na vývoj pojmov. Historické skúmanie objasní, ako sa v súčasnosti používajú pojmy.
- Slovo „Data Science“ sa datuje okolo šesťdesiatych rokov, ale vtedy sa používalo ako alternatíva k počítačovej vede. V súčasnosti má úplne iný význam.
- V roku 2008 sa DJ Patil a Jeff Hammerbacher stali prvými jednotlivcami, ktorí sa nazývajú „Data Scientists“, aby opísali svoju úlohu na LinkedIn a Facebooku.
- V roku 2012 sa v článku Harvard Business Review citoval vedec údajov ako „najsexiálnejšie zamestnanie 21. storočia“.
- Pojem dolovanie údajov sa vyvíjal paralelne. V 90-tych rokoch 20. storočia sa medzi databázovými komunitami rozšíril.
- Data Mining vďačí za svoj pôvod spoločnosti KDD (Knowledge Discovery in Databases). KDD je proces získavania poznatkov z informácií prítomných v databázach. A Data Mining je hlavným podprocesom v KDD.
- Dolovanie údajov sa často používa zameniteľne s KDD.
Aj keď sa tieto názvy objavujú nezávisle, často sa vzájomne dopĺňajú, pretože napokon úzko súvisia s analýzou údajov.
Porovnanie medzi jednotlivými údajmi medzi dolovaním údajov Vs (Infographics)
Nižšie je Top 9 Porovnanie Data Science Vs Data Mining
Príklad použitia
Zoberme si scenár, v ktorom ste hlavným predajcom v Indii. Máte 50 obchodov pôsobiacich v 10 veľkých mestách v Indii a ste v prevádzke 10 rokov.
Povedzme, že chcete študovať údaje za posledných 8 rokov a zistiť počet predajov sladkostí počas sviatočných období 3 miest. Ak je to váš cieľ, odporúčam vám zamestnať osobu so skúsenosťami s dolovaním údajov. Data Miner by pravdepodobne prechádzal historickými informáciami uloženými v pôvodných systémoch a využíval by algoritmy na extrahovanie trendov.
Zvážte ďalší prípad, keď chcete vedieť, ktoré sladkosti získali pozitívnejšiu recenziu. V takom prípade sa vaše zdroje údajov nemusia obmedzovať iba na databázy, ale môžu sa rozšíriť aj na sociálne weby alebo spätnú väzbu od zákazníkov. V takom prípade by som vám navrhol zamestnať vedca údajov. Osoba zamestnaná ako vedec údajov je vhodnejšia na použitie algoritmov a vykonanie tejto sociálno-výpočtovej analýzy.
Kľúčové rozdiely medzi ťažbou údajov z údajov Vs
Nižšie je uvedený rozdiel medzi vedou údajov a ťažbou údajov
- Dolovanie dát je činnosť, ktorá je súčasťou širšieho procesu získavania poznatkov v databázach (KDD), zatiaľ čo veda o údajoch je študijným odborom rovnako ako aplikovaná matematika alebo informatika.
- Na vedu o údajoch sa často pozerá v širšom zmysle, zatiaľ čo dolovanie údajov sa považuje za medzeru.
- Niektoré činnosti v rámci dolovania údajov, ako napríklad štatistická analýza, zapisovanie tokov údajov a rozpoznávanie vzorov, sa môžu prelínať s vedou o vede. Z toho dôvodu sa Data Mining stáva podmnožinou Data Science.
- Strojové učenie v dolovaní údajov sa používa viac pri rozpoznávaní vzorov, zatiaľ čo v Data Science má všeobecnejšie využitie.
Poznámka
- Data Science a Data Mining by sa nemali zamieňať s analýzou Big Data Analytics a je možné, že baníci aj vedci pracujú na veľkých súboroch údajov.
Porovnávacia tabuľka dobývania údajov Data Science Vs
Základ pre porovnanie | Ťažba dát | Data Science |
Čo je to? | Technika | Oblasť |
ohnisko | Obchodný proces | Vedecká štúdia |
Cieľ | Zvýšte použiteľnosť údajov | Vytváranie produktov zameraných na údaje pre organizáciu |
Výkon | vzory | pestrý |
účel | Nájsť predtým neznáme trendy | Sociálna analýza, vytváranie prediktívnych modelov, odhalenie neznámych faktov a ďalšie |
Odborná perspektíva | Dolovanie údajov môže vykonávať niekto so znalosťou navigácie v údajoch a so štatistickým porozumením | Človek musí pochopiť strojové učenie, programovanie, infografické techniky a musí mať znalosti domény, aby sa stal vedcom údajov |
rozsah | Dolovanie údajov môže byť podmnožinou Data Science, pretože ťažobné činnosti sú súčasťou plynovodu Data Science | Multidisciplinárne - Veda o údajoch sa skladá z vizualizácií údajov, výpočtových sociálnych vied, štatistiky, ťažby údajov, spracovania prirodzeného jazyka, atď. |
Obchoduje s (typ údajov) | Väčšinou štruktúrované | Všetky formy údajov - štruktúrované, pološtrukturované a neštruktúrované |
Iné menej populárne mená | Archeológia údajov, zber informácií, získavanie informácií, extrakcia znalostí | Veda založená na údajoch |
Záver - Data Science Vs Dining
Takže tu máte! Som si istý, že ste si už viac vedomí toho, aké sú hlavné rozdiely medzi nimi a v akom kontexte by sa tieto dva mali využiť. Jedna vec, ktorú by ste si mali zapamätať, je neexistencia formálnych a presných definícií údajov o vede a ťažbe dát. Medzi akademickou obcou a priemyslom stále prebiehajú diskusie o tom, čo predstavuje presnú definíciu. Každý je však na tej istej stránke, pokiaľ ide o rozdiely na vysokej úrovni a popisy dvoch výrazov, ktoré sme preskúmali v tomto článku.
Odporúčaný článok
Toto bol sprievodca pre Data Science Vs Mining, ich význam, Head to Head Porovnanie, Kľúčové rozdiely, Porovnávacia tabuľka a Záver. Ďalšie informácie nájdete aj v nasledujúcich článkoch -
- Veda o dátach a jej rastúci význam
- 7 Dôležité techniky dolovania údajov pre dosiahnutie najlepších výsledkov
- Prediktívne analýzy verzus Data Science - naučte sa 8 užitočných porovnaní
- 8 Dôležité techniky dolovania údajov pre úspešné podnikanie