Rozdiel medzi prediktívnou analýzou a ťažbou údajov
Prediktívna analytika je proces zdokonaľovania tohto zdroja údajov pomocou obchodných poznatkov na získanie skrytej hodnoty z týchto novoobjavených vzorov. Dolovanie údajov je objavenie skrytých vzorcov údajov pomocou strojového učenia - a dômyselné algoritmy sú ťažobné nástroje.
Dolovanie dát + znalosti domény => prediktívna analýza => hodnota podniku
Porovnanie porovnávania údajov medzi prediktívnou analýzou a dolovaním údajov
Nižšie je 5 Porovnanie prediktívnej analýzy s ťažbou údajov
Kľúčové rozdiely medzi prediktívnou analýzou a ťažbou údajov
Nižšie je uvedený rozdiel medzi prediktívnou analýzou a dolovaním údajov
● Proces - Proces získavania údajov možno zhrnúť do šiestich fáz -
a.Business/Research Understanding Phase - Jasne vyjasnite ciele a požiadavky projektu z hľadiska obchodnej alebo výskumnej jednotky ako celku
b.Data Understanding Phase - zhromažďujte a používajte prieskumné analýzy údajov, aby ste sa oboznámili s údajmi a objavili počiatočné informácie.
c.Dáza prípravy dát - Vyčistite a použite transformáciu na nespracované údaje, aby bola pripravená na nástroje na modelovanie
d.Modeling Phase - Vyberte a použite vhodné techniky modelovania a kalibrujte nastavenia modelu na optimalizáciu výsledkov.
e.hodnotiaca fáza - modely sa musia vyhodnotiť z hľadiska kvality a efektívnosti pred ich zavedením. Určite tiež, či model skutočne dosahuje ciele stanovené preň vo fáze 1.
f.Deployment Phase - Využitie modelov vo výrobe.Môže to byť jednoduché nasadenie, ako je vygenerovanie správy alebo zložité riešenie, ako je implementácia paralelného procesu získavania údajov v inom oddelení.
Kroky na vysokej úrovni v oblasti procesov prediktívnej analýzy
a.Definujte obchodný cieľ - Aký obchodný cieľ sa má dosiahnuť a ako sa hodia údaje. Napríklad obchodným cieľom sú efektívnejšie ponuky pre nových zákazníkov a potrebné údaje je segmentácia zákazníkov so špecifickými atribútmi.
b.Zbierať ďalšie údaje - potrebné ďalšie údaje môžu byť údaje profilu používateľa z online systému alebo údaje z nástrojov tretích strán, aby sa lepšie porozumeli údajom. Pomáha to zistiť príčinu tohto vzoru. Niekedy sa uskutočňujú marketingové prieskumy zamerané na zhromažďovanie údajov.
c.Draft Predictive Model - Model vytvorený s novo zozbieranými údajmi a obchodnými znalosťami. Model môže byť jednoduchým obchodným pravidlom, ako napríklad „Ak poskytneme podobnú ponuku, existuje väčšia šanca na konverziu používateľov z Indie na vek z b do b“. alebo zložitý matematický model.
● Firemná hodnota - samotný dátový Ming, ktorý pridáva hodnoty firmám, ako sú
a.Dôkladne porozumieť segmentom zákazníkov v rôznych dimenziách
b.Získajte charakteristiku výkonnosti špecifickú pre KPI (napr. zvyšuje sa počet predplatných s aktívnymi používateľmi?)
c.Identifikovať pokusy o podvodnú aktivitu a zabrániť jej.
d.Systémy výkonnosti systému (napr. - Čas načítania stránky na rôznych zariadeniach - nejaký vzor?)
Prediktívna analytika umožňuje organizácii poskytnúť tri výhody:
a.Vision - Pomáha vidieť, čo je pre ostatných neviditeľné. Vizuálna analytika môže prejsť množstvom minulých zákazníckych údajov, priradiť ich k iným údajom a zhromaždiť všetky kusy v správnom poradí.
b.Decision - Dobre vypracovaný prediktívny analytický model poskytuje analytické výsledky bez emócií a zaujatosti. Poskytuje konzistentné a nezaujaté poznatky o podpore rozhodnutí.
c.Precision - Pomáha používať automatizované nástroje na vykonávanie úloh súvisiacich s podávaním správ - šetrí čas a zdroje, znižuje ľudské chyby a zvyšuje presnosť.
● Meranie výkonnosti - Výkonnosť procesu dolovania údajov meraná na tom, ako dobre sa nachádzajú modely na nájdenie modelov v údajoch. Väčšinu času to bude regresný, klasifikačný alebo klastrovací model a pre všetky tieto oblasti je dobre definovaná miera výkonnosti.
Výkonnosť prediktívnej analýzy sa meria na vplyve na podnikanie.Napríklad - Ako dobre fungovala zacielená reklamná kampaň v porovnaní so všeobecnou kampaňou ?. Bez ohľadu na to, ako dobre sa dajú nájsť modely na získavanie údajov, aby ste dobre pracovali s predikčnými modelmi, je nevyhnutné mať obchodné informácie.
● Budúcnosť - pole Ťažba dát sa vyvíja veľmi rýchlo. Snaží sa nájsť vzory v údajoch s menšími dátovými bodmi s minimálnym počtom funkcií pomocou sofistikovanejších modelov, ako sú Deep Neural Networks. Mnoho priekopníkov v tejto oblasti, ako je Google, sa tiež snaží zjednodušiť a sprístupniť tento proces všetkým. Jedným z príkladov je Cloud AutoML od spoločnosti Google.
Prediktívna analytika sa rozširuje do širokého spektra nových oblastí, ako je predikcia retencie zamestnancov, predikcia kriminality (aka prediktívna polícia) atď. V rovnakom čase sa organizácie snažia presnejšie predpovedať zhromažďovaním maximálnych informácií o používateľoch, ako sú kam idú, aký typ videí sledujú atď.
Porovnávacia tabuľka medzi prediktívnou analýzou a ťažbou údajov
Nižšie sú uvedené zoznamy bodov, opíšte porovnania medzi prediktívnou analýzou a dolovaním údajov:
Základ porovnania | Ťažba dát | Prediktívne analýzy |
definícia | Dolovanie údajov je proces zisťovania užitočných vzorcov a trendov vo veľkých súboroch údajov. | Prediktívna analytika je proces získavania informácií z veľkých súborov údajov s cieľom urobiť predpovede a odhady budúcich výsledkov. |
dôležitosť | Pomôžte lepšie porozumieť zozbieraným údajom. napr:
● Lepšie porozumenie segmentom zákazníkov ● Nákupný vzorec podľa geografie alebo času ● Analytika správania prostredníctvom clickstream ● Analýza časovej osi cien akcií. ● GPS údaje o uliciach | Predpovedajte vrcholový výsledok získavania údajov pomocou znalosti domény -
● Aký zákazník bude kupovať ďalej? ● Aká bude miera odlivu zákazníkov? ● Koľko nových odberov sa začne, ak bude táto ponuka poskytnutá? ● Aké množstvo zásob produktu je potrebné na nasledujúci mesiac |
Rozsah | Použite algoritmy strojového učenia, ako je regresia, klasifikácia na zhromaždené údaje, aby ste našli skryté vzory | Aplikujte obchodné znalosti na vzorce banských dát s akýmikoľvek ďalšími údajmi potrebnými na získanie platných obchodných predpovedí |
výsledok | Výstupom dolovania dát bude vzor v údajoch vo forme časovej osi s rôznym rozdelením alebo zoskupeniami. Ale neodpovedá, prečo sa tento vzorec vyskytol? | Prediktívna analytika sa snaží nájsť odpovede na tento model s použitím obchodných poznatkov, a tak z neho robí viac použiteľné informácie. |
Zapojení ľudia | Väčšinou to robia štatistici a technici strojového učenia, ktorí majú silné matematické pozadie na vykonávanie funkcií a tvorbu ML modelu. | Musia tu byť vedomosti špecifické pre podnikanie a jasný obchodný cieľ. Obchodní analytici a ďalší odborníci v oblasti domén môžu analyzovať a interpretovať vzory objavené strojmi, pričom z dátových vzorov môžu vyťažiť užitočný význam a odvodzovať použiteľné informácie. |
Záver - názorná analýza v porovnaní s dolovaním údajov
Ako povedal Rick Whiting v programe InformationWeek, čo ďalej je, čo bude ďalej. Prediktívna analýza je oblasť, v ktorej sa podniká inteligencia podniku. Ťažba údajov pomáha organizáciám akýmkoľvek spôsobom a jedným z najdôležitejších je vytvorenie dobrého základu pre prediktívnu analýzu.
Odporúčaný článok
Toto bol sprievodca rozdielom medzi prediktívnou analýzou a dolovaním údajov, ich významom, porovnávaním údajov medzi vedúcimi osobami, kľúčovými rozdielmi, porovnávacou tabuľkou a záverom. Ďalšie informácie nájdete aj v nasledujúcich článkoch -
- Prediktívne analýzy verzus Data Science - naučte sa 8 užitočných porovnaní
- Prediktívna analýza Analytics Analytics Vs - Ktorá z nich je užitočná
- 7 Najužitočnejší rozdiel medzi ťažbou údajov a ťažbou webu
- Data Warehousing VS Data Mining - 4 úžasné porovnania
- Úvod do architektúry dolovania dát