Čo je to vizualizácia dát?

A prečo sa už viac nestaráme o koláčové grafy,

Vizualizácia údajov nie je iba obyčajným prekladom údajových bodov do úchytných stĺpcových grafov a čiarových grafov. Je to ako ponor do oceánu, ktorý ukrýva poklady na každej úrovni. Hneď na začiatku máme priame rozdelenie dát do učebnicových figúr viz. rozptylové grafy, čiarové grafy, koláčové grafy a stĺpcové grafy. Čiarové grafy sa všeobecne používajú na znázornenie trendu údajov v priebehu času. V tejto téme, čo je vizualizácia dát, sme vyčistili celý koncept, ktorý máme pred sebou, s daným grafom a koláčovými grafmi.

Výsečové grafy

Jedným z najviac všadeprítomných grafov, ktoré sa používajú, je graf na pizzu alebo koláčový graf.

Pomer plynov v zmesi.

Zdroj : plotly

Táto schéma, ktorá sa bežne používa pri voľbách, aby ukázala, ktorá strana má levy na zdieľanie hlasov, má síce veľmi populárne nevýhody. Štatistici ako Edward Tufte, Leland Wilkinson a Gerald van Belle vyjadrili svoju sklon k používaniu koláčových grafov. Najpresvedčivejšie dôkazy proti koláčovým grafom pravdepodobne poskytol Stephen Few, zakladateľ spoločnosti Perceptual Edge. Stephen vo svojom článku „Uložiť koláč na dezert“ uverejnenom v bulletine Visual Business Intelligence Newsletter vysvetľuje, prečo na prekvapenie svojich kolegov a študentov cíti, že koláčové grafy sú neúčinným prostriedkom vizualizácie údajov.

Pozrite sa na koláčový graf nižšie.

V tomto grafe zobrazujúcom podiel potravín objednaných po 21:00 je ľahké odhadnúť percento patriace do zmrzliny - 25%. Po miernej úprave však už nie je možné ľahko zistiť percento objednávok na zmrzlinu.

Aj keď percento zmrzlín je stále rovnaké pri 25%. Z vyššie uvedeného diagramu je ťažké porozumieť. V predchádzajúcom diagrame bolo ľahké uhádnuť percento, pretože odtieň pre zmrzlinu začal v 6 hodín a natiahol sa až do polohy 9 hodín. Keďže sú naše oči trénované, aby videli hodiny na 12, 3, 6 a 9 - koláčový graf je tiež ľahšie interpretovateľný, ak jeho regióny dodržia 4 polohy hodín. Zástanca nadšeného koláčového grafu by navrhol, že by sa tomuto problému dalo ľahko vyhnúť použitím štítkov a percentuálneho vyjadrenia každého regiónu.

Výsečový graf s údajmi

Ale opäť, aby sme mohli zmapovať hodnotu s položkou, naše oči sa musia neustále zameriavať z legendy v dolnej časti grafu na štítky v grafe. Riešením by bolo pripojiť názov položky spolu s hodnotami - získať niečo podobné tomuto:

Dokonca by ste povedali. Ale potom sa vás pýtam - Teraz, keď sme pripojili názvy položiek spolu s hodnotami, ako sa líši koláčový graf nad tabuľkou nižšie:

Vyčistite tabuľku s údajmi zoradenými podľa percenta objednávky

Nevyzerá táto informácia oveľa lepšie ako štítky a legendy roztrúsené v koláčovom grafe. Aké je teda použitie koláčového grafu? Vizualizácie majú pridávať hodnotu, sú agentmi záverov, majú odhaliť ich tajomstvá. V tomto prípade však koláčový graf nespĺňa svoj sľub.

Zadajte stĺpcový graf vizualizácie dát

Štíhlejší a oveľa elegantnejšou alternatívou k výsečovému grafu je stĺpcový graf, ktorý dokáže vyjadriť všetko, čo koláč hovorí, a oveľa viac, bez toho, aby si robil neporiadok so štítkami a legendami.

Stĺpcový graf znázorňujúci to isté - ľahko porovnateľný, kontrastný a záverečný

Ide o rovnaké informácie, ktoré sa teraz pozorovateľovi poskytujú jemne. Okrem zobrazovania jednotlivých hodnôt nám tento graf umožňuje rýchlo porovnávať popularitu každej potraviny a dokonca porovnávať relatívny rozdiel v hodnote medzi po sebe nasledujúcimi položkami. Rovnaké údaje by boli k dispozícii prostredníctvom tabuľky, ale naše mozgy sú pri spracovávaní obrázkov lepšie ako dešifrovanie textu. Preto sa používanie koláčového grafu časom znížilo. Aj keď je v mediálnom priemysle obľúbený vizuálny materiál, nahradili ho lepšie a sofistikovanejšie zobrazenia. Okrem čiarových grafov, koláčov a stĺpcových grafov existuje nespočetné množstvo ďalších grafov, ktoré sa hodia. Jeden zaujímavý graf, ktorý však nie je tak obľúbený pre nezasvätených, je Sankeyho diagram. Tento diagram sa používa na vyjadrenie distribúcie a toku hmoty. Môže ísť o energiu, peniaze alebo dokonca vodu.

Sankey Diagram toku energie a distribúcie typického zamestnanca IT.

Hore je fiktívny Sankey diagram znázorňujúci, ako a kde je distribuovaná väčšina energie zamestnanca IT.

Novšie nástroje

S príchodom sociálnych médií a rôznych platforiem, kde ľudia môžu písať svoje pocity, recenzie a názory, je jedným z nástrojov vizualizácie údajov, ktorý sa stal úplne bežným, slovo mrak. Slovo mrak nám pomáha zistiť, o čom ľudia hovoria.

Veľmi reálne, živé slovo cloudové zobrazenie používateľských recenzií PUBG v obchode Google Play

Ak sa pozrieme na slovo cloud tu, ktoré bolo vybudované z 80 najlepších hodnotení hry PUBG v obchode Google Play, zistíme, že celková reakcia na hru je „dobrá“, niektorí ju dokonca nazývajú „najlepší“., Zdá sa však, že existuje problém s niektorými „aktualizáciami“, ktoré ľudia prosia o nápravu tvorcov hier. Keď v ten deň skontrolujeme recenzie v obchode, vidíme to isté.

Problém s aktualizáciami. Tiež tu nájdete, či nájdete výskyt slova „prosím“

Budúcnosť

Toto je iba poškriabanie špičky ľadovca. Knižnice ako plotly a D3 posunuli vizualizáciu údajov na inú úroveň. Stalo sa tak z dôvodu zmeny dopytu. Ako by ste si predstavili inteligentné mesto na prístrojovej doske? Obrovská obrazovka, na ktorej je možné zobraziť vitality celého mesta. Na jednej stránke sa musí zobraziť premávka, spotreba energie, zdravotný stav rôznych oblastí, kvalita vzduchu a množstvo ďalších parametrov. Táto požiadavka vyvoláva odlišný prístup k vizualizácii dát. Dozvedeli sme sa, že čo je vizualizácia údajov pomocou tohto konceptu. Už sa nemôžeme držať grafov a grafov. Vyžaduje sa nový prístup, keď sa grafy stretávajú s umením a fantáziou, vytvárajú obohacujúci vizuálny zážitok. Táto diskusia vyvoláva celkom iný článok. Až nabudúce.

Odporúčané články

Tento článok je užitočným sprievodcom pri vizualizácii údajov. Tu sme diskutovali základné pojmy s grafmi a grafmi, aby ste mohli ľahko pochopiť vizualizáciu dát. Viac informácií nájdete aj v nasledujúcom článku -

  1. Kariéra v administrátorovi databázy Oracle
  2. 7 Najužitočnejší rozdiel medzi ťažbou údajov a ťažbou webu
  3. Otázky týkajúce sa rozhovoru s analýzou údajov
  4. Príklady veľkých dátových analýz

Kategórie: