Úvod do typov vizualizácie dát

V modernej aréne veľkých údajov, ktoré majú viac ako 2, 5 kvintiliónu bajtov (1 kvintilión bajtov = 10 18 bajtov!) Údajov vytvorených každý deň (podľa socialmediatoday.com), umierajúca potreba ukladania údajov. Tieto dáta sú, samozrejme, husté, a preto nie sú čitateľné používateľom a sú neustále zaostrené. Aby sa paradigma posunula na ľahšie pochopenie rozsahu údajov a na získanie užitočných výhod v podnikaní, údaje sa musia predkladať intuitívnejším spôsobom, a preto by na ich vizualizáciu boli potrebné vhodné grafy. Existujú nástroje a metodiky postavené na efektívne vykreslenie údajov, ale účinnosť väčšinou závisí od typu údajov a požiadavky, ktorú treba z údajov vyňať.

Čo je to vizualizácia dát?

Vizualizácia údajov je metodika, pomocou ktorej sa zobrazujú údaje v surovom formáte, aby sa zdôraznil ich význam. S príchodom veľkých údajov sa stalo nevyhnutnosťou vybudovať zmysluplný spôsob prezentácie údajov, aby sa množstvo údajov nestrácalo. Časť zobrazovania údajov sa môže použiť na rôzne účely, napríklad na nájdenie trendov / spoločných znakov / vzorov v údajoch, zostavenie modelov pre strojové učenie alebo sa môže použiť na jednoduchú operáciu, ako je agregácia.

Rôzne typy vizualizácie údajov

Vizualizácia údajov je všeobecne rozdelená do 6 rôznych typov. Aj keď oblasť vizualizácie údajov neustále rastie, nebude prekvapením, ak sa počet kategórií zvýši.

Dočasné: Údaje pre tieto typy vizualizácie by mali spĺňať obidve podmienky: reprezentované údaje by mali byť lineárne a mali by byť jednorozmerné. Tieto typy vizualizácie sú reprezentované čiarami, ktoré sa môžu prekrývať a tiež majú spoločný počiatočný a cieľový dátový bod.
Bodový grafNa označenie dátového bodu sa používajú bodky. Najbežnejšie v dnešnom svete v strojovom učení sa počas analýzy experimentálnych údajov.
Výsečový grafTento typ vizualizácie zahŕňa okrúhlu grafiku, kde dĺžka oblúka predstavuje veľkosť.
Diagram polárnej oblastiPodobne ako koláčový graf, aj polárny graf je kruhovým grafom, s výnimkou sektorových uhlov, ktorých dĺžka je rovnaká a vzdialenosť od stredu znamená veľkosť.
Čiarové grafyPodobne ako bodový graf sú údaje reprezentované bodmi, s výnimkou spojov, ktoré udržiavajú spojitosť.
časovej osiTýmto spôsobom zobrazujeme zoznam údajových bodov v chronologickom poradí podľa času.
Sekvencie časových radovV časových radoch reprezentujeme veľkosť údajov v 2-D grafe v chronologickom poradí podľa časovej pečiatky v údajoch.
Hierarchické: Tieto typy vizualizácií zobrazujú usporiadané skupiny v rámci väčšej skupiny. V jednoduchom jazyku je hlavnou intuíciou za týmito vizualizáciami klastre, ktoré sa môžu zobraziť, ak tok klastrov začína od jedného bodu.
Stromový diagramV stromovom diagrame je hierarchický tok znázornený vo forme stromu, ako názov napovedá. Niekoľko terminológií pre toto zastúpenie je:

- Root Node: Počiatočný bod.

- Podriadený uzol: Vyššie uvedený rodič

- Leaf node: Už žiadny podriadený uzol.

Krúžkové grafy / diagram SunburstReprezentácia stromu v stromovom diagrame je prevedená na radiálnu bázu. Tento typ pomáha pri prezentácii stromu v stručnej veľkosti. Vnútorný kruh je koreňový uzol. A oblasť podriadeného uzla znamená% údajov.
TreeMapStrom je znázornený vo forme obdĺžnikov tesne zabalených. Oblasť označuje množstvo, ktoré obsahuje.
Balenie v kruhuPodobne ako v trezore používa namiesto obdĺžnikov kruhové balenie.
Sieť: Vizualizácia tohto typu spája množiny údajov s množinami údajov. Tieto vizualizácie zobrazujú, ako sa tieto množiny údajov navzájom vzťahujú v rámci siete.
Maticové grafyTento typ vizualizácie sa často používa na nájdenie spojenia medzi rôznymi premennými v rámci seba. Napríklad korelačný graf
Aluviálne diagramyToto je typ vývojového diagramu, v ktorom sú zmeny toku siete reprezentované v intervaloch, ako si to vyžaduje užívateľ.

Slovo mrakZvyčajne sa používa na reprezentáciu textových údajov. Slová sú úzko spojené a veľkosť textu označuje frekvenciu slova.

Schémy uzlových prepojeníTu sú uzly znázornené ako bodky a je znázornené spojenie medzi uzlami.
Viacrozmerné: Na rozdiel od časového typu vizualizácie môžu mať tieto typy viac dimenzií. V tomto môžeme použiť 2 alebo viac funkcií na vytvorenie 3D vizualizácie prostredníctvom súbežných vrstiev. Umožní užívateľovi prezentovať kľúčové informácie o jedle tým, že rozbije veľa nepotrebných údajov.
Rozptylové grafyVo viacrozmerných údajoch vyberieme ľubovoľné 2 vlastnosti a potom ich vykreslíme do dvojrozmerného rozptylového grafu. Takto by sme dostali n C 2 = n (n-1) / 2 grafy.
Skladané stĺpcové grafySegmenty segmentov reprezentácie sú nad sebou. Môže to byť buď 100% stĺpcový graf, kde je segregácia vyjadrená v%, alebo jednoduchý stĺpcový graf, ktorý označuje skutočnú veľkosť.
Paralelný súradnicový grafV tomto znázornení sa nakreslí pozadie a n rovnobežných čiar (pre n-rozmerné údaje).
Geospatial: Tieto vizualizácie sa týkajú súčasného fyzického umiestnenia v reálnom živote jeho krížením s mapami (môže to byť geopriestorová alebo priestorová mapa). Intuíciou za týmito vizualizáciami je vytvorenie holistického pohľadu na výkon.
Vývojová mapaUvádza sa presun informácií alebo objektov z jedného miesta na druhé, kde veľkosť šípky označuje množstvo.
Mapa ChoroplethGeopriestorová mapa je zafarbená na základe konkrétnej dátovej premennej.
kartogramovéhoTento typ zobrazenia používa na mapovanie tematickú premennú. Tieto mapy skresľujú realitu, aby poskytovali informácie. To znamená, že v konkrétnej premennej sú mapy prehnané. Napríklad obrázok vľavo je priestorová mapa skreslená na štruktúru včelích úľov.

Tepelná mapaV geopriestorovom žánri sa veľmi podobajú Choropletovi, ale môžu sa použiť aj v iných oblastiach ako geopriestorových.
Rôzne: Tieto vizualizácie nie je možné zovšeobecniť v obzvlášť veľkej skupine. Takže namiesto vytvárania menších skupín pre jednotlivé typy ich zoskupujeme do rôznych. Nižšie je uvedených niekoľko príkladov:
Graf otvorenej - vysokej - nízkej - zatvorenejTento typ grafov sa zvyčajne používa na vyjadrenie ceny akcií. Rastúci trend sa nazýva býčí a klesajúci ako Bearish.
Kagi-ChartTypicky je dopyt po ponuke aktíva znázornený pomocou tohto grafu.

záver

Z vyššie uvedených typov vizualizácie vidíme, že vo všeobecnosti existuje 6 typov skupín. Vyššie uvedený zoznam nie je vyčerpávajúci, ale len málo, ktoré sa bežne používajú. V nasledujúcich časoch, keď a kedy sa do zoznamu pridajú nové typy, sa skupiny môžu zväčšiť. To je pre typy vizualizácie. Pokračovali by sme v tom, na aké parametre sa treba zamerať pri určovaní typu vizualizácie.

Odporúčané články

Toto je sprievodca vizualizáciou typu údajov. Tu diskutujeme Úvod a rôzne typy vizualizácie dát. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Typy techník analýzy údajov
  2. Integrácia dát Talend
  3. Nástroje na analýzu údajov
  4. Nástroje na vedu o údajoch
  5. Talend Tools
  6. Čo je integrácia údajov?
  7. Bodový graf v Matlabe
  8. Ako sa stĺpcový graf používa v Matlabe (príklady)

Kategórie: