Úvod do typov vizualizácie dát
V modernej aréne veľkých údajov, ktoré majú viac ako 2, 5 kvintiliónu bajtov (1 kvintilión bajtov = 10 18 bajtov!) Údajov vytvorených každý deň (podľa socialmediatoday.com), umierajúca potreba ukladania údajov. Tieto dáta sú, samozrejme, husté, a preto nie sú čitateľné používateľom a sú neustále zaostrené. Aby sa paradigma posunula na ľahšie pochopenie rozsahu údajov a na získanie užitočných výhod v podnikaní, údaje sa musia predkladať intuitívnejším spôsobom, a preto by na ich vizualizáciu boli potrebné vhodné grafy. Existujú nástroje a metodiky postavené na efektívne vykreslenie údajov, ale účinnosť väčšinou závisí od typu údajov a požiadavky, ktorú treba z údajov vyňať.
Čo je to vizualizácia dát?
Vizualizácia údajov je metodika, pomocou ktorej sa zobrazujú údaje v surovom formáte, aby sa zdôraznil ich význam. S príchodom veľkých údajov sa stalo nevyhnutnosťou vybudovať zmysluplný spôsob prezentácie údajov, aby sa množstvo údajov nestrácalo. Časť zobrazovania údajov sa môže použiť na rôzne účely, napríklad na nájdenie trendov / spoločných znakov / vzorov v údajoch, zostavenie modelov pre strojové učenie alebo sa môže použiť na jednoduchú operáciu, ako je agregácia.
Rôzne typy vizualizácie údajov
Vizualizácia údajov je všeobecne rozdelená do 6 rôznych typov. Aj keď oblasť vizualizácie údajov neustále rastie, nebude prekvapením, ak sa počet kategórií zvýši.
Dočasné: Údaje pre tieto typy vizualizácie by mali spĺňať obidve podmienky: reprezentované údaje by mali byť lineárne a mali by byť jednorozmerné. Tieto typy vizualizácie sú reprezentované čiarami, ktoré sa môžu prekrývať a tiež majú spoločný počiatočný a cieľový dátový bod. | ||
Bodový graf | Na označenie dátového bodu sa používajú bodky. Najbežnejšie v dnešnom svete v strojovom učení sa počas analýzy experimentálnych údajov. | ![]() |
Výsečový graf | Tento typ vizualizácie zahŕňa okrúhlu grafiku, kde dĺžka oblúka predstavuje veľkosť. | ![]() |
Diagram polárnej oblasti | Podobne ako koláčový graf, aj polárny graf je kruhovým grafom, s výnimkou sektorových uhlov, ktorých dĺžka je rovnaká a vzdialenosť od stredu znamená veľkosť. | ![]() |
Čiarové grafy | Podobne ako bodový graf sú údaje reprezentované bodmi, s výnimkou spojov, ktoré udržiavajú spojitosť. | ![]() |
časovej osi | Týmto spôsobom zobrazujeme zoznam údajových bodov v chronologickom poradí podľa času. | ![]() |
Sekvencie časových radov | V časových radoch reprezentujeme veľkosť údajov v 2-D grafe v chronologickom poradí podľa časovej pečiatky v údajoch. | ![]() |
Hierarchické: Tieto typy vizualizácií zobrazujú usporiadané skupiny v rámci väčšej skupiny. V jednoduchom jazyku je hlavnou intuíciou za týmito vizualizáciami klastre, ktoré sa môžu zobraziť, ak tok klastrov začína od jedného bodu. | ||
Stromový diagram | V stromovom diagrame je hierarchický tok znázornený vo forme stromu, ako názov napovedá. Niekoľko terminológií pre toto zastúpenie je:
- Root Node: Počiatočný bod. - Podriadený uzol: Vyššie uvedený rodič - Leaf node: Už žiadny podriadený uzol. | ![]() |
Krúžkové grafy / diagram Sunburst | Reprezentácia stromu v stromovom diagrame je prevedená na radiálnu bázu. Tento typ pomáha pri prezentácii stromu v stručnej veľkosti. Vnútorný kruh je koreňový uzol. A oblasť podriadeného uzla znamená% údajov. | ![]() |
TreeMap | Strom je znázornený vo forme obdĺžnikov tesne zabalených. Oblasť označuje množstvo, ktoré obsahuje. | ![]() |
Balenie v kruhu | Podobne ako v trezore používa namiesto obdĺžnikov kruhové balenie. | ![]() |
Sieť: Vizualizácia tohto typu spája množiny údajov s množinami údajov. Tieto vizualizácie zobrazujú, ako sa tieto množiny údajov navzájom vzťahujú v rámci siete. | ||
Maticové grafy | Tento typ vizualizácie sa často používa na nájdenie spojenia medzi rôznymi premennými v rámci seba. Napríklad korelačný graf | ![]() |
Aluviálne diagramy | Toto je typ vývojového diagramu, v ktorom sú zmeny toku siete reprezentované v intervaloch, ako si to vyžaduje užívateľ. |
|
Slovo mrak | Zvyčajne sa používa na reprezentáciu textových údajov. Slová sú úzko spojené a veľkosť textu označuje frekvenciu slova. |
|
Schémy uzlových prepojení | Tu sú uzly znázornené ako bodky a je znázornené spojenie medzi uzlami. | ![]() |
Viacrozmerné: Na rozdiel od časového typu vizualizácie môžu mať tieto typy viac dimenzií. V tomto môžeme použiť 2 alebo viac funkcií na vytvorenie 3D vizualizácie prostredníctvom súbežných vrstiev. Umožní užívateľovi prezentovať kľúčové informácie o jedle tým, že rozbije veľa nepotrebných údajov. | ||
Rozptylové grafy | Vo viacrozmerných údajoch vyberieme ľubovoľné 2 vlastnosti a potom ich vykreslíme do dvojrozmerného rozptylového grafu. Takto by sme dostali n C 2 = n (n-1) / 2 grafy. | ![]() |
Skladané stĺpcové grafy | Segmenty segmentov reprezentácie sú nad sebou. Môže to byť buď 100% stĺpcový graf, kde je segregácia vyjadrená v%, alebo jednoduchý stĺpcový graf, ktorý označuje skutočnú veľkosť. | ![]() |
Paralelný súradnicový graf | V tomto znázornení sa nakreslí pozadie a n rovnobežných čiar (pre n-rozmerné údaje). | ![]() |
Geospatial: Tieto vizualizácie sa týkajú súčasného fyzického umiestnenia v reálnom živote jeho krížením s mapami (môže to byť geopriestorová alebo priestorová mapa). Intuíciou za týmito vizualizáciami je vytvorenie holistického pohľadu na výkon. | ||
Vývojová mapa | Uvádza sa presun informácií alebo objektov z jedného miesta na druhé, kde veľkosť šípky označuje množstvo. | ![]() |
Mapa Choropleth | Geopriestorová mapa je zafarbená na základe konkrétnej dátovej premennej. | ![]() |
kartogramového | Tento typ zobrazenia používa na mapovanie tematickú premennú. Tieto mapy skresľujú realitu, aby poskytovali informácie. To znamená, že v konkrétnej premennej sú mapy prehnané. Napríklad obrázok vľavo je priestorová mapa skreslená na štruktúru včelích úľov. | ![]() |
Tepelná mapa | V geopriestorovom žánri sa veľmi podobajú Choropletovi, ale môžu sa použiť aj v iných oblastiach ako geopriestorových. | ![]() |
Rôzne: Tieto vizualizácie nie je možné zovšeobecniť v obzvlášť veľkej skupine. Takže namiesto vytvárania menších skupín pre jednotlivé typy ich zoskupujeme do rôznych. Nižšie je uvedených niekoľko príkladov: | ||
Graf otvorenej - vysokej - nízkej - zatvorenej | Tento typ grafov sa zvyčajne používa na vyjadrenie ceny akcií. Rastúci trend sa nazýva býčí a klesajúci ako Bearish. | ![]() |
Kagi-Chart | Typicky je dopyt po ponuke aktíva znázornený pomocou tohto grafu. | ![]() |
záver
Z vyššie uvedených typov vizualizácie vidíme, že vo všeobecnosti existuje 6 typov skupín. Vyššie uvedený zoznam nie je vyčerpávajúci, ale len málo, ktoré sa bežne používajú. V nasledujúcich časoch, keď a kedy sa do zoznamu pridajú nové typy, sa skupiny môžu zväčšiť. To je pre typy vizualizácie. Pokračovali by sme v tom, na aké parametre sa treba zamerať pri určovaní typu vizualizácie.
Odporúčané články
Toto je sprievodca vizualizáciou typu údajov. Tu diskutujeme Úvod a rôzne typy vizualizácie dát. Viac informácií nájdete aj v ďalších navrhovaných článkoch -
- Typy techník analýzy údajov
- Integrácia dát Talend
- Nástroje na analýzu údajov
- Nástroje na vedu o údajoch
- Talend Tools
- Čo je integrácia údajov?
- Bodový graf v Matlabe
- Ako sa stĺpcový graf používa v Matlabe (príklady)