Úvod do miešania údajov v table
Prvkom, ktorý jasne zobrazuje všestranný charakter Tableau, je Data Blending. Miešanie vo všeobecnosti znamená kombinovanie. Dáta sa často ukladajú do viacerých tabuliek na rôznych úrovniach. V terminológii databázy môžeme povedať, že rovnaké údaje máme vo viacerých tabuľkách, ale s rôznymi granularitami. Napríklad tabuľka obsahuje distribučný objem na regionálnej úrovni, zatiaľ čo iná tabuľka má distribučný objem na úrovni divízií. Tabuľky budú mať určité spoločné polia. Niekedy budeme potrebovať polia z oboch tabuliek na analýzu. V takýchto prípadoch ponúka koncepcia kombinovania údajov ľahké riešenie na kombináciu údajov z rôznych zdrojov údajov.
Potreba prelínania údajov v table
V Tableau sa kombinovanie údajov týka kombinovania údajov. Kľúčovým aspektom kombinovania údajov je to, že kombinuje tabuľky na úrovni zobrazenia, bez toho, aby skutočne uskutočňovalo spojenie medzi tabuľkami. Pretože Tableau je v podstate vizuálny analytický nástroj a nie vždy je potrebné pripojiť sa k tabuľkám. Okrem toho sa kombinácia stáva hárkom a nie zošitom. To zaisťuje kombináciu funkcií kombinovania údajov na úrovni zobrazenia.
Miešanie údajov v table
Teraz uvidíme, ako kombinovať údaje v Tableau. Pre demonštráciu uvažujeme o distribučných údajoch. Dve rôzne tabuľky obsahujú údaje týkajúce sa distribučného objemu. Sú prítomné v dvoch rôznych súboroch programu Excel. Jedna tabuľka obsahuje údaje na úrovni distribučného kanála, zatiaľ čo druhá tabuľka obsahuje údaje distribučnej jednotky. V týchto dvoch tabuľkách je niekoľko polí, aj keď existujú s rôznymi názvami.
Nasleduje postupný postup na uskutočnenie zmiešavania údajov v Tableau a na použitie kombinovaných údajov.
Krok 1
Načítanie údajov z dvoch tabuliek jedna po druhej
- V ponuke Údaje kliknite na možnosť Nový zdroj údajov, vyberte požadovaný zdroj a nahrajte ho do tabuľky.
Vykonajte vyššie uvedený krok dvakrát a načítajte obidve tabuľky do tabuľky Tableau. Zobrazia sa na karte Údaje, ako je to znázornené na nasledujúcom snímke obrazovky
- Po načítaní sa oba zdroje zobrazia na karte Údaje
Krok 2
V prípade zmiešavania údajov vykonáme nasledujúce kroky:
- V ponuke Údaje kliknite na položku „Upraviť vzťahy … “. Zobrazí sa dialógové okno Vzťahy.
- V predvolenom nastavení sa aktuálne vybraný zdroj údajov stane primárnym zdrojom údajov.
- Z rozbaľovacej ponuky však môžeme vybrať požadovaný primárny zdroj údajov.
- Keď je vybraná možnosť Automaticky, tieto možnosti nie sú aktívne.
- Požadovaný primárny zdroj údajov je možné vybrať z rozbaľovacej ponuky.
- Po výbere požadovaného zdroja údajov ako primárneho zdroja údajov kliknite na tlačidlo OK.
- Kliknutím na tlačidlo Pridať sa zobrazí dialógové okno Pridanie / úprava polí
- Pomocou Pridať / Upraviť mapovanie polí môžeme pridať vlastné polia na mapovanie údajov medzi tieto dva zdroje údajov.
- Kliknite na OK, akonáhle sú požadované výbery z dvoch sekcií, tj sú urobené polia Primárny a Sekundárny zdroj údajov.
Krok 3
Po vykonaní vyššie uvedených krokov skontrolujeme, či je miešanie úspešné alebo nie, pomocou vhodných rozmerov z oboch tabuliek.
Krok 4
Vyššie uvedená grafická analýza ukazuje distribučný objem produktu podľa divízie. Zatiaľ čo distribučný objem je číselné pole, ktoré sa nachádza v oboch tabuľkách s rovnakým názvom, v sekundárnom zdroji údajov, tj v tabuľke distribučnej jednotky, sa nachádza rozdelenie ako pole distribučnej jednotky. Prostredníctvom operácie zmiešavania údajov sme spojili tieto dve tabuľky a namapovali hodnoty. V grafe sme teda mohli vidieť hodnoty kódu DU oproti príslušným divíziám. Nevykonávanie kombinovania údajov by vygenerovalo medzery pre pole Kód DU.
Krok 5
Obe tabuľky obsahujú údaje o distribučnom objeme, ale iba na rôznych úrovniach, takže objemy rozdelenia pre obe tabuľky by mali byť rovnaké a tiež celkový objem. Overme si to.
Všimnite si, ako je uvedené vyššie, oba grafy znázorňujú rovnaký vzorec pre distribučný objem podľa divízie, hoci miera bola vybraná z primárnych aj sekundárnych zdrojov údajov. To ukazuje, že hoci distribučný objem existuje na rôznych úrovniach v rôznych tabuľkách, zostane rovnaký. Toto je ďalší dôkaz správneho zmiešania údajov uľahčený mapovaním cez príslušné polia.
záver
Miešanie dát je jednoduchý a rýchly spôsob kombinovania údajov z viacerých zdrojov v Tableau. V skutočnosti sa nepripojí k tabuľkám, hoci sa dá porovnať s ľavým spojením, ktoré považuje zdroj primárnych údajov za ľavú tabuľku. Kombinuje iba údaje na úrovni zobrazenia, aby sa uľahčila podrobná grafická analýza.
Odporúčané články
Toto je návod na kombináciu údajov v Tableau. Tu diskutujeme postupný postup na zmiešavanie údajov v Tableau a ako používať kombinované údaje. Viac informácií nájdete aj v nasledujúcom článku -
- Platforma pre vedu o údajoch
- Aplikácie dolovania dát
- Architektúra veľkých dát
- Kariéra v oblasti vedy o údajoch