Miešanie údajov v table Naučte sa kroky na vykonanie zmiešavania údajov

Obsah:

Anonim

Úvod do miešania údajov v table

Prvkom, ktorý jasne zobrazuje všestranný charakter Tableau, je Data Blending. Miešanie vo všeobecnosti znamená kombinovanie. Dáta sa často ukladajú do viacerých tabuliek na rôznych úrovniach. V terminológii databázy môžeme povedať, že rovnaké údaje máme vo viacerých tabuľkách, ale s rôznymi granularitami. Napríklad tabuľka obsahuje distribučný objem na regionálnej úrovni, zatiaľ čo iná tabuľka má distribučný objem na úrovni divízií. Tabuľky budú mať určité spoločné polia. Niekedy budeme potrebovať polia z oboch tabuliek na analýzu. V takýchto prípadoch ponúka koncepcia kombinovania údajov ľahké riešenie na kombináciu údajov z rôznych zdrojov údajov.

Potreba prelínania údajov v table

V Tableau sa kombinovanie údajov týka kombinovania údajov. Kľúčovým aspektom kombinovania údajov je to, že kombinuje tabuľky na úrovni zobrazenia, bez toho, aby skutočne uskutočňovalo spojenie medzi tabuľkami. Pretože Tableau je v podstate vizuálny analytický nástroj a nie vždy je potrebné pripojiť sa k tabuľkám. Okrem toho sa kombinácia stáva hárkom a nie zošitom. To zaisťuje kombináciu funkcií kombinovania údajov na úrovni zobrazenia.

Miešanie údajov v table

Teraz uvidíme, ako kombinovať údaje v Tableau. Pre demonštráciu uvažujeme o distribučných údajoch. Dve rôzne tabuľky obsahujú údaje týkajúce sa distribučného objemu. Sú prítomné v dvoch rôznych súboroch programu Excel. Jedna tabuľka obsahuje údaje na úrovni distribučného kanála, zatiaľ čo druhá tabuľka obsahuje údaje distribučnej jednotky. V týchto dvoch tabuľkách je niekoľko polí, aj keď existujú s rôznymi názvami.

Nasleduje postupný postup na uskutočnenie zmiešavania údajov v Tableau a na použitie kombinovaných údajov.

Krok 1

Načítanie údajov z dvoch tabuliek jedna po druhej

  • V ponuke Údaje kliknite na možnosť Nový zdroj údajov, vyberte požadovaný zdroj a nahrajte ho do tabuľky.

Vykonajte vyššie uvedený krok dvakrát a načítajte obidve tabuľky do tabuľky Tableau. Zobrazia sa na karte Údaje, ako je to znázornené na nasledujúcom snímke obrazovky

  • Po načítaní sa oba zdroje zobrazia na karte Údaje

Krok 2

V prípade zmiešavania údajov vykonáme nasledujúce kroky:

  • V ponuke Údaje kliknite na položku „Upraviť vzťahy “. Zobrazí sa dialógové okno Vzťahy.

  • V predvolenom nastavení sa aktuálne vybraný zdroj údajov stane primárnym zdrojom údajov.
  • Z rozbaľovacej ponuky však môžeme vybrať požadovaný primárny zdroj údajov.
  • Keď je vybraná možnosť Automaticky, tieto možnosti nie sú aktívne.

  • Požadovaný primárny zdroj údajov je možné vybrať z rozbaľovacej ponuky.
  • Po výbere požadovaného zdroja údajov ako primárneho zdroja údajov kliknite na tlačidlo OK.

  • Kliknutím na tlačidlo Pridať sa zobrazí dialógové okno Pridanie / úprava polí

  • Pomocou Pridať / Upraviť mapovanie polí môžeme pridať vlastné polia na mapovanie údajov medzi tieto dva zdroje údajov.
  • Kliknite na OK, akonáhle sú požadované výbery z dvoch sekcií, tj sú urobené polia Primárny a Sekundárny zdroj údajov.

Krok 3

Po vykonaní vyššie uvedených krokov skontrolujeme, či je miešanie úspešné alebo nie, pomocou vhodných rozmerov z oboch tabuliek.

Krok 4

Vyššie uvedená grafická analýza ukazuje distribučný objem produktu podľa divízie. Zatiaľ čo distribučný objem je číselné pole, ktoré sa nachádza v oboch tabuľkách s rovnakým názvom, v sekundárnom zdroji údajov, tj v tabuľke distribučnej jednotky, sa nachádza rozdelenie ako pole distribučnej jednotky. Prostredníctvom operácie zmiešavania údajov sme spojili tieto dve tabuľky a namapovali hodnoty. V grafe sme teda mohli vidieť hodnoty kódu DU oproti príslušným divíziám. Nevykonávanie kombinovania údajov by vygenerovalo medzery pre pole Kód DU.

Krok 5

Obe tabuľky obsahujú údaje o distribučnom objeme, ale iba na rôznych úrovniach, takže objemy rozdelenia pre obe tabuľky by mali byť rovnaké a tiež celkový objem. Overme si to.

Všimnite si, ako je uvedené vyššie, oba grafy znázorňujú rovnaký vzorec pre distribučný objem podľa divízie, hoci miera bola vybraná z primárnych aj sekundárnych zdrojov údajov. To ukazuje, že hoci distribučný objem existuje na rôznych úrovniach v rôznych tabuľkách, zostane rovnaký. Toto je ďalší dôkaz správneho zmiešania údajov uľahčený mapovaním cez príslušné polia.

záver

Miešanie dát je jednoduchý a rýchly spôsob kombinovania údajov z viacerých zdrojov v Tableau. V skutočnosti sa nepripojí k tabuľkám, hoci sa dá porovnať s ľavým spojením, ktoré považuje zdroj primárnych údajov za ľavú tabuľku. Kombinuje iba údaje na úrovni zobrazenia, aby sa uľahčila podrobná grafická analýza.

Odporúčané články

Toto je návod na kombináciu údajov v Tableau. Tu diskutujeme postupný postup na zmiešavanie údajov v Tableau a ako používať kombinované údaje. Viac informácií nájdete aj v nasledujúcom článku -

  1. Platforma pre vedu o údajoch
  2. Aplikácie dolovania dát
  3. Architektúra veľkých dát
  4. Kariéra v oblasti vedy o údajoch