Čo je to modelovanie údajov? - Ako to funguje Výhoda Nárast zručnosti a kariéry

Obsah:

Anonim

Čo je to dátové modelovanie

Jednoducho povedané, Data Modeling sa týka vytvorenia dátového modelu, ktorý môže byť uložený v niektorej databáze. Dátový model predstavuje konceptuálnu reprezentáciu asociácie medzi rôznymi dátovými objektmi.

Pochopenie modelovania dát / rozsahu

Vyskytuje sa v troch rôznych vrstvách:

  • Fyzický model: Je to schéma, ktorá hovorí, ako sa údaje fyzicky ukladajú do databázy
  • Koncepčný model: Je to užívateľský pohľad na dáta, tj vysoká úroveň, ktorú užívateľ vidí.
  • Logický model: Je umiestnený medzi fyzickým modelom a koncepčným modelom a predstavuje údaje logicky, oddelene od svojich fyzických úložísk.

Hierarchické modelovanie dát: Tieto modely sa používali ako náhrada súborových systémov. Dáta sa uchovávali v strome ako jedno príliš veľa usporiadaní.

Relačné dátové modelovanie: Je pravda, že hierarchický model nám pomohol prejsť od systémov založených na súboroch, ktoré znížili zložitosť, ale stále jeden vedel o konkrétnom použitom fyzickom ukladaní údajov. Relačná databáza sa riadi relačným modelom, v ktorom sú údaje uložené v tabuľkách, na rozdiel od hierarchickej databázy, v ktorej sú uložené v stromovej štruktúre. Stručne povedané, to znížilo zložitosť viac v porovnaní s hierarchickým modelom.

Ako uľahčuje modelovanie údajov prácu / prečo by sme ich mali používať?

Pomáha nám pri vizuálnej reprezentácii údajov a presadzuje obchodnú logiku, nariadenia, politiky atď. O údajoch. Je to príručka, ktorú používajú vedci a analytici pri navrhovaní a implementácii databázy. Takže bez modelovania údajov je úloha analytikov a vedcov implementovať obchodné požiadavky do databázy zložitá.

Prečo potrebujeme modelovanie údajov? / Čo s tým môžete urobiť?

Hlavným cieľom jeho použitia je:

  • Aby sme zaistili, že všetky dátové objekty sú správne zastúpené, ako keby to nebolo správne, dostali by sme nesprávne výsledky.
  • Ako už bolo uvedené, pomáha navrhovať databázu na koncepčnej, fyzickej a logickej úrovni.
  • Pomáha pri návrhu relačných tabuliek, primárnych kľúčov, cudzích kľúčov atď.
  • Vývojári databáz môžu vytvoriť lepšiu fyzickú databázu s dobrým modelom, pretože sa pre nich stáva vodiacim nástrojom.
  • Pomáha identifikovať chýbajúce a nadbytočné údaje.
  • Pomáha nám to mať lepšiu IT infraštruktúru a mať ľahkú a lacnú údržbu, keď je to z dlhodobého hľadiska potrebné, aj keď to spočiatku vyžaduje čas.

Práca s modelovaním údajov

Teraz vytvorme vzorový dátový model, aby sme pochopili, ako pracovať s modelom. Aby sme to dosiahli, musíme postupovať podľa určitých krokov:

  • Najprv musíme pochopiť požiadavky. V tomto prípade vytvoríme model pre internetový obchod. Majúc na pamäti, že potrebujeme dve tabuľky a) zákazníci b) výrobky
  • Ďalším krokom je získanie atribútov tabuliek alebo entít

a. zákaznícka tabuľka môže mať atribúty ako:

  • id
  • názov
  • e-mail
  • adresa

b. Tabuľka produktov môže mať atribúty ako:

  • id
  • názov

V tabuľke zákazníkov môžeme mať ID ako primárny kľúč a podobne ID produktu v tabuľke produktu bude primárnym kľúčom, ako je znázornené na nižšie uvedených diagramoch.

Teraz navrhneme vzťah medzi týmito dvoma tabuľkami. Aby sme prepojili tabuľku zákazníkov a produktov, vytvoríme tabuľku nazvanú nákup, ktorá bude ako tabuľka objednávok (tj ktorý zákazník si objednal ktorý produkt).

Ak sa pozriete na obrázok vyššie, referencia nákupu a nákupu je v poriadku, pretože každý nákup má jedného zákazníka a jeden zákazník má veľa nákupov. Tento odkaz je v poriadku. Ešte jednu vec sme vzali user_account_id ako cudzí kľúč (odkaz na id v kľúči zákazníka). Podobne product_id. Stále existuje problém s referenciou na zakúpenie produktu, pretože niekoľko produktov sa dá kúpiť v jednom nákupe, pričom niekoľko nákupov môže obsahovať rovnaký produkt.

Na prekonanie tohto problému navrhneme sprostredkovateľskú tabuľku známu ako purchase_item, ktorá bude spojená s nákupom a produktom. Na obrázku nižšie vidíme problém vyriešený.

výhody

Existujú rôzne výhody:

  • Pomáha podnikom komunikovať, plánovať v celej organizácii.
  • Pomáha rozpoznať správny zdroj údajov, ktoré sa dajú použiť na naplnenie modelu.
  • To sa dá použiť na definovanie vzťahov medzi rôznymi tabuľkami, ako je primárny kľúč, cudzí kľúč atď.

Kto je tým správnym publikom na učenie sa tejto technológie?

Je to veľmi dôležité. Správne publikum pre techniky učenia sa modelovania sú jednotlivci, ktorí sú dátovými architektmi a analytikmi údajov. Väčšina jednotlivcov začína ako analytici údajov a potom sa pohybujú po rebríku.

Ako vám táto technológia pomôže v kariérnom raste?

Podľa spoločnosti Glassdoor sa predpokladá, že priemerný plat na trhu modelárov v priemere zarobí približne 78 601 dolárov. Takže vidíte, že ide o dobre platenú prácu. Väčšina veľkých spoločností investuje do modelárov, pretože sú veľmi dôležité na udržanie integrity údajov.

záver

Na záver možno povedať, že model vytvorený modelármi zabezpečuje konzistenciu pri pomenovávaní konvencií, integrity a bezpečnosti údajov. pretože dobré údaje umožnia podniku správne a efektívne využívať ich údaje.

Odporúčané články

Toto bola príručka Čo je to dátové modelovanie. Tu sme diskutovali o definícii, kariérnom raste, zručnostiach, výhodách a práci s modelovaním údajov pomocou príkladov. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Čo je to agilný projektový manažment?
  2. Rozhovory s otázkami týkajúcimi sa skladovania údajov
  3. Čo je SAS?
  4. Čo je technológia Big Data Technology?
  5. Sprievodca dátovým modelom v Cassandre