Úvod do strojového učenia

Strojové učenie (ML) je umenie vyvíjať algoritmy bez výslovného programovania. V posledných dvoch desaťročiach sa vygenerovali údaje o exabajtoch a väčšina odvetví bola úplne digitalizovaná. Tieto existujúce údaje používajú algoritmy strojového učenia (ML) na vývoj prediktívnych modelov a automatizáciu niekoľkých časovo náročných úloh.

Pozrime sa, ako sa algoritmy ML líšia od naprogramovaných algoritmov založených na logike:

Pri algoritme založenom na logike je tok dobre definovaný a vopred známy, existuje však niekoľko scenárov skutočného života (napríklad klasifikácia obrázkov), v ktorých nie je možné definovať logiku. V takýchto prípadoch sa strojové učenie ukázalo ako veľmi užitočné. Techniky strojového učenia prijímajú vstupné parametre a očakávané referenčné výstupné údaje a generujú logiku, ktorá sa potom nasadzuje do výroby.

Hlavné súčasti úvodu do strojového učenia:

Strojové vzdelávanie je rozdelené do nasledujúcich kategórií:

1. Strojové učenie pod dohľadom

Algoritmus pod dohľadom ML berie vstupné údaje (funkcie) spolu s výstupmi označenými na vstupe. Väčšinou sa používajú na klasifikáciu a regresné úlohy.

Klasifikácia:

  • Rozhodnutie o oprávnenosti pôžičky : Automatizujte proces schvaľovania pôžičky pomocou údajov z minulosti, ktoré majú parametre, ako sú vek, príjem, vzdelanie, mesto atď., Aby ste rozhodli, či je možné pôžičku žiadateľa schváliť.

regresia:

  • Predikcia ceny domu : Predpovedajte cenu domu pomocou funkcií, ako je veľkosť domu, vek domu, počet izieb, lokalita atď.

2. Strojové učenie bez dozoru

Techniky ML bez dozoru nevyžadujú žiadne označené údaje a používajú sa na zoskupovanie údajov do rôznych segmentov na základe vstupných funkcií.

Príklad: Na oddelenie skupiny 100 ľudí do 5 zoskupení môžu vstupné funkcie zahŕňať záujmy, koníčky, sociálne prepojenia atď.

Aplikácie strojového učenia

V uplynulom desaťročí sa zavedením strojového učenia zmenilo niekoľko odvetví vrátane zdravotníctva, sociálnych médií, digitálneho marketingu, nehnuteľností, logistiky, dodávateľského reťazca a výroby. Začiatočníci v týchto odvetviach už dosiahli značné zisky. Rastie dopyt po kvalifikovanej pracovnej sile so strojovým vzdelávaním spolu so znalosťami domén.

Nasleduje niekoľko aplikácií, v ktorých techniky ML zohrávali významnú úlohu:

  • Klasifikácia nevyžiadanej pošty:

Na klasifikáciu pošty ako spam / nie spam pomocou označených odpovedí s použitím údajov, ako je obsah správy, používanie slovnej zásoby používanej v propagačných e-mailoch, e-mailovej adrese odosielateľa, IP odosielateľa, použitia hypertextových odkazov, interpunkcie čísel atď.

  • Detekcia rakoviny:

ML sa čoraz viac používa v zdravotníctve na diagnostiku a dokonca aj na zisťovanie rakoviny pomocou lekárskych údajov o predchádzajúcich pacientoch. Pri detekcii karcinómu prsníka berie tréningový algoritmus vstupy ako veľkosť nádoru, polomer, zakrivenie a obvod. Na výstupe máme pravdepodobnosť, že nádor je malígny alebo nie.

  • Predikcia predaja :

Rastúci počet predajcov digitalizuje svoje záznamy, mnohí z nich začali používať nástroje strojového učenia na predpovedanie predaja konkrétnej položky v danom týždni, aby mohli skladovať dostatočné množstvo zásob. Úvod Techniky strojového učenia by prevzali vstupy z predaja za predchádzajúci rok pre rôzne položky a našli vzory sezónnych výkyvov a poskytli konkrétne predpovede pre predaj určitých položiek. Môžeme tiež identifikovať položky s nízkou výkonnosťou z hľadiska predaja.

  • Rozpoznávanie tváre:

Pravdepodobne ste pri nahrávaní obrázkov na Facebook zistili, že označujú tváre vašich priateľov k ich menám. V backend stroji / algoritme hlbokého učenia robia túto prácu. Rovnaký základný úvod do princípov strojového učenia sa používa aj na rozpoznávanie tváre, keď sú privádzané vstupné tváre a neurónové siete sú trénované na klasifikáciu týchto obrazov.

  • Klasifikácia textu:

S rastúcou populáciou prichádzajúcou na internet sa pre spoločnosti zaoberajúce sa webovými / sociálnymi médiami, ako sú Twitter, Facebook, Quora, stalo povinnosťou nasadiť systémy založené na klasifikácii textov. Twitter / Quora to používa na identifikáciu nenávistných komentárov / príspevkov. Niektoré spravodajské spoločnosti tiež používajú algoritmy klasifikácie textu na zoskupovanie podobných článkov.

  • Interpretácia zvuku / hlasu:

Zaujímalo by vás, ako sa zariadenia ako Alexa, Siri a Google stávajú inteligentnými každý deň pri porozumení zvukových údajov v rôznych jazykoch s rôznymi prízvukmi. Obrovské množstvo údajov je v týchto zariadeniach školených na úvod do techniky strojového učenia, čo umožňuje.

  • Systémy na detekciu podvodov:

Niekoľko spoločností zaoberajúcich sa elektronickým obchodom využíva systémy detekcie podvodov založené na ML, aby identifikovali zákazníkov vytvárajúcich falošné objednávky a tiež eliminovali predajcov predávajúcich falšované produkty na platforme. Bankovníctvo a iné začínajúce finančné technológie sa pri odhaľovaní podvodov veľmi spoliehajú na techniky ML

  • Odporúčacie motory

Netflix používa na sledovanie filmov bez dozoru ML, zatiaľ čo Amazon ho používa na odporúčanie produktov na nákup.

výhody

  • Automatizujte časovo náročné úlohy:

Aplikácie založené na ML automatizovali niekoľko úloh, ako napríklad rozhodovanie na nízkej úrovni, zadávanie údajov, telefonovanie, procesy schvaľovania pôžičiek.

  • Úspora nákladov:

Akonáhle je algoritmus vyvinutý a uvedený do výroby, môže spôsobiť značné úspory nákladov, pretože ľudská práca a rozhodovanie sú minimálne.

  • Čas obrátky:

Pri mnohých aplikáciách je najdôležitejší celkový čas. Spoločnosť ML dokázala skrátiť čas v takých oblastiach, ako sú napríklad žiadosti o poistenie automobilov, v ktorých používateľ odovzdáva obrázky a vypočítava sa výška poistného. Pomohlo to aj elektronickým obchodným spoločnostiam pri vybavovaní výnosov z predaných zásob.

  • Rozhodovanie založené na údajoch:

Nielen podniky, ale aj veľa vlád sa spolieha na ML pri rozhodovaní o tom, do ktorých projektov investovať a ako optimálne využiť existujúce zdroje.

nevýhody

  • Algoritmy ML môžu byť skreslené:

Veľa krát sú vstupné údaje do algoritmu ML skreslené pre konkrétne pohlavie, rasu, krajinu, kastu atď. To vedie k tomu, že algoritmy ML šíria nežiaduce skreslenie do rozhodovacieho procesu. Toto bolo pozorované v niektorých aplikáciách, ktoré implementovali proces prijímania do školy typu ML / škola a odporúčanie sociálnych médií.

  • Na dosiahnutie prijateľnej presnosti je potrebné veľké množstvo údajov:

Zatiaľ čo sa ľudia môžu učiť ľahko pre malé množiny údajov, pre niektoré aplikácie, úvod do strojového učenia si vyžaduje obrovské množstvo údajov, aby sa dosiahla dostatočná presnosť.

  • Manipulovať s rozhodnutím používateľa:

Analytická firma Cambridge Analytica nedávno využívala na sociálnych médiách algoritmy ML na zacielenie a ovplyvnenie rozhodnutia voličov.

  • V súčasnosti môže byť úvod do algoritmu strojového učenia vhodný do budúcnosti:

Technika ML trénovaná na aktuálnom súbore údajov nemusí byť pre budúcnosť vhodná, pretože distribúcia vstupov sa môže v priebehu času významne meniť. Jedným z protiopatrení na prekonanie tohto je periodické precvičovanie modelu.

Odporúčané články

Toto bol sprievodca Úvodom do strojového učenia. Tu sme diskutovali o strojovom učení so základnými bodmi a charakteristikami úvodu do strojového učenia. Môžete sa tiež pozrieť na nasledujúce články:

  1. Techniky strojového učenia
  2. Strojové učenie vs neurónová sieť
  3. Kariéra v strojovom vzdelávaní
  4. Rozdiel medzi strojovým učením veľkých dát Vs
  5. Hyperparameter Machine Learning

Kategórie: