Úvod do životného cyklu strojov (ML)

Životný cyklus strojového učenia je o získavaní poznatkov prostredníctvom údajov. Životný cyklus strojového učenia opisuje trojfázový proces, ktorý používajú vedci údajov a dátoví inžinieri na vývoj, školenie a poskytovanie modelov. Vývoj, školenie a servis modelov strojového učenia je výsledkom procesu nazývaného životný cyklus strojového učenia. Je to systém, ktorý využíva dáta ako vstup, má schopnosť učiť sa a zlepšovať sa pomocou algoritmov bez toho, aby bol na to naprogramovaný. Životný cyklus strojového učenia má tri fázy, ako je to znázornené na obrázku nižšie: vývoj potrubia, školenie a odvodenie.

Prvý krok v životnom cykle strojového učenia spočíva v transformácii nespracovaných údajov na vyčistený súbor údajov, ktorý sa často zdieľa a opakovane používa. Ak analytik alebo vedec údajov, ktorý sa stretne s problémami s prijatými údajmi, musí mať prístup k pôvodným údajom a transformačným skriptom. Existuje niekoľko dôvodov, prečo sa možno budeme chcieť vrátiť k starším verziám našich modelov a údajov. Napríklad nájdenie staršej najlepšej verzie môže vyžadovať prehľadávanie mnohých alternatívnych verzií, pretože modely sa nevyhnutne zhoršujú v predikčnej sile. Existuje mnoho dôvodov pre túto degradáciu, napríklad posun v distribúcii údajov, ktorý môže mať za následok rýchly pokles prediktívnej sily ako kompenzácie za chyby. Diagnostika tohto poklesu si môže vyžadovať porovnanie údajov o školeniach so živými údajmi, preškolenie modelu, revíziu skorších rozhodnutí o návrhu alebo dokonca prepracovanie modelu.

Poučenie sa z chýb

Vývoj modelov si vyžaduje osobitné súbory údajov o školení a testovaní. Nadmerné používanie testovacích údajov počas tréningu môže viesť k zlej generalizácii a výkonnosti, pretože môžu viesť k nadmernému nasadeniu. Kontext tu zohráva dôležitú úlohu, preto je potrebné pochopiť, ktoré údaje sa použili na výcvik zamýšľaných modelov as ktorými konfiguráciami. Životný cyklus strojového učenia je riadený údajmi, pretože model a výstup školenia sú spojené s údajmi, na ktorých bol školený. Na nasledujúcom obrázku je uvedený prehľad potrubného učenia strojov medzi jednotlivými strojmi z hľadiska údajov.

Kroky zapojené do životného cyklu strojového učenia

Vývojový program Machine Learning neustále vykonáva experimenty s novými súbormi údajov, modelmi, softvérovými knižnicami, ladiacimi parametrami, aby sa optimalizovala a zvýšila presnosť modelu. Pretože výkon modelu úplne závisí od vstupných údajov a školiaceho procesu.

1. Zostavenie modelu strojového učenia

Tento krok určuje typ modelu na základe aplikácie. Taktiež zistí, že aplikácia modelu v štádiu učenia modelu tak, aby mohli byť správne navrhnuté podľa potreby zamýšľanej aplikácie. K dispozícii je množstvo modelov strojového učenia, ako je model pod dohľadom, model bez dozoru, klasifikačné modely, regresné modely, zhlukové modely a modely výučby posilnenia. Podrobný pohľad je znázornený na obrázku nižšie:

2. Príprava údajov

Rôzne údaje môžu byť použité ako vstup pre strojové učenie. Tieto údaje môžu pochádzať z viacerých zdrojov, napríklad z podnikania, farmaceutických spoločností, zariadení internetu vecí, podnikov, bánk, nemocníc atď. Vo fáze učenia sa stroja sa poskytuje veľké množstvo údajov, pretože so zvyšujúcim sa počtom údajov sa tieto údaje prispôsobujú poskytuje požadované výsledky. Tieto výstupné údaje sa môžu použiť na analýzu alebo sa môžu vložiť ako vstup do iných aplikácií alebo systémov strojového učenia, pre ktoré bude slúžiť ako zárodok.

3. Modelový tréning

Táto fáza sa zaoberá vytvorením modelu z údajov, ktoré sú mu poskytnuté. V tomto štádiu sa časť tréningových údajov používa na nájdenie modelových parametrov, ako sú koeficienty polynómu alebo hmotnosti strojového učenia, ktoré pomáhajú minimalizovať chyby pre daný súbor údajov. Zostávajúce údaje sa potom použijú na testovanie modelu. Tieto dva kroky sa vo všeobecnosti opakujú niekoľkokrát, aby sa zlepšil výkon modelu.

4. Výber parametrov

Zahŕňa výber parametrov spojených s tréningom, ktoré sa tiež nazývajú hyperparametre. Tieto parametre riadia efektívnosť vzdelávacieho procesu, a teda od toho závisí výkon modelu. Sú veľmi dôležité pre úspešnú výrobu modelu strojového učenia.

5. Prenos učenia

Pretože pri opakovanom použití modelov strojového učenia v rôznych oblastiach existuje mnoho výhod. Teda, napriek tomu, že model nie je možné priamo prenášať medzi rôznymi doménami, používa sa na poskytnutie východiskového materiálu na začatie prípravy modelu ďalšej etapy. Výrazne tak znižuje čas potrebný na zaškolenie.

6. Verifikácia modelu

Vstupom tejto fázy je vyškolený model vytvorený fázou učenia modelu a výstupom je overený model, ktorý poskytuje dostatočné informácie, ktoré používateľom umožňujú určiť, či je model vhodný na zamýšľané použitie. Táto fáza životného cyklu strojového učenia sa teda týka skutočnosti, že model správne pracuje, keď sa zaobchádza s neviditeľnými vstupmi.

7. Nasadiť model strojového učenia

V tejto fáze životného cyklu strojového učenia sa snažíme integrovať modely strojového učenia do procesov a aplikácií. Konečným cieľom tejto fázy je správna funkčnosť modelu po nasadení. Modely by sa mali rozmiestniť takým spôsobom, aby sa dali používať na odvodenie a aby sa pravidelne aktualizovali.

8. Monitorovanie

Zahŕňa zahrnutie bezpečnostných opatrení na zabezpečenie riadneho fungovania modelu počas jeho životnosti. Aby sa tak stalo, je potrebná riadna správa a aktualizácia.

Výhody životného cyklu strojového učenia

Strojové učenie poskytuje výhody sily, rýchlosti, efektívnosti a inteligencie prostredníctvom učenia bez ich explicitného programovania v aplikácii. Poskytuje príležitosti na zlepšenie výkonu, produktivity a robustnosti.

Záver - Strojový životný cyklus

Systémy strojového učenia sa stávajú dôležitejšie každý deň, pretože množstvo údajov zahrnutých v rôznych aplikáciách sa rýchlo zvyšuje. Technológia strojového učenia je srdcom inteligentných zariadení, domácich spotrebičov a online služieb. Úspech strojového učenia sa môže ďalej rozšíriť na systémy kritické z hľadiska bezpečnosti, správu údajov, vysokovýkonnú výpočtovú techniku, ktorá má veľký potenciál pre aplikačné domény.

Odporúčané články

Toto je sprievodca životným cyklom strojového učenia. Tu diskutujeme o úvodu, poučení z chýb, krokov zapojených do životného cyklu strojového učenia a jeho výhod. Viac informácií nájdete aj v ďalších navrhovaných článkoch -

  1. Spoločnosti umelého spravodajstva
  2. Analýza sady QlikView
  3. Ekosystém internetu vecí
  4. Cassandra Data Modeling

Kategórie: