# 2: Það sem þú þarft að vita um reiknirit í vélanámi og hvers vegna þér ætti að vera sama

Þetta er hluti 2 af 6 hluta námskeiðinu, skref-fyrir-skref PM Guide to Building Machine Learning Based Products.

Við ræddum áður um hvaða viðskiptaáhrif ML getur haft. Nú skulum við skoða alla tæknilega hugtök sem þú þarft að vita til að vinna með gagnageymsluteymi og hjálpa þeim að skapa mestu áhrifin fyrir fyrirtækið þitt (eða að minnsta kosti hljóma eins og þú vitir hvað þeir eru að tala um).

Reiknirit, líkön og gögn

Á hugmyndarstigi byggjum við vél sem gefin ákveðin framleiðsla mun framleiða ákveðna afköst sem óskað er með því að finna mynstur í gögnum og læra af því.

Mjög algengt mál er að vélin byrjar með því að skoða tiltekið mengi aðföng og sett af framleiðsla sem samsvarar þeim aðföngum. Það auðkennir mynstur á milli þeirra og býr til safn flókinna reglna sem það getur síðan átt við um nýjar aðföng sem það hefur ekki séð áður og skilað tilætluðum framleiðsla. Til dæmis miðað við fermetra, heimilisfang og fjölda herbergja (inntakið) erum við að leita að spá fyrir um söluverð á heimilinu (framleiðslan). Segjum að við höfum gögn um fermetra myndefni, heimilisfang og fjölda herbergja í 10.000 húsum, svo og söluverð þeirra. Vélin mun "þjálfa" sig á gögnunum - þ.e. greina munstur sem ákvarðar hvernig fermetra myndefni, heimilisfang og fjöldi herbergja hefur áhrif á verð íbúðar, svo að ef við gefum honum þessi 3 inntak fyrir hús sem það hefur ekki séð áður, þá getur spáð fyrir um það verð hússins.

Hlutverk gagnafræðingsins er að finna bestu vélina sem hægt er að nota miðað við aðföng og væntanleg framleiðsla. Hún hefur mörg sniðmát - kallað reiknirit - fyrir vélar. Vélarnar sem hún framleiðir úr þessum sniðmátum til að leysa sérstakt vandamál kallast módel. Sniðmát hefur mismunandi valkosti og stillingar sem hún getur fínstillt til að framleiða mismunandi gerðir úr sama sniðmáti. Hún getur notað mismunandi sniðmát og / eða fínstillt stillingar fyrir sama sniðmát til að búa til mörg líkön sem hún getur prófað til að sjá hver gefur bestan árangur.

Athugið að framleiðsla líkansins er rétt / gagnleg til ákvarðanatöku að einhverju leyti. Líkön eru ekki 100% rétt, en eru frekar „bestu giskanir“ miðað við gagnamagnið sem líkanið hefur séð. Því fleiri gögn sem líkanið hefur séð, þeim mun líklegra er að það gefi gagnleg framleiðsla.

Sætið af þekktum aðföngum og framleiðslum sem gagnafræðingurinn notar til að „þjálfa“ vélina - þ.e. láta líkanið greina munstur í gögnunum og búa til reglur - er „þjálfunarsettið“. Þessi gögn eru notuð með einu eða fleiri „sniðmátum“ til að búa til eitt eða fleiri gerðir sem vísindamennirnir telja að geti unnið til að leysa vandamálið. Mundu að jafnvel þó að hún notaði aðeins eitt „sniðmát“ (reiknirit), þá getur hún fínstillt nokkra möguleika til að búa til margar gerðir úr sama sniðmát með mismunandi stillingum, svo hún endar líklega með nokkrum gerðum.

Eftir að hún á nokkrar af þessum „þjálfuðu“ gerðum verður hún að athuga hversu vel þau vinna og hver vinnur best. Hún gerir það með því að nota ferskt gagnasafn sem kallast „staðfestingarsettið“. Hún keyrir líkönin á aðföngum til að staðfesta stillingu til að sjá hver gefur niðurstöður sem eru næst útgangsgildissamningnum. Í dæminu okkar - hvaða líkan mun spá fyrir um íbúðaverð sem er næst raunverulegu verði sem heimilið var selt fyrir. Hún þarfnast fersks gagna á þessu stigi vegna þess að líkönin voru búin til miðað við frammistöðu sína með æfingasettinu, svo þau eru hlutdræg að vinna vel í þeim leikhluta og munu ekki gefa sannan lestur.

Þegar hún staðfesti hvaða líkan skilar bestum árangri og valdi vinningshafann, þarf gagnfræðingurinn okkar að ákvarða raunverulegan árangur þess líkans, þ.e. hversu góð besta líkan hún gæti framleitt í raun og veru við lausn vandans. Aftur, hún þarf ferskt gagnasett vegna þess að líkanið klárlega stendur sig vel á þjálfunar- og löggildingarsettunum - þannig var það valið! Lokagagnasafnið er kallað „prófasettið“. Í dæminu okkar mun hún athuga hversu nálægt húsnæðisverði sem spáð er fyrir aðföng prufusettanna er við prufasett raunverð heima. Við munum fjalla nánar um mæling á frammistöðu síðar.

Tegundir „náms“

Hvers konar reiknirit þú getur beitt til að leysa vélanám vandamál veltur mjög á gögnum sem þú hefur. Lykilflokkun á námsgrunni er byggð á gögnum sem krafist er til að smíða líkön sem nota þau: Hvort gögnin þurfa að innihalda bæði aðföng og útgang eða bara aðföng, hversu mörg gagnapunkta er krafist og hvenær gögnunum er safnað. Það felur í sér 4 meginflokka: Nám undir umsjón, nám án eftirlits, nám sem er undir eftirliti og styrkt nám.

Umsjón með námi

Málið sem við ræddum ítarlega í fyrri hlutanum lýsti því sem við köllum „nám undir eftirliti“. Þetta er tegund náms þar sem reiknirit þarf að sjá mikið af merktum gögnum dæmum - gögn sem samanstendur af bæði aðföngum og samsvarandi framleiðsla til að vinna. Hinn „merkti“ hluti vísar til þess að merkja aðföng með útkomunni sem líkanið er að reyna að spá fyrir um, í dæmi okkar um íbúðaverð.

Umsjón með námslógrímum sjá merktu gögnin (aka „jarðvegsgögn“), læra af þeim og gera spár byggðar á þessum dæmum. Þeir þurfa mikið af merktum gögnum fyrirfram: Þó að fjöldinn sé háð notkunartilfellinu eru hundruð gagnapunkta lágmarkskostnaður til að komast að einhverju gagnlega.

Tvö klassísk vandamál sem eru leyst með námi undir eftirliti eru:

  • Aðhvarf. Að álykta um gildi óþekktra breytu byggða á öðrum gögnum sem hún telur ástæðu til hefði áhrif á þá breytu. Tvö algeng notkun er spá í tímaspá - td fyrra dæmi okkar um að spá fyrir um gildi íbúðar út frá breytum eins og staðsetningu og fermetra myndum og spá um framtíðargildi - td spá fyrir um gildi heima á ári héðan í frá miðað við sögulegt og núverandi gildi heima fyrir gögn. Aðhvarf er tölfræðileg aðferð sem ákvarðar sambandið á milli óháðu breytanna (gögnin sem þú ert þegar með) og háðra breytu sem gildi sem þú ert að leita að spá í).
  • Flokkun. Að bera kennsl á hvaða flokk eining tilheyrir úr tilteknu mengi flokka. Þetta gæti verið tvöfaldur flokkun - td að ákvarða hvort staða muni fara í veiru (já / nei) og flokks flokkun - td merkja vöru myndir með viðeigandi flokknum sem varan tilheyrir (af mögulega hundruðum flokka).

Nám án eftirlits

Við nám án eftirlits reynir reikniritið að greina munstur í gögnunum án þess að þurfa að merkja gagnasettið með tilætluðum árangri. Gögnin eru „ómerkt“ - þau eru „bara“ án þess að nein merking sé fest á þau. Nokkur sígild vandamál, sem eru leyst með ómönnuðum námsaðferðum, eru:

  • Þyrping. Miðað við ákveðin líkindi viðmiðanir, finndu hvaða hlutir eru líkari hver öðrum. Eitt svæði þar sem þyrping er notuð er texti - íhugaðu leitarniðurstöður sem skila mörgum skjölum sem eru mjög svipuð. Nota má þyrpingu til að flokka þau saman og auðvelda notandanum að bera kennsl á skýrustu skjölin.
  • Félag. Flokkaðu hluti í fötu byggða á einhverju sambandi, þannig að nærvera eins hlutar í fötu spáir fyrir um nærveru annars. Sem dæmi má nefna „fólkið sem keypti… keypti líka…“ meðmælavandann: Ef greining á fjölda innkaup kerra leiðir í ljós að tilvist vara X í innkaupakörfu er líkleg til að gefa til kynna að vara Y verði einnig í innkaupakörfunni, þú getur strax mælt með vöru Y fyrir alla sem setja vöru X í körfuna sína.
  • Greining á frávikum. Að bera kennsl á óvænt mynstur í gögnum sem þarf að flagga og meðhöndla. Venjuleg forrit eru svik uppgötvun og eftirlit með heilsu fyrir flókin kerfi. (Athugið: Til eru greiningaraðferðir undir eftirliti en notkun óeftirlitsaðferða er algeng þar sem samkvæmt skilgreiningu er nokkuð erfitt að afla merktra gagna fyrir frávik og það er forsenda þess að nota tækni undir eftirliti.)

Hálfstýrt nám

Þetta er blendingur á milli námsins undir eftirliti og án eftirlits þar sem reikniritið krefst nokkurra þjálfunargagna, en miklu minna en þegar um er að ræða nám undir eftirliti (hugsanlega stærðargráðu minni). Reiknirit geta verið framlengingar á aðferðum sem notaðar eru annað hvort í námi undir eftirliti og án eftirlits - flokkun, aðhvarf, þyrping, fráviksgreining o.fl.

Styrkingarnám

Hér byrjar reikniritið með takmörkuðu safni gagna og lærir eftir því sem það fær meiri endurgjöf um spár sínar með tímanum.

Eins og þú sérð, til viðbótar við þá tegund vandamála sem þú ert að reyna að leysa, hefur gagnamagnið sem þú hefur áhrif á þær tegundir námsaðferða sem þú getur notað. Þetta á einnig við á hinn veginn - námsaðferðin sem þú þarft að nota getur krafist þess að þú fáir meiri gögn en þú hefur til að leysa vandamál þitt á áhrifaríkan hátt. Við munum ræða það síðar.

Önnur algeng „Buzzwords“ sem vert er að vita

Það eru nokkur önnur hugtök sem þú munt oft lenda í þegar þú vinnur meira í rýminu. Það er mikilvægt að skilja samband þeirra (eða skort á því) við flokkana sem við ræddum um.

Djúpt nám er rétthyrnt við ofangreindar skilgreiningar. Það er einfaldlega beiting ákveðinnar tegundar kerfis til að leysa námsvandamál - hægt væri að hafa eftirlit með lausninni, hafa eftirlit með osfrv.

An Artificial Neural Network (ANN) er námskerfi sem reynir að líkja eftir því hvernig heilinn okkar virkar - í gegnum net „taugafrumna“ sem eru skipulagðir í lögum. Taugakerfi hefur að minnsta kosti inntakslag - mengi taugafrumna sem gögn eru tekin inn í netið, framleiðsla lag - taugafrumurnar sem árangurinn er miðlaður út og eitt eða fleiri lög þar á milli, kallað „falin lög“. , sem eru lögin sem vinna tölvunarvinnuna. Djúpt nám er einfaldlega notkun taugakerfisneta með fleiri en einu huldu lagi til að ná námsverkefni. Ef þú notar einhvern tímann slík net - til hamingju, þá geturðu með réttu kastað í kring the buzzword líka!

Aðferðir samsveita eða nám í ensemble er notkun margra módela til að fá niðurstöðu sem er betri en það sem hvert líkan gæti náð fyrir sig. Líkönin gætu verið byggð á mismunandi reikniritum eða á sömu reiknirit með mismunandi breytum. Hugmyndin er sú að í stað þess að hafa eitt líkan sem tekur inntak og býr til afköst - segðu spá af einhverju tagi, þá hefurðu sett af gerðum sem hver og einn býr til spá og eitthvert ferli til að vega og meta mismunandi niðurstöður og ákveða hver framleiðsla samanlagður hópur ætti að vera. Ensembleaðferðir eru oft notaðar í námi undir eftirliti (þær eru mjög gagnlegar í spávandamálum) en geta einnig átt við í námi án eftirlits. Lið þitt á gagnavísindum mun líklega prófa slíkar aðferðir og beita þeim þegar við á.

Náttúruleg málvinnsla (NLP) er svið tölvunarfræði sem fjallar um að skilja tungumál með vélum. Ekki allar tegundir NLP nota vélinám. Til dæmis, ef við myndum „merkisský“ - sjónræn framsetning á þeim fjölda skipta sem orð birtast í texta - er ekkert nám í för með sér. Ítarlegri greining og skilningur á máli og texta þarf oft ML. Nokkur dæmi:

  • Leitarorð kynslóð. Að skilja efni texta og búa sjálfkrafa til lykilorð fyrir það
  • Mismunun tungumáls. Að ákvarða viðeigandi merkingu út frá mörgum mögulegum túlkunum á orði eða setningu (þetta er frábær skýring með dæmum)
  • Tilfinningagreining. Að skilja hvar á kvarðanum neikvæða til jákvæðu liggur viðhorfið sem gefið er upp í texta
  • Nefnt útdrátt eininga. Að bera kennsl á fyrirtæki, fólk, staði, vörumerki osfrv. Í texta; þetta er sérstaklega erfitt þegar nöfnin eru ekki áberandi (td fyrirtækinu „Microsoft“ er auðveldara að bera kennsl á en fyrirtækið „Target“, sem er líka orð á ensku)

NLP er ekki aðeins notað fyrir tungumálamiðaðar umsóknir ML eins og spjallbóta. Það er einnig notað mikið til að undirbúa og forvinna gögn áður en það getur verið gagnlegt inntak í mörg ML gerð. Meira um það síðar.

Vinsamlegast athugið: Skilgreiningarnar hér að ofan eru ætlaðar til að koma meginhugmyndunum á framfæri og vera praktískar; fyrir nákvæma vísindalega skilgreiningu vinsamlegast vísa til annarra heimilda.

Hvernig vandamálið hefur áhrif á lausnina (og nokkur fleiri lykil ML hugtök)

Markmiðið sem þú ert að reyna að ná með ML mun fyrirmæli margar ákvarðanir í eftirfylgni. Það er mikilvægt að skilja nokkur grundvallarhugtök ML og áhrif þeirra á viðskiptamarkmið þín til að tryggja að gögn vísindateymisins geti framkallað réttu lausnina fyrir fyrirtækið þitt.

Reiknirit val

Lítil breyting á vandamálaskilgreiningunni gæti þýtt að allt annar reiknirit sé nauðsynleg til að leysa það, eða að minnsta kosti verður smíðað annað líkan með mismunandi gagnaflutningi. Stefnumótasíða sem leitar að því að bera kennsl á tegundir mynda sem virka vel fyrir notendur geta notað ónáða námstækni eins og þyrping til að bera kennsl á algeng þemu sem virka, en ef vandamálið er að mæla með mögulegum dagsetningum fyrir ákveðinn einstakling, þá getur vefurinn notað nám undir eftirliti byggð á aðföngum sérstaklega fyrir hvern og einn notanda, svo sem myndir sem þeir hafa þegar skoðað.

Lögun val

ML líkön bera kennsl á mynstur í gögnum. Gögnin sem þú færð í líkönin eru skipulögð í eiginleika (einnig kallaðir breytur eða eiginleikar): Þetta eru viðeigandi, að mestu leyti óháðir gagnagreinar sem lýsa einhverjum þætti fyrirbæra sem þú ert að reyna að spá fyrir um eða bera kennsl á.

Taktu fyrra dæmi um fyrirtæki sem er að leita að forgangsröðun útlána til umsækjenda. Ef við skilgreinum vandamálið sem „forgangsraða viðskiptavini út frá líkum þeirra á að umbreyta“, munum við fela í sér eiginleika eins og svarhlutfall svipaðra viðskiptavina við ýmsar tegundir ná lengra. Ef við skilgreinum vandamálið sem „forgangsraða viðskiptavini sem líklegastir eru til að endurgreiða lán sín“ gætum við ekki tekið með þá eiginleika vegna þess að þeir skipta ekki máli við mat á líkum viðskiptavinarins á að greiða.

Markmið Aðgerðaval

Hlutlæga aðgerðin er markmiðið sem þú ert að fínstilla fyrir eða niðurstaðan sem líkanið er að reyna að spá fyrir um. Til dæmis, ef þú ert að reyna að stinga upp á vörum sem notandi gæti haft áhuga á, getur framleiðsla líkansins verið líkurnar á því að notandi muni smella á vöruna ef hann sá hana. Það geta einnig verið líkurnar á því að notandinn kaupi vöruna. Val á hlutlægri aðgerð fer fyrst og fremst eftir viðskiptamarkmiði þínu - í þessu dæmi hefur þú meiri áhuga á þátttöku notenda, en þá getur hlutverk þitt verið smellt eða dvalartími eða í beinum tekjum, en þá mun hlutverk þitt vera innkaup? Önnur lykilatriðið er aðgengi gagna: Til að reikniritið geti lært, þá verðurðu að gefa honum mörg gagnapunkta sem eru „merkt“ sem jákvæð (vörurnar sem notandi sá og smellti á) eða neikvæðar (vörurnar sem notandi sá og smellti ekki á). Þú ert líklega með stærðargráðu fleiri gagnapunkta af vörum sem smellt var á (eða ekki smellt á) á móti vörum sem voru keyptar.

Lýsanleiki og túlkun

Framleiðsla ML módel er oft tala - líkur, spá um líkurnar á því að eitthvað muni gerast eða er satt. Í dæmi um tillögur um vörur er hægt að úthluta vörum á vefnum líkur á að einstaklingur noti smelli á þær og vörurnar sem eru með mestar líkur verða sýndar notandanum. En hvernig veistu að það virkar? Í þessu tilfelli er tiltölulega auðvelt að sannreyna að reikniritið virkar - þú getur líklega keyrt stutt próf og séð. En hvað ef aðilarnir sem þú ert að raða til eru mögulegir starfsmenn og fyrirmynd þín prófar líkurnar á því að þeir séu góðir frambjóðendur fyrir fyrirtæki? Mun notandi (segja ráðningastjóri) bara taka orð þín fyrir það, eða verður hann að skilja hvers vegna reikniritið raðar manni A á undan persónu B?

Í mörgum tilvikum hefurðu nokkrar skýringar á því. Hins vegar eru margir ML reiknirit svartur kassi: Þú setur inn marga eiginleika og færð líkan sem erfitt er að ómögulegt að skýra. Mönsturnar sem vélin finnur í gögnum eru oft svo umvafin að manneskja mun ekki geta gripið þau jafnvel þótt auðvelt væri að koma þeim í orð.

Í síðari hlutum munum við sjá að þörfin fyrir skýringu - að hve miklu leyti notandi þarf til að geta skilið hvernig árangurinn náðist og túlkunarhæfni - að hvaða marki notandinn þarf að draga ákveðnar ályktanir út frá niðurstöðunum, er afgerandi íhugun á nálgun þinni við líkanagerð, val á eiginleikum og kynningu á árangri.

Fyrirmynd og árangursmæling Mál gildra sem ætti að passa upp á

Gagnafræðingarnir þínir munu takast á við nokkur algeng vandamál varðandi gagnavinnslu og líkanagerð, en til þess að eiga afkastamikil samtöl við þá er gagnlegt fyrir forsætisráðherrana að skilja nokkur algeng gildra. Það er ekki tæmandi listi, en inniheldur nokkur algengari mál sem koma upp.

Overfitting

Líkan er sagt „of fitt“ þegar það fylgir gögnunum svo náið að það endar með því að lýsa of miklum hávaða en ekki raunverulegu undirliggjandi sambandi innan gagna (sjá mynd). Í grófum dráttum, ef nákvæmni líkansins í gögnum sem þú þjálfar það með (gögnin sem líkanið „lærir af“) eru verulega betri en nákvæmni þess varðandi gögnin sem þú staðfestir og prófar þau, þá gætir þú átt við of mikið að passa .

Overfitting líkingu

Nákvæmni, muna og viðskipti milli þeirra

Það eru tvö hugtök sem eru mjög ruglingsleg í fyrsta skipti sem þú heyrir þau, en það er mikilvægt að skilja að fullu þar sem þau hafa skýrar afleiðingar í viðskiptum.

Nákvæmni flokkunar (og aðrar algengar ML-aðferðir eins og skjalasöfnun) er oft mældar með tveimur lykilmælingum: Nákvæmni og innköllun. Nákvæmni mælir hlutdeild sannra jákvæðra spár úr öllum jákvæðum spám sem reiknirit myndaði, þ.e.% jákvæðra spár sem eru réttar. Ef nákvæmnin er X%, eru X% af jákvæðum spám reikniritsins sanna jákvæður og (100-X)% eru rangar jákvæður. Með öðrum orðum, því meiri nákvæmni því minni rangar jákvæðni muntu hafa.

Muna er hlutur jákvæðra spár úr öllum raunverulegum jákvæðum í gögnum - þ.e. hvaða% af raunverulegu jákvæðunum í gögnum sem reiknirit þitt tókst að bera kennsl á sem jákvæður. Ef innköllunin er X%, voru X% sannra jákvæða í gögnunum auðkennd með reikniritinu sem jákvæðir, en (100-X)% voru greindir sem (rangar) neikvæður. Með öðrum orðum, því hærra sem muna, því minna rangar neikvæðar upplýsingar.

Það er alltaf skipt milli nákvæmni og innköllunar. Ef þú vilt ekki hafa neinar rangar jákvæður - þ.e. þú þarft meiri nákvæmni, mun reikniritið hafa fleiri fölsk neikvæðni, þ.e. minni muna, vegna þess að það myndi „kjósa“ að merkja eitthvað sem neikvætt en að ranglega merkja það sem jákvætt, og og öfugt. Þessi viðskipti eru viðskiptaákvörðun. Taktu dæmi um lánsumsóknina: Viltu frekar spila það á öruggan hátt og taka aðeins við umsækjendum sem þú ert mjög viss um að eiga skilið að verða samþykkt og auka þannig líkurnar á því að hafna nokkrum góðum viðskiptavinum (meiri nákvæmni, minni innköllun = minni rangar jákvæðni, rangari neikvæðni) , eða þiggja fleiri umsækjendur um lán sem ætti að hafna en ekki hætta á að missa af góðum viðskiptavinum (meiri muna en minni nákvæmni = minni rangar neikvæðingar, rangari jákvæðni)? Þó að þú getir á einfaldan hátt sagt að þetta sé hagræðingarvandamál, þá eru oft þættir sem þarf að íhuga sem eru ekki auðvelt að mæla eins og viðhorf viðskiptavina (td ósanngjarnir hafnaðir viðskiptavinir verða reiðir og raddir), tegundaráhætta (td orðspor þitt sem sölumaður ræðst af lágt vanskilalán), lagaskyldur o.s.frv., sem gerir þetta mjög að viðskiptum, en ekki gagnavísi, ákvörðun.

Oft villandi líkan af nákvæmni líkans

Líkan nákvæmni ein og sér er ekki góður mælikvarði fyrir neina gerð. Ímyndaðu þér sjúkdóm með tíðni 0,1% í íbúum. Líkan sem segir að enginn sjúklingur sé með sjúkdóminn óháð inntaki er 99,9% nákvæmur, en alveg gagnslaus. Það er mikilvægt að íhuga alltaf bæði nákvæmni og rifja upp og halda jafnvægi á þeim eftir viðskiptaþörf. Nákvæmni er góð mælikvarði þegar dreifing mögulegra niðurstaðna er nokkuð jöfn og mikilvægi rangra jákvæða og fölskra neikvæða snýst einnig um jafnt, sem sjaldan er raunin.

Að meðaltali tölfræði og ójafnvægi þjálfunargögn

Þegar þú ert að fást við marga hluti sem líkan þarf að takast á við þarftu að skoða árangurstölur fyrir alla hluti (eða að lágmarki þær mikilvægu) sérstaklega. Taktu til dæmis flokkunarlíkan sem flokkar myndir í einn af hópum flokka eftir tegund dýra á myndinni. Heildar nákvæmni / innköllunartölur líkansins endurspegla kannski ekki aðstæður þar sem sumir flokkar hafa mikla nákvæmni, á meðan aðrir hafa mjög litla nákvæmni. Þetta gerist venjulega þegar þú ert ójafnvægi í þjálfunargögnum þínum - segðu að þú hafir 1.000 merktar myndir af köttum og hundum og aðeins 10 myndir af berjum. Almenn nákvæmni þín kann að vera mjög mikil þar sem flestar myndir af köttum og hundum verða flokkaðar rétt, meðan allir birnir eru ranglega greindir vegna þess að líkanið hefur lítil sem engin gögn sem tengjast þeim. Ef þessir sjaldgæfari flokkar eru mikilvægir fyrir fyrirtæki þitt gætir þú þurft samstillt átak til að fá þjálfunargögn fyrir þá til að líkanið þitt gangi vel á milli mála.

Allt í lagi - þetta var frekar langt, en vonandi hefur þú nú góðan skilning á öllum tæknilegu grundvallaratriðum. Næst munum við fara í gegnum ítarlegt, skref-fyrir-skref ferli við að þróa líkan frá hugmyndum til að ráðast í framleiðslu.

Ef þér fyndist þessi færsla áhugaverð, myndirðu vinsamlegast smella á græna hjartað hér að neðan til að láta mig vita, eða deila með einhverjum öðrum sem gæti fundið það gagnlegt? Það myndi gera daginn minn algerlega!