Acing gagnavísindaviðtalið - 2. hluti

Ég skrifaði um undirbúning fyrir Data Science viðtalið - 1. hluti í síðustu viku.

Þessi grein er eftirfylgni og niðurstaða þessa efnis. Áður hef ég verið að skrifa greinar um AI viðtalspurningar fyrir nokkur helstu fyrirtæki á þessu sviði. Byggt á samhljóða endurgjöfinni á þessar greinar frá lesendum virtist að það væri eðlilegt eftirfylgni með hvernig ætti að undirbúa sig fyrir þessi viðtöl. Til þess að fjalla ítarlega um þetta stóra umræðuefni skipti ég því í hluta. Þetta er hluti 2.

Næstu skref eru dýpra í heim AI og munu þurfa meiri fyrirhöfn og dýptarnám. Þess má geta að næstu skref ættu að vera unnin á nauðsynlegan grundvöll byggða á sérstökum lóðréttum fyrirtækjanna og gagnavísastakkanum.

AI námsstakkur

Skref 1–4: Skref til að fá AI viðtalið - 1. hluti

5. Líkur - aðhvarfslíkön (tölfræði - 2 dagar):

Líkur eru líkurnar á því að atburður muni eiga sér stað. Líkur á að einhver muni kaupa vöruna á netinu, smelltu á hlekkinn eða nota eiginleika. Öll vandamálin sem AI getur leyst, það mun alltaf vera með einhverjar grunnlíkur. Það er mjög grundvöllur rökfræði sem þarf til að byggja reiknirit sem neyta gagna.

Stór hluti af þessu sviði er að undirbúa mismunandi gerðir til að passa við gögnin eða álykta frá þeim. Línanleg aðhvarf, aðgerðaleg aðhvarf, stighneigð eru nokkrar af fyrirmyndunum. Þessar gerðir eru kenndar í flestum tölvunarfræði / stærðfræðibrautum. Þetta eru mjög mikilvæg þar sem val á líkani hjálpar þér að spá hvert gögnin þín fara eða hvað gerist næst.

Mikilvæg lesning sem ég myndi nota:

  • Hagnýtar ráðleggingar fyrir stigatengda þjálfun á djúpum arkitektúrum: https: //arxiv.org/abs/1206.5533
  • Tölfræðibók á netinu (Líkindakafli): Líkindadýpi
  • A fljótt að lesa um aðhvarfslíkön: Margfeldi aðhvarfs

6. Grunnatriði í námi véla (tölvumál - 4 dagar):

Vélarnám er notað frá því að spá fyrir um hegðun notenda til sjálfkeyrandi bíla og allt þar á milli. Gatnamót ódýrar reikniaðgerðar ásamt ódýru gagnageymslu hafa skilað sér í uppsveiflu á þessu sviði. Það er víðfeðmt svið í sjálfu sér og það krefst djúps kafa miðað við tilhneigingu og getu einstaklinga. Grunnatriði ættu að innihalda Tensorflow (eftir Google), Scikit læra hver eru API sem eru byggð á Python sérstaklega hönnuð fyrir AI / ML vandamál.

Mikilvæg lesning til undirbúnings:

  • Reiknirit fyrir vélanám (Listi yfir mikilvægar reiknirit): ML Reiknirit
  • Bakslag (Backdrop Technique in ML): Understanding Backdrop eftir Andrej Karpathy
  • Námsleiðbeiningar fyrir TensorFlow: Tensorflow námskeið

7. Háþróaður ML (Computing - 3 dagar)

Advanced ML inniheldur ýmsar reiknirit og tækni til að takast á við flókin vandamál í gögnum. Tímaröðargögn geta verið flókin til að passa við hefðbundna ML gerð. Þess vegna eru LSTM - langtímaminni netkerfi notuð til að takast á við þetta mál.

Mikilvæg lesning til undirbúnings:

  • LSTM (Auðveldasta leiðin til að skilja LSTM): Að skilja LSTM
  • Raunverulegt Kaggle dæmi fyrir Time Series: Vélanám til tímaröðagreiningar
  • Háþróaður ML (Háskóli Brussel kynning): Vélnámsaðferðir fyrir tímaröð spá

8. Raunverulegur / ómótaður gagnavinnsla (tölvuvinnsla - 3 dagar)

Djúpt námstækni Google með talþekkingu er vel þekkt. Þeir hafa notað endurkomin tauganet (RNNs) til að ná því markmiði. Símkerfið hefur ekki nægar upplýsingar til að halda áfram þar sem gögnin eru ómótað og þess vegna höldum við upplýsingar um röð stafa eða gagna og gefum þeim netið. Þessi tegund af RNN eru hentugur fyrir talþekking. Þetta er líka gríðarlegt rannsóknasvið og breidd og dýpt er háð einstaklingnum og fyrirtækinu sem hann er í viðtali við.

Mikilvæg lesning til undirbúnings:

  • Hagnýt leiðarvísir fyrir notkun RNN: Tímaröð spá sem notar RNN
  • Að skilja afturútbreiðslutækni: Stanford's Back propagation Class

Gagnasett fyrir AI / ML / DS rannsóknir: Alhliða listi

Þegar þú hefur náð þessu langt er hægt að nota hlekkinn hér að ofan til að neyta gagna og kynnast stærð og tegund vinnu, gera gagnfræðingar. Hendur á hagnýtri þekkingu fer aldrei í framkvæmd.

9. Djúpt nám - taugakerfi (tölvunetning - 3 dagar)

Deep Learning skarast við ML á margan hátt. Það felur í sér hugtök eins og GANs (Generative Adversarial Networks) og hálfstýrða nám. CNNs eða samtengd taugakerfi eru notuð til myndgreiningar og flokkunar. Þetta svæði hefur víðtæk áhrif í núverandi tækni vistkerfi. Það fer eftir fyrirtækinu og notkun þess getur verið breytileg frá myndbandsmyndun til myndaflokkunar. Þess vegna ætti svæðið að vera reiðubúið að hafa í huga hvers konar spurningar gætu komið upp, allt eftir fyrirtækinu.

Mikilvæg lesning sem ég myndi nota:

  • Samskipta taugakerfi: CS-231 (Stanford Class Notes)
  • Deep Learning (Bók): http://neuralnetworksanddeeplearning.com/
  • Ítarleg djúpnám (bók): https://www.deeplearningbook.org/

Þetta lýkur undirbúningi AI / ML / DS viðtals. Undirbúningurinn er breytilegur eftir því hvaðan einstaklingurinn nálgast sviðið frá. Undirbúningur tími fyrir vísindamenn mun vera frá gagnaverkfræðingum til venjulegra tölvunarfræðinga. Undirbúningur ætti að taka u.þ.b. 20–22 daga, allt eftir núverandi þekkingu viðkomandi, tímaþröng og sértækar kröfur fyrirtækisins.

Undirbúningur fyrir AI viðtal - 1. hluti: Skref til að ná AI viðtalinu - 1. hluti

Gerast áskrifandi að fréttabréfinu okkar um Acing AI, ég lofa að senda ekki ruslpóst og ÓKEYPIS þess!

Takk fyrir að lesa! Ef þú hafðir gaman af því skaltu prófa hversu oft þú getur slegið á 5 sekúndum. Það er frábært hjartalínurit fyrir fingurna OG mun hjálpa öðru fólki að sjá söguna.