Kuidas masinõppe eksperimente süstemaatiliselt planeerida ja käivitada

Kuidas masinõppe eksperimente süstemaatiliselt planeerida ja käivitada

Masinõppekatsed võivad võtta palju aega. Mõnel juhul tunde, päevi ja isegi nädalaid.

See annab teile palju aega mõtlemiseks ja täiendavate eksperimentide kavandamiseks.

Lisaks võib keskmine rakendatud masinõppeprojekt vajada kümneid kuni sadu diskreetseid katseid, et leida andmete ettevalmistamise mudel ja mudeli konfiguratsioon, mis annab hea või suurepärase jõudluse.

Katsete veniv olemus tähendab, et peate hoolikalt kavandama ja haldama korraldatavate katsete järjekorda ja tüüpi.

Peate olema süsteemne.

Selles postituses leiate lihtsa lähenemisviisi masinõppe katsete kavandamiseks ja haldamiseks.

Selle lähenemisviisi abil saate:

  • Jälgige oma projekti kõige olulisemaid küsimusi ja järeldusi.
  • Jälgige, millised katsed olete lõpetanud ja mida soovite läbi viia.
  • Suumige andmete ettevalmistamisel, mudelitel ja mudeli konfiguratsioonidel, mis annavad parima jõudluse.

Sukeldume sisse.

Kuidas masinõppe eksperimente süstemaatiliselt planeerida ja käivitada

Kuidas masinõppe eksperimente süstemaatiliselt planeerida ja käivitada
Foto autor Qfamily, mõned õigused kaitstud.

Segadus sajad katsed

Mulle meeldib üleöö eksperimente teha. Palju katseid.

Seda selleks, et ärgates saaksin tulemusi kontrollida, värskendada oma ideid selle kohta, mis töötab (ja mis mitte) ja käivitada järgmise katsevooru, et siis aega veeta leidude analüüsimiseks.

Ma vihkan aja raiskamist.

Ja ma vihkan käimasolevaid katseid, mis ei viiks mind olemasoleva aja ja ressurssidega lähemale eesmärgile leida kõige osavam mudel.

Kerge on kaduda, kus olete. Eriti pärast seda, kui teil on sadade katsete tulemusi, analüüse ja järeldusi.

Teie katsete halb haldamine võib põhjustada halbu olukordi, kus:

  • Vaatate katseid.
  • Püüate välja pakkuda häid ideid katsetest, mida saaks kohe pärast praeguse paki lõppu teha.
  • Teete katse, mille olete juba varem läbinud.

Sa ei taha kunagi sellises olukorras olla!

Kui olete oma mängu tipus, siis:

  • Teate täpselt, milliseid katseid olete pilguga teinud ja millised olid leiud.
  • Teil on läbi viia pikk loetelu katsetest, mis on järjestatud nende eeldatava tasuvuse järgi.
  • Teil on aega sukelduda tulemuste analüüsi ja mõelda välja uusi ja metsikuid ideid, mida proovida.

Kuid kuidas saaksime püsida sadade katsete tipus?

Kujundage ja korraldage katseid süstemaatiliselt

Üks võimalus, mis aitab mul projekti katsetega süsteemset tööd teha, on arvutustabeli kasutamine.

Hallake tehtud katseid, mis käivad ja mida soovite arvutustabelis käivitada.

See on lihtne ja tõhus.

Lihtne

See on lihtne, kuna mul või kellelgi on sellele juurdepääs kõikjalt ja näha, kus me oleme.

Ma kasutan arvutustabeli majutamiseks teenust Google Docs.

Koodi pole. Märkmikku pole. Pole ühtegi uhket veebirakendust.

Lihtsalt arvutustabel.

Tõhus

See on efektiivne, kuna see sisaldab teavet, mida on vaja katse jälgimiseks ühe rea kohta ja ühe veeru kohta iga teabe kohta.

Tehtud katseid saab kavandatutest eraldada.

Ainult kavandatud katsed on seadistatud ja käivitatud ning nende järjekord tagab, et kõigepealt käivitatakse kõige olulisemad katsed.

Teid üllatab, kui palju selline lihtne lähenemine võib teie aega vabastada ja panna teid oma projekti üle sügavalt mõtlema.

Arvutustabeli näide

Vaatame ühte näidet.

Võime ette kujutada allolevate veergudega arvutustabelit.

Need on vaid näide viimasest projektist, mille kallal töötasin. Soovitan kohandada need oma vajadustele.

  • Allprojekt: Alamprojekt võib olla uuritavate ideede rühm, tehnika, andmete ettevalmistamine ja nii edasi.
  • Kontekst: Kontekst võib olla konkreetne eesmärk, näiteks baasjoone ületamine, häälestamine, diagnostika jne.
  • Seadistamine: Seadistus on katse fikseeritud konfiguratsioon.
  • Nimi: Nimi on kordumatu tunnus, võib-olla ka skripti failinimi.
  • Parameeter: Parameeter on see, mida katses muudetakse või mida vaadatakse.
  • Väärtused: Väärtus on katses uuritava parameetri väärtus või väärtused.
  • Staatus: Olek on katse olek, näiteks kavandatud, käivitatud või tehtud.
  • Oskus: Oskus on North Star'i mõõdik, mis on projekti jaoks väga oluline, näiteks täpsus või viga.
  • Küsimus: Küsimus on motiveeriv küsimus, mida katse püüab lahendada.
  • Leidmine: Leid on katse tulemuse kokkuvõte, vastus küsimusele.

Selle konkreetsuse huvides on allpool ekraanipilt Google Doci arvutustabelist koos nende veerupäiste ja välja mõeldud näitega.

Süstemaatiline katseprotokoll

Süstemaatiline katseprotokoll

Ma ei oska öelda, kui palju aega see lähenemine mind päästis. Ja eelduste arv, et see osutus parimate tulemuste saavutamisel valeks.

Tegelikult olen avastanud, et sügavad õppemeetodid on eelduste ja vaikeväärtuste suhtes sageli üsna vaenulikud. Pidage seda eksperimentide kavandamisel meeles!

Kasutage oma eksperimente maksimaalselt

Allpool on mõned näpunäited, mis aitavad teil selle projekti lihtsast lähenemisest maksimumi võtta.

  • Ajurünnak: Leidke aeg leidude sagedaseks ülevaatamiseks ning nendele vastamiseks uute küsimuste ja katsete loetlemiseks.
  • Väljakutse: Väljakutse eeldused ja vaidlustage varasemad leiud. Mängige teadlast ja kavandage katseid, mis võltsivad teie avastusi või ootusi.
  • AllprojektidKaaluge alamprojektide kasutamist uurimise struktureerimiseks, kus järgite juhtnööre või uurite konkreetseid meetodeid.
  • Eksperimentaalne tellimus: Kasutage reajärjestust prioriteedina, et kõigepealt käivitada kõige olulisemad katsed.
  • Sügavam analüüs: Salvestage tulemuste ja koondatud leidude põhjalikum analüüs teise dokumenti; arvutustabel pole koht.
  • Katse tüübid: Ärge kartke segada erinevaid katsetüüpe, näiteks ruudustikuotsinguid, kohapealseid kontrolle ja mudeli diagnostikat.

Teate, et see lähenemine töötab hästi, kui:

  • Uurite API dokumentatsiooni ja pabereid, et saada rohkem ideid proovitavate asjade kohta.
  • Teil on palju rohkem katseid järjekorras kui ressursse nende käivitamiseks.
  • Mõtlete tõsiselt, kas palgata veel tonni EC2 eksemplare.

Kokkuvõte

Selles postituses avastasite, kuidas saate tõhusalt hallata sadu käivitatud, käimasolevaid katseid ja mida soovite käivitada arvutustabelis.

Avastasite, et lihtne tabel võib teid aidata:

  • Jälgige, milliseid katseid olete teinud ja mida avastanud.
  • Jälgige, milliseid katseid soovite teha ja millistele küsimustele nad vastavad.
  • Suumige oma ennustava modelleerimise probleemi jaoks kõige tõhusamate andmete ettevalmistamise, mudeli ja mudeli konfiguratsiooniga.

Kas teil on selle lähenemise kohta küsimusi? Kas olete ise midagi sarnast teinud?
Andke mulle teada allpool toodud kommentaarides.

Samuti võite olla huvitatud