Što je Holdout set? Ponekad se naziva i "testiranjem" podataka, podskup zadržavanja daje konačnu procjenu izvedbe modela strojnog učenja nakon što je obučen i potvrđen. Skupovi čekanja nikada se ne smiju koristiti za donošenje odluka o tome koje algoritme koristiti ili za poboljšanje ili podešavanje algoritama.
Je li unakrsna provjera bolja od zadržavanja?
Unakrsna provjera je obično poželjna metoda jer daje vašem modelu priliku da trenira na višestrukim podjelama testiranja vlaka. To vam daje bolju indikaciju koliko će vaš model raditi na nevidljivim podacima. Zadržavanje, s druge strane, ovisi o samo jednom podjelu testa vlaka.
Što je pristup zadržavanju?
Holdout metoda je najjednostavnija vrsta metode za procjenu klasifikatora. U ovoj metodi, skup podataka (zbirka podataka ili primjera) je odvojen u dva skupa, nazvana Training set i Test set. Klasifikator obavlja funkciju dodjeljivanja stavki podataka u danoj zbirci ciljnoj kategoriji ili klasi.
Trebam li uvijek raditi unakrsno provjeravanje?
Općenito je unakrsna provjera uvijek potrebna kada trebate odrediti optimalne parametre modela, za logističku regresiju to bi bio C parametar.
Koja je prednost križne provjere K-fold?
ako usporedite test-MSE-ovi su bolji u slučaju k-puta CV-a od LOOCV-a. k-fold CV ili bilo koji CV ili metode ponovnog uzorkovanja nepoboljšati testne pogreške. procjenjuju pogreške testa. u slučaju k-folda, radi bolji posao procjene pogreške od LOOCV.