Dakle, ne bi trebalo imati nikakvu razliku hoćete li promiješati ili ne podatke testa ili validacije (osim ako ne računate neku metriku koja ovisi o redoslijedu uzoraka), s obzirom na to da nećete računati nikakav gradijent, već samo gubitak ili neku metriku/mjeru kao što je točnost, koja nije osjetljiva na redoslijed…
Zašto bi se podaci trebali mijenjati kada se koristi unakrsna provjera valjanosti?
to pomaže brzom približavanju treninga . spriječava bilo kakvu pristranost tijekom treninga. onemogućuje modelu da nauči redoslijed treninga.
Mogu li nasumično mijenjati set za provjeru valjanosti?
A model se prvo trenira na A i B zajedno kao skup za obuku, a evaluira se na skupu za provjeru valjanosti C. … Unakrsna provjera radi samo u istim slučajevima u kojima možete nasumično miješati svoje podatke kako biste odabrali skup za provjeru valjanosti.
Za što se koristi miješanje podataka?
Promjena podataka. Jednostavno rečeno, tehnike miješanja imaju za cilj miješanje podataka i opcionalno mogu zadržati logičke odnose između stupaca. Nasumično miješa podatke iz skupa podataka unutar atributa (npr. stupca u čistom ravnom formatu) ili skupa atributa (npr. skupa stupaca).
Je li poredak podataka važan u strojnom učenju?
Je li redoslijed podataka za obuku bitan pri obučavanju neuronskih mreža? - Quora. Iznimno je važno promiješati podatke o obuci kako ne biste dobili cijele mini serije primjera s visokom korelacijom. Sve dokpodaci su izmiješani, sve bi trebalo raditi OK.