Sisällysluettelo:

Miksi pudota ensin hanki tutteja?
Miksi pudota ensin hanki tutteja?
Anonim

1 Vastaus. drop_first=True on tärkeä käyttää, koska se auttaa vähentämään ylimääräistä saraketta, joka syntyy valemuuttujan luomisen aikana. Näin ollen se vähentää valemuuttujien välille luotuja korrelaatioita.

Miksi pudotamme ensin get dummyt?

Ensimmäisen kategorisen muuttujan pudottaminen on mahdollista koska jos joka toinen valesarake on 0, tämä tarkoittaa, että ensimmäinen arvosi olisi ollut 1. Mitä poistat redundanssissa, saat hämmennys.

Mitä PD get dumit tekevät?

get_dummies käytetään tietojen käsittelyyn. Se muuntaa kategoriset tiedot vale- tai indikaattorimuuttujiksi.

Miksi käytämme Get_dummiesia Pythonissa?

Get_dummies-funktiota käytetään kategorisen muuttujan muuntamiseen vale-/indikaattorimuuttujiksi. Tiedot, joista saadaan nuken indikaattorit. Merkkijono DataFrame-sarakkeiden nimien liittämiseen.

Mitä eroa on OneHotEncoderilla ja Get_dummiesilla?

OneHotEncoder on sklearn-esikäsittelytoiminto. Toisin kuin get_dummies, OHE ei lisää muuttujia tietokehykseesi Se luo valemuuttujia muuntamalla X:n, ja kaikki nuket tallennetaan X:ään. Voit myös määrittää, mitkä sarakkeet haluat luoda tukkeja. kun sovit X by OHE.

Suositeltava: