Del curso: Python para data scientist avanzado

Accede al curso completo hoy mismo

Únete hoy para acceder a más de 24.700 cursos impartidos por expertos del sector.

Fundamentos del Principal Component Analysis (PCA)

Fundamentos del Principal Component Analysis (PCA) - Tutorial de Python

Del curso: Python para data scientist avanzado

Fundamentos del Principal Component Analysis (PCA)

Supongamos que nos encontramos en la situación de que queremos visualizar una base de datos pero tiene más columnas de las que podemos poner en un gráfico, más de dos o tres dimensiones. Si nos encontramos delante de esta situación, "Principal Component Analysis" es la solución o una de las soluciones que nos ofrece Python. El PCA es un método algebraico famosísimo, que básicamente lo que hace es reducir la dimensionalidad de matrices. ¿Qué es lo que implica? Que estas columnas que tenemos aquí, que son seis, las podemos convertir en dos o tres si queremos. Básicamente lo que hace este método es comprimir la variabilidad de las columnas de las que disponemos en menos columnas aplicando una rotación de los ejes. Es muy importante que antes de empezar escalemos los datos. ¿Por qué hacemos esto? Porque al tratarse de varianzas, esta depende de la magnitud de la variable. Si haces este mismo análisis sin escalar, es decir, sin usar este código de aquí, lo que pasará es que las distancias,…

Contenido