Del curso: Python para data scientist avanzado
Accede al curso completo hoy mismo
Únete hoy para acceder a más de 24.700 cursos impartidos por expertos del sector.
Fundamentos del Principal Component Analysis (PCA) - Tutorial de Python
Del curso: Python para data scientist avanzado
Fundamentos del Principal Component Analysis (PCA)
Supongamos que nos encontramos en la situación de que queremos visualizar una base de datos pero tiene más columnas de las que podemos poner en un gráfico, más de dos o tres dimensiones. Si nos encontramos delante de esta situación, "Principal Component Analysis" es la solución o una de las soluciones que nos ofrece Python. El PCA es un método algebraico famosísimo, que básicamente lo que hace es reducir la dimensionalidad de matrices. ¿Qué es lo que implica? Que estas columnas que tenemos aquí, que son seis, las podemos convertir en dos o tres si queremos. Básicamente lo que hace este método es comprimir la variabilidad de las columnas de las que disponemos en menos columnas aplicando una rotación de los ejes. Es muy importante que antes de empezar escalemos los datos. ¿Por qué hacemos esto? Porque al tratarse de varianzas, esta depende de la magnitud de la variable. Si haces este mismo análisis sin escalar, es decir, sin usar este código de aquí, lo que pasará es que las distancias,…
Practica mientras aprendes con los archivos de ejercicios.
Descarga los archivos que el instructor utiliza para enseñar el curso. Sigue las instrucciones y aprende viendo, escuchando y practicando.
Contenido
-
-
-
-
(Bloqueado)
Seleccionar en Machine Learning variables5 min 6 s
-
(Bloqueado)
Selección automatizada de variables en Machine Learning4 min 41 s
-
(Bloqueado)
Selección de parámetros en Machine Learning5 min 8 s
-
(Bloqueado)
Selección automatizada de parámetros en Machine Learning4 min 19 s
-
(Bloqueado)
Fundamentos del Principal Component Analysis (PCA)5 min 15 s
-
(Bloqueado)
Variantes del PCA2 min 52 s
-
(Bloqueado)
Imputación de valores en Machine Learning5 min 53 s
-
(Bloqueado)
-
-
-