Trabajando con Archivos
3. Archivos CSV
3.4. Usando pandas
Primero de todo instalamos el módulo de pandas:
Figura 1
Es un paquete que te ayuda a trabajar con datos multidimensionales que son comunes en estadística o econometría. El nombre viene de PANel DAta Set.
Por otro lado, pandas es muy útil para manipular tablas de datos, esto con la estructura de datos que vamos a conocer como data frames.
Los dataframes tiene la particularidad de que diferentes tipos de variables pueden encajar en la misma tabla. Esto a diferencia de un array de que sólo admite un tipo de dato por conjunto de datos (suena a diccionarios o listas de Python)
Por último, pandas está construido sobre numpy lo que lo hace también súper rápido y eficiente.
Consigna
Se tiene un archivo llamado evaluaciones.csv y se quiere procesar para calcular el promedio de los parciales y finalmente mostrar una gráfico de torta con los aprobados ( >=6) y los No aprobados (<6).
Figura 2
Vamos a usa pd para asociar el archivo evaluaciones.csv al objeto df. Luego agregamos una columna mas, llamada promedio con el método .assign completamos todas las líneas de esa columa en cero ( Promedio =0).
Para mas información de panda (https://pandas.pydata.org/) y leer la documentación sobre los métodos. También podemos recurrir a w3schools , que tiene algún ejemplo ( https://www.w3schools.com/python/pandas/ ) .
La salida del script sería:
Vamos a calcular el promedio de las notas y guardarlo en la columna Promedio.