Portada » Proyectos de análisis de datos para principiantes en 2023

Proyectos de análisis de datos para principiantes en 2023

by Donal Sandro Noblejas Huaman

Hola mi nombre es donal Sandro Noblejas Huamán de Lima Perú 🇵🇪 hoy vengo con otro artículo de  Análisis de Datos y como siempre y en cada uno de ellos completamente solo y me agrada porque se aprende, y como siempre sin empresas, personas, familiares, ni el estado ni ningún tipo de ayuda cuidado con los estafadores solo en mis tiempos libres redactando jejeje, bueno ahí vamos.

20 proyectos de análisis de datos para principiantes que lo ayudarán a adquirir conocimientos básicos y útiles en el procesamiento de datos y que puede utilizar para crear su cartera. 

Estos proyectos cubrirán las habilidades de análisis de datos más demandadas y las herramientas de análisis de datos más utilizadas: Excel, SQL, Python, R, Tableau, Power BI.

1. Panel del centro de llamadas con Excel

En el tutorial Análisis de datos con Excel, aprenderá cómo preprocesar sus datos y cambiarlos a sus tipos de datos preferidos: 

  • aprenda a crear tablas dinámicas y a crear gráficos y mapas basados ​​en ellas;
  • Aprenda a diseñar la estructura y el fondo de su panel e insertar gráficos y mapas en él.
  • Aprenda a utilizar la función de filtro y las segmentaciones para que su panel sea interactivo.

Guía y conjunto de datos:

En el segundo tutorial, aprenderá y practicará el flujo de trabajo de análisis de datos SQL respondiendo varias preguntas comerciales con SQL en Jupyter. Aprenderá cómo leer y utilizar un esquema de base de datos y cómo consultar la base de datos para unir tablas y devolver información específica de ellas.

Desafío: La tienda de música Chinook se está asociando con un sello discográfico. Realice análisis de datos para ayudar a comprender el desempeño de sus vendedores y ayudarlos a decidir si invertir en álbumes o pistas individuales. Ayúdelos a decidir en qué artistas invertir identificando el género más popular y las ventas por país.

Código fuente, instrucciones y base de datos:

En un proyecto anterior, ejecutó consultas SQL en  un cuaderno Jupyter.  https://www.dataquest.io/blog/jupyter-notebook-tutorial/ Los  cuadernos de Jupyter son muy populares para proyectos de ciencia de datos porque le permiten crear y compartir documentos que contienen código, ecuaciones, texto y visualizaciones en un solo lugar. En otros casos, puede trabajar en un entorno de desarrollo integrado (IDE) de SQL, como DB Browser para SQLite y MySQL Workbench.

En este proyecto de análisis de datos, aprenderá cómo ejecutar consultas en su computadora usando el Explorador de bases de datos para el IDE de SQLite. Explorará la base de datos de ventas de automóviles a escala. Escribirá consultas para analizar el rendimiento del producto y desarrollar estrategias de reabastecimiento. Analizará el comportamiento y los hábitos de sus clientes y desarrollará una estrategia de comunicación y marketing personalizada que maximice el LTV y minimice los costos de marketing.

Aquí hay enlaces al código fuente, instrucciones y base de datos de este proyecto:

SQLite es uno de los motores de bases de datos más utilizados en el mundo. Es liviano y no requiere un servidor para funcionar. Estas características lo hacen muy popular para aplicaciones móviles.

SQLite es un motor de base de datos simple que tiene sus limitaciones. Sólo una persona puede realizar cambios en la base de datos a la vez, lo que limita el acceso múltiple. PostgreSQL elimina la limitación de escritura simultánea del motor de base de datos SQLite.

En este proyecto de análisis de datos, aprenderá cómo crear una base de datos para almacenar datos usando PostgreSQL. Comenzará diseñando el esquema y las tablas de la base de datos. Después de esto, aprenderá cómo cargar datos de un archivo CSV en tablas de bases de datos. A continuación, aprenderá cómo establecer privilegios para cada grupo de usuarios, siguiendo el principio de privilegio mínimo. Finalmente, probará la configuración de su base de datos ejecutando y analizando los resultados de las consultas SQL.

Aquí hay enlaces al código fuente, instrucciones y datos de este proyecto:

https://www.kaggle.com/datasets/AnalyzeBoston/crimes-in-boston

5. Análisis de las páginas de Wikipedia.

Hasta ahora has trabajado con Excel y archivos de bases de datos. Existen otros formatos de archivo que pueden almacenar sus datos. Supongamos que sus datos están disponibles en Internet en varias páginas web. Puede extraer el sitio web para obtener sus datos o guardar las páginas web en formato HTML.

En este proyecto aprenderá cómo analizar documentos HTML con datos guardados de páginas de Wikipedia. Aprenderá cómo limpiar sus datos eliminando encabezados, pies de página y marcas superfluas. Al trabajar con la biblioteca BeautifulSoup, aprenderá cómo extraer datos de páginas HTML utilizando etiquetas específicas. Finalmente, aprenderá cómo limpiar y analizar los datos extraídos de cada documento HTML.

Aquí hay enlaces al código fuente y las instrucciones para este proyecto:

El web scraping es el proceso de obtención de datos de páginas web. Esta es una habilidad de minería de datos invaluable que separa a los buenos analistas de datos de los excelentes. Los empleadores estarán seguros de que usted tiene las habilidades necesarias para recopilar los datos necesarios para sus proyectos de Internet.

En este proyecto de minería de datos, aprenderá cómo recopilar datos de varias páginas web. Aprenderá a utilizar consultas y bibliotecas de Selenium para extraer páginas web. A continuación, aprenderá a inspeccionar elementos en una página web, analizar documentos HTML en la biblioteca BeautifulSoup y extraer datos de etiquetas específicas. Cargará los datos en pandas DataFrames y los guardará como archivos CSV para usarlos en su análisis.

Aquí hay enlaces al código fuente y al video tutorial de este proyecto:

Los datos reales y los datos obtenidos de Internet no son puros. Requieren un procesamiento previo para convertirlos a formatos que las bibliotecas de estadísticas, aprendizaje automático y visualización puedan procesar.

Este proyecto es una continuación del proyecto anterior. Aquí trabajará con archivos CSV que contienen datos extraídos de varias páginas web. Al trabajar con la biblioteca pandas, aprenderá cómo eliminar caracteres superfluos de sus datos, manejar valores faltantes, convertir objetos a tipos de datos apropiados, seleccionar subconjuntos de los objetos que necesita de cada DataFrame y fusionarlos. Al final del proyecto, tendrá datos preprocesados ​​listos para el aprendizaje automático y el análisis estadístico.

Aquí hay enlaces al código fuente y al video tutorial de este proyecto:

Después de dominar Excel y SQL, la siguiente herramienta más importante que un analista de datos debe agregar a su caja de herramientas es el conocimiento de un lenguaje de programación. Python y R son los lenguajes de programación más populares para el análisis de datos.

En este proyecto de análisis de datos, utilizará el lenguaje de programación Python para realizar análisis probabilísticos y estadísticos que ayudarán a una empresa de capacitación en línea a encontrar los mejores mercados para anunciar sus cursos de programación.

Aquí hay enlaces al código fuente, instrucciones y datos de este proyecto:

Muchos conceptos de estadística y aprendizaje automático se implementan utilizando algunos conocimientos fundamentales de probabilidad. No sorprende que el conocimiento de probabilidad y estadística sean las habilidades básicas que necesita un analista de datos.

En este proyecto, nos sumergiremos profundamente en el mundo de la probabilidad estudiando las probabilidades de ganar la lotería. Ayudarás a un instituto médico especializado en el tratamiento de la adicción al juego a desarrollar una lógica para una aplicación móvil. La aplicación móvil ayudará a las personas a evaluar mejor sus posibilidades de ganar la lotería. Utilizará la teoría de la probabilidad para estimar la probabilidad de ganar el premio mayor usando uno o más boletos, así como la probabilidad de recibir ganancias menores cuando se acierten los números del 2 al 5.

Aquí hay enlaces al código fuente y las instrucciones para este proyecto:

Los sistemas de recomendación están por todas partes en Internet. Cuando Netflix recomienda un programa de televisión o Amazon sugiere que compre un libro, hay un motor de recomendación funcionando bajo el capó. 

En este proyecto de análisis de datos, creará un sistema de recomendación de películas utilizando el conjunto de datos MovieLens. Cargará su conjunto de datos en un DataFrame de pandas y realizará operaciones de raspado elemento por elemento utilizando expresiones regulares.

Los algoritmos de aprendizaje automático no funcionan bien con datos de texto. Debemos encontrar una manera de representar el texto numéricamente. Aprenderá a utilizar el algoritmo de vectorización de texto de frecuencia de término-frecuencia de densidad inversa (TF-IDF) para representar datos de texto numéricamente. A continuación, aprenderá a utilizar la métrica de similitud de distancia del coseno para evaluar puntuaciones de similitud. Finalmente, creará un panel interactivo para mostrar sus resultados.

Aquí hay enlaces al código fuente y al video tutorial:

El análisis predictivo forma parte de las tareas diarias de un analista de datos. Hay tantos algoritmos de aprendizaje automático como tareas de análisis predictivo.

En este proyecto, utilizaremos datos estadísticos de la NBA para predecir los jugadores más valiosos (MVP) de la NBA. Primero cargaremos el archivo CSV en un DataFrame de pandas, limpiaremos y transformaremos las funciones. 

A continuación, entrenaremos nuestros algoritmos de regresión y seleccionaremos las métricas adecuadas para evaluar el rendimiento del modelo. Finalmente, realizaremos una prueba retrospectiva para probar el rendimiento de nuestro modelo a lo largo del tiempo.

Aquí hay enlaces al código fuente, video tutorial y datos de este proyecto:

Existe un debate en curso sobre qué lenguaje de programación es más adecuado para la ciencia y el análisis de datos, Python o R.

En este proyecto, aprenderá cómo raspar y extraer datos de una página web utilizando el paquete rvest. También aprenderá cómo se realiza el preprocesamiento de datos en R. Analizará los tipos de datos apropiados, eliminará caracteres superfluos y manejará los valores faltantes. Finalmente, cargará sus datos en un marco de datos y visualizará su distribución usando el paquete ggplot.

Aquí está el código fuente, las instrucciones y la página web que se debe eliminar para este proyecto:

Su trabajo como analista de datos puede implicar investigar los resultados de experimentos. La empresa cambió recientemente su interfaz de usuario y notó que la gente pasaba más tiempo en su sitio web. Su desafío puede ser determinar si esto es el resultado de cambios realizados en la interfaz de usuario. Para realizar una investigación se plantean hipótesis nulas y alternativas. Luego verifica si la observación en los datos es estadísticamente significativa o aleatoria.

En este proyecto aprenderá a formular hipótesis y probar su significancia estadística. Trabajará con datos del popular programa de televisión “Jeopardy!!” Probarás si un concursante que aparece en el programa debe centrarse en un área temática determinada, ciertos tipos de preguntas y preguntas que tengan un valor monetario determinado.

Aquí está el código fuente, las instrucciones y los datos de este proyecto:

Los analistas de datos suelen trabajar en problemas de análisis predictivo. El lenguaje de programación R también es excelente para el análisis predictivo. Tiene muchos paquetes de aprendizaje automático bien desarrollados.

En este proyecto de análisis de datos, aprenderá a utilizar los paquetes de aprendizaje automático de R para hacer predicciones. 

Aquí hay enlaces al código fuente, instrucciones y datos de este proyecto:

La visualización de datos es una habilidad muy importante en el análisis de datos. Podemos identificar fácilmente patrones y tendencias en los datos cuando se presentan visualmente. 

El lenguaje de programación R es una herramienta muy poderosa para la visualización de datos. Tiene muchos paquetes de visualización de datos y con unas pocas líneas de código podemos crear cualquier tipo de visualización.

En este proyecto, utilizará el paquete ggplot para realizar análisis de datos exploratorios en un conjunto de datos de incendios forestales. Crearás gráficos 1D y 2D para comprender mejor los datos. Aprenderá a utilizar gráficos de visualización para identificar valores atípicos. Creará gráficos para responder preguntas como en qué momento del mes ocurren la mayoría de los incendios y qué factores causan incendios forestales graves.

Aquí hay enlaces a la fuente, instrucciones y datos de este proyecto:

En este tutorial, creará visualizaciones con Tableau utilizando datos de clientes. Aprenderá: dar formato a columnas en Tableau; crear mapas, histogramas, diagramas de dispersión, gráficos de anillos y gráficos de mariposa; y crear un panel interactivo.

Aquí hay enlaces al video tutorial, al panel y a los datos de este proyecto gratuito de análisis de datos con Tableau:

  • 17. Panel de control de Airbnb con Tableu 1.

Realizaremos un análisis más descriptivo utilizando Tableau utilizando datos de Airbnb para los vecindarios de la ciudad de Nueva York. Este proyecto tiene dos vertientes. En esta sección del proyecto, convertirá columnas a tipos de datos apropiados y profundizará en la visualización de características geográficas.

Al final del proyecto, creará un mapa de precios promedio para alquileres de Airbnb según sus códigos postales, así como gráficos de barras horizontales de las regiones con las calificaciones y disponibilidad de camas más altas.

Aquí hay enlaces al video tutorial, al panel y a los datos de este proyecto gratuito de análisis de datos con Tableau:

18. Panel de control de Airbnb con Tableau 2.

En esta sección del proyecto, construiremos un gráfico de series de tiempo para analizar el cambio en el costo promedio de alquiler. Aprenderá técnicas de formato de gráficos que le permitirán crear visualizaciones que transmitan con precisión sus resultados. A continuación, aprenderá cómo crear un panel con todos los gráficos que ha creado y cómo usar filtros para hacerlo interactivo.

Aquí hay enlaces al video tutorial, al panel y a los datos de este proyecto gratuito de análisis de datos con Tableau:

19. Informe y panel de Power BI para Domino’s Pizza.

En este proyecto, creará un informe y un panel de Power BI con datos de ventas de Domino’s Pizza. Aprenderá cómo importar datos a Power BI, convertir columnas a tipos de datos adecuados y eliminar columnas innecesarias. A continuación, aprenderá a administrar relaciones y a utilizar una expresión de análisis de datos (DAX) de Power BI para realizar cálculos. Luego aprenderá cómo crear un panel y generar informes en Power BI.

Aquí hay un enlace al tutorial y a los datos de este proyecto gratuito de análisis de datos con Power BI:

20. Panel de ventas de Zomato con Power BI

Aquí tienes otro proyecto de Power BI que te ayudará a mejorar tus habilidades. En este proyecto actuarás como analista de datos para un cliente que quiere abrir un negocio de restaurantes en la ciudad de Bangalore. Crearás un panel interactivo que permitirá al cliente tomar decisiones informadas que maximicen las ganancias. Su cuenta personal ayudará al cliente a elegir el tipo de restaurante, ubicación preferida y cocina. El panel le indicará al cliente la rentabilidad y los costos promedio de los clientes, y también ayudará a identificar competidores potenciales.

Aquí hay enlaces al video tutorial y a los datos de este proyecto gratuito de análisis de datos:

Hemos analizado 20 proyectos interesantes de análisis de datos que cubren tanto las habilidades como las herramientas que los analistas de datos deberían tener. Estos proyectos son imprescindibles en tu cartera porque demuestran que tienes las habilidades para ser analista de datos bueno es tiempo de estudiar saludos.

Los estaré esperando 

Autor Donal Sandro Noblejas Huamán

Lima Perú 🇵🇪 

Sitio web verlista.com/

facebook.com/verlistaa

https://pe.linkedin.com/in/donal-sandro-noblejas-huaman

You may also like

Leave a Comment

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?
-
00:00
00:00
Update Required Flash plugin
-
00:00
00:00