Skip to content

mck21/it-jobmarket-analytics

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Header Image

Proyecto de Análisis Exploratorio de Datos (EDA) - Mercado de Trabajo en IT

Este proyecto realiza un análisis exploratorio de datos utilizando Python, del mercado laboral en el sector de IT, específicamente en áreas de Data Science e Inteligencia Artificial.

Python Pandas NumPy Matplotlib Seaborn

Estructura del Proyecto

├── data/                      # Carpeta con los datos originales
│   ├── ai_job_dataset.csv     # Dataset de trabajos de IA
│   └── jobs_in_data_2024.csv  # Dataset de trabajos de Data Science
├── notebooks/                 # Jupyter notebooks con el análisis
│   ├── 01TransformacionYLimpieza.ipynb  # Limpieza y transformación inicial
│   ├── 02AnalisisDescriptivo.ipynb      # Análisis estadístico descriptivo
│   └── 03Visualizacion.ipynb            # Visualizaciones y gráficos
├── src/                      
│   └── data/                 
│       └── data_loader.py    # Funciones de carga y análisis básico
├── results/                  # Resultados del análisis
│   └── it_jobmarket_clean.csv # Dataset combinado procesado
├── img/                      # Imágenes y gráficos del análisis
├── requirements.txt          # Dependencias del proyecto
├── README.md                 # Documentación principal
└── ANALYSIS.md               # Informe con la metodología y los resultados del análisis

Datos

El proyecto utiliza dos conjuntos de datos del mercado laboral en IT:

  1. ai_job_dataset.csv: Dataset de trabajos de Inteligencia Artificial (15,000 registros)
  2. jobs_in_data_2024.csv: Dataset de trabajos de Data Science (14,199 registros)

Características principales de los datasets:

  • AI Jobs: Incluye información sobre salarios, ubicación, nivel de experiencia, tecnologías requeridas, beneficios y modalidad de trabajo
  • Data Jobs: Contiene datos sobre categorías de trabajo, ubicación geográfica, nivel de experiencia y modalidad de trabajo
  • Total combinado: 22,614 ofertas de trabajo analizadas

Important

Para ver el detalle completo del análisis exploratorio de datos, incluyendo los pasos seguidos, metodología y resultados, consulta el archivo ANALYSIS.md.

📊 Dashboard Interactivo

Para una experiencia interactiva con los datos y visualizaciones dinámicas, puedes acceder al dashboard en Google Sheets:

🔗 Ver Dashboard Interactivo en Google Sheets

Dashboard Interactivo

Insights Principales

💰 Salarios

  • Data Jobs ofrecen salarios 18.3% superiores a AI Jobs ($145,381 vs $118,717)
  • Correlación fuerte entre experiencia y salario (0.558-0.738)
  • Salarios promedio del dataset combinado: $127,695

🌍 Distribución Geográfica

  • Estados Unidos concentra el 30.31% de todas las ofertas
  • AI Jobs muestran mayor diversidad geográfica
  • Data Jobs se concentran fuertemente en Estados Unidos (80.5%)

💼 Modalidad de Trabajo

  • AI Jobs: Distribución equilibrada entre In-person (33.8%), Hybrid (33.4%), Remote (32.8%)
  • Data Jobs: Predominio presencial - In-person (61.7%), Remote (35.5%), Hybrid (2.8%)

🔧 Tecnologías

  • Stack tecnológico promedio: 4.0 tecnologías por trabajo
  • Solo 14.3% de trabajos de AI requieren habilidades específicas en NLP
  • Beneficios promedio: 7.5/10 en trabajos de AI

Requisitos

  • Python 3.8+
  • Dependencias listadas en requirements.txt

Instalación

  1. Clonar el repositorio
  2. Crear un entorno virtual:
    python -m venv venv
    source venv/bin/activate  # En Windows: venv\Scripts\activate
  3. Instalar dependencias:
    pip install -r requirements.txt

¿Por qué usar un entorno virtual?

El uso de un entorno virtual (venv) permite aislar las dependencias del proyecto, evitando conflictos con otras versiones de librerías instaladas en el sistema. Esto garantiza que el código funcione de manera consistente en diferentes entornos y facilita la instalación de dependencias específicas sin afectar otros proyectos.

Al activar el entorno virtual, cualquier paquete instalado con pip se almacenará dentro del directorio venv, en lugar de instalarse globalmente en el sistema.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published