Este proyecto realiza un análisis exploratorio de datos utilizando Python, del mercado laboral en el sector de IT, específicamente en áreas de Data Science e Inteligencia Artificial.
├── data/ # Carpeta con los datos originales
│ ├── ai_job_dataset.csv # Dataset de trabajos de IA
│ └── jobs_in_data_2024.csv # Dataset de trabajos de Data Science
├── notebooks/ # Jupyter notebooks con el análisis
│ ├── 01TransformacionYLimpieza.ipynb # Limpieza y transformación inicial
│ ├── 02AnalisisDescriptivo.ipynb # Análisis estadístico descriptivo
│ └── 03Visualizacion.ipynb # Visualizaciones y gráficos
├── src/
│ └── data/
│ └── data_loader.py # Funciones de carga y análisis básico
├── results/ # Resultados del análisis
│ └── it_jobmarket_clean.csv # Dataset combinado procesado
├── img/ # Imágenes y gráficos del análisis
├── requirements.txt # Dependencias del proyecto
├── README.md # Documentación principal
└── ANALYSIS.md # Informe con la metodología y los resultados del análisis
El proyecto utiliza dos conjuntos de datos del mercado laboral en IT:
ai_job_dataset.csv: Dataset de trabajos de Inteligencia Artificial (15,000 registros)jobs_in_data_2024.csv: Dataset de trabajos de Data Science (14,199 registros)
- AI Jobs: Incluye información sobre salarios, ubicación, nivel de experiencia, tecnologías requeridas, beneficios y modalidad de trabajo
- Data Jobs: Contiene datos sobre categorías de trabajo, ubicación geográfica, nivel de experiencia y modalidad de trabajo
- Total combinado: 22,614 ofertas de trabajo analizadas
Important
Para ver el detalle completo del análisis exploratorio de datos, incluyendo los pasos seguidos, metodología y resultados, consulta el archivo ANALYSIS.md.
Para una experiencia interactiva con los datos y visualizaciones dinámicas, puedes acceder al dashboard en Google Sheets:
🔗 Ver Dashboard Interactivo en Google Sheets
- Data Jobs ofrecen salarios 18.3% superiores a AI Jobs ($145,381 vs $118,717)
- Correlación fuerte entre experiencia y salario (0.558-0.738)
- Salarios promedio del dataset combinado: $127,695
- Estados Unidos concentra el 30.31% de todas las ofertas
- AI Jobs muestran mayor diversidad geográfica
- Data Jobs se concentran fuertemente en Estados Unidos (80.5%)
- AI Jobs: Distribución equilibrada entre In-person (33.8%), Hybrid (33.4%), Remote (32.8%)
- Data Jobs: Predominio presencial - In-person (61.7%), Remote (35.5%), Hybrid (2.8%)
- Stack tecnológico promedio: 4.0 tecnologías por trabajo
- Solo 14.3% de trabajos de AI requieren habilidades específicas en NLP
- Beneficios promedio: 7.5/10 en trabajos de AI
- Python 3.8+
- Dependencias listadas en
requirements.txt
- Clonar el repositorio
- Crear un entorno virtual:
python -m venv venv source venv/bin/activate # En Windows: venv\Scripts\activate
- Instalar dependencias:
pip install -r requirements.txt
El uso de un entorno virtual (venv) permite aislar las dependencias del proyecto, evitando conflictos con otras versiones de librerías instaladas en el sistema. Esto garantiza que el código funcione de manera consistente en diferentes entornos y facilita la instalación de dependencias específicas sin afectar otros proyectos.
Al activar el entorno virtual, cualquier paquete instalado con pip se almacenará dentro del directorio venv, en lugar de instalarse globalmente en el sistema.

