Jueves 22 de agosto del 2019

Big Data para el análisis del mercado laboral

Reflexiones en torno a las bolsas de trabajo y el uso de Big Data.

Esta nota ha sido elaborada por la Bolsa de Trabajo PUCP.

El beneficio que brinda la tecnología informática, utilizando herramientas de análisis de Big Data, se ha convertido en una práctica ampliamente difundida en el monitoreo de la demanda del mercado en los diferentes sectores de actividad empresarial y estatal. Los portales de empleo se implementaron en el Perú desde hace aproximadamente 24 años y se desarrollaron como portales públicos. Luego, se hicieron parte de las bolsas de empleo universitarias. LinkedIn, como herramienta de redes, se ha convertido en un sustituto significativo. Sin embargo, en la actualidad, los portales universitarios y públicos siguen captando un porcentaje muy elevado para reclutar talento profesional en el país y en el mundo. Los portales de empleo almacenan importante información sobre la demanda profesional que puede ser aprovechada como instrumento para la toma de decisiones en torno a la oferta académica de las instituciones de formación profesional, sean estas estatales o privadas.

Si identificamos cada publicación para cubrir una posición como una convocatoria de personal, es posible elaborar reportes con la distribución de las convocatorias por profesión de acuerdo a los criterios que se listan a continuación:

  • Área de especialización demandada
  • Grado académico demandado
  • Competencias específicas demandadas
  • Remuneración ofrecida
  • Sector de actividad de la organización demandante
  • Tamaño de la organización demandante

De acuerdo con esta lista, puede apreciarse como una presentación sencilla, pero puede a la vez, convertirse en una herramienta poderosa si la clasificación permite desagregar la información considerando dos o tres criterios de los mencionados en simultáneo. Esto se logra con herramientas de manejo de bases de datos. Se podría, por ejemplo, ver la distribución de la demanda de ingenieros industriales según áreas de especialización en un sector productivo, tomando en cuenta solo empresas grandes.

Como un elemento de actualización de mallas curriculares para cursos conducentes a grado universitario, los resultados de la evolución de la demanda en los últimos años constituyen un input representativo, específicamente en lo relativo a las áreas de especialización, así como las competencias demandadas. Definitivamente, por tratarse de una decisión que se debe actualizar cada tres años de acuerdo con el artículo 40° de la Ley N° 30220, Ley Universitaria, la información debe contrastarse con tendencias a futuro, lo cual supone el uso de otras herramientas de recojo de información.

La información es especialmente valiosa para detectar demandas de cursos de extensión con duración menor a un año. Es una aplicación que brinda una orientación casi completa en la definición de la malla curricular, incluyendo los conocimientos sugeridos por cada tema, si esta se elabora con información reciente. Si se cruza con información sobre los sectores y el tamaño de las organizaciones demandantes se podría elaborar cursos para nichos específicos, tomando en cuenta adicionalmente el nivel de demanda.

Lo descrito es una representación de algunas posibilidades de captar información aprovechable a través de la aplicación de tecnologías informáticas. Corresponde ahora, señalar cuáles son los recursos tecnológicos demandados y el espacio en dónde se enfrenta la mayor demanda de esfuerzo. En la primera parte, tenemos el frente de software. En principio, la información debe estar almacenada sobre la base de algún ordenamiento, en una base de datos. Probablemente el orden no permita un trabajo directo, por lo que habrá que ordenar esa información en una primera instancia de acuerdo a criterios que permitan una búsqueda manual en la computadora. En una segunda etapa, se utilizan técnicas de machine learning. El ordenamiento y la clasificación requerirá desarrollar algoritmos que permitan que la máquina aprenda a clasificar la información a partir de muestras representativas debidamente clasificadas por expertos en la materia. Así, desde esta la muestra clasificada la máquina debe “aprender” y los primeros resultados de la corrida deben ser sometidos a pruebas en las que lo aconsejable es que los mismos expertos en el tema sean los responsables de la revisión. Eventualmente, deberán desarrollar diccionarios de términos que faciliten la clasificación y el conteo.

Cada vez se encuentran más profesionales que dominan esas técnicas de manejo de la información, y aparecen nuevas aplicaciones, muchas de ellas dentro del software libre. Una de las partes que puede demandar mayor tiempo es  la revisión manual, lo cual involucra tres entradas indispensables para el desarrollo del reporte: la elaboración de los diccionarios de términos, la clasificación manual de una  muestra para clasificación de carreras (se debe separar convocatorias dirigidas a una especialidad de manera inapropiada, y corresponde limpiar las convocatorias para considerar solo aquellas que realmente están relacionadas con la profesión) y  la clasificación de la muestra por  áreas de especialización.

Adicionalmente, se debe realizar un trabajo de revisión para validar los resultados de la aplicación.  Un buen trabajo de clasificación de la muestra y validación de la misma debería ser desarrollado por expertos en el tema. El detalle se ubica en que la labor puede ser tediosa y no es tan sencillo conseguir mayor disposición de expertos en la materia para que dediquen su tiempo a dicha labor. Sin embargo, la utilidad de la aplicación es elevada y debe considerarse que genera una relación costo beneficio extremadamente positiva.

 


Aviso: Los contenidos de este boletín sintetizan la información y los debates tomados de los medios de comunicación y las investigaciones que se citan al pie. Su contenido no refleja necesariamente la opinión del Vicerrectorado Académico de la PUCP.


 

Deja un comentario