Saber más, planificar mejor
A menudo se olvida que la batalla por los trabajadores cualificados no sólo se libra en el mercado laboral, sino dentro de las propias empresas. Aquellas que consiguen retener a sus empleados cualificados se aseguran permanentemente su caudal de experiencia y su propia competitividad. Esta es la conclusión de un proyecto piloto sobre el tema del aprendizaje automático que el Grupo Windhoff llevó a cabo junto con la Asociación Alemana de Seguros de Pensiones (DRV Bund).
"En el DRV Bund, el tema de la planificación estratégica de los recursos humanos está siendo más importante que nunca en los próximos años. Debido a la estructura por edades de Alemania, nos encontramos ante un doble dilema demográfico: por un lado, el número de pensionistas aumenta el número de solicitudes y, por tanto, nuestras necesidades de personal. Por otro, un gran número de empleados nos abandona a medio plazo por motivos de edad, lo que reduce nuestra plantilla. A esto se añade una guerra por los talentos cada vez más intensa y una dinámica creciente en el mundo laboral".explica el Dr. Michael Tekieli, responsable de People Analytics en DRV Bund.
Cambio de prioridades
Hasta ahora, el tema de la fluctuación no ha sido uno de los puntos conflictivos, pero en un futuro próximo cobrará sin duda mayor relevancia, prosigue el Dr. Tekieli: "Para evitar que la rotación se convierta en un problema, necesitamos soluciones específicas. Éstas deberían permitirnos, al menos, anticiparnos con antelación y precisión a los cambios en el panorama del personal y, en el mejor de los casos, contrarrestar de forma proactiva y eficaz las salidas críticas para el éxito gracias a nuestros conocimientos."
En este contexto, se formularon dos preguntas para el proyecto piloto: ¿En qué medida puede contribuir el aprendizaje automático a identificar los riesgos de fluctuación? ¿Es capaz la Inteligencia Artificial Explicable (XAI) de comprender las razones de una fluctuación no relacionada con la edad? Para dar respuesta a estas preguntas, los responsables del proyecto decidieron utilizar Smart Predict junto con SAP Analytics Cloud.
En el primer paso, era importante crear una base de datos coherente a partir de fuentes internas (sistemas ERP y de RRHH) y externas. En la práctica, esto significaba que los datos personales y profesionales de un empleado se complementaban con aspectos del entorno de la empresa. En total, se codificaron 40 atributos descriptivos. A continuación, se identificaron los factores de influencia más importantes: La edad, la edad del hijo menor, el tiempo de trabajo real sin absentismo, la antigüedad en meses, el aumento salarial absoluto en los últimos doce meses y la gravedad de las restricciones debidas a las medidas durante la pandemia en comparación con el Índice de Rigidez de Covid.
En la búsqueda de variables descriptivas adecuadas se consultaron publicaciones científicas, así como la creatividad de todo el equipo del proyecto. Diferentes horizontes temporales de un cese no relacionado con la edad en los próximos meses (1/3/6/12) surgieron como variables objetivo. Los atributos capturados se recogieron para cada uno de los más de 25.000 empleados mensualmente durante los años 2018 a 2020. El resultado fue un conjunto de datos de 650.000 filas o 230 megabytes.
Predicción inteligente
Smart Predict permite realizar el análisis de los datos recopilados en el departamento como autoservicio. Los argumentos decisivos para el uso de SAC fueron la rápida elaboración de resultados mediante aprendizaje automático automatizado, resultados transparentes gracias a XAI y una alta calidad de predicción de los potentes algoritmos de aprendizaje automático. El análisis funciona de forma intuitiva y puede llevarse a cabo sin conocimientos de programación, por lo que no son necesarios ni expertos en TI ni recursos de ciencia de datos.
Para contrarrestar las reservas sobre la aceptación, se llevó a cabo la denominada prueba fuera de muestra. Entre otras cosas, el proyecto demostró que un algoritmo entrenado con los datos antes de junio de 2020 también habría detectado retrospectivamente a los empleados que se marcharan en el segundo semestre de 2020 con un porcentaje de aciertos del 12,5%. La prueba también demostró que las correlaciones aprendidas eran "robustas", es decir, transferibles al futuro. En conjunto, el aprendizaje automático detectó más del 50% de las fluctuaciones no relacionadas con la edad.
Otro método para aumentar la aceptación fue la comprobación de la verosimilitud de los patrones encontrados, que el modelo de análisis predictivo utiliza para generar previsiones. Los patrones encontrados siguieron siendo un medio importante para comprender qué empleado podría abandonar la empresa y por qué motivos. Sin embargo, los algoritmos modernos de aprendizaje automático son tan complejos que no se puede comprender directamente el efecto de los factores que influyen en la probabilidad de abandono. Es lo que se denomina un fenómeno de caja negra. En los últimos años, se han creado enfoques en el campo de investigación de la XAI para explicar sucesivamente la caja negra.
Por ejemplo, el SAC utiliza los valores SHAP desde el tercer trimestre de 2021. Esto permite explicar el significado y la influencia de varios atributos a nivel local, es decir, en relación con el empleado individual. Esto permite una comprobación de plausibilidad y causalidad por parte de expertos en la materia, así como la extracción de nuevos conocimientos.
Además de la evaluación individual de cada empleado, también se realizaron análisis con respecto a ejemplos prototípicos utilizando procedimientos automatizados de agrupación (agrupación inteligente). El vínculo con la planificación de personal existente para la fluctuación relacionada con la edad se realiza agregando los valores esperados en diferentes dimensiones. Esto permite ver qué departamentos y puestos pueden verse especialmente afectados por la fluctuación no relacionada con la edad. El Dr. Tekieli añade: "Para nosotros, como organización, solo entra en cuestión una evaluación y presentación a nivel agregado. Así conseguimos un sano equilibrio entre la mejora del marco operativo para nuestros empleados, teniendo en cuenta la diversidad de necesidades y, al mismo tiempo, garantizando en todo momento la protección de los datos personales de conformidad con el GDPR".
Resultados convincentes
Queda por decir: Con las tecnologías modernas, se pueden extraer respuestas objetivas de los datos históricos de RRHH. Esto significa que las fluctuaciones pueden anticiparse con meses de antelación e incluso las probabilidades pueden cuantificarse de forma pronóstica. En consecuencia, se pueden iniciar medidas activas de retención de RRHH (por ejemplo, oportunidades de desarrollo específicas) para mantener a grupos de empleados en la empresa.
"Al principio era muy escéptico sobre el uso del aprendizaje automático, ya que se omite el paso supuestamente importante de la hiperparametrización. Sin embargo, la calidad de las predicciones me sorprendió gratamente. Un importante factor de éxito del aprendizaje automático es, sin duda, la calidad de los datos. Si se dejan todos los pasos en manos de la máquina, la calidad de los datos de entrenamiento adquiere una importancia aún mayor. Por lo tanto, el tema bastante impopular y árido de la integridad de los datos debería ser al menos tan importante para las organizaciones como un cuadro de mandos de aprendizaje automático unificado y claro."señala el Dr. Tekieli.