Cantidad y calidad

Aunque el cambio a S/4 es inevitable, muchas empresas siguen dudando. Una de las razones para evitar la transformación podría ser el elevado número de datos maestros con mala calidad de datos en los distintos silos de datos.

Matthias Foerg Uniserv

8 agosto 2022

Contenido:

A los comentarios (0)

Este texto ha sido traducido automáticamente del alemán al español.

Por último, había que preparar los datos maestros para la migración. Al mismo tiempo, los duplicados relevantes en los datos maestros podían identificarse y evitarse con la estrategia adecuada. ¿Cómo deben proceder las empresas? SAP no sólo está dando a las empresas un ultimátum para la migración a S/4 al poner fin al soporte del fabricante para las versiones anteriores. SAP también está impulsando la migración a la nube.

El DSAG Investment Report 2022 muestra que el 32% de las empresas utilizan S/4 on-premises, el 6% utilizan S/4 en la nube privada y el 2% en la nube pública. Según el informe, las empresas se muestran reacias a migrar completamente, ya que aparentemente algo menos de la mitad de las empresas que tienen S/4 on-premises siguen utilizando ERP/ECC 6.0 o Business Suite 7 en paralelo. Esto indica que todavía no hay suficiente confianza en una sustitución completa por el nuevo sistema.

Lamentablemente, la estrategia "cloud-first" y el cambio de modelo de datos siguen encontrándose con demasiada frecuencia con estructuras de silos de datos que han crecido con los años. Un estudio de IDC de 2020, por ejemplo, mostró que las empresas mantienen una media de 23 silos de datos. Un estudio de Barc del año anterior muestra que el 65 por ciento de los participantes en el estudio todavía no han cambiado fundamentalmente esto. Al contrario, el número de silos de datos incluso está aumentando. Esto no ayuda ni a una migración completa ni a un uso híbrido de diferentes sistemas, sino que dificulta aún más la inevitable sustitución.

El informe del DSAG también muestra que el comportamiento de la inversión en S/4 es ligeramente descendente en comparación con el año anterior. Las empresas deberían aprovechar este momento para mejorar la calidad de sus datos maestros y mantenerla permanentemente. Porque sólo con una alta calidad de datos garantizada puede tener éxito la sustitución del antiguo sistema y aprovecharse plenamente el valor añadido de la nueva solución.

Como un falso cincuenta

Se recomienda a las empresas que transfieran sus datos maestros al nuevo modelo de datos antes de la migración a S/4 y que asignen las entidades correctamente. Sin embargo, los silos de datos aún existentes, pero también los cambios de nombre o dirección y los errores humanos de introducción de datos provocan repetidamente registros de datos duplicados o incluso múltiples. Incluso en recopilaciones de datos bien gestionadas, una media del cinco por ciento de los registros de datos siguen siendo redundantes, si no se tienen en cuenta los duplicados intencionados, como las diferentes direcciones de facturación y entrega. Hay que localizar los duplicados, en el sentido de encontrar el registro de datos pertinente en una comprobación de duplicados y una búsqueda difusa. Sólo así se puede identificar claramente al interlocutor comercial correcto en caso de duda.

Es aconsejable contrarrestar la aparición de duplicados en cuanto se introducen, para no tener que buscar y limpiar posteriormente todo el stock de datos. Lo ideal es que la comprobación de duplicados se realice cerca del diálogo en la transacción del interlocutor comercial. Pero la comprobación en el cuerpo de búsqueda de direcciones en SAP también es una opción: aquí, la búsqueda difusa de Hana puede buscar y cotejar primero los datos existentes directamente en segundo plano cuando se introducen datos nuevos. Sin embargo, se crea una lista bastante extensa de posibles candidatos de registros de datos duplicados o múltiples.

Pero, en caso de duda, ¿qué registros de datos, es decir, qué interlocutor comercial, son correctos y relevantes? Es necesario un tratamiento manual posterior de la lista de propuestas. En el caso de las bases de datos de gran tamaño, puede tratarse de cientos o incluso miles de registros de datos, lo que no resulta fácil de gestionar para los empleados, y mucho menos para identificar al interlocutor comercial correcto.

Búsqueda difusa Hana

En el entorno de S/4 o la base de datos Hana bajo SAP ERP o SAP CRM, una solución de identidad inteligente adicional integrada en SAP, como la de Uniserv, puede ayudar como complemento a reducir la lista de candidatos de la búsqueda difusa de Hana a los aciertos más relevantes. De este modo, se elimina aproximadamente el 90 por ciento de los duplicados irrelevantes. En la comprobación de duplicados, es decir, la creación o modificación de un registro de datos, así como en la búsqueda difusa con búsqueda, apertura, evaluación y selección del interlocutor comercial, al final queda una cantidad manejable de registros de datos relevantes, que finalmente pueden procesarse manualmente de forma eficiente. La decisión final sobre qué registro de datos es el correcto, es decir, el relevante, puede tomarse rápidamente.

A partir de la entrada (entrada verde en la primera línea), el sistema encuentra el resultado (coincidencia) con el complemento Uniserv y Hana Fuzzy Search y lo evalúa. La ventaja reside en la transparencia: el usuario reconoce el camino (esquema de colores) hasta los datos y puede así evaluarlos de nuevo.

Particularidades de la identificación: Mientras que en la ventana de búsqueda se introducen unos pocos argumentos de una persona o empresa para una búsqueda difusa, en la comprobación de duplicados se introducen de forma estructurada diversos elementos, como el nombre y los apellidos, la calle, el número de la casa, el código postal y la ciudad, para la creación o modificación de un registro de datos. En consecuencia, hay que dominar las posibilidades especiales de identificación. Tras la reducción, queda alrededor de un diez por ciento de aciertos, para los que una puntuación indica la probabilidad agregada de que un registro de datos sea un duplicado o represente ya el registro de datos correcto. Cuanto mayor sea la puntuación, más probable es que se trate de un duplicado. La evaluación se lleva a cabo utilizando tokens predefinidos, es decir, determinados segmentos o componentes que se comprueban durante la búsqueda con ayuda de bases de conocimientos específicas de cada país y un algoritmo subyacente.

El usuario puede ver los tokens, por lo que la evaluación es transparente. En el modo experto, los usuarios pueden ver qué fichas se han clasificado y cómo. Esto explica la clasificación de la relevancia de un conjunto de datos y ayuda a los empleados a identificar el conjunto de datos correcto y relevante. Por lo tanto, además de Hana Fuzzy Search, es aconsejable contar con una tecnología adicional que reduzca la lista de resultados hasta tal punto que se pueda identificar correctamente a los interlocutores comerciales de forma eficiente y ahorrando tiempo. La regla es: relevancia antes que cantidad. Esto ayuda enormemente a las empresas a evitar que surjan nuevos duplicados o registros de datos múltiples.

Especialmente la mitad de las empresas mencionadas al principio, que trabajan paralelamente en distintas versiones de SAP, corren el riesgo de llevar duplicados como proverbial lastre en sus existencias de datos. Por tanto, antes de la conversión completa, deberían llevar a cabo una comprobación de duplicados y una garantía general de la calidad de los datos. Y en las operaciones posteriores, deben vigilar de cerca los registros de datos duplicados y múltiples para que, a la larga, ningún nuevo duplicado contamine el sistema como "falsos cincuenta".

Parámetros de búsqueda

Búsqueda de sinónimos: Los nombres "Steffi" y "Stefanie" aparecen como potencialmente pertenecientes juntos.

Búsqueda de salientes: Los nombres dobles también se encuentran introduciendo el nombre único, por ejemplo "Heinz Müller-Schulze" por "Heinz Müller".

Error tipográfico: Duplicado reconocido a pesar de entrada incorrecta, por ejemplo con "Stehpan" y "Stephan".

Resolución de acrónimos: Se reconocen las abreviaturas, como "TK" para "Techniker Krankenkasse".

Equivalencia de códigos postales: Los códigos postales geográficamente próximos pueden evaluarse en consecuencia.

Matthias Foerg Uniserv

Matthias Förg es Jefe de Ventas de Uniserv y responsable de las ventas mundiales de soluciones Uniserv para la calidad de datos y la gestión de clientes. Cuenta con más de 20 años de experiencia en el sector de las TI. Para Uniserv, Förg ha acompañado a las empresas en su camino hacia el mundo digital desde 2016, con un enfoque especial en SAP.

Todos los artículos del autor

Cantidad y calidad

Como un falso cincuenta

Búsqueda difusa Hana

Parámetros de búsqueda

Escriba un comentario (cancelar respuesta)

Héroes y heroínas en segundo plano

El nuevo papel del Centro de Competencia SAP

Por qué la mayoría de las empresas fracasan no por la IA, sino por ellas mismas

Lugar de celebración

Fecha del acontecimiento

Entrada normal

Entrada para los suscriptores de la revista E3

Estudiantes

Lugar de celebración

Fecha del acontecimiento

Cantidad y calidad

Como un falso cincuenta

Búsqueda difusa Hana

Parámetros de búsqueda

Escriba un comentario (cancelar respuesta)

Héroes y heroínas en segundo plano

El nuevo papel del Centro de Competencia SAP

Por qué la mayoría de las empresas fracasan no por la IA, sino por ellas mismas

Lugar de celebración

Fecha del acontecimiento

Entrada normal

Entrada para los suscriptores de la revista E3

Estudiantes

Lugar de celebración

Fecha del acontecimiento

Entradas