De chico medio a líder de su clase


Bernd Weber es un todoterreno. No es muy alto, pero tampoco bajo, le gusta vestir con colores apagados y se mueve despacio. Probablemente se describiría a sí mismo como un hombre con tareas importantes, pequeños achaques y en la flor de la vida.
Muchos de nosotros conocemos a este Bernd de alguna parte, es más conocido por sus iniciales BW. Echemos un vistazo más de cerca a este tipo corriente. ¿Qué aspecto tiene realmente?
Los resultados presentados en este artículo se basan en numerosos análisis automatizados de sistemas de almacén empresarial productivos que realizamos en 2012 como parte de la prueba de idoneidad de DataVard SAP BW. Los sistemas proceden de empresas de diversos sectores y tamaños, desde químicas hasta servicios públicos, desde pymes hasta empresas del DAX.
El tipo medio
Nuestro Bernd Weber, es decir, la media absoluta de SAP BW, tiene un tamaño de sistema de unos 4,2 terabytes. Nuestra visión de conjunto muestra que, con un 46%, casi la mitad de todos los sistemas tienen también entre uno y cinco terabytes.
Otro 31%, es decir, uno de cada tres sistemas, tiene un tamaño incluso inferior a un terabyte. El 10% de los sistemas tiene un tamaño de entre cinco y diez terabytes, y sólo el 13% de todos los sistemas analizados supera el límite de los diez terabytes.
En vista de la actual discusión sobre big data, nos preguntamos de dónde viene este tema de tendencia en el contexto de SAP BW, ya que la mayoría de los sistemas aparentemente no son tan grandes. Sin embargo, en nuestra opinión, un indicador importante de big data no es el tamaño puro del sistema, sino el volumen de datos que hay que consultar en una consulta.
En nuestro sistema medio, menos de un tercio de los datos se encuentra en la capa de información. Además, el sistema suele constar de más de un 40% de datos temporales y de otro tipo.
Por otros datos entendemos todo excepto los datos maestros, los datos de cubo, los datos ODS, los datos PSA y los registros de cambios. A menudo encontramos que las tablas más grandes de este grupo son las estadísticas de BW. El resto del sistema BW está formado por las capas de preparación de datos y los datos maestros.
El tamaño de un sistema de BW no permite sacar muchas conclusiones sobre los retos futuros. Un indicador importante es el crecimiento. Nuestro Bernd Weber tiene una tasa de crecimiento de un impresionante 30% anual.
Por supuesto, hay problemas de crecimiento. Después de dos o tres años, el sistema ha duplicado su tamaño. Por un lado, los costes de las tecnologías de almacenamiento existentes están bajando y, por tanto, pueden absorber financieramente al menos parte del crecimiento.
Por otro lado, sin embargo, estamos asistiendo a desarrollos actuales como la computación en memoria, que están haciendo subir de nuevo los costes por gigabyte. Los crecientes volúmenes de datos conllevan un aumento del coste total de propiedad (TCO), así como problemas de rendimiento.
El sistema medio tiene un tiempo de ejecución ponderado de los pasos de consulta de 14 segundos. Este resultado explica mucha frustración por parte del usuario. La pálida apariencia de nuestro tipo medio no sólo se debe a sus discretas características, como su tamaño y rendimiento, sino también a su última actualización.
Bernd Weber es un sistema BW en NetWeaver Release 7.01. Sólo el nueve por ciento de los sistemas funcionan con 7.30 y superiores. Este dato es especialmente interesante en relación con Hana, ya que se requiere al menos esta versión para cambiar a esta tecnología.
Los mejores de la clase
En contraste con nuestro discreto sistema medio, el líder de la clase es una personalidad deslumbrante. La gran diferencia radica en su estatura y su forma física. Es atlético y rápido.
En contraste con los 14 segundos de tiempo de ejecución del paso de consulta ponderado del tipo medio, el Primus llegó a la meta en cuatro segundos, y todo ello sin Hana. El porcentaje de grasa corporal del Primus también es interesante: los datos temporales y del sistema solo representan el 20 por ciento del sistema total.
Además, el almacenamiento de datos es más ágil, ya que en los proveedores de información sólo se almacenan los datos actuales y los datos "fríos" se externalizan regularmente. Sin duda, hay muchas razones que explican este buen rendimiento, tres de las cuales se exponen brevemente a continuación:
1. la utilización de su buena inversión, los recursos a bordo de un sistema BW, son aquí un importante factor de éxito. El modelo de datos optimiza el tiempo de acceso: el esfuerzo de lectura por consulta es bajo. Para medirlo, calculamos el número de filas que hay que leer por cada fila de salida.
En el sistema medio, se leen 57 registros de datos por cada línea visualizada. En los sistemas punteros, sólo hay de tres a cinco líneas. Esta optimización del sistema BW puede lograrse sin soluciones externas.
2. los mejores sistemas tienen en común una buena gestión, que elimina los datos que no son necesarios para la elaboración de informes y datos. Los sistemas líderes trabajan con soluciones totalmente automatizadas para garantizar la sostenibilidad.
En contraste con estos sistemas, cuando analizamos muchos sistemas BW normales, comprobamos que las tablas de estadísticas y registros se encuentran entre las más grandes del sistema. Esto plantea la cuestión de si las estadísticas de acceso a consultas de hace tres años son tan valiosas como los pedidos entrantes del día anterior.
3 Con el líder de la clase, los datos también se dividen en función de la frecuencia de acceso con el fin de optimizar los tiempos de notificación. El tiempo de notificación se optimiza porque se reduce la cantidad de datos a los que se accede.
Observamos dos enfoques para ello: Particionamiento y archivado/almacenamiento near-line. En la partición, los proveedores de información suelen dividirse manualmente. Esto puede significar, por ejemplo, que los datos de pedidos de cada ejercicio se almacenen en un proveedor de información distinto.
Con el archivado o NearLine Storage (NLS), los datos se descargan automáticamente del proveedor de información activo una vez transcurrido un período de retención. Con la interfaz NLS, SAP ha hecho posible que los usuarios conserven pleno acceso a los datos.
NLS no es sinónimo de Sybase IQ: dependiendo de la solución utilizada, los datos se almacenan en forma altamente comprimida directamente en el sistema SAP o se cargan en un almacén de datos independiente. La ventaja sobre la partición es que el sistema contiene menos lastre, ya que los datos antiguos constituyen una parte menor del sistema.
Conclusión
Como hemos visto, los sistemas BW difieren enormemente. El rendimiento, en particular, puede llevar rápidamente a la frustración del usuario en sistemas medios y por debajo de la media.
En este caso, Hana sólo ayuda de forma limitada: Un cambio de tecnología no mejora inmediatamente un modelo de datos deficiente. Hay varias formas de actualizar el sistema. Un análisis detallado del sistema BW es la mejor manera de encontrar los puntos de partida adecuados.
La prueba de idoneidad de SAP BW de DataVard ofrece un análisis del estado actual, así como una evaluación comparativa con más de 100 sistemas BW productivos. Esto deja claro de un vistazo en qué áreas su propio almacén empresarial tiene potencial de mejora.
