Alternativa a Datasphere
SAO lleva muchos años experimentando con la entrega óptima de datos corporativos. El primer intento fue SAP Data Hub, que era un buen concepto, pero consumía demasiados recursos y, por tanto, no resultaba económico. En la actualidad, SAP lo está intentando con el complejísimo concepto Datasphere, véase también la página 48. Pero hay otro camino, como nos cuentan Richard Brouwer, Especialista Principal en Ingeniería de Ventas para SAP en Fivetran, y Benedikt Engel, Arquitecto de Soluciones para EMEA en Snowflake, en una entrevista doble exclusiva de E-3.
E-3: Copo de Nieve y Fivetran, ¿qué los unió y qué los conecta?
Richard Brouwer, Fivetran: Snowflake y Fivetran son socios desde hace aproximadamente una década, y también somos clientes el uno del otro. -Fivetran está considerado uno de los socios tecnológicos de élite de Snowflake y es Data Integration Partner of the Year 2022. Ambas empresas se han propuesto sacar los datos de los silos, y juntas ofrecemos una solución que lo consigue. Normalmente, los datos no proceden de Snowflake, sino de otros sistemas. Fivetran ofrece canalizaciones listas para usar y totalmente gestionadas que alimentan Snowflake con datos. Al hacerlo, nuestra capacidad única para replicar datos SAP también nos convierte en el socio de integración preferido para Snowflake. Muchos clientes de SAP saben que la entrega de datos SAP a Snowflake es engorrosa. Fivetran entrega estos datos de forma sencilla y eficaz casi en tiempo real. Nuestro objetivo es introducir los datos en Snowflake como una réplica perfecta de la fuente. Snow-flake sirve entonces como repositorio único y de confianza para todos los datos.
Ángeles: Mientras tanto, ya no se dice que "los datos son el nuevo petróleo", sino que "el tiempo es el nuevo petróleo". De esto también tratan Snowflake y Fivetran: Snowflake como plataforma de datos y Fivetran como ELT que permite disponer de datos de innumerables fuentes casi en tiempo real. Con Snowflake, los datos se armonizan y analizan, lo que proporciona información valiosa y supone un enorme aumento de la eficiencia y la eficacia. Como resultado, ahora podemos abordar nuevos problemas para los que antes la relación coste-beneficio no era la adecuada.
E-3: Y concretamente, ¿dónde se complementan?
Brouwer: Con más de 400 conectores, Fivetran proporciona datos de una amplia gama de fuentes en un formato que permite a los clientes sacar el máximo partido de sus datos en la plataforma Snowflake. Por ejemplo, en Salesforce, los datos de SAP pueden conectarse a más de 460 fuentes de terceros. Dado que los datos están disponibles en el formato adecuado y con la frecuencia óptima, su valor es mucho más fácil de aprovechar con las capacidades de la plataforma Snowflake que con otras soluciones. Incluso cuando la cantidad de datos y el número de fuentes crecen exponencialmente, nuestros clientes de Snowflake siempre tienen todos sus datos al alcance de la mano.
Benedikt Engel, Copo de nieve: A continuación, Snowflake proporciona la funcionalidad necesaria para analizar los datos y enriquecerlos con más datos a través de Snowflake Market-place, o los rentabiliza de otras formas para que los clientes puedan tomar las decisiones correctas.
E-3: Desde la perspectiva de un cliente SAP existente con ECC o S/4, ¿qué puede ofrecer usted que SAP no pueda?
Ángeles: Una plataforma de datos nativa en la nube escalable y rentable con una arquitectura fácil de usar, agnóstica respecto a la nube y caracterizada por el aislamiento de las cargas de trabajo gracias a la separación de los recursos de cálculo y almacenamiento e informática. Nuestros clientes pueden solicitar clústeres de computación de forma flexible, que se suministran por segundos y se abonan mediante un sistema de pago por uso: una auténtica solución SaaS.
Brouwer: Nuestra completa oferta incluye una gama de soluciones superiores para que los clientes de SAP con sistemas ECC o S/4 repliquen sus datos SAP. Con nuestra eficiente replicación de datos en múltiples nubes, les permitimos replicar sin problemas en diferentes plataformas en la nube y les ofrecemos la flexibilidad de elegir el entorno más adecuado. Nuestro enfoque totalmente gestionado garantiza una replicación sin complicaciones, mientras que el procesamiento de datos en las instalaciones mejora el rendimiento y proporciona información en tiempo real. Con una migración y replicación de datos seguras y prácticamente en tiempo real, minimizamos el impacto en los sistemas de origen y los clientes pueden cargar sus datos SAP en Snowflake de forma rentable.
E-3: ¿Cuál es su relación con SAP?
Brouwer: Fivetran es socio de SAP y el primer conector certificado estará disponible en breve.
Ángeles: En lo que respecta a la plataforma analítica, Snowflake suele tener clientes comunes con SAP. A menudo se desarrollan sinergias: SAP ERP es una de las fuentes de datos, mientras que Snowflake ayuda a los clientes a hacer realidad casos de uso que antes eran difícilmente viables, o solo con mucho esfuerzo. Nuestra plataforma se utiliza para analizar datos SAP y no SAP, a veces ampliados con datos de Snowflake Marketplace o datos en streaming de dispositivos IoT.
E-3: En el sentido más amplio, usted trabaja en el campo de la gestión de datos.
Existen excelentes bases de datos SQL, ¿dónde ve exactamente el reto actual en la gestión de datos corporativos?
Ángeles: Muchos clientes eligen Snowflake para resolver los siguientes problemas: En primer lugar, sus datos existen en muchas copias, algunas de las cuales son incoherentes. El resultado es la redundancia de datos. Como consecuencia, distintos análisis de los mismos datos suelen arrojar resultados diferentes, lo que hace prácticamente imposible gestionar la empresa en función de los datos. En segundo lugar, debido a limitaciones físicas o a diferentes responsabilidades en materia de datos, éstos se encuentran en bases de datos completamente distintas, es decir, en silos de datos.
Esto significa que los datos no pueden combinarse. Por tanto, su utilidad es limitada. Si pueden combinarse, los procesos de aprobación opacos y las diferentes opciones dentro del sistema respectivo dificultan una gobernanza uniforme, lo que rápidamente genera problemas de seguridad. Y en tercer lugar, vemos que las soluciones existentes no crecen con la empresa: palabra clave: escalabilidad limitada. A menudo, los sistemas deben planificarse para una utilización máxima porque no son elásticos. Si se aplica la amortización habitual en cinco años, a menudo es demasiado arriesgado iniciar un proyecto porque los costes y beneficios son difíciles de estimar.
E-3: Fivetran dice en su sitio web: "La plataforma automatizada de movimiento de datos", y Snowflake también ofrece distribución de datos. Hay que mover los datos?
Brouwer: Sí, y con volúmenes y fuentes de datos cada vez mayores, automatizar el movimiento de datos es la única forma de tener éxito. La creación manual de estas canalizaciones plantea muchos problemas. Encontrar ingenieros de datos cualificados que puedan crear las canalizaciones es cada vez más difícil. Además, es necesario mantenerlos y mejorarlos continuamente. El movimiento de datos es especialmente necesario cuando hay que vincular datos de distintas fuentes. Si están en una sola plataforma, se obtienen respuestas mucho más rápidas y eficientes.
E-3: ¿Así que se trata de movimiento y transformación de datos?
Brouwer: Cuando comparamos el movimiento de datos con la distribución de datos, estamos hablando de diferentes formas de movimiento de datos. Fivetran mueve principalmente datos brutos o datos de origen. Dichos datos necesitan ser movidos porque normalmente necesitan ser combinados con otras fuentes. Esto incluye también la transformación de los datos. Transformar estos datos y enriquecerlos con otras fuentes de datos es mucho más eficiente en Snowflake. Cuando hablamos de distribución de datos, se trata más bien de productos de datos. Este tipo de datos se adapta mejor a los datos de copia cero en Snowflake.
Ángeles: Snowflake pretende acabar con los silos de datos almacenándolos una sola vez y permitiendo que cualquiera pueda acceder a ellos. Esto se consigue gracias a nuestra arquitectura única, que incluye la separación de la informática y el almacenamiento. Esto nos proporciona una escalabilidad ilimitada en almacenamiento y computación.
E-3: Entonces, ¿dónde está el origen de Copito de Nieve?
Ángeles: Snowflake tiene sus orígenes en la nube, uno de los pilares fundamentales de la arquitectura Snowflake. Al hacer que Snowflake esté disponible en AWS, GCP y Azure y vincular las cuentas entre sí, creamos lo que llamamos nuestra Snowgrid, que nos permite ofrecer a nuestros clientes un intercambio de datos de copia cero, replicación y conmutación por error. Esto permite a nuestros clientes entrar en un intercambio directo con otros clientes y compartir sus datos directamente, no solo dentro de los límites de la empresa, sino también con otras organizaciones, socios, terceros y otras industrias. Con este enfoque, rompemos los silos de datos, geográficamente y también entre proveedores de nube. Los datos siempre están vivos, no hay copias innecesarias. Pero primero hay que llevar los datos a Snowflake y, para ello, Fivetran, con sus numerosos conectores, es la solución elegida.
E-3: SAP ha desarrollado un concepto con el Data Hub para que los datos se queden donde están almacenados, ¿no?
Brouwer: Es cierto, pero, por regla general, los datos no están disponibles en el formato que la empresa necesita ni con la frecuencia necesaria. Para crear un centro de datos, también es necesario configurar el sistema SAP. Además, los datos de SAP son muy valiosos. Para poder utilizar este valor, debe combinarse con otras fuentes de datos. Snow-flake es una plataforma mucho mejor para ello. Esto se debe a que Data Hub se basa en el concepto de visualización de datos. Para combinar datos de diferentes fuentes, todavía hay que mover grandes cantidades de datos. Así pues, SAP Data Hub es bueno para examinar datos, pero no es ideal para un entorno de producción.
E-3: Elevator Pitch: ¿Para qué retos debería ponerse en contacto con usted un cliente de SAP?
Ángeles: Si no puede o sólo puede aplicar con dificultad los requisitos de los departamentos especializados, ya sea por la relación precio-rendimiento, porque faltan funcionalidades en la plataforma o porque la escalabilidad de la arquitectura no es suficiente en el punto para soportar cargas de trabajo adicionales.
Brouwer: Si los datos SAP no están disponibles a tiempo o en el formato o nivel de detalle adecuados, es el momento de recurrir a Snowflake y Fivetran. Permitimos a los clientes extraer no sólo datos SAP, sino también datos importantes o críticos para el negocio de otras fuentes de datos externas y combinarlos en un almacén de datos central. Así es como rompemos los silos de datos y posibilitamos las decisiones basadas en datos.
E-3: ¿Dónde y cómo complementa su oferta de forma óptima una arquitectura ECC o S/4?
Brouwer: En la replicación eficiente, rentable y rápida de datos de SAP. También damos soporte a casos de uso pequeños y grandes desde ECC o S/4 a Snowflake. Gracias a las capacidades únicas de CDC de Fivetran, las transformaciones en Snowflake también se ejecutan de forma eficiente y rápida, entregando los datos casi en tiempo real o por lotes. Al vincular datos SAP con datos de otras fuentes, los clientes pueden obtener mucho más valor de sus datos SAP.
Ángeles: Aquí es exactamente donde entra Snowflake: Generamos información a partir de todos los datos de todas las fuentes vinculadas. En ese sentido, nos sentamos encima de los sistemas fuente de ECC.
E-3: Gracias por la entrevista.