{"id":62752,"date":"2019-10-31T11:00:00","date_gmt":"2019-10-31T10:00:00","guid":{"rendered":"http:\/\/e3mag.com\/?p=62752"},"modified":"2020-02-08T00:22:23","modified_gmt":"2020-02-07T23:22:23","slug":"que-es-big-data","status":"publish","type":"post","link":"https:\/\/e3mag.com\/es\/was-ist-big-data\/","title":{"rendered":"\u00bfQu\u00e9 son los macrodatos?"},"content":{"rendered":"<p>El mayor obst\u00e1culo al principio es el propio t\u00e9rmino Big Data. Lamentablemente, la traducci\u00f3n directa de datos masivos s\u00f3lo afecta a un aspecto. Todos los datos normales del sistema ERP y otras bases de datos tambi\u00e9n son datos masivos.<\/p>\n<p>Por tanto, en t\u00e9rminos de volumen, debemos hablar de cantidades demasiado grandes para las bases de datos, demasiado grandes en sentido absoluto o en el sentido de costes y beneficios. Otro aspecto es el grado de estructuraci\u00f3n de los datos.<\/p>\n<p>El sistema ERP contiene un 99% de datos bien estructurados. El uno por ciento es texto libre, como un albar\u00e1n. Con Big Data, es el otro extremo y la informaci\u00f3n apasionante est\u00e1 en las \u00e1reas de datos no estructurados. Cu\u00e1ndo y d\u00f3nde se tom\u00f3 una foto es interesante, pero lo que la foto muestra es infinitamente m\u00e1s importante.<\/p>\n<p>Esto tambi\u00e9n va acompa\u00f1ado del tipo de preparaci\u00f3n de los datos. Mientras que con las bases de datos se trata de una consulta del tipo \"facturaci\u00f3n total al mes\", con los ejemplos anteriores hablamos de repente de an\u00e1lisis de im\u00e1genes y an\u00e1lisis de texto.<\/p>\n<p>Sin embargo, la definici\u00f3n m\u00e1s importante de Big Data es \"todos los datos que no se utilizan hoy para aumentar los beneficios de la empresa\". Aqu\u00ed la creatividad est\u00e1 a la orden del d\u00eda.<\/p>\n<p>Uno de mis proyectos anteriores ha consistido en la utilizaci\u00f3n de servidores en el centro de datos, con el objetivo de reducir el n\u00famero de servidores. Para ilustrarlo, me gustar\u00eda poner un ejemplo.<\/p>\n<p>Las ventas deben vincularse con informaci\u00f3n sobre la intensidad con que los clientes han visto el producto correspondiente en el sitio web. Por ejemplo, un producto se anuncia en los medios de comunicaci\u00f3n. \u00bfSe percibe esta publicidad?<\/p>\n<p>En caso afirmativo, deber\u00eda observarse un aumento del n\u00famero de accesos en las p\u00e1ginas de producto asociadas. \u00bfLos clientes potenciales leen brevemente la p\u00e1gina del producto, se convencen de inmediato y compran? \u00bfO leen detenidamente los datos t\u00e9cnicos y luego no compran?<\/p>\n<p>Una vez que se tiene una idea de qu\u00e9 datos deben analizarse con Big Data, surge la cuesti\u00f3n de una arquitectura prometedora. Especialmente en el \u00e1rea de Big Data, se desarrollan constantemente nuevos productos para sustituir a los antiguos. Hace unos a\u00f1os, Map Reduce en Hadoop era lo \u00faltimo, luego lleg\u00f3 Apache Spark, que tiene mejor rendimiento y mayor potencia.<\/p>\n<p>Durante mucho tiempo Apache Hive fue el camino a seguir, hoy es Parquet Files. En un entorno tan din\u00e1mico, no quiero gastar mucho dinero en una soluci\u00f3n que potencialmente podr\u00eda utilizarse a corto plazo, y tambi\u00e9n quiero tener la apertura para cambiar a algo nuevo en cualquier momento.<\/p>\n<p>Apache Spark responde a este deseo de una soluci\u00f3n potente, pero al mismo tiempo abierta, por lo que se utiliza en casi todos los proyectos del mundo.<\/p>\n<p>La instalaci\u00f3n es f\u00e1cil, las transformaciones complejas son posibles con menos l\u00edneas de c\u00f3digo y el software no cuesta nada. El mayor coste ser\u00eda crear un sistema de BI.<\/p>\n<p>As\u00ed que, en lugar de eso, a\u00f1ado las m\u00e9tricas calculadas con Spark al almac\u00e9n de datos existente y permito a los usuarios realizar nuevos an\u00e1lisis con las viejas herramientas conocidas; por ejemplo, correlacionando ahora las ventas con el tiempo de lectura y las p\u00e1ginas vistas de un producto.<\/p>\n<p>Conclusi\u00f3n y futuro: Hasta hace poco, almacenar y procesar este tipo de datos secundarios no resultaba atractivo en t\u00e9rminos de precio. El volumen de datos era demasiado grande, la densidad de la informaci\u00f3n demasiado baja y la \u00fanica forma de procesarlos eficazmente era con herramientas relacionadas con la BD.<\/p>\n<p>Estos argumentos ya no son v\u00e1lidos hoy en d\u00eda. Con el Apache Hadoop Filesystem (HDFS), se pueden formar grandes sistemas de archivos a partir de componentes baratos de PC en lugar de comprar una costosa matriz de discos.<\/p>\n<p>Apache Spark puede procesar estas grandes cantidades de datos, con los complejos algoritmos asociados que incluyen m\u00e9todos estad\u00edsticos y de aprendizaje autom\u00e1tico.<\/p>\n<p>Y la soluci\u00f3n: las herramientas del sector de los almacenes de datos, incluidas las de SAP, se han adaptado a esta situaci\u00f3n y ofrecen acceso directo a archivos Hadoop o env\u00edan tareas de transformaci\u00f3n a un cl\u00faster Spark conectado. Una de estas joyas desconocidas es SAP Hana Spark Connector.<\/p>","protected":false},"excerpt":{"rendered":"<p>Muchas empresas acaban de empezar con los macrodatos. Tienen ideas iniciales. Se est\u00e1 explorando el potencial. SAP tambi\u00e9n tiene diferentes enfoques del tema, dependiendo del departamento con el que hable.<\/p>","protected":false},"author":1891,"featured_media":62136,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"pmpro_default_level":"","footnotes":""},"categories":[36004,7,36593],"tags":[210,927,73,798],"coauthors":[36006],"class_list":["post-62752","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-smart-big-data-integration","category-meinung","category-mag-1910","tag-big-data","tag-data-warehouse","tag-erp","tag-hadoop","pmpro-has-access"],"acf":[],"featured_image_urls_v2":{"full":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",1000,450,false],"thumbnail":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration-150x150.jpg",150,150,true],"medium":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",400,180,false],"medium_large":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration-768x346.jpg",768,346,true],"large":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",1000,450,false],"image-100":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration-100x45.jpg",100,45,true],"image-480":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration-480x216.jpg",480,216,true],"image-640":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration-640x288.jpg",640,288,true],"image-720":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration-720x324.jpg",720,324,true],"image-960":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration-960x432.jpg",960,432,true],"image-1168":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",1000,450,false],"image-1440":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",1000,450,false],"image-1920":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",1000,450,false],"1536x1536":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",1000,450,false],"2048x2048":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",1000,450,false],"trp-custom-language-flag":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",18,8,false],"bricks_large_16x9":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",1000,450,false],"bricks_large":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",1000,450,false],"bricks_large_square":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",1000,450,false],"bricks_medium":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",600,270,false],"bricks_medium_square":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration.jpg",600,270,false],"profile_24":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration-24x24.jpg",24,24,true],"profile_48":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration-48x48.jpg",48,48,true],"profile_96":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration-96x96.jpg",96,96,true],"profile_150":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration-150x150.jpg",150,150,true],"profile_300":["https:\/\/e3mag.com\/wp-content\/uploads\/2019\/08\/Smart-and-Big-Data-Integration-300x300.jpg",300,300,true]},"post_excerpt_stackable_v2":"<p>Viele Firmen stehen in Bezug auf Big Data am Anfang. Man hat erste Ideen. Das Potenzial wird ausgelotet. Auch SAP hat unterschiedliche Herangehensweisen an das Thema, je nachdem mit welcher Abteilung man spricht.<\/p>\n","category_list_v2":"<a href=\"https:\/\/e3mag.com\/es\/category\/meinung\/smart-big-data-integration\/\" rel=\"category tag\">Smart &amp; Big Data Integration<\/a>, <a href=\"https:\/\/e3mag.com\/es\/category\/meinung\/\" rel=\"category tag\">Die Meinung der SAP-Community<\/a>, <a href=\"https:\/\/e3mag.com\/es\/category\/mag-1910\/\" rel=\"category tag\">MAG 19-10<\/a>","author_info_v2":{"name":"Werner D\u00e4hn, rtdi.io","url":"https:\/\/e3mag.com\/es\/author\/werner-daehn\/"},"comments_num_v2":"0 comentarios","_links":{"self":[{"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/posts\/62752","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/users\/1891"}],"replies":[{"embeddable":true,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/comments?post=62752"}],"version-history":[{"count":0,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/posts\/62752\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/media\/62136"}],"wp:attachment":[{"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/media?parent=62752"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/categories?post=62752"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/tags?post=62752"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/coauthors?post=62752"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}