{"id":133777,"date":"2023-11-02T13:50:00","date_gmt":"2023-11-02T12:50:00","guid":{"rendered":"http:\/\/e3mag.com\/?p=133777"},"modified":"2023-11-03T08:13:04","modified_gmt":"2023-11-03T07:13:04","slug":"euclid-y-hana","status":"publish","type":"post","link":"https:\/\/e3mag.com\/es\/euclid-y-hana\/","title":{"rendered":"Euclides y Hana"},"content":{"rendered":"<h2 class=\"wp-block-heading\">SAP TechEd 2023, Bangalore, India<\/h2>\n\n\n\n<p>Al inicio de TechEd 2023, el Director de Tecnolog\u00eda de SAP, J\u00fcrgen M\u00fcller, dijo que estaba feliz de anunciar ahora una mejora importante, si no la m\u00e1s significativa, para la plataforma de base de datos Hana. El suspense estaba servido: en TechEd, una sensaci\u00f3n de Hana m\u00e1s all\u00e1 de los Large Language Models (LLM), que se limitan a utilizar algoritmos de aprendizaje profundo para resumir, ordenar o generar predicciones a partir de grandes cantidades de datos.<\/p>\n\n\n\n<p>J\u00fcrgen M\u00fcller argument\u00f3 en TechEd 2023 en Bangalore, no incorrectamente: Los grandes modelos ling\u00fc\u00edsticos en su mayor\u00eda s\u00f3lo pueden capturar el pasado. Se entrenan utilizando datos existentes, en su mayor\u00eda extra\u00eddos de Internet. Una respuesta inmediata en tiempo real basada en datos operativos es dif\u00edcil. La base de datos Hana de SAP ha sido responsable de los resultados en tiempo real durante muchos a\u00f1os, \u00a1ahora con vectores!<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Vectores<\/h2>\n\n\n\n<p>La supuesta sensaci\u00f3n de Hana es ahora, seg\u00fan el Director de Tecnolog\u00eda de SAP, J\u00fcrgen M\u00fcller, la posibilidad de utilizar vectores como objetos en la plataforma de base de datos. Ahora bien, en las matem\u00e1ticas euclidianas tradicionales, los vectores no son realmente ninguna sensaci\u00f3n. Con las herramientas inform\u00e1ticas existentes de la plataforma de base de datos Hana, cualquier estudiante de primer semestre de inform\u00e1tica puede implementar unas cuantas funciones vectoriales sencillas. Lo que J\u00fcrgen M\u00fcller puede haber querido decir es una extensi\u00f3n del lenguaje SQL DB con unos pocos comandos vectoriales.<\/p>\n\n\n\n<p>\u00bfQu\u00e9 es un vector? En un sistema de coordenadas con un eje x y un eje y, se pueden elegir dos puntos cualesquiera. Si estos puntos se conectan mediante la l\u00ednea recta m\u00e1s corta posible y se a\u00f1ade una flecha al final, entonces se tiene delante en el papel un gr\u00e1fico dirigido o un vector en el espacio bidimensional. Tambi\u00e9n es f\u00e1cil imaginar un vector en un espacio tridimensional (ejes x, y y z), por ejemplo, un l\u00e1piz sobre una mesa. El extremo del l\u00e1piz y la punta pueden determinarse con precisi\u00f3n como puntos en el espacio. Por tanto, el l\u00e1piz ser\u00eda el vector.<\/p>\n\n\n\n<p>Ahora nos movemos hacia dimensiones superiores que son dif\u00edciles de imaginar visualmente (un cubo de cuatro dimensiones tendr\u00eda una sombra tridimensional, por ejemplo), pero las dimensiones superiores siguen siendo f\u00e1ciles de calcular, incluso como aritm\u00e9tica mental, que es, al fin y al cabo, lo que este blog del redactor jefe pretende demostrar.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Muchos par\u00e1metros, muchas dimensiones<\/h2>\n\n\n\n<p>Tarea: Agrupar un mill\u00f3n de ofertas en funci\u00f3n de los grupos de clientes, la utilizaci\u00f3n de las m\u00e1quinas, el volumen de negocio, etc., es decir, agruparlas en grupos que tengan similitudes. Cada oferta tiene par\u00e1metros espec\u00edficos que pueden identificarse f\u00e1cilmente. El estado del cliente puede deducirse del nombre del cliente. Los malos clientes reciben el valor cero, los buenos clientes reciben el valor nueve. Las ofertas peque\u00f1as de menos de 1.000 euros obtienen el valor uno, las grandes ofertas de m\u00e1s de un mill\u00f3n de euros obtienen el valor 25 y todas las dem\u00e1s obtienen una gradaci\u00f3n fija entre uno y 25. El procedimiento es similar con las mercanc\u00edas ofertadas: Bienes en stock, producci\u00f3n \u00fanica, etc. Y as\u00ed sucesivamente: al final de este proceso hay diez categor\u00edas y cada oferta tiene un valor por categor\u00eda. Estos diez valores tambi\u00e9n pueden interpretarse como un vector (el punto de partida es el cero) en un espacio de diez dimensiones y escribirse de la siguiente manera: (5, 9, 3, 7, 11, 2, 42, 15, 6, 102).<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Distancia euclidiana<\/h2>\n\n\n\n<p>Para cada oferta existe ahora un vector en el espacio de diez dimensiones. Ahora hay que agrupar estas ofertas para posibles medidas de marketing, ventas previstas o para pedir materias primas por adelantado. El truco de la agrupaci\u00f3n, es decir, el proceso de formaci\u00f3n de grupos, consiste en determinar las distancias de los distintos vectores en el espacio de diez dimensiones.<\/p>\n\n\n\n<p>Las distancias entre l\u00e1pices colocados sobre la mesa de una oficina en un espacio tridimensional son f\u00e1ciles de determinar. Se mide la distancia con una regla. Todos los l\u00e1pices que est\u00e1n a menos de diez cent\u00edmetros de distancia pertenecen a un grupo, todos los dem\u00e1s al siguiente. (Oigo una oposici\u00f3n justificada: la agrupaci\u00f3n es un poco m\u00e1s compleja, pero el principio vectorial, tal como lo presenta el Director de Tecnolog\u00eda de SAP, J\u00fcrgen M\u00fcller, sigue siendo muy sencillo).<\/p>\n\n\n\n<p>Cada vector de oferta tiene como extremo un punto de datos en un espacio de diez dimensiones (v\u00e9anse los diez n\u00fameros anteriores). Las distancias eucl\u00eddeas se utilizan, entre otras cosas, como medidas de distancia o similitud para medir lo parecidos o distintos que son estos puntos de datos. Pero, \u00bfc\u00f3mo calculamos la distancia de los dos puntos de datos entre el vector de ejemplo mencionado anteriormente (5, 9, 3, 7, 11, 2, 42, 15, 6, 102) y una segunda oferta con aproximadamente el vector (7, 2, 5, 13, 25, 9, 1, 132, 55, 8)?<\/p>\n\n\n\n<p>El primer paso consiste en calcular la diferencia respectiva de los puntos de datos: Primer valor del primer vector de suministro menos el primer valor del segundo vector, es decir: 5 menos 7, 9 menos 2, 3 menos 5, etc. Estos resultados se elevan al cuadrado y se suman: -2 al cuadrado es 4, 7 al cuadrado es 49, etc. De la suma de los diez n\u00fameros elevados al cuadrado (4 m\u00e1s 49 m\u00e1s 4 m\u00e1s 36, etc.) se saca la ra\u00edz, \u00a1este resultado es la distancia eucl\u00eddea! \u00a1Eureka!<\/p>\n\n\n\n<p>Esto significa que existen relaciones matem\u00e1ticas claramente definidas entre el mill\u00f3n de ofertas. Estas distancias euclidianas pueden utilizarse ahora como medidas de similitud para la agrupaci\u00f3n. Esto permite crear excelentes mapas cuyas \u00e1reas (clusters) proporcionan informaci\u00f3n directa sobre preferencias, similitudes y tendencias. Hace unos diez a\u00f1os, E3-Verlag, junto con el profesor Alfred Taudes de la Universidad de Econom\u00eda y Negocios de Viena, cre\u00f3 un mapa Hana de este tipo basado en una encuesta realizada en la comunidad SAP. (Los resultados de la encuesta de entonces son el mill\u00f3n de ofertas de este ejemplo).<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Los mapas no son IA<\/h2>\n\n\n\n<p>Lo que el Director de Tecnolog\u00eda de SAP, J\u00fcrgen M\u00fcller, present\u00f3 en Bangalore en TechEd 2023 tiene una gran importancia pr\u00e1ctica. Muchos clientes actuales de Hana apreciar\u00e1n mucho la ampliaci\u00f3n del lenguaje a dimensiones superiores. Sin embargo, lo que se present\u00f3 es matem\u00e1tica muy tradicional y muy familiar. Presentar la distancia euclidiana como un hito en el desarrollo de Hana es extra\u00f1o.<\/p>\n\n\n\n<p>Suplemento: Adem\u00e1s de la distancia euclidiana, existe una segunda unidad de medida. La m\u00e9trica de Manhattan es una medida de proximidad, que tambi\u00e9n es una medida de proximidad o distancia para variables m\u00e9tricas como la altura, la edad o el peso. La m\u00e9trica de Manhattan mide las distancias como distancias perpendiculares; como caminar por un sistema de calles o salir en taxi. En cambio, la distancia euclidiana mide la distancia directa, m\u00e1s corta y diagonal (a vuelo de p\u00e1jaro). Ambos m\u00e9todos pueden utilizarse para generar clusters para un mapa de abastecimiento. <a href=\"https:\/\/welt-der-bwl.de\/Manhattan-Metrik\" data-type=\"link\" data-id=\"https:\/\/welt-der-bwl.de\/Manhattan-Metrik\" target=\"_blank\" rel=\"noopener\">\u200e (Fuente<\/a><\/p>","protected":false},"excerpt":{"rendered":"<p>La agrupaci\u00f3n, es decir, la b\u00fasqueda de similitudes, puede a menudo crear momentos muy esclarecedores cuando uno trabaja con grandes cantidades de datos. El truco se basa en el c\u00e1lculo de la distancia euclidiana y tambi\u00e9n puede hacerse sin Hana como un simple c\u00e1lculo mental.<\/p>","protected":false},"author":2,"featured_media":132122,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"pmpro_default_level":"","footnotes":""},"categories":[27840],"tags":[65,624,1175],"coauthors":[27825],"class_list":["post-133777","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-chefredakteur-blog","tag-hana","tag-ki-joule","tag-teched","pmpro-has-access"],"acf":[],"featured_image_urls_v2":{"full":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu.jpeg",1000,450,false],"thumbnail":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-150x150.jpeg",150,150,true],"medium":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-400x180.jpeg",400,180,true],"medium_large":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-768x346.jpeg",768,346,true],"large":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu.jpeg",1000,450,false],"image-100":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-100x45.jpeg",100,45,true],"image-480":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-480x216.jpeg",480,216,true],"image-640":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-640x288.jpeg",640,288,true],"image-720":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-720x324.jpeg",720,324,true],"image-960":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-960x432.jpeg",960,432,true],"image-1168":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu.jpeg",1000,450,false],"image-1440":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu.jpeg",1000,450,false],"image-1920":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu.jpeg",1000,450,false],"1536x1536":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu.jpeg",1000,450,false],"2048x2048":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu.jpeg",1000,450,false],"trp-custom-language-flag":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-18x8.jpeg",18,8,true],"bricks_large_16x9":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu.jpeg",1000,450,false],"bricks_large":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu.jpeg",1000,450,false],"bricks_large_square":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu.jpeg",1000,450,false],"bricks_medium":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-600x270.jpeg",600,270,true],"bricks_medium_square":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-600x450.jpeg",600,450,true],"profile_24":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-24x24.jpeg",24,24,true],"profile_48":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-48x48.jpeg",48,48,true],"profile_96":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-96x96.jpeg",96,96,true],"profile_150":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-150x150.jpeg",150,150,true],"profile_300":["https:\/\/e3mag.com\/wp-content\/uploads\/2023\/09\/Chefredakteur-neu-300x300.jpeg",300,300,true]},"post_excerpt_stackable_v2":"<p>Das Clustern, also das Finden von \u00c4hnlichkeiten, kann f\u00fcr gro\u00dfe Datenmengen oft sehr erhellende Momente schaffen. Der Trick beruht auf der Berechnung der euklidischen Distanz und kann auch ohne Hana nur als simple Kopfrechnung erfolgen.<\/p>\n","category_list_v2":"<a href=\"https:\/\/e3mag.com\/es\/categoria\/blog-del-jefe-redactor-2\/\" rel=\"category tag\">Chefredakteur-Blog<\/a>","author_info_v2":{"name":"Peter M. F\u00e4rbinger, E3 Magazine","url":"https:\/\/e3mag.com\/es\/author\/peter-m-faerbinger-e-3-magazin\/"},"comments_num_v2":"0 comentarios","_links":{"self":[{"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/posts\/133777","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/comments?post=133777"}],"version-history":[{"count":5,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/posts\/133777\/revisions"}],"predecessor-version":[{"id":134210,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/posts\/133777\/revisions\/134210"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/media\/132122"}],"wp:attachment":[{"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/media?parent=133777"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/categories?post=133777"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/tags?post=133777"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/e3mag.com\/es\/wp-json\/wp\/v2\/coauthors?post=133777"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}