Mostrando entradas con la etiqueta Datamining. Mostrar todas las entradas
Mostrando entradas con la etiqueta Datamining. Mostrar todas las entradas

martes, 23 de febrero de 2010

BI & GeoMarketing... es una locura?

Hace tiempo que no comentamos nada, pero es lo que tiene liarse la manta a la cabeza y meterse en un fregado interesante. Por fin y tras unos meses de trabajo tenemos montada una plataforma de datawarehouse orientado de forma específica a marketing, escalable y accesible via web. En breve publicaremos oficialmente su lanzamiento, pero en primicia adelantaros de que su manejo se realiza via web, incluyendo los cubos de datos. El sistema de reporting esta basado en Flex, por lo que funcional y gráficamente es muy potente. Y tanto la analítica como por supuesto la salida de datos indudablemente incluye GIS.

Estamos realizando los primeros análisis en producción con un cliente de gran consumo que maneja casi 4 millones de registros de clientes en su CRM, años de información de campañas y una gran diversidad de líneas de producto. Incluimos redes de distribución (retail) a varios niveles, regiones comerciales, resultados de ventas y todas las campañas de marketing asociadas al CRM y lo cruzamos en tiempo real contra toda nuestra base de análisis sociodemográfico, económico, comercial y especialmente de competencia, áreas de influencia primarias y secundarias de distribución, información de AIMC marcas, tránsito etc etc. Estamos montando un motorcito de análisis predictivo (aun en pañales, pero ahi vamos) Lo mejor de todo es que hasta funciona :-)

En fin, que ya comentaremos mas en profundidad pero de momento os lo presento, el nombre es español, que ya era hora.

viernes, 5 de junio de 2009

Análisis Espacial en el Geomarketing: GeoDA

Uno de los principales problemas que se plantean a la hora de analizar los resultados de un proyecto de geomarketing es la falta de software para hacer este tratamiento. Si bien con el geomarketing podemos representar nuestros clientes, competencia, cuotas, etc, se debe buscar un por qué a esta situación.

Hoy en día es normal el uso de técnicas de data minning para conocer la tipología de nuestros clientes, por ejemplo, su Índice de Capacidad Ecónomica, Edad, Sexo, etc, pero se pueden estudiar las variables espaciales, también conocido por Análisis Exploratorio de Datos Espaciales (AEDE), que explican su distribución en el espacio.

Para ello existen diferentes softwares y módulos para programas comerciales, como el caso de GeoStatical Analyst de ESRI, el PDM de GeoConcept o el caso del programa que me gustaría presentar, GeoDA, desarrollado por Luc Anselin (Universidad de Illinois). El programa se presentó en 2002 y se puede descargar de manera gratuita desde aquí.



El programa se puede dividir en:

  • 1. Entrada de datos y edición. Trabaja con puntos y polígonos, y permite la edición de los mismos, la creación de grids, centroides y polígonos de Thiessen. Compatible con el formato shp de ESRI.
  • 2. Transformación de variables y creación de nuevas variables a paritr de funciones log, exp. Permite la creación de consultas (joins) y cálculos algebráicos
  • 3. Mapeo. Mapas temáticos, cartogramas y animaciones. Cuartiles, Desviaciones, percentiles, "box map", cartograma circular...
  • 4. Gráficos estadísticos. Histogramas, "box plot", "scatter plot", ·D "scatter plot".
  • 5. Autocorrelación espacial o dependencia. Coincidencia de valores altos/bajos de una variable en el espacio. La técnica usada es la dispersión de Moran, que representa en el eje X la variable previamente estandarizada y en el Y la variable espacialmente retardada de dicha varaible estandarizada. También permite estudiar las concentraciones espaciales, también denominadas zonas frias/calientes. La técnica usada es LISA (Local Indicator of Spatial Asociation) basado en la dispersión local de Moran.
  • 6. Regresión Espacial.

Para más información se pueden consultar los siguientes artículos y manuales:

* Fuente: Blog de GeoMarketing de Jesus Lagos
* Análisis Estadístico de datos geográficos en GeoMarketing: el programa GeoDa. Coro Chasco Irigoyen.
* GeoDa: An Introduction to Spatial Data Analysis. Luc Anselin.
* Manual de GeoDa.
* Web de GeoDa.

sábado, 30 de mayo de 2009

Los sistemas GIS y su relación con Business Intelligence

Los Sistemas de Información Geográfica (SIG) en su parte de aplicaciones para GeoMarketing tienen planteamientos parecidos a los de Business Intelligence. Tanto es así que es frecuente la aparición de ambos ámbitos en un mismo proyecto. La discusión sobre si el geomarketing es o no un tipo de BI nos parece poco productiva; en cambio si son realmente interesantes los valores añadidos que pueden aportar a las empresas tanto los procesos como las tecnologías involucradas. Ya hemos comentado en alguna ocasión los espectaculares resultados que estaban produciendo la integración de BI y SIG.

Una definición sencilla de SIG sería un sistema de información que gestiona datos con localizaciones exactas en una representación del mundo físico, lo que llamamos datos espaciales, y atributos temáticos referidos a objetos referenciados con los datos espaciales.

En un SIG se captura, recolecta, almacena, analiza, comparte, gestiona y visualiza información georeferenciada. Cuando tenemos que construir un GIS lo primero que hacemos es analizar la información que se desea integrar. Frecuentemente nos encontraremos con diferentes formatos (CAD, otros formatos digitales, PDF, papel…).

El objetivo de este análisis será normalizar y unificar esa información, construyendo un tipo de base de datos que se denomina base de datos geográfica. Tras este diseño pasamos a un proceso que casi siempre está en los proyectos de BI: el ETL. Dentro de la BD geográfica se integra información cartográfica junto con información proveniente de otros sistemas, como puedan ser CRM, ERPs, callejeros o herramientas de diseño. Desde un punto de vista técnico pueden ser cualquier cosa integrable: datawarehouses, datamarts, bases de datos, imágenes escaneadas…

En una BD geográfica queda modelizado el mundo real en términos de objetos con su representación gráfica en términos de tamaño y dimensión relativa a la superficie de la tierra. Estos datos, que llamamos cartográficos, quedan integrados a su vez con lo que se denominan atributos temáticos. Ejemplos típicos de atributos temáticos son los datos sociológicos, económicos y demográficos.

Los objetos geográficos están organizados en capas de información. Objetos que físicamente tendrían la misma ubicación quedan organizados en distintas capas, pudiendo ser visualizados o no según las necesidades.

Por ejemplo, si una empresa desea representar la ubicación física de sus clientes actuales y potenciales para hacer una campaña de marketing, tendríamos en un GIS el mapa cartográfico de la ciudad en cuestión por un lado y por ejemplo representaríamos los atributos temáticos disponibles sobre tipo de compra que efectúan los clientes actuales y la capacidad adquisitiva de los potenciales. El análisis de esta información puede por ejemplo delimitarnos zonas geográficas con denominadores comunes interesantes entre clientes potenciales y actuales. Con este conocimiento podríamos crear una campaña muy localizada a coste bajo y por tanto muy productiva.

Para ello el SIG provee de capacidad analítica para gestionar datos georeferenciados teniendo en cuenta que lo que nos interesa es que se están referenciando objetos con una componente espacial sobre los que se tiene información asociada.

Se suele clasificar los SIG en tipo Vectorial o de tipo Raster aunque actualmente se maneja la información con ambos tipos. Por otro lado también están los más recientes SIG Orientados a Objetos.

Los SIG Vectoriales utilizan puntos y vectores definidos en términos de pares de coordenadas y altitudes respecto a un sistema cartográfico... Por otra parte los SIG Raster están especialmente indicados en aquellos casos en los que los objetos a representar son difusos o difíciles de delimitar como puede ser una mancha de petróleo o una nube. Delimitan la base de datos mediante mallas de píxeles. En caso de que sea necesaria una resolución muy alta y por tanto subir el número de píxeles el rendimiento del sistema se ve penalizado.

Los SIG orientados a objetos organizan la información geográfica a partir de los objetos geográficos y sus relaciones con otros. Incorporan además la dinamicidad de los objetos en términos espaciotemporales.

La interfaz de visualización principal de un SIG es por supuesto el mapa que hace el papel de dashboard sobre el que interaccionamos tanto para acceder, visualizar y analizar la información como para generar informes y mejorar la toma de decisiones. Los análisis geográficos son especialmente potentes al poder superponer en el mapa las características de los elementos de una misma categoría y poder hacer operaciones en las que se tenga en cuenta la conectividad, la coincidencia y la contigüidad de objetos.

Tras construir el SIG los usuarios disponen de un sistema fiable que les permite acceder de forma rápida, homogénea y organizada a conjuntos de información que han sido integrados según las necesidades de la empresa y a la que antes no tenían acceso, tenían una visión limitada y parcial o que el proceso de conseguirla era lento, costoso en cantidad de horas-hombre invertidas, proclive a errores o muy difícil de conseguir de forma integrada, por ejemplo por diferencias de formatos (CAD, papel, formatos digitales, PDF, etc).

Como mayores valores añadidos de un SIG destaca su capacidad, al igual que en Business Intelligence, de realizar análisis complejos aunque sobre entornos geográficos y la mejora de la toma de decisiones asociada, el acceso fácil y rápido a información exacta, completa, relacionada y actualizada y la generación de mapas e informes de gran calidad. En general, al implantar un GIS, se reducen los costes operativos, se incrementa la productividad y se ahorra mucho tiempo en la gestión de mapas.