Minería de Datos

El Data Mining es un conjunto de técnicas y tecnologías que permiten explorar
grandes bases de datos, de manera automática o semiautomática, con el
objetivo de encontrar patrones repetitivos que expliquen el comportamiento de
estos datos.

Características

La característica que distingue a la minería de datos es que puedes obtener
información sin tener que hacer preguntas específicas, ya que su tarea es
resolver este ámbito:

Predictiva

Tiene como rol ser predictiva, en relación a la posibilidad de decir qué es lo
que puede pasar utilizando estadísticas y probabilidades de información que
está oculta en datos almacenados

Conocer

También funciona para conocer, además de eventos futuros, datos
importantes que conviene saber, pero que no están a la vista. Por ejemplo, una relación inusual entre las ventas de dos productos diferentes y cómo esa
relación varía de acuerdo a cómo se posicionan estos productos en los locales de ventas al por menor

¿Para qué sirve minar datos?

La minería de datos permite a las empresas optimizar el futuro al comprender el pasado y el presente, y hacer predicciones precisas sobre lo que es probable que suceda a continuación.

Aumento de ingresos

P

Adquirir nuevos clientes

Comprender los segmentos y las preferencias de los clientes

Mejora de la venta cruzada y la venta ascendente

Retención de clientes y fidelización

Detectar fraudes

Incrementar el ROI de las campañas de marketing

Identificación de riesgos crediticios

Fases de un proceso de data mining

Determinación de los objetivos
Procesamiento de los datos
Modelado
Análisis de los resultados

Técnicas más empleadas

Redes neuronales
Una red neuronal es un tipo específico de modelo de aprendizaje automático que se usa a menudo con inteligencia artificial y aprendizaje profundo.

Árboles de decisión
Los árboles de decisión son un tipo específico de modelo predictivo que permite a las organizaciones extraer datos de manera eficaz.

Regresión lineal
Las técnicas de regresión son útiles para identificar la naturaleza de la relación entre variables en un conjunto de datos.

Modelos estadísticos


Las técnicas estadísticas son el núcleo de la mayoría de los análisis involucrados en el proceso de minería de datos.