¿Qué es la normalización de datos?

tipos de normalizacion

¿Qué es la normalización de datos?

La normalización es, como la propia palabra indica, el acto de establecer una norma sobre algo.  Las normas que se aplican pueden ser muy diversas y aplicadas a una infinidad de datos distintos.

En Accumin Intelligence hablamos de normalización, cuando se tratan los datos de nombre y/o dirección separándolos en sus diferentes componentes y verificando su validación.

Al separar una dirección postal se divide o campifica cada uno de sus componentes: tipo y nombre de vía, número de portal, complementos de la dirección (piso, puerta, letra, bloque y escalera), código postal y población. En el caso de los nombres se separa el dato tratado en: nombre, nexo del primer apellido, primer apellido, nexo del segundo apellido y segundo apellido.

Normalizar no es solamente dividir una dirección o nombre en los campos correspondientes, sino que también se aplican reglas y normas para corregir las palabras siempre de la misma manera, independientemente de cómo esté escrito en su origen.

Por ejemplo, convertimos las diferentes formas en las que se puede escribir el término “Avenida”, como puede ser: AVD; Avd; AV; AVA; Avinida; Abenida,…  en una común: “AVDA”.  Al igual sucede con las abreviaturas en apellidos y nombres, por ejemplo: “MTNEZ” que una vez tratado se normalizará por “MARTINEZ” y se identificará como apellido.

Los datos correspondientes al nombre además de normalizarse se enriquecen con el género  en función del nombre de origen y los datos de dirección se contrastan con fuentes oficiales para verificar si son o no válidos, incorporando indicadores que permiten saber el grado de validación de la dirección postal y la fiabilidad de la misma.

En Accumin Intelligence también normalizamos teléfonos bajo un estándar, en este caso se eliminan los caracteres no numéricos, se asigna el prefijo y se validan los primeros dígitos del número. Al igual sucede con el DNI, el cual estandarizamos eliminando los caracteres habituales como puntos, guiones y comas, para mantener un formato común.

En el caso de los e-mails podemos hablar de la misma situación, eliminamos caracteres no habituales y normalizamos estandarizando las direcciones de correos más habituales como Gmail o Hotmail, cuando se encuentran mal escritas.

Ventajas de la normalización de datos

Otras formas de optimización de datos

Deduplicación de datos

Identificamos duplicidades en las bases de datos para conseguir una visión única de cliente.

Enriquecimiento de datos

Aportamos riqueza y aumentamos la información de las bases de datos con información geográfica y estadística. 

Hablemos

Te ayudaremos a encontrar la mejor solución

de datos para ti. Escríbenos sin compromiso

y te contactaremos lo antes posible.