Actualidad

Dirty data: qué es y qué puede suponer para las empresas

A estas alturas a nadie le sorprende que se hable de los datos como una de las armas más importantes para ser una empresa competitiva. Pero la información por si sola no es nada si no se tiene en cuenta dónde está, quién la tiene y para qué nos puedes servir. Y ese es precisamente el mayor reto de los partners que trabajan en torno a la analítica de datos. Conseguir que estos no se conviertan en dirty data.

Al definir el dirty data podemos decir que son el conjunto de datos incorrectos, incompletos, desactualizados o duplicados que se encuentran en las bases de datos o equipos de los trabajadores de las empresas.

El 82% de los datos empresariales son dirty data

Estos datos pueden ser incorrectos bien porque el usuario se ha equivocado al introducirlos o han quedado obsoletos (por ejemplo, por un cambio de domicilio), o bien porque han sido falsificados de forma intencionada con fines ilegales o delictivos en encuestas, formularios o solicitudes de prueba de un servicio. Entre los datos más falsificados está la edad, seguido por la localización y la dirección de email.

Esta información podría suponer hasta el 82 % de los datos de las compañías, según advierte Hocelot. Todo ello porque entre 2017 y 2019 esta tipología de datos ha crecido un 57% en las bases de datos empresariales. Un alto porcentaje que generaría cada año unas pérdidas de 321 millones de euros.

La importancia del dato actualizado

Atajar el dirty data es una necesidad para cualquier organización. No solo contar con la información sino además que sea verídica para poder hacer análisis, esté completa para la toma de mejores decisiones y por supuesto, no tenga duplicidades que ocupen espacio y añadan sobrecostes innecesario a la compañía.

Los beneficios son dobles, tal y como explica Antonio Camacho, CEO de Hocelot:

Estamos percibiendo una mayor concienciación entre las empresas para implementar soluciones que les ayuden a identificar qué datos son incorrectos y limpiar y optimizar así sus bases de datos. Pero también vemos beneficios directos sobre los clientes finales, que ven como los productos que les ofrecen las empresas se ajustan mejor a sus necesidades reales».

Y es que estructurar los datos correctamente es un reto en si mismo. Una necesidad cada vez más apremiante teniendo en cuenta que cada día se genera más información. No en vano la gestión del dato, con todas las posibilidades de automatización y administración posibles, es y será una oportunidad de negocio clave para los partners TI.