Actualidad

La nueva era de los datos: nuevos retos para una gestión eficiente

El auge que están experimentando los proyectos de transformación digital, unido al impacto de la pandemia de la COVID-19, que ha incrementado el uso de la Red, ha elevado el crecimiento del volumen de datos que se generan. Especialmente el incremento se ha visto en redes sociales y mensajería, plataformas que impulsan la proliferación de datos efímeros que se convierten en un aliado para las empresas pero a la vez un desafío. La gestión de los datos es un reto de hoy para estar preparados para el mañana.

La cantidad de datos creados, consumidos y almacenados en el mundo crece cada año a un ritmo imparable. Si hace años los pronósticos acerca del crecimiento de los datos que se esperaban de cara al futuro ya apuntaba a grandes volúmenes, la pandemia de la COVID-19 ha acelerado estas cifras ante el aumento de la cantidad de personas que trabajan en remoto, el auge de la educación online, y el crecimiento del ocio en el hogar.

Esta marabunta de datos hace que su gestión se convierta en un auténtico quebradero de cabeza para los responsables de TI y de la seguridad en las organizaciones. No obstante, y atendiendo al hecho de que los expertos alertan de que la creación y replicación de datos crecerá a un ritmo más rápido de la capacidad de almacenamiento instalada, uno de los aspectos que más preocupan ahora es la generación y gestión de datos efímeros.

En 2020 se crearon 64,2 Zetabytes de datos pero menos del 2% se han almacenado

Según datos de IDC, en 2020 se crearon o replicaron 64,2 Zetabytes de datos, cuando la capacidad de almacenamiento total instalada era de 6,8 Zetabytes. Sin embargo, menos del 2% de los nuevos datos generados a lo largo del pasado año se ha guardado y almacenado hasta 2021, el resto se pueden catalogar como datos efímeros, creados o replicados principalmente con el propósito de consumo, o se ha almacenado temporalmente en caché y, posteriormente, se han sobrescrito con datos más nuevos.

Las previsiones de la consultora apuntan que este impacto se resentirá durante años de forma que la cantidad de datos digitales creados hasta 2025 será mayor que el doble de la cantidad de datos creados desde la instauración del almacenamiento digital. La pregunta es, ¿cuánto se debe almacenar?

El pronóstico de IDC señala que la creación y replicación de datos globales experimentará una tasa de crecimiento anual compuesta (CAGR) del 23% durante el período que va del año 2020 al 2025. Por tanto, habrá que estar muy pendientes de cómo avanza su proliferación para una eficiente gestión de datos.

Crecimiento imparable, gestión urgente

Las previsiones apuntan que el auge de IoT (Internet de las Cosas), y sin incluir las cámaras de videovigilancia, conllevará que sean los datos generados por estos dispositivos conectados los que experimentarán el crecimiento más rápido, seguido de los datos generados por las redes sociales.

Otro aspecto interesante es que los datos creados en la nube no crecen tan rápido como los datos almacenados en ella. Además, la creación de datos en el perímetro está creciendo casi tan rápido como en la nube y, según IDC, el DataSphere empresarial crecerá dos veces más rápido que el DataSphere de los consumidores debido al papel cada vez mayor de la nube para el almacenamiento y el consumo.

Impulsado por el crecimiento constante en la cantidad de datos creados y replicados, la consultora espera que la expansión incesante del StorageSphere produzca un crecimiento anual compuesto del 19,2% durante los próximos cinco años en la base instalada de capacidad de almacenamiento en todo el mundo. Si bien no todos los datos creados o replicados se guardan (o deben guardarse), el crecimiento de la creación de datos finalmente impulsa el crecimiento de la base instalada.

Las organizaciones deberían prepararse para almacenar más datos

La base instalada de capacidad de almacenamiento según el índice Global StorageSphere alcanzó 6,7 Zetabytes en 2020, y está creciendo constantemente, pero a una tasa de crecimiento anual más lenta que la de Global DataSphere, lo que significa que estamos ahorrando menos datos que creamos cada año.

Las organizaciones deberían considerar prepararse ahora para almacenar más datos mientras buscan alcanzar hitos de transformación digital y mejorar las métricas comerciales acelerando iniciativas innovadoras de análisis de datos.

Nuevos retos

Los datos se han convertido en un activo importante, si no el que más, para las organizaciones. Pero ya no es suficiente solo con guardarlos, urge tener un gobierno del dato que permita su gestión de datos eficiente y que explotarlos para extraer el máximo valor de ellos. Y aquí los retos a afrontar son muchos.

Datos multi-estructurados, con ruido, volátiles… son algunas características que evidencian que el enfoque tradicional para integrar datos ya no es productivo ni suficiente. Esto conlleva la necesidad de que las organizaciones adopten un nuevo esquema, más flexible y que atienda a los nuevos requerimientos.

Especialmente importante es cómo afrontar un gobierno de datos ante el creciente volumen de datos desestructurados, que están disponibles pero pueden no estar preparados para ser utilizados, así como los multi-estructurados que se han ido almacenando en data warehouses tradicionales y aplicaciones de Business Intelligence. A esto se le suma el creciente uso de redes sociales y aplicaciones que apuestan por la volatilidad de los datos, como son stories de Instagram o mensajes en redes como Snapchat, contenidos efímeros pero difíciles de controlar.

Guardar los datos no es suficiente, es necesario sacar el máximo rendimiento

Además, cada vez se precisan más análisis de interacciones y gestionar datos “con ruido”, cuando los grandes volúmenes de datos están acompañados por un mayor volumen de datos que suponen ruido, por lo que se necesitan modelos rentables de almacenamiento, procesamiento  y gestión de datos.

La calidad de los datos también es otro de los quebraderos de cabeza y que hay que tener muy en cuenta a la hora de gestionar datos. En muchos casos se almacenan los denominados “datos sucios”, que llevan a las organizaciones a tener que asumir costes económicos con datos no válidos.

Con todo ello, las estructuras de datos deben ser veloces. Si la velocidad de generación de datos es muy superior a la capacidad de procesamiento, puede que en el momento de analizar los datos, ya estén obsoletos.

Esto lleva a que, sin duda, hoy día una de las grandes preocupaciones de las organizaciones se está produciendo con el uso de la mensajería efímera. Se trata de una tecnología dinámica que permite a las personas enviar mensajes cifrados seguros de un extremo a otro y que se borran automáticamente después de un breve período. Con el auge de aplicaciones de mensajería efímera como WhatsApp o Clubhouse, es importante que las organizaciones consideren los beneficios y riesgos para actualizar las políticas de comunicación de los empleados.

Si bien pueden destacarse beneficios tales como que disminuyen las preocupaciones por la privacidad al proteger las comunicaciones y los datos confidenciales, también hay que tener en cuenta su efecto positivo en la gobernanza de los datos, ya que los datos innecesarios pueden eliminarse en lugar de retenerlos y que queden obsoletos.

La minimización y eliminación de datos también ayuda al cumplimiento de las leyes de privacidad como el Reglamento general de protección de datos (RGPD) y reduce el riesgo de exposición a violaciones de datos.

Pese a estas ventajas, la mensajería efímera puede presentar obstáculos, por lo que las organizaciones que cuentan con datos efímeros deben ser conscientes de cómo las aplicaciones están programadas para eliminarse, qué datos se almacenan y los tipos de comunicaciones en las que los empleados participan en varias plataformas.

Las organizaciones deben tomar decisiones informadas y desarrollar políticas de uso integrales

Si bien estas aplicaciones pueden ayudar significativamente a las organizaciones a alcanzar objetivos de gobernanza de la información, como hacer una gestión de datos para reducir los  innecesarios y promover la privacidad desde el diseño, muchas permiten a los usuarios elegir un período de tiempo para la eliminación de mensajes y ofrecen un control de usuario adicional. Para cumplir con los objetivos de retención y eliminación de datos, las organizaciones pueden crear una política detallada sobre qué tipos de comunicación deben realizarse con mensajes efímeros, qué eliminar y qué preservar.

Pero también hay que prestar mucha atención a los temas de seguridad. Las organizaciones deben tomar medidas afirmativas para gestionar los riesgos de mensajería efímera. Debido a la naturaleza volátil de este contenido efímero y al potencial de uso indebido, las organizaciones deben prepararse proactivamente para los riesgos y monitorizar el uso de estas aplicaciones por parte de los empleados.

Por lo tanto, las organizaciones deben tomar decisiones informadas y desarrollar políticas de uso integrales para aplicaciones de mensajería efímeras. Las decisiones informadas sobre esta tecnología son cruciales ya que las políticas son la forma en que las organizaciones pueden controlar, monitorizar y hacer cumplir el uso de mensajería efímera.

Hacia un almacenamiento eficiente

En este escenario, si ya el creciente volumen de datos que deben gestionarse lleva años apuntando hacia un desafío considerable, ahora, su crecimiento exponencial, unido al auge de los datos efímeros hace que el reto sea aún mayor.

Por eso es crucial que las organizaciones establezcan una estrategia clara para que el almacenamiento de datos sea eficiente. Los datos son cruciales para los esfuerzos de cualquier organización y lo serán aún más a la hora de establecer su resiliencia digital, la capacidad de para adaptarse rápidamente a las posibles interrupciones del negocio aprovechando las capacidades digitales para no solo restaurar las operaciones comerciales, sino también capitalizar las condiciones cambiantes. Los datos permiten la resiliencia digital porque las empresas dependen de los datos.

Asimismo, las empresas que han hecho, o están realizando su transformación digital, utilizan datos para desarrollar soluciones nuevas e innovadoras para la empresa del futuro. Las empresas están descubriendo que tener más datos no solo ayuda a afirmar la dirección en la que avanzan, sino que también crea oportunidades para lanzar nuevas fuentes de ingresos en sus carteras de productos.

Los datos son la fuente para pulsar la confianza de empleados, socios y clientes

Junto a esto, no hay que olvidar que cada vez es más importante que las organizaciones monitoricen a sus empleados, socios y clientes para mantener altos niveles de confianza y empatía que aseguren la satisfacción y lealtad del cliente. Los datos son la fuente de este pulso.

Muchas organizaciones creen que existe un valor latente y potencialmente no extraído del análisis de datos más antiguos. Sin embargo, el coste de almacenar más datos impide que las organizaciones modifiquen sus políticas de retención de datos que llevarían a retener los datos por más tiempo.

Este es un factor que se espera que continúe siendo un obstáculo hasta que las organizaciones comiencen a mostrar un ROI positivo en las iniciativas de análisis de datos, especialmente con datos más antiguos. El ROI comprobado en las iniciativas de análisis reforzaría la necesidad de almacenar más datos o retenerlos por más tiempo.

Seguir estas consideraciones ayudará a estas organizaciones a extraer un mayor provecho de los datos almacenados y disponer de datos de verdadero valor entre las grandes cantidades que cada día se gestionan.

Imagen inicial | Luca Bravo