A pesar de lo impresionante que fue el progreso de las empresas hacia una economía basada en los datos el año pasado, el gran golpe que hemos estado esperando de los grandes datos aún está por llegar.
A pesar de lo impresionante que fue el progreso de las empresas hacia una economía basada en los datos el año pasado, el gran golpe que hemos estado esperando de los grandes datos aún está por llegar.
El año 2020 está grabado en la memoria colectiva de los CIOs como uno de los años más cataclísmicos y consecuentes de este siglo. Pero, aunque la pandemia ayudó a impulsar la transformación digital mucho más allá de las expectativas de cualquiera, no hay que equivocarse: No fue la tormenta perfecta que todos imaginamos.
En todo caso, la ola sin precedentes de despliegues basados en datos del año pasado puso de manifiesto las deficiencias de los marcos existentes que están silenciando el potencial de los macrodatos. Muchas organizaciones, por ejemplo, se han visto frustradas por el tiempo que puede llevar la preparación de los datos antes de que los analistas y científicos puedan siquiera iniciar un nuevo proyecto.
Además, el proceso de migración de los modelos resultantes a los procesos de negocio ha sido igual de molesto. Y sin los controles de seguridad y gobernanza adecuados en todo el ciclo de vida de los datos, los analistas y científicos de datos corren el riesgo de exponer y manchar permanentemente los almacenes de datos críticos.
Lo que estamos viendo es una triangulación de las estrategias de datos, protección de datos y nube. Y todas se están uniendo, con una gobernanza más omnipresente, la necesidad de esa triangulación no es nueva. Pero los requisitos se complicaron enormemente durante la pandemia, principalmente por dos razones. En primer lugar, el número de proyectos de ciencia de datos dentro de muchas organizaciones se multiplicó. Y, en segundo lugar, la constelación de fuentes de datos que alimentan esos proyectos se amplió enormemente.
Pero tal vez la mayor lección de la gestión de datos que se desprende de la pandemia es que muchas más organizaciones comprenden ahora que hay una forma correcta de manejar los datos, y una forma incorrecta. Y aunque hay herramientas que facilitan el trabajo, no hay atajos.
Muchos CIO y CDO están dando prioridad a la construcción, el alquiler o la compra de lo que algunos denominan una plataforma de datos en la nube, es decir, todo el trabajo de gestión a nivel del suelo que debe tener lugar antes, durante y después del brillante trabajo de excavar en el lago de datos en busca de respuestas.
Tormenta de Datos
Las tormentas perfectas se forman cuando, por fin, todos los ingredientes necesarios para impulsar un nuevo mercado hacia el cielo no sólo están disponibles, sino también lo suficientemente maduros como para escalar. Eso suena mucho más limpio de lo que ocurre en la vida real, por supuesto. Porque las secciones individuales del andamiaje rara vez se desarrollan al mismo ritmo. Peor aún, a veces es difícil ver qué está listo y qué no sin desplegar lo que está disponible en la naturaleza.
Lo cual, como todos sabemos, es exactamente lo que ocurrió durante la pandemia, cuando esta cerró todo, la evolución del uso de los datos para desbloquear los resultados se convirtió en una revolución.
Sin duda, el cierre desechó los modelos y cuadros de mando existentes, dejando sin valor las previsiones de oferta, demanda y costes ajustadas con precisión. Las empresas se encontraron de repente a ciegas. Necesitaban urgentemente nuevos sistemas para operar en una realidad que apenas empezó a tomar forma en marzo de 2020.
Esto hizo que las empresas se apresuraran a buscar nuevas fuentes de datos, dando lugar a la demanda de sistemas híbridos y multi-nube. Muchas empresas, por ejemplo, incorporaron las tasas de infección, las tendencias del sentimiento pandémico y otra información relacionada con la COVID a sus nuevos modelos en ciernes. Al mismo tiempo, algunas grandes organizaciones establecidas encontraron la religión de la reducción de costes durante el cierre y retiraron las cargas de trabajo estables y regulares de la nube.
Mientras que el número de cargas de trabajo se disparó en todas partes, la nube privada en realidad le quitó cuota no sólo a la nube pública, sino también a la híbrida y a la multi-nube. Según un estudio, más del 24% de las cargas de trabajo se desplegaron en la nube privada, lo que supone un notable aumento con respecto al 16,6% de hace un año. La nube híbrida sigue dominando, albergando el 35,8% de las cargas de trabajo.
Llevado al límite
Todo esto llevó a muchos equipos más allá de sus zonas de confort. Estaban acostumbrados, por ejemplo, a modelos construidos en torno a un único conjunto de datos complementarios. Así que la complejidad añadida de nuevos recursos con estructuras desconocidas situadas en intercambios lejanos elevó el reto a cotas vertiginosas.
Si a esto le añadimos el reto de gestionar el acceso de una nueva oleada de empleados de distintas unidades de negocio y departamentos corporativos a los que nunca les había importado lo que había en ese silo de datos, tenemos los ingredientes de una pesadilla de transformación digital.
Con esa tarea aparentemente abrumadora por delante, no es difícil entender por qué los productos de alto vuelo y de obtención rápida de información resultaron para algunos demasiado atractivos como para ignorarlos. Por desgracia, la IA sin la necesaria plataforma de datos en la nube puede crear más problemas de los que resuelve.
Una plataforma con cualquier otro nombre
La estructura impuesta a las organizaciones reguladas, les benefició el año pasado, cuando necesitaron aumentar su universo de fuentes de datos. Pero las que carecían de una estructura común para ayudar a los ingenieros a preparar y gestionar los datos de dos silos relacionados pero separados se encontraron totalmente desprevenidas para la tarea.
Para ellos, parte del obstáculo era que, casi por defecto, un modelo cerrado con su propio conjunto de datos dedicado viene con toda la preparación de datos y la ingeniería, seguridad, gobernanza y MLOps que necesita. Así que no tenían nada establecido y, hasta hace un año, ninguna motivación para instalar una estructura que garantizara la compatibilidad de dos conjuntos de datos internos.
Como resultado, no hay una estructura común para ayudar a los ingenieros a preparar y gestionar los datos de dos silos para servir a un nuevo y más amplio esfuerzo de exploración. Sin esa estructura, el arduo trabajo de preparación de los datos beneficia por defecto sólo a ese proyecto. Así que los ingenieros están condenados a enfrentarse a la misma hercúlea hazaña de cara al siguiente proyecto.
Un modelo para construir modelos
Todo esto viene a decir que existe una necesidad imperiosa de contar con una plataforma de datos en la nube que garantice esfuerzos sólidos, estándar, repetibles y reutilizables. Un modelo para construir modelos, por así decirlo. Puede que no sea glamuroso. Pero es una pieza esencial del andamiaje que debe estar en su lugar antes de que la tormenta perfecta que se avecina pueda rodar en el centro de datos.
Fuente: CIO
Comments