Seguinos en

Revista Information Technology

Predecibles

Por Alejandra Beresovsky El uso de técnicas de análisis de datos masivos para inferir comportamientos futuros se extiende a nuevos ámbitos y se vuelve cada vez más accesible. Promesas y desafíos de los modelos predictivos.
Publicado lunes 27 de febrero de 2023

El mayor acceso a grandes volúmenes de datos y el incremento de la capacidad de cómputo han extendido el uso de modelos predictivos para distintas aplicaciones, desde las más clásicas, como el análisis de riesgo financiero, hasta el diseño de contenidos de lectura específicos para cada consumidor o, inclusive, el desarrollo personalizado de tratamientos médicos.
A la par de ofrecer múltiples oportunidades, su utilización presenta a la par desafíos, como la comprensión de la dimensión ética de la gestión de información. También es amplia la expectativa sobre las posibilidades que ofrecerá a futuro, al igual que los temores sobre los efectos de posibles abusos.

“La enorme cantidad de datos que generamos y el incremento en el poder de cómputo dieron como resultado el incremento de investigaciones sobre nuevos algoritmos, capaces de resolver problemáticas más complejas, que hace algunos años nos hubiesen parecido impensadas”, explica Alejandro Taboada, profesor de Data Science de la Universidad de Palermo (UP). Taboada da ejemplos de cómo estos procesos se han incorporado a la vida cotidiana: “Actualmente, vivimos y convivimos rodeados de modelos predictivos, ya sea el autocompletado de texto en los mails de Gmail, la recomendación de videos de YouTube o el ordenamiento de imágenes en carpetas de Google Photos”.

Javier García Fronti, subdirector de la Maestría y Especialización en Gestión y Análisis de Datos de la Escuela de Negocios y Administración Pública de Económicas en la Universidad de Buenos Aires (UBA), considera que la novedad no está en el uso de los modelos, sino en quiénes han comenzado a usarlo. “Siempre hubo tecnologías de avanzada en las multinacionales, en las grandes empresas; pero actualmente lo que se ve es que cada vez más empresas medianas y pequeñas empiezan a incorporar tecnologías predictivas y también las usan áreas que antes no lo hacían, como Marketing o Recursos Humanos”, afirma.

A los fines de su procesamiento, los datos pueden dividirse en “estructurados” (organizados en general en bases de celdas y columnas) y “no estructurados” (no tienen un ordenamiento o formato predefinido, por ejemplo, las imágenes). Taboada señala que, según esta clasificación, son también diferentes las técnicas predictivas a utilizar.
“En la actualidad, se encuentran separadas en modelos ‘shallow’ (poco profundos) y modelos ‘deep’ (profundos)”, resume. “Si bien conceptualmente podríamos usar ambos para cualquier tipo de solución, en la industria los modelos de tipo ‘shallow’ (como las regresiones, los árboles de decisión, las máquinas de vector soporte) están más relacionados con la búsqueda de patrones en datos estructurados, como los productos que un usuario utilizó, la última fecha de logueo, la antigüedad de la cuenta, etcétera”, añade. Y completa: “Por otro lado, los modelos ‘deep’ o de ‘aprendizaje profundo’ (‘deep learning’) son utilizados para detectar patrones en datos no estructurados, como por ejemplo una imagen, un video, un audio o un texto”.

Las técnicas predictivas pueden contribuir al diseño de políticas públicas. Así sucedió, por caso, durante la pandemia, cuando un equipo de la Universidad Nacional de San Martín (Unsam) realizó un estudio sobre movilidad de la población con base en el uso de teléfonos móviles.
“Era una manera de estimar cómo se estaban cumpliendo las medidas de restricción. Si se sabía de qué lugar a qué lugar se movía la gente, se podría predecir hacia dónde iba el virus y poner barreras sanitarias para impedir ese movimiento”, describe Daniel de Florian, director del Centro Internacional de Estudios Avanzados de la Escuela de Ciencia y Tecnología de la Unsam.

31% de los profesionales de la cadena de abastecimiento ya utiliza el análisis predictivo en sus operaciones, mientras que el 48% tiene previsto adoptarlo en los próximos cinco años, según MHI.

De Florian destaca que un aspecto fundamental del proceso fue la protección de los datos personales. “Nos aliamos rápidamente con Movistar y procuramos cumplir con dos premisas: la de la información y la de la privacidad. Muchas veces las tecnologías modernas nos aportan múltiples soluciones en términos de seguridad, de salud o de lo que fuera, pero se inmiscuyen también con la privacidad”, enfatiza.

Lo que hicieron para conocer el movimiento de la población fue basarse en la conexión de los celulares a las antenas, lo cual garantizó que no se identificara a los usuarios. “Así no se puede determinar en forma precisa la ubicación de una persona, porque las antenas están muy separadas entre sí, pero al ser millones de celulares, estadísticamente se resolvían muchos problemas y se podía contar con una medida muy sólida sobre la movilidad del conjunto de la población”, apunta el físico.
Los datos aportados por las antenas de celulares luego se procesaban y, gracias tecnología de inteligencia artificial, se predecía el movimiento vehicular de los días posteriores.

Una variación muy grande respecto de la predicción generaba una alarma y se determinaba si tenía que ver con un relajamiento de las condiciones de restricción o con algún evento en particular”, señala De Florian, quien destaca la validez del sistema para otros usos en el futuro.
Diego Branca, director de IT de Roche, indica que una de las aplicaciones de los modelos predictivos en la industria farmacéutica es la medicina personalizada, la cual, aclara “no es hacer un tratamiento para una persona, sino para un grupo de individuos que se parecen”.

Es por ello que, a partir de datos, se hace un perfil genómico de un grupo de individuos y se lo incorpora a la investigación y desarrollo de nuevos fármacos”.

El especialista no está participando en esos trabajos, pero sí está utilizando modelos predictivos para, por caso, definir la oferta de contenidos educativos para profesionales de la salud.

“Hoy los médicos tienen demasiada información. Comenzamos a analizar su comportamiento en un portal educativo que lanzamos en 2020, llamado ‘Diálogo Roche’, para poder determinar lo que realmente les interesaba”, precisa. Y aclara: “La idea es que el médico no tenga que cargar datos, sino solo interactuar. Nosotros proporcionamos el contenido y analizamos el comportamiento.
El clic ya es una acción”.

Los negocios también han tomado en cuenta la creciente importancia de estos modelos y buscan usarlo cada vez más. Según un informe del MHI y Deloitte, el 31por ciento de los profesionales de la cadena de abastecimiento ya utiliza el análisis predictivo en sus operaciones, mientras que el 48 por ciento tiene previsto adoptar esta tecnología en los próximos cinco años. añade.

Convergencia profesional

Los profesionales que hacen análisis de datos pueden provenir de distintas áreas de conocimiento. Branca enfatiza que el equipo que conduce refleja esa diversidad.
“Hay profesionales de diseño, de comunicación, de marketing, de informática, de ciencia de datos y una filósofa, cuyo aporte es clave, porque hasta nos cambia la forma de preguntar”, revela.

“Por supuesto, siempre necesitaremos de la confluencia de expertos en sistemas para armar la infraestructura, profesionales de las estadísticas para trabajar mejor los datos, y muchas veces también de programadores especiales para manipularlos o desarrollar simulaciones”, recalca, por su parte, Hernán Etiennot, profesor del Área Académica de Sistemas de Dirección y Control del IAE, la escuela de negocios de la Universidad Austral.

Pero aclara: “Dependiendo de dónde se aplique, intervendrán entrenadores para equipos deportivos, biólogos para temáticas de medioambiente o salud, profesionales de marketing para vender los productos, entre otros”. Y concluye: “Ellos son quienes aportan la visión del negocio o actividad donde se aplicarán los datos, quienes traen las preguntas y le dan sentido a la interpretación de los números en la actividad”.

“Necesitamos de expertos en sistemas, profesionales de las estadísticas, y muchas veces también de programadores.” - Hernán Etiennot, profesor del Área Académica de Sistemas de Dirección y Control del IAE.

En los ámbitos corporativos y gubernamentales, el potencial es enorme. “La aplicación hoy es vasta, ha tomado espacio en los mercados con robots que compran y venden acciones basados en estas predicciones, desarrollan el marketing de las empresas, el diseño de los productos, hacen predicciones de mantenimiento y hasta se usan para la contratación de personal”, cuenta Etiennot.
“También impactan en la economía, con proyectos de datos abiertos por ciudades para que la gente pueda desarrollar proyectos de mejora de consumo o detectar cómo asignar determinados recursos a poblaciones carenciadas”, añade.

“(Hoy) se puede hacer un análisis muy fuerte, con pocas líneas de código y utilizando una gran cantidad de librerías públicas.” - Daniel de Florian, director del Centro Internacional de Estudios Avanzados de la Escuela de Ciencia y Tecnología de la Unsam

US$ 35,45 mil millones es el valor que se espera que alcance el mercado global de análisis predictivo para 2027, según Allied Market Research.

Desafíos

El uso de técnicas de análisis de datos y predictores tiene una enorme proyección, pero también grandes desafíos. Algunos de ellos tienen que ver con limitaciones.

“Hay dos aspectos fundamentales a destacar. El primero es que siempre la predicción se basa en datos pasados. Esto implica, por ejemplo, que si los datos son muy viejos, quizás no podamos predecir correctamente hasta no tener una cantidad de datos nuevos relevante y significativa.
Otra implicancia es que, si los datos pasados se basan en sesgos personales o culturales, la predicción mantendrá estos sesgos, salvo que se los corrija específicamente”, dice Etiennot. “El segundo punto a tener en cuenta es la responsabilidad en el uso de esta predicción social”, agrega. Este aspecto también es destacado por García Fronti: “No se puede hablar de estos temas sin abordar lo que algunos autores llaman ‘política de datos’”.

“Hay más datos, hay mayor capacidad de cálculo y, a partir de eso, se pueden hallar nuevos patrones de comportamiento de esos datos. El tema es cómo utilizar esos patrones de comportamiento y cómo, al encontrarlos, se respeta la privacidad de quienes brindan los datos”, reflexiona. La accesibilidad de las tecnologías también puede generar desigualdades, pero en ese punto, De Florian es optimista. “Una de las grandes revoluciones de la ciencia de datos hoy es que se puede hacer un análisis muy sustantivo, muy fuerte, muy sólido, con unas pocas líneas de código y utilizando una gran cantidad de librerías públicas. Eso ha impulsado la posibilidad de que mucha gente sin conocimiento muy preciso pueda hacer ese trabajo”, desarrolla el especialista como cierre.