Big Data no nos dice por qué dos cosas están relacionadas.
Contenidos
Big Data no nos dice por qué dos cosas están relacionadas, solo que lo están, pero incluso esto a menudo es lo suficientemente bueno.
Al comprar un automóvil usado, ¿qué criterios buscas para asegurarte de no terminar comprando un clunker? Puedes considerar cosas como la edad, el kilometraje, el país de origen y la marca y el modelo; todos estos criterios parecen bastante lógicos. ¿Pero tomarías en cuenta el color de la pintura del automóvil?
En 2012, los concursantes en una competencia de análisis de datos recibieron una tarea similar, y su análisis de correlación reveló un hallazgo sorprendente: los autos pintados de naranja tenían la mitad de probabilidades de tener defectos que el automóvil promedio.
Sin duda te preguntas por qué sería así. Tener curiosidad sobre las razones detrás de una relación y desarrollar teorías para explicarla es la naturaleza humana. Pero una de las implicaciones de los grandes datos es que no necesitamos desarrollar nuestras propias teorías sobre causa y efecto y luego probarlas. Los análisis automáticos de todos los datos pueden ofrecer correlaciones que nunca pensamos en buscar.
En el ejemplo del automóvil usado, las causas detrás de la relación pueden permanecer invisibles para nosotros, pero permitir que los datos hablen por sí mismos al menos puede ofrecer correlaciones. Y encontrar tales correlaciones ya se puede poner en uso práctico.
Considera la investigación de IBM y la Universidad de Ontario para ayudar a los médicos a tomar mejores decisiones al cuidar a bebés prematuros. Al analizar los datos sobre los signos vitales de los bebés, esperaban identificar cambios sutiles que pudieran indicar el inicio de la infección incluso antes de que los síntomas se vuelvan visibles. Contra-intuitivamente, el estudio reveló que los signos vitales de los bebés se volvieron muy estables antes de una infección grave, una especie de calma antes de la tormenta. Antes de la investigación, los médicos no se habrían preocupado por los signos vitales estables, pero armados con este hallazgo ahora pueden proporcionar un mejor tratamiento cuando más se necesita.