La combinación de conjuntos de datos puede crear un mayor valor.
Contenidos
La combinación de conjuntos de datos puede crear un mayor valor que las partes individuales.
Como cualquiera que haya jugado al juego de mesa Clue (es decir, Cluedo) lo sabrá, los datos pueden tener poco valor por sí solos, pero cuando se combinan con otros pueden decirte mucho más. Esto también es cierto para los conjuntos de datos: a veces su valor se vuelve aparente solo cuando se combina con otros conjuntos de datos. Las tendencias se pueden encontrar en los datos recientemente combinados que no se podían descubrir solo en los conjuntos de datos individuales.
Por ejemplo, en 2011 un grupo de investigación danés demostró este fenómeno. En uno de los estudios más grandes de este tipo, combinaron datos de usuarios de teléfonos móviles con registros de pacientes con cáncer. Esto significó que pudieron comprobar no solo un vínculo entre el uso del teléfono móvil y el cáncer, sino también si un mayor uso del teléfono móvil aumentó el riesgo.
Críticamente, utilizaron no solo una muestra de los datos, sino también registros de casi todos los casos de cáncer en el país, lo que les permitió controlar factores como la educación y los ingresos sin que los datos se volvieran poco confiables. A pesar de la naturaleza integral del estudio, los resultados publicados no recibieron mucha atención de los medios porque no se encontró evidencia de un vínculo.
Aunque el ejemplo anterior implica combinar diferentes conjuntos de datos, también se pueden lograr efectos similares combinando múltiples conjuntos del mismo tipo de datos que luego proporcionan un mayor valor en el agregado.
Inrix, una compañía de análisis de tráfico con sede en Seattle, se basa en este principio. Recopilan datos de ubicación en tiempo real de fabricantes de automóviles, flotas comerciales y su propia aplicación para teléfonos inteligentes. Poco a poco, esta información no es muy útil para los titulares de datos originales, pero al combinarla, Inrix puede crear datos oportunos sobre los flujos de tráfico y atascos para sus usuarios a cambio de una tarifa por su servicio.