Contenidos
Big Data proporciona información que no podríamos descubrir analizando datos a una escala menor.



Antes del advenimiento de las computadoras, recopilar y registrar información era una tarea ardua y que requería mucho tiempo. Para poner esto en contexto, considera la información necesaria para completar un censo de la población. Según la Constitución de los Estados Unidos, se requiere un censo cada década, sin embargo, el censo de 1880 tardó más de ocho años en completarse y publicarse. Esto significaba que la información se había vuelto obsoleta incluso antes de que estuviera disponible.
Pero eso fue entonces. Ahora, con la invención de las computadoras, la digitalización e Internet, la imagen ha cambiado considerablemente. La información se puede recopilar de forma pasiva (o con mucho menos esfuerzo) y a mayores velocidades, y el costo de almacenamiento es cada vez más económico. Esto nos ha llevado al advenimiento de la era big data.
Aunque no existe una definición formal, “big data” se refiere tanto a los datos que se capturan en una escala mucho mayor de lo que era posible anteriormente, como a las oportunidades que ofrecen conjuntos de datos de este tamaño en términos de información valiosa descubierta a través del análisis.
En 2009, Google proporcionó un gran ejemplo de las posibilidades de los grandes datos cuando publicaron un artículo de investigación que mostraba cómo podían analizar los términos de búsqueda de los usuarios para predecir el brote de gripe y controlar su propagación. Compararon datos históricos de términos de búsqueda con datos sobre la propagación de la gripe en el tiempo y el espacio de 2007 y 2008, y descubrieron 45 términos de búsqueda que podrían usarse en una fórmula para predecir la propagación de la gripe, una predicción que se correlacionó fuertemente con las cifras oficiales.
Solo unas semanas después de la publicación del artículo, el brote de la nueva cepa mortal de gripe, H1N1, llegó a los titulares. El sistema de Google entró en acción y proporcionó indicadores que demostraron ser más útiles y oportunos que las estadísticas gubernamentales para entregar información valiosa a los funcionarios de salud pública.