Resumen del libro Big Data por Viktor Mayer-Schönberger y Kenneth Cukier

Lee este Resumen del libro Big Data por Viktor Mayer-Schönberger y Kenneth Cukier y conoce explicaciones y ejemplos de las herramientas de Big Data para crear valor y ganancias.

Grandes conjuntos de datos más desordenados.

Grandes conjuntos de datos más desordenados pueden ser más útiles que los más pequeños y precisos.

Mientras intentaban desarrollar un programa de traducción de idiomas en la década de 1980, los ingenieros de IBM tuvieron una idea novedosa. Decidieron prescindir del método estándar de usar reglas gramaticales y diccionarios y, en cambio, permitieron que la computadora confiara en probabilidades estadísticas para calcular qué palabra o frase se solicitó, en función de las muestras de texto traducido que ingresaron.

Los ingenieros de IBM decidieron usar una muestra grande pero limitada de datos de alta calidad, usando tres millones de pares de oraciones de traducciones oficiales de documentos parlamentarios canadienses. A pesar de los primeros resultados prometedores, el proyecto fracasó. Aunque el sistema podía proporcionar traducciones confiables para las palabras y frases usadas con mayor frecuencia, era menos confiable para aquellas que ocurren con poca frecuencia. El sistema falló, a pesar de la calidad de los datos. El problema era la cantidad, simplemente no había suficiente.

Cuando tenemos solo una pequeña proporción de los datos, las imprecisiones pueden ser un gran problema, especialmente cuando queremos ver los resultados que ocurren con poca frecuencia. Pero a medida que avanzamos para tener proporciones de datos significativamente más altas, las imprecisiones tienen un efecto mucho menor en los resultados.

Menos de una década después del intento fallido de IBM, Google decidió abordar el problema de la traducción con un enfoque ligeramente diferente. Decidieron usar un conjunto de datos mucho más grande de calidad cuestionable: todo el Internet global. Su sistema recorrió la web y utilizó cualquier traducción que pudiera encontrar, que ascendía a miles de millones de páginas de texto. A pesar de la dudosa calidad de la entrada, el gran volumen de datos hizo que las traducciones del sistema fueran más precisas que las de cualquier sistema rival.

El tamaño de los conjuntos de datos que podemos tener con Big Data nos permite ser más indulgentes en términos de inexactitudes en los datos; tener una proporción tan grande de los datos disponibles minimiza el efecto de cualquier inexactitud.

Más resúmenes y artículos como éste para tí

La gran historia de todo (Origin Story) por David Christian

Grandes conjuntos de datos más desordenados. Contenidos Página 1: IntroducciónPágina 2: La recopilación de datos.Página 3: Big data nos libera …

Resumen del libro El Suéter Azul (The Blue Sweater). Por Jacqueline Novogratz

El resumen del libro El Suéter Azul, es una mirada autobiográfica a los viajes de la autora por África y cómo la ayudaron a comprender los fracasos de la caridad tradicional

Resumen del libro Cruzando El Abismo (Crossing the Chasm). Por Geoffrey A. Moore

El resumen del libro Cruzando el abismo, examina la dinámica del mercado a la que se enfrentan los nuevos productos innovadores

Resumen del libro Sed (Thirst). Por Scott Harrison

El resumen del libro Sed, es la crónica inspiradora de la vida de Scott Harrison desde su inusual infancia hasta sus noches como promotor de fiestas en la ciudad de Nueva York y, finalmente, como el CEO de caridad

Resumen del libro En Deuda (Debt). Por David Graeber

El resumen del libro En deuda, presenta un examen antropológico del dinero que desafía los supuestos comunes, afirmando que el dinero y el concepto de deuda son en realidad productos de circunstancias históricas específicas

Resumen del libro Dar y Recibir (Give and Take). Por Adam Grant

El resumen del libro Dar y recibir, ofrece un soplo de aire fresco a las teorías tradicionales sobre lo que se necesita para tener éxito