And every one that heareth these sayings of
mine, and doeth them not, shall be likened unto a foolish man, which built his
house upon the sand: And the rain descended, and the floods came, and the winds
blew, and beat upon that house; and it fell: and great was the fall of it.
San
Mateo 7:26-27 (King James Version)
Además, ellos que escuchan mis
palabras sin hacer caso a su sabiduría serán como un hombre tonto quién había
construido su casa sobre arena. Pues, se llovió con inundaciones y vientos
fuertes y golpearon tal casa sobre arena. Por supuesto, esa casa colapsó y grande fue tal caída…
Resumen. Esta carta se
centrará en un producto de WSI, disponible mediante WSI McDigital, que puede
ayudar el desarrollo de Tijuana. Se encontrará dos traducciones – un folleto
promocional y un artículo de la revista “Foreign Affairs”, ambos sobre los
grandes datos (BIG DATA) – después una breve discusión sobre la accesibilidad
de esta inteligencia e información.
|
Summary. This discussion reviews an
information-based marketing intelligence product of WSI that can aid
Tijuana in becoming a tech axis. The complementary readings – the WSI-World
product brief and an article from “Foreign Affairs" that deal with BIG DATA –
create a theoretical and commercial depth underlying this new "El Dorado" or Fountain of Truth. The previous essay on BIG DATA is now bilinguë.
|
Comentarios
sobre los BIG DATA. La banda “The Police” produjo una canción popular hace treinta años
que dijo, “Demasiados datos corriendo dentro de mí; demasiados datos me
haciendo loco…” ¡Cómo relevante es esta angustia hoy en día! Sin embargo,
tanta información tiene sus ventajas para nosotros:
[1]
fuente profunda de información;
[2]
inteligencia en tiempo real;
[3]
patrones de datos como indicadores de la tendencias emergentes; y,
[4]
generador constante de nuevas ideas.
|
Thoughts on BIG DATA. Thirty years
ago, a popular song lamented a Chinese water torture of data dripping into the besieged
minds of bewildered moderns. That complaint made sense a generation ago, before the
data-deluge of the inter-net. Imagine its relevance today! Noah’s flood was a
puddle compared to this disruption. Nevertheless, tucked inside in all those
data is several big-bangs of information. Indeed, these BIG DATA give
intuitive thinkers a strategic advantage in connecting dots into new
masterpieces.
|
Al contrario a los métodos analíticos de
estadísticas, esta información desde los BIG DATA no es exacta pero es
indistinta (es decir, “fuzzy”). El reto de esta disciplina emergente será la
dificultad que la gran mayoría de analogías, luego conceptos de productos,
luego start-ups van a fallar por una o ambas razones.
[1] Una analogía no tenga resonancia en el
mercado dirigido.
[2] Una buena idea no vaya a comunicarse a los
actores importantes.
|
The irony of BIG DATA remains their being fuzzy information, or data
not clean enough (i.e., rendered into standardized comparability) for the precise application of techniques used in statistical analyses. While
BIG DATA cannot be scrubbed into controlled samples, a less precise use of them (i.e. identifying patterns without the assurance of
statistical significance) can generate actionable intelligence. Thus, analysts
are switching from statistical analogies to educated guesses.
|
Para aprovecharse de la ciencia de los BIG
DATA, se puede enfocarse en el producto de viabilidad mínima, como un
prototipo-de-trabajo, para mejorarse, gracias a la colaboración de los
actores más importantes (es decir, financieros y clientes).
|
BIG DATA practitioners can draw faulty conclusions from fuzzy data or companies can fail to communicate ideas thus drawn. With few resources and often uniform
thinking among co-founders, start-ups are vulnerable to turning educated guesses into very bad bets due to group-think.
|
El
papel de la Plataforma WSI para la Red / Comunidad Social (Social Community Platform) en la democratización de
conocimientos. Como detallado en el folleto de WSI a continuación, este
método de BIG DATA es ahora disponible para todos en Tijuana mediante
WSI-McDigital.
|
WSI-World’s Social Community Platform
product. This recently launched service exploits intelligence, primarily gathered through social media, by applying the techniques of BIG DATA.
This product is ideal for refining minimum viable
products into money-makers.
|
Implicaciones
para Technojuana.
Hoy en día, el mundo está cambiando vertiginosamente.
Si Tijuana va a emerger como un eje de jóvenes emprendedores de vanguardia
enriqueciendo al resto de la República, no solo dichos emprendedores, sino el
gobierno municipal y empresas establecidas tendrán que trabajar juntos para
consolidar este caos de conocimientos y creatividad en una infraestructura
intelectual. Si no, el capital intelectual inerte produce nada para la
ciudad, excepto para ubicar el foco tecnológico lejos en el futuro al costo
de hoy.
|
Implications for
Tecnojuana. Dizzying disruption has
graduated from being a fact of life to a modus vivendi. If Tijuana is truly
to emerge, through a long-deferred renaissance, into a future axis of the
inter-net of things that enriches the brightest young entrepreneurs in Mexico
while benefitting the larger society, these cutting edge co-founders will
prosper far more by pooling their creativity into a an intellectual
infra-structure based on far-reaching data. The largest hazard for Tecnojuana
remains a failure to harness these data so that the eco-system’s intellectual
capital remains inert.
|
Transacciones entre negocios (B2B) ahora dependen de
información. El sentido del momento propicio para proceder, con otros
factores alineados, necesita inteligencia comercial, no solo de la ‘persona’
del cliente (es decir, acciones y decisiones predichos por las preferencias
sabidas de consumidores), sino de las amenazas puestas por la competencia. No
hay mucho tiempo para “sobrepensar” los temas. Aunque el motor de crecimiento disruptivo
se basa en la fusión de mecatrónica e informática, su gasolina es la
información valiosa ocultada en la piscina casi infinita de datos y
combinaciones de datos.
|
Thinking long-term without quick-footed opportunism may leave
Tecnojuana with no future at all. Maquiladoras are the most vulnerable- B2B
sales rely on information formulated into intelligence. Actionable
intelligence extracted from the web requires a vision of who the customer is,
as indicated by a buyer “persona” (i.e., a composite personality of the targeted
clients inferred from their behaviors on the web). It is important not to
over-think this process. Focussing on hidden patterns buried in the flux of
data enables manufacturers to realize opportunities and to adapt to competitive
threats.
|
Gracias a la
Plataforma de WSI, empresas de mediano tamaño pueden desplegar este servicio como una nueva habilidad para
impulsar ideas desde la mente o el laboratorio hasta el mercado. Al fin, esto
es la meta elusiva de la transferencia de tecnología a través de todo México.
|
Thus the inter-net of things is an information driven fusion of mechanical
and systems engineering. The SMEs likely to be at the forefront are best
suited for WSI-World’s Social Community Platform to transfer technology
quickly and cost-efficiently, a desire thus far unrealized across all Mexico.
|
WSI (We Simplify the Internet)
Plataforma para la Red / Comunidad Social.
La tecnología de los grandes datos (los BIG DATA) permite a su equipo de
trabajo organizar, inspirar y movilizar
Entender cómo los BIG DATA pueden dar a su equipo los medios para
realizar mejores oportunidades comerciales
Nuestra Comunidad Social (una súper-red)
entrega soluciones comprensivas por toda la secuencia de sus ventas para integrar
sus esfuerzos con las redes sociales. Esta plataforma de vanguardia le permite
a su equipo la habilidad para humanizar sus actividades digitales, por mantener
conexiones con sus actores importantes a través de la calle o del mundo.
¡Imaginar el valor para su marca en virtud de una habilidad para integrar
tantos datos en inteligencia explotable!
Dicha súper-red se impulsa por métodos subyacente de los BIG DATA
mientras que sigue ser alerta al contexto. La implicación para ustedes es que
sus usuarios pueden entrar nuevos datos para actualizar inteligencia comercial
en tiempo real. ¡Está bien! Prepararse dar bienvenido a nuevas oportunidades
como:
motor de información impulsado por los BIG DATA. Es sencillo: más usuarios comprometidos conducen a más
datos recogidos conducen a más inteligencia inferida. Aplicación de métricos y
herramientas analíticas puede refinar tales datos en inteligencia de valor
añadido.
gerencia de conocimientos entre compañeros. ¡El clave es la colaboración! Con tantos datos multivariados
compartidos dentro de todo el equipo u organización, el alcance intelectual de
cada miembro se extiende por múltiplos para detectar nuevas oportunidades y
para hacer frente a retos emergentes rápido.
compromiso dirigido. La súper-red permite la segmentación de datos a
aquellos que los necesitan ahora para que los miembros dirigidos tienen la
información necesaria mientras que los actores mantienen una perspectiva de
todos conocimientos integrados.
una plataforma inmediatamente lista para aplicarse (“turn-key”). Aprovecharse de una
plataforma fácil y conveniente sobre infraestructura nueva o actual.
Esta plataforma de Comunidad Social hace disponible un montón de
ventajas para su equipo de trabajo, como:
control exclusivo de
todos sus datos, información e inteligencia;
intercambio dinámico de ideas,
perspectivas, culturas, filosofías y conceptos; así como,
fomentación re relaciones crecientes entre
todos los actores importantes (líderes, empleados, clientes actuales o
posibles) de manera bien informada.
Con este acceso completo a los BIG DATA, la plataforma crea oportunidades para:
desarrollar mejores percepciones para detectar no solo oportunidades, sino riegos;
elaborar productos dirigidos más responsivos; así como,
acelerar el desarrollo de servicios hacia la próxima generación.
Ponerse
su inteligencia sobre el camino rápido hasta los BIG DATA. Contactarnos sobre
la súper-red alimentada por la plataforma de la Comunidad Social.
The
Rise of Big-Data
|
El aumento de los
‘InfiniDatos’
|
||
FOREIGN AFFAIRS: Focus;
Cukier, Kenneth Neil and Mayer-Schoenberger, Viktor; mayo-junio 2013
|
|||
Big data starts with the fact
that there is a lot more information floating around these days than ever
before, and it is being put to extraordinary new uses. Big data is distinct
from the Internet, although the Web makes it much easier to collect and share
data. Big data is about more than just communication: the idea is that we can
learn from a large body of information what we could not comprehend when we
used only smaller amounts.
|
Grandes datos (Big Data) se inician con el
hecho de que hay mucha más información flotando alrededor en estos días.
Ellos se están poniendo a los nuevos usos extraordinarios. Big Data son
distintos de la inter-net, aunque la net hace mucho más fácil de recoger y
compartir tales datos. Big Data son sobre más que apenas la comunicación: la
idea es que podemos aprender de un gran cuerpo de información de lo que no
podíamos comprender con cantidades más pequeñas en años pasados.
|
||
The explosion of data is
relatively new. As recently as the year 2000, only one-quarter of all the
world’s stored information was digital. The rest was preserved on paper,
film, and other analog media. But because the amount of digital data expands
so quickly -- doubling around every three years -- that situation was swiftly
inverted. Today, less than two percent of all stored information is
non-digital.
|
La explosión de datos es nueva. En 2000, sólo
una cuarta parte de toda la información almacenada en el mundo era digital.
El resto se conservó en papel, el cine y otros medios analógicos. Pero debido
a la cantidad de datos digitales que ha expandido tan rápidamente -
duplicándose cada tres años - esa situación cambió rápidamente. Hoy en día,
menos de 2% de toda la información almacenada no es digital.
|
||
Given this massive scale, it is
tempting to understand big data solely in terms of size. But that would be
misleading. Big data is also characterized by the ability to change into data
many aspects of the world that have never been quantified before; call it
“datafication.” For example, location has been datafied, first with the
invention of longitude and latitude, and more recently with GPS satellite
systems. Words are treated as data when computers mine centuries’ worth of
books. Even friendships and
“likes” are datafied, via Facebook.
|
Dada esta escala, se tiene la tentación de
comprender big data exclusivamente en términos de tamaño. Pero eso sería
engañoso. Big data también se caracterizan por la capacidad de transformar
muchos aspectos del mundo dentro de nuevos datos que no han sido cuantificados
antes. Se puede llamarlo "dataficación." Por ejemplo, el
posicionamiento se ha 'dataficado', primero con la invención de
longitud y latitud, y más recientemente con los sistemas de satélites de GPS.
Las palabras se tratan como datos cuando los ordenadores recorren siglos de
libros. Incluso las amistades y "likes" se 'datafican', a través de
Facebook.
|
||
This kind of data is being put to
incredible new uses with the assistance of inexpensive computer memory,
powerful processors, smart algorithms, clever software, and math that borrows
from basic statistics. Instead of trying to “teach” a computer how to do
things, such as drive a car or translate between languages, which
artificial-intelligence experts have tried unsuccessfully to do for decades,
the new approach is to feed enough data into a computer so that it can infer
the probability that, say, a traffic light is green and not red or that, in a
certain context, lumière is a more appropriate substitute for “light” than
léger.
|
Este tipo de datos se está poniendo a los
nuevos usos increíbles con la ayuda de la memoria del ordenador barata,
potentes procesadores, algoritmos inteligentes, software inteligente, y
matemáticas que se basan en las estadísticas básicas. En lugar de tratar de
"enseñar" a una computadora cómo hacer las cosas, como conducir un
automóvil o traducir entre idiomas -- una tarea que los expertos de
inteligencia artificial han intentado sin éxito hacer por décadas, el nuevo
enfoque es alimentar suficientes datos en una computadora para que se puede
inferir la probabilidad de que, por ejemplo, un semáforo está en verde y no
en rojo, o que, en cierto sentido, lumière es un sustituto más adecuado que
léger para la "luz".
|
||
Using great volumes of
information in this way requires three profound changes in how we approach
data. The first is to collect and use a lot of data rather than settle for
small amounts or samples, as statisticians have done for well over a century.
The second is to shed our preference for highly curated and pristine data and
instead accept messiness: in an increasing number of situations, a bit of
inaccuracy can be tolerated, because the benefits of using vastly more data
of variable quality outweigh the costs of using smaller amounts of very exact
data. Third, in many instances, we will need to give up our quest to discover
the cause of things, in return for accepting correlations. With big data,
instead of trying to understand precisely why an engine breaks down or why a
drug’s side effect disappears, researchers can instead collect and analyze
massive quantities of information about such events and everything that is
associated with them, looking for patterns that might help predict future
occurrences. Big data helps answer what, not why, and often that’s good
enough.
|
La aplicación de grandes volúmenes de
información de esta manera requiere tres cambios profundos en la forma en que
nos acercamos a los datos. La primera consiste en
recopilar y utilizar una gran cantidad de datos en lugar de conformarse con
pequeñas cantidades o conjuntos, como los estadísticos han hecho por más de
un siglo. La segunda es dejar de nuestra preferencia por los datos muy
precisos y prístinos. En cambio, debemos aceptar desorden: en un número cada
vez mayor de situaciones, un poco de falta de precisión puede ser tolerada,
ya que los beneficios de usar mucho más datos de calidad variable son mayores
que los costos de la utilización de menores cantidades de datos muy exactos.
En tercer lugar, en muchos casos, tendremos que abandonar nuestra búsqueda
para descubrir la causa de las cosas, a cambio de la aceptación de las
correlaciones. Con big data, en lugar de tratar de entender exactamente
porqué un motor se rompe o porqué efecto secundario de una droga aparece, los
investigadores pueden recolectar y analizar cantidades masivas de información
sobre este tipo de eventos y todo lo que se asocia con ellos, en busca de
patrones que podrían ayudar a predecir los acontecimientos futuros. Big data
ayudan a responder a lo que, no es por eso. Muchas veces eso es
suficiente.
|
||
APPROACHING
"N=ALL"
|
ACERCÁNDOSE
hacia ‘N=TODO’
|
||
Modern sampling is based on the
idea that, within a certain margin of error, one can infer something about
the total population from a small subset, as long the sample is chosen at
random. When there was not that much data around, researchers had to make
sure that the figures they bothered to collect were as exact as possible.
Tapping vastly more data means that we can now allow some inaccuracies to
slip in (provided the data set is not completely incorrect).
|
La toma de muestras moderna se basa en la
idea de que, dentro de un cierto margen de error, se puede inferir algo
acerca de la población total de un pequeño grupo, mientras que el conjunto se
elige al azar. Cuando no había que muchos datos fácilmente disponibles, los
investigadores tenían que asegurarse que dichos pocos datos recogidos eran
tan exactas como sea posible. Aprovecharnos de mucho más datos significa que
ahora podemos permitir que algunos errores (siempre que el conjunto de datos
no sea totalmente falso).
|
||
FROM
CAUSATION TO CORRELATION
|
DESDE
CAUSA HACIA CORELACIÖN
|
||
These two shifts in how we think
about data -- from some to all and from clean to messy -- give rise to a
third change: from causation to correlation. This represents a move away from
always trying to understand the deeper reasons behind how the world works to
simply learning about an association among phenomena and using that to get
things done.
|
Estos dos cambios en la forma en que pensamos
acerca de los datos - desde algunos a todos, así como desde limpio a sucio -
dan lugar a un tercer cambio: desde la causalidad hacia la correlación. Esto
representa un alejamiento de siempre tratar de comprender las razones
profundas detrás de cómo funciona el mundo, en favor de percibir una
asociación entre los fenómenos y su utilidad en hacer cosas.
|
||
Medicine provides another good
example of why, with big data, seeing correlations can be enormously
valuable, even when the underlying causes remain obscure. In February 2009,
Google created a stir in health-care circles. Researchers at the company
published a paper that showed how it was possible to track outbreaks of the
seasonal flu using nothing more than the archived records of Google searches.
Google handles more than a billion searches in the United States every day
and stores them all. The company took the 50 million most commonly searched
terms between 2003 and 2008 and compared them against historical influenza
data from the Centers for Disease Control and Prevention. The idea was to
discover whether the incidence of certain searches coincided with outbreaks
of the flu -- in other words, to see whether an increase in the frequency of
certain Google searches conducted in a particular geographic area correlated
with the CDC’s data on outbreaks of flu there. The CDC tracks actual patient
visits to hospitals and clinics across the country, but the information it
releases suffers from a reporting lag of a week or two -- an eternity in the
case of a pandemic. Google’s system, by contrast, would work in near-real
time.
|
Medicina es otro buen ejemplo de por qué, con
big data, viendo las correlaciones pueden ser de gran valor, incluso cuando
las causas subyacentes siguen siendo oscuros. En febrero de 2009, Google creó
un revuelo en los círculos de salud. Los investigadores de la compañía
publicaron un documento que mostraba cómo era posible seguir los brotes de la
gripe estacional usando nada más que los registros archivados de las
búsquedas mediante Google. Google maneja más de mil millones de búsquedas en
Estados Unidos todos los días y almacena todas. La compañía tomó los 50
millones de términos más buscados entre los años 2003 y 2008 y los compararon
con los datos históricos sobre la gripe de los Centros para el Control y
Prevención de Enfermedades (el C.D.C.). La idea era descubrir si la
incidencia de determinadas búsquedas coincidió con los brotes de la gripe -
en otras palabras, para ver si un incremento en la frecuencia de ciertas
búsquedas mediante Google, realizadas en una zona geográfica determinada, era
relacionado con los datos del C.D.C. sobre los brotes de la gripe en las
mismas áreas. El C.D.C. registra las visitas reales de pacientes a los
hospitales y clínicas de todo el país, pero la información diseminada sufre
de un retraso de la notificación de una semana o dos - una eternidad en el
caso de una pandemia. El sistema de Google, por el contrario, iba a funcionar
casi en tiempo real.
|
||
Google did not presume to know
which queries would prove to be the best indicators. Instead, it ran all the
terms through an algorithm that ranked how well they correlated with flu
outbreaks. Then, the system tried combining the terms to see if that improved
the model. Finally, after running nearly half a billion calculations against
the data, Google identified 45 terms -- words such as “headache” and “runny
nose” -- that had a strong correlation with the CDC’s data on flu outbreaks.
Moreover, the data were imperfect. But the sheer size of the data set
more than compensated for its messiness. The result, of course, was simply a
correlation.
|
Google no había pretendido saber cuáles
términos de búsqueda serían los mejores indicadores. En su lugar, corrieron
todos los términos a través de un algoritmo que clasificaban los datos por
nivel de correlación con los brotes de gripe. A continuación, el sistema
ha intentado combinar los términos para ver si eso mejoraría el modelo.
Finalmente, después de correr casi quinientos millones de cálculos con
respecto a datos, Google identificó 45 términos - palabras como "dolor
de cabeza" y "flujo nasal" - que tuvieron una fuerte
correlación con los datos del C.D.C. sobre los brotes de gripe. Por otra
parte, los datos eran imperfectos. Sin embargo, el tamaño del conjunto de
datos más que compensado por su desorden. El resultado, por supuesto,
era una mera correlación.
|
||
BACK-END
OPERATIONS
|
OPERACIONES POR ATRÁS (de
back-end)
|
||
There will be a special need to
carve out a place for the human: to reserve space for intuition, common
sense, and serendipity. There is no good term yet for this sort of
transformation, but “datafication” seems apt. Once we
datafy things, we can transform their purpose and turn the information into
new forms of value.
|
Habrá una especial necesidad de integrar el
ser humano: para reservar espacio para la intuición, el sentido común, y la
casualidad. No hay un buen término, sin embargo, para este tipo de
transformación, pero "dataficación" parece bien. Una vez que
'dataficamos' cosas, podemos transformar su propósito y convertir la
información en nuevas formas de valor.
|
||
For example, IBM was granted a
U.S. patent in 2012 for “securing premises using surface-based computing
technology” -- a technical way of describing a touch-sensitive floor
covering, somewhat like a giant smartphone screen. Once it becomes possible
to turn activities of this kind into data that can be stored and analyzed, we
can learn more about the world -- things we could never know before because
we could not measure them easily and cheaply.
|
Por ejemplo, I.B.M. obtuvo una patente en
2012 para "asegurar las instalaciones que utilizan la tecnología
informática basada en la superficie" - una forma técnica de describir
una baja sensible al tacto que cubre, similar en concepto a una pantalla del
smartphone gigante. Una vez que se hace posible a su vez las actividades de
este tipo en datos que pueden ser almacenados y analizados, podremos aprender
más sobre el mundo - cosas que nunca podríamos saber antes porque no hemos
podido medirlas con facilidad ya bajo costo.
|
||
BIG
DATA IN THE BIG APPLE
|
BIG DATA en la GRAN MANZANA
(New York)
|
||
Big data will have implications
far beyond medicine and consumer goods: it will profoundly change how
governments work and alter the nature of politics. When it comes to
generating economic growth, providing public services, or fighting wars,
those who can harness big data effectively will enjoy a significant edge over
others. So far, the most exciting work is happening at the municipal level,
where it is easier to access data and to experiment with the information. In
an effort spearheaded by New York City Mayor Michael Bloomberg (who made a
fortune in the data business), the city is using big data to improve public
services and lower costs. One
example is a new fire-prevention strategy.
|
Big data tendrán implicaciones más allá de la
medicina y de bienes de consumo: se cambiará profundamente cómo funcionan los
gobiernos y alterar la naturaleza de las políticas. Cuando se trata de
generar crecimiento económico, la prestación de servicios públicos, o
guerras, aquellos que pueden aprovecharse de los grandes datos efectivamente
van a disfrutar de una ventaja significativa sobre los demás. Hasta ahora, el
trabajo más emocionante está sucediendo a nivel municipal, donde es más fácil
acceder a los datos y para experimentar con la información. En un esfuerzo
liderado por el alcalde de Nueva York Michael Bloomberg (quien hizo una
fortuna financiera en los negocios de datos), la ciudad se está utilizando
big data para mejorar los servicios públicos y reducir los costos. Un ejemplo
es una nueva estrategia de prevención de incendios.
|
||
Illegally subdivided buildings
are far more likely than other buildings to go up in flames. The city gets
25,000 complaints about overcrowded buildings a year, but it has only 200
inspectors to respond. A small team of analytics specialists in the mayor’s
office reckoned that big data could help resolve this imbalance between needs
and resources. The team created a database of all 900,000 buildings in the
city and augmented it with troves of data collected by 19 city agencies. That
correlative knowledge has proved immensely valuable: in the past, building
inspectors issued vacate orders in 13 percent of their visits; using the new
method, that figure rose to 70 percent -- a huge efficiency gain.
|
Edificios ilegalmente subdivididos son mucho
más propensos que otros edificios para incendiarse. La ciudad recibe 25.000
quejas sobre edificios superpoblados por año, pero sólo tiene 200 inspectores
para responder. Un pequeño equipo de especialistas en análisis en la oficina
del alcalde creía que grandes volúmenes de datos pudieran ayudarles a
resolver este desequilibrio entre las necesidades y los recursos. El equipo
creó una base de datos de todos los 900.000 edificios de la ciudad y lo
amplió con montones de datos recolectados por 19 agencias de la ciudad. Ese
conocimiento correlacionado ha sido inmensamente valioso: en el pasado,
inspectores de la construcción emitió órdenes de desalojo en el 13% de sus
visitas, con el nuevo método, la cifra se elevó a 70% - una mejora de
eficiencia enorme.
|
||
Big data is also helping increase
the transparency of democratic governance. A movement has grown up around the
idea of “open data,” which goes beyond the freedom-of-information laws that
are now common in developed democracies. Supporters call on governments to
make vast amounts of data that they hold easily available to the public. The
United States has been at the forefront and many other countries have
followed.
|
Big data también están ayudando aumentar la
transparencia de la gobernanza democrática. Un movimiento ha crecido en torno
a la idea de "datos abiertos", que va más allá de las leyes de
libertad de información que ahora sean trillados en las democracias
desarrolladas. Los partidarios llaman a los gobiernos a tomar grandes
cantidades de datos inofensivos para hacerlos a fácil acceso al público. Los
Estados Unidos han estado a la vanguardia y muchos otros países han seguido.
|
||
BIG
DATA OR BIG BROTHER?
|
¿BIG DATA o HERMANO DICTADOR?
|
||
States will need to help protect
their citizens and their markets from new vulnerabilities caused by big data.
But there is another potential dark side:
big data could become Big
Brother. In all countries, but particularly in nondemocratic ones, big data
exacerbates the existing asymmetry of power between the state and the
people. Perhaps such systems would identify which young people are most
likely to shoplift. There might be decent reasons to get so specific,
especially when it comes to preventing negative social outcomes other than
crime.
|
Los Estados tendrán que ayudar a proteger a
sus ciudadanos y sus mercados contra nuevas vulnerabilidades causadas por big
data. Pero hay otra posibilidad de un lado oscuro: big data pueden
convertirse en el hermano dictador. En todos los países, pero especialmente
en los no democráticos, big data agravan la asimetría de poder existente
entre el Estado y los gobernados. Tal vez tales sistemas se identifican
cuáles jóvenes son más propensos a robar en tiendas. Puede haber razones de
llegar tan específico, sobre todo cuando se trata de prevenir los resultados
sociales negativos pero no criminales.
|
||
For example, if social workers
could tell with 95 percent accuracy which teenage girls would get pregnant or
which high school boys would drop out of school, wouldn’t they be remiss if
they did not step in to help? It sounds tempting. Prevention is better than
punishment, after all. But even an intervention that did not admonish and
instead provided assistance could be construed as a penalty -- at the very
least, one might be stigmatized in the eyes of others. In this case, the
state’s actions would take the form of a penalty before any act were
committed, obliterating the idea of free will.
|
Por ejemplo, si los trabajadores sociales
pueden contar con un 95% de precisión qué señoritas adolescentes podrían
quedarse embarazadas, o cuáles chicos de secundaria se retirarían de la
escuela, ¿serían negligentes los trabajadores sociales si no intervienen para
ayudar? Suena tentador. La prevención es mejor que el castigo, sin duda. Sin
embargo, incluso una intervención servicial podría interpretarse como una
sanción - por lo menos, uno podría ser estigmatizado a los ojos de los demás.
En este caso, las acciones del Estado tomaría la forma de un penal antes de
la comisión de ningún acto, destruyendo la santidad de libre voluntad.
|
||
This misplaced trust in data can
come back to bite. Organizations can be beguiled by data’s false charms and
endow more meaning to the numbers than they deserve. The figures are
frequently inaccurate and were of little value as a way
to measure success. Although it is important to learn from data to improve
lives, common sense must be permitted to override the spreadsheets. A
worldview built on the importance of causation is being challenged by a preponderance
of correlations.
|
Esta fe ingenua en los datos puede volver a
mordernos. Las organizaciones pueden ser engañadas por los falsos encantos de
datos y confieren más sentido a los números que existe dentro de ellos. Las
cifras son frecuentemente inexactas y de poco valor como una manera de medir
el éxito. Si bien es importante aprender de los datos para mejorar la vida,
el sentido común debe permitir superarse a las hojas de cálculo. Una visión
del mundo basada en la importancia de la causalidad está siendo desafiada por
una preponderancia de las correlaciones.
|
||
KENNETH CUKIER is Data Editor of The Economist. VIKTOR
MAYER-SCHOENBERGER is Professor of Internet Governance and Regulation at the
Oxford Internet Institute. They are the authors of Big Data: A Revolution That Will
Transform How We Live, Work, and Think (Houghton
Mifflin Harcourt, 2013), from which this essay is adapted.
|