¿Que tanta información dejas en la red?

Es un tema poco tratado en la red, es un tema poco tratado en las universidades escuelas e incluso en los grupos de debates locales, pero que si lo analizamos tiene una importancia muy grande y de gran impacto en nuestras vidas digitales de hoy día, hoy quiero escribir sobre:

  • Que tanta información dejamos en la red.
  • Como se usa esta información.
  • De que forma se genera dicha información.

Primero, como dijo ese gran filosofo que no dijo nada porque murió antes de poder decir lo que iba a decir:

Empecemos por el principio.

¿Que es un dato?

Ahora bien, que viene siendo un dato? Un dato es una representación simbólica de un hecho, de un proceso, pueden describir sucesos, condición de algo, estado, un dato puede ser un valor numérico, alfabético que describa algún atributo sobre algo.

Es decir cada movimiento que hacemos, cada acción, hecho al azar de la naturaleza, cada acontecimiento, cada observación genera un dato, a diario estamos generando datos, las 24 horas del día, cada día de nuestra vida e incluso después de la muerte nuestros cuerpos seguirán generando datos (que tiempo tarda en descomponerse el cuerpo, cuanto crecen las uñas, etc..)

El problema es que un dato por si solo no genera información.

¿Que es la información?

La razón por la que un dato no genera información es la siguiente, según la wikipedia la información es un conjunto organizado de datos procesados que constituye un mensaje que cambia el estado de conocimiento de un sujeto o sistema que recibe dicho mensaje.

Notan la palabra mágica en negritas…? Datos procesados


Podríamos pasarnos una vida entera generando datos aleatorios y sin ningún sentido aparente hasta que aplicamos un proceso que nos permita darle sentido a esos datos y convertirlos en información.

datos-informacion1

Veamos un ejemplo sencillo de datos que se transforman en información.

Entro al supermercado a comprar vino, me paro frente al estantería y solo miro y analizo los vinos que me quedan a la altura de la mirada, muy vagamente miro las botellas que están en la parte inferior y muy vagamente miro las botellas que me quedan muy altas, asi que sin mas complicación tomo una botella de las que están a la altura media, paso por caja, la pago y me voy.

Esta acción ya ha generado en un dato, pero por si sola no nos dice nada, entonces alguien viene y se da cuenta por observación de que después de mi 10 personas siguieron el mismo patrón y entonces consigue la información de que los productos colocados a la altura de los ojos venden mas que los que están en la parte inferior o superior de la estantería.

Esto solo es un ejemplo minúsculo en comparación con los datos que genera nuestra vida diaria, ahora llevemos eso al campo informático, donde tenemos una vida digital, tenemos identidad, y pensemos por un momento en las toneladas y toneladas de migas de pan que dejamos mientras usamos Internet.

Pensemos por un momento en las toneladas y toneladas de migas de pan que dejamos mientras usamos Internet.

¿Como se recogen nuestros datos en la red?

Existen 3 métodos principales por los cuales pueden ser recolectados estos datos y son:

Voluntaria data(Data voluntaria).

Como su nombre lo indica es data que compartimos a voluntad propia, en esta parte entra lo de compartir tu nombre, tu apellido, tu estado civil, tu edad, tu sexo, enfermedades que has sufrido, las películas que te gustan, los libros que has leído, etc…

Es el tipo de datos con el que solemos llenar los formularios online del hospital, del Facebook, de Google, de los contratos de servicios, formularios de inscripción de estudios, etc…

La información que se extrae de esta data no siempre es real, es decir al ser compartida voluntariamente podemos mentir y proporcionar algo que no es cierto, como ocultar nuestros gustos por los libros, preferencia religiosa, preferencia sexual, vida social, etc… y es justo cuando entra el siguiente método.

Observed Data(Data observada).

Aquí la cosa es mas cabrona, ya que es información recolectada a partir de observación en nuestro comportamiento en la red, cuando entramos en la red hay unos paparazzis llamados algoritmos que recolectan nuestros hábitos de navegación, nuestras preferencias al comprar un producto u otro, el tiempo que dedicamos a estar conectados, las horas del día a las que nos conectamos, cuales días del mes es cuando mas compramos, se toman en cuenta nuestras búsquedas en Google, los Likes que damos en Facebook y en Instagram, se analizan los correos que enviamos, se buscan patrones y tantas cosas mas.

Hay toda una industria allá afuera que nos conoce incluso mas que nosotros mismos, nuestros smartphones recolectan data 24 horas al día (incluso apagados) y la envían a servidores dedicados exclusivamente al procesamiento de estos datos para convertirlos en información. Pero cuando la información observada ya no es suficiente entonces llega la mas perversa de todas.

Deducted Data (Data deducida)

Imaginemos que un robot gigantesco con largos tentáculo podría utilizar la data compartida voluntariamente y junto a la data observada sacar un tercer tipo de data llamada “Data deducida”, pues si lo llevamos al mundo real no crean que estamos muy lejos de la realidad ya que la inteligencia artificial, el Big Data, Business Inteligence y el uso de software analítico son capaces no solo de conocernos mejores que nosotros mismos, sino que son capaces de anticipar nuestro comportamiento sobre el tiempo, es decir los algoritmos que son los nuevos dueños del mundo ya son capaces de adivinar nuestra tendencia en el futuro, de ver mas allá de nuestras acciones y descubrir cosas muy intimas como tu verdadera preferencia sexual, tu inclinación política, tu inclinación religiosa, rasgos de personalidad entre muchas cosas mas.

En esta nueva era tecnológica la información es el nuevo petroleo y quien la tenga y la controle sera el dueño exclusivo del mundo.

Sabias que…

1.-Google actualiza el algoritmo que usa en su buscador cerca de 500 veces al año lo que equivale a una actualización cada 17 horas.

2.-Facebook toma en cuenta incluso el tiempo que tarda el cursor sobre el botoncito de “Me gusta” antes de clickear.

3.-Gracias a la tecnología CBT (Cross Browser Tracking) la mayoría de los websites pueden seguirte aunque cambies de navegador, de dirección IP e incluso navegando de modo incógnito.

Lectura recomendada:
Cross Browser Tracking

Inteligencia artificial & Big Data

Algoritmos que gobiernan el mundo.

 

“Recorded Future” el ojo que espia tus conversaciones en Facebook.

Tenemos que admitir que la privacidad y la seguridad de nuestras conversaciones tienen un “antes” y un “después” de Snowden, ese ex-analista de la NSA que nos mostró la delicada linea en la que se cruzan la seguridad de las naciones con la privacidad de los usuarios, desde entonces nada ha sido igual, los que alardeaban de una privacidad en sus servicios pasaron a ser mas cuidadosos, los que de por si ya eras desconfiados con la “privacidad” en la red nos convertimos en paranoicos de la criptografia.

Pues resulta que los chicos de Bosnadev estaban testeando una App y la misma se enviaba a través de enlaces mediante mensajes de chat en FB y como todos sabemos los enlaces son verificados antes de ser enviados al destinatario, lo extraño específicamente es el log de conexiones de la misma:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
13.04.2015 22:05:01 2a03:2880:3010:3ff4:face:b00c:0:1
13.04.2015 22:05:02 2a03:2880:3010:3ff6:face:b00c:0:1
13.04.2015 22:05:02 2a03:2880:3010:3ff3:face:b00c:0:1
13.04.2015 22:05:03 2a03:2880:2020:8ff0:face:b00c:0:1
13.04.2015 22:05:03 2a03:2880:2020:8ff2:face:b00c:0:1
13.04.2015 22:05:24 2a03:2880:2020:8ff4:face:b00c:0:1
13.04.2015 22:05:29 2a03:2880:20:3ff1:face:b00c:0:1
13.04.2015 22:05:31 2a03:2880:20:5ff4:face:b00c:0:1
13.04.2015 22:05:32 2a03:2880:20:cff6:face:b00c:0:1
13.04.2015 22:07:58 2a03:2880:11:2ff9:face:b00c:0:8000
13.04.2015 22:07:58 2a03:2880:2130:7ff2:face:b00c:0:1
13.04.2015 22:08:05 2a03:2880:3010:3ff2:face:b00c:0:1
13.04.2015 22:08:06 2a03:2880:3010:3ff5:face:b00c:0:1
13.04.2015 22:08:06 2a03:2880:3010:3ff7:face:b00c:0:1
13.04.2015 22:08:07 2a03:2880:3010:7ff6:face:b00c:0:1
13.04.2015 22:08:42 2a03:2880:20:4ff2:face:b00c:0:1

Desde mi punto de vista son demasiadas direcciones IPv6 para un simple chequeo.

Luego forzaron la creación de un registro de rastreo en IPv4 para una URL recién creada, lo hicieron enviándola por por el chat de facebook y leyendo el log de la URL y el resultado fue conexiones a servidores de nada mas que “Recorded Future” una empresa financiada por Google y por CIA.

En un articulo de Alex Fitzpatrick para Mashable se habla que la compañía se vale de un software que escanea las conversaciones en busca de “Keywords” para generar reportes a sus Sponsors.

Cuando enviamos un enlace usando el chat de Facebook este se busca en los motores de búsqueda y si no esta compartido públicamente entonces se analiza, “solo se analiza lo que nunca ha sido publicado”, en defensa a los resultados ellos simplemente dicen:

…our patented Web Intelligence Engine continuously analyzes the open Web…

Hay que resaltar que el software de vigilancia pone mas énfasis en usuarios que comparten enlaces en los que no existe una relación previa entre perfiles, asi como buscar ciertas frases y patrones de comportamiento encontrados en los records de cybercriminales incluso depredadores sexuales,lo cual me tranquiliza un poco mas, ya que no me están espiando, están cuidándome, preocupándose por mi.

Esto nos lleva a pensar que el mismo miedo de estar inseguros y ser blancos de un ataque no esta llevando al borde de la red, donde estamos dispuesto a sacrificar nuestra privacidad por recibir una pseudo-protección.

Esto es todo por ahora distinguidos lectores, si te gusto mi articulo comparte y ayúdame a llegar a mas personas.

Lectura recomendada:

https://bosnadev.com/

http://mashable.com/2012/07/12/facebook-scanning-chats/