lunes, 15 de septiembre de 2014

Privacidad vs conocimiento, esa es la cuestión.

Toca tratar el tema de la privacidad que es un concepto que continuamente se ve sometido a cambios del entorno y por tanto, a menudo nos toca pensar sobre sí es necesaria una actualización. Hace un par de años tuve la oportunidad de poder hablar del Big data que en aquel momento era un concepto incipiente. Para ello me puse a investigar sobre todas las tendencias tecnológicas que pudieran usar esta forma de procesamiento masivo para generar conocimiento. Revisando los contenidos he podido verificar que efectivamente aquellas tendencias se han consolidado y que se han fabricado nuevos dispositivos y sensores para poder generar datos que puedan ser procesados desde esta perspectiva. En este sentido, a principios de año decidí experimentar con el uso de wearables e incorporar en mi vida un elemento de monitorización continúa de la actividad diaria, el sueño y la alimentación. Como creyente de los beneficios de la retroalimentación, la teoría del control y el ciclo de mejora continúa este tipo de dispositivos me iban a permitir comprobar si las sensaciones se conformaban con los datos reales obtenidos. 

Lo primero que pude comprobar es que casi todos los dispositivos almacenan la información recogida fuera del mismo, lo que implica el exilio de los datos a la cloud de la empresa de turno . Sin embargo en materia de privacidad también destaca en las condiciones del servicio la promesa de que la información no será cedida o vendida a terceros. Es un punto importante dado que este tipo de empresas no parecen orientarse a vencer privacidad de sus clientes particulares sino a vender el conocimiento  acumulado y agregado en términos estadísticos.

En esencia parece que muchos de los estudios relacionados con Big data pretenden el análisis de patrones o tendencias basándose en los resultados estadísticos de la masa de datos obtenidos. En este sentido en muchos casos se apela a ese carácter estadístico y anónimo para entender que no existe privacidad posible. Sin embargo yo soy de los que creen que al menos la recogida para un tratamiento de esa naturaleza si tiene que ser informada al afectado que debe tener la libertad de poder elegir si pertenecer o no a esa masa de datos. Estas empresas asumen que esa materia prima individual es gratis y que ellos pueden explotarla sin más. Valga como ejemplo el estudio realizado por el BBVA y Telefónica sobre los habitos de los extranjeros en sus visitas a Madrid y Barcelona. Sin embargo si fuera necesario obtener consentimiento quizás en un futuro no muy lejano las empresas tendrían que pagar al afectado por tener acceso a ese poquito de privacidad cedida.


La otra reflexión que quiero comentar y que da título al post es que como afectado y defensor de la privacidad, estos dispositivos y algunos servicios webs de tratamiento plantean una importante disyuntiva respecto a sí merece la pena cierto sacrificio de privacidad frente al beneficio que aporta el conocimiento obtenido desde esos servicios sobre tus datos. Es decir, si es interesante ceder datos personales para cambiarlos por información y conocimiento personal.  En mi caso las cesiones se realizan de los datos vinculados a movimiento, sueño y comidas y el acceso en modo lectura a estado de cuentas corrientes ( ahí es nada).


Hace unos días aparecía en El País una noticia relacionada con la tendencia de cuantificar la vida y registrarlo todo. El artículo completo cuenta la historia de Nicholas Felton que ve en la recogida de estos datos una forma de recordar. "Cuantificar las actividades me permite poder mirar, de un solo vistazo, amplios periodos de tiempo y condensarlos en una imagen o un número". Desde 2005 Felton elabora un informe anual que sintetiza esos 365 días en la Web http://feltron.com/.

En mi caso la cuantificación está sirviendo para confirmar la existencia de algún mal hábito y actua como i-conciencia al ser machaconamente repetido el mensaje de "debes hacer más de esto..." o "debes cambiar esto otro...". Los datos hacen que veas que efectivamente por mucho que intentes auto engañarte las cosas no cambian de forma sencilla. También es importante poder ver la evolución que tienen los cambios que introduces y ver como las tendencias cambian. En mi caso estoy comprobando como la aplicación que uso empieza a dar recomendaciones vinculadas a la media de población por edad, por perfil, etc. Además es muy importante de cara a la motivación el que te indicen cada día los retos a superar. En este sentido, recibes informes diarios que te indican tus resultados anteriores y te animan a superarlos. Cosas como "el miércoles pasado andaste 3000 pasos, a ver si lo superas..." o "la semana pasada dormiste una media de 6 horas, mejorarlo".

De toda esta experiencia se obtiene como conclusión que ya tenemos tecnología que van a darnos una nueva perspectiva sobre el mundo. Las personas nos hemos transformado sin darnos cuenta en sensores que registran información y la transmiten a repositorios donde puede ser estudiada y analizada de forma agregada y muy probablemente de ahí salga nuevo conocimiento que permita nuevas decisiones más inteligentes. Citando literalmente a Lord Kelvin, “Cuando puedes medir aquello de lo que estás hablando y expresarlo en números, puede decirse que sabes algo acerca de ello; pero, cuando no puedes medirlo, cuando no puedes expresarlo en números, tu conocimiento es muy deficiente y poco satisfactorio.”

Puede que la víctima colateral de todo ello sea la privacidad aunque seguramente tengamos que plantearnos de nuevo el concepto. Ya a comienzos de año en la entrevista de la APEP con motivo del día europeo de la protección de datos dejaba entrever algunos de estos cambios sobre big data o el IoT. Una de las principales cuestiones que debe plantearse es que debemos actualizar el término "datos de carácter personal" por información o conocimiento de carácter personal ya que las empresas empiezan a juntar puntos y empiezan a unir diferentes tipos de datos para obtener de nosotros "conocimiento". En este sentido la legislación debería empezar a regular los "tratamientos de datos" y no los ficheros, debería hablar de limitaciones en el procesamiento de cierta información para ciertos fines, etc... como digo, orientarse más que al hecho al resultado que tendrá el procesamiento masivo de datos de carácter personal. Para mostrar un ejemplo de estos puntos, podemos analizar el perfil de Google. Hace unos días profundizando en los paneles de configuración de la privacidad dí con la sección  Historial de la cuenta  donde te indican qué etiquetas ya tienes vinculadas en función del rastro que dejas. El listado total de categorías está descrito en este enlace https://support.google.com/ads/answer/2842480?hl=es&ref_topic=2971788. Obviamente todo es configurable para que nada de esto sea conservado pero el problema es que por defecto está activo y en pocos momentos creo recordar que Google haya hecho demasiado hincapié en informar al usuario sobre todas estas opciones. Yo soy consciente de que doy a Google determinados datos... pero lo que es complejo que pueda conocer es qué información extraen de todo ello y si me interesa o no que puedan comerciar con ella. Aunque este post de Bruce Schneier tiene ya unos años, es interesante su clasificación de los tipos de información que se alojan en una red social. De alguna forma, sirve para plantearse el concepto de “dato de carácter personal” y pensar si es necesaria una nueva redefinición del término cuando estamos ahora en la explosión de los servicios gratuitos que venden “meta-datos”. Lo que gente como Eli Pariser han pronosticado y que explican claramente en su charla Ted "Cuidado con la burbuja de filtros debe tenerse muy en cuenta para nuestros nativos digitales desde ya.
"A medida que las empresas de la red se esfuerzan por adaptar sus servicios (incluyendo noticias y resultados de búsqueda) a nuestros gustos personales, surge una consecuencia no deseada peligrosa: quedar atrapados en una "burbuja de filtros" que nos obstaculiza el acceso a esa información que podría desafiar o ampliar nuestra visión del mundo."
Los nativos digitales son desde el minuto 1 caracoles que van dejando un rastro procesable. El problema es que estos menores que tendrán una historia rastreable serán mucho más predecibles que nosotros como consumidores y de alguna forma, más sencillamente manipulables.



Quizás toca ya subir un escalón en la cadena de tratamiento y empezar a regular el uso de “información de carácter personal” como un conjunto de datos suministrados por el afectado o calculados o derivados del uso de aplicaciones, recursos, etc…”

Fuente: http://www.schneier.com/blog/archives/2010/08/a_taxonomy_of_s_1.html 

Below is my taxonomy of social networking data, which I first presented at the Internet Governance Forum meeting last November, and again -- revised -- at an OECD workshop on the role of Internet intermediaries in June.
  • Service data is the data you give to a social networking site in order to use it. Such data might include your legal name, your age, and your credit-card number. • Disclosed data is what you post on your own pages: blog entries, photographs, messages, comments, and so on.
  • Entrusted data is what you post on other people's pages. It's basically the same stuff as disclosed data, but the difference is that you don't have control over the data once you post it -- another user does.
  • Incidental data is what other people post about you: a paragraph about you that someone else writes, a picture of you that someone else takes and posts. Again, it's basically the same stuff as disclosed data, but the difference is that you don't have control over it, and you didn't create it in the first place.
  • Behavioral data is data the site collects about your habits by recording what you do and who you do it with. It might include games you play, topics you write about, news articles you access (and what that says about your political leanings), and so on. 
  • Derived data is data about you that is derived from all the other data. For example, if 80 percent of your friends self-identify as gay, you're likely gay yourself.

Todas estas reflexiones me llevan a retomar lo que ya expresé en el post "La necesidad de establecer la infoética del Big data"  para que exista un compromiso ético de no abusar del potencial de estas tecnologías.

 
;