quinta-feira, 14 de agosto de 2008

Privacy and Search Engines

No posto abaixo (se nao leu ainda, recomendo ler antes de ler este) foi explicado como as ferramentas de busca baseiam seus negocios. Basicamente, oferecendo anuncios aos internautas de produtos que eles estariam pessivelmente interessados. A priori, esse sistema parece uma otima ideia, onde no fim todos saem ganhando, nao fosse pela privacidade pessoal em risco. Como? Vamos passo a passo.

Como disse anteriormente, quando voce busca por um termo no Google, ele grava algumas informacoes chamadas "search logs", que sao:


www-az3.proxy.aol.com - 03/Jun/2008 10:16:22 – http://www.google.com/search?q=travel – MSIE 6.0; Windows NT 5.1 - 740674ce213e9d9

Onde:

www-az3.proxy.aol.com
(endereco de internet)
03/Jun/2008 10:16:22
(data e horario da busca)
http://www.google.com/search?q=travel
(a busca, contendo o termo "travel")
MSIE 6.0; Windows NT 5.1
(o navegador e o sistema,
MS Internet Explorer 6 on Windows XP)
740674ce213e9d9
(unico cookie ID, ligado ao seu navegador da
primeira em que voce visita o site)

Esses search logs, no caso do Google, sao armazenados por 18 meses(!) Assim, por todo este periodo o provedor de buscas online tem todas as suas buscas armazenadas e facilmente acessiveis. Assim, ele sabe o que voce buscou, data e horario, seu navegador (explorer, mozila firefox) e seu IP address. Na realidade eles nao sabem que eh voce especificamente, mas sabem que alguem usando o seu computador (facilmente localizavel pelo IP address) fez tais buscas na internet. Imaginem a infinidade de informacoes ao seu respeito podem ser extraidas destes dados armazenados. Se voce nao consegue imaginar, vamos a um exemplo prat
ico - the AOL case.


The AOL case

Em agosto de 2006 o provedor AOL divulgou uma lista com todos os termos pesquisados pelos usuarios pelo periodo de 3 meses para propositos academicos, assim as pessoas poderiam ver o que os usuarios tem procurado na internet. Essa lista foi divulgada assim:

Todas as buscas estavam ligadas a um numero aleatorio que foi atribuido a cada usuario. Assim, por exemplo, usuario 123456789 buscou pelos termos x, y, z nos dias a, b, c. O numero dado a cada usuario era aleatorio, nao possuira qualquer dado sobre IP address, cookies, nada. O provedor AOL pensou que nao haveria problema nenhum em divulgar tal lista, desde que o nome dos usuarios foram anonimizados.

Resultado: em poucos minutos o jornal The New York Times pode identificar um dos usuarios como sendo a Sra. Thelma Arnold. Uma viuva que mora no estado da Georgia, EUA. Ela buscou por termos como "cachorros que urinam em todo lugar", " homem solteiro de 60 anos" e outros mais. So entao AOL se deu conta do terrivel engano. Mas como foi possivel identificar o usuario? Bem, mesmo quando os search logs sao associados com numeros anonimos, ainda assim deles eh possivel extrair informacao pessoal. Tendo em conta que as pessoas muitas vezes digitam seus proprios nomes, de familiares e amigos, numeros de telefone, cartao de credito, RG, CPF.... tudo para verificar quanta informacao ao seu respeito esta disponivel na internet. Associe todos estes termos, com busca por "previsao do tempo em Leuven, Belgica" e voce sabera onde alguem mora. Associe constante busca por "empregado Microsoft" e voce tem o local de trabalho. Associe buscas por "como comprar drogas online" e voce tem uma situacao no minimo embaracosa. Associe busca por "como praticar aborto em casa" e voce tem um crime e um autor.

Um dos usuarios AOL, numero 17556639, buscou por termos como "“how to kill your wife” (several times), “dead people”, “pictures of dead people”, “killed people”, “dead pictures”, “ murder photo”, “photo of death”, “www.murderdpeople.com”, “decapitated photos”, “car crashes” and “car crash photo”. O que isso quer dizer? Que descobrimos um assassino? Como eu disse no comeco deste blog, informacao sem o devido contexto pode ser extremamente perigosa. Imagine que o usuario acima estava escrevendo um livro de ficcao e buscava ideias de como assassinar seus personagens. No entanto, a sua impressao dele(a) provavelmente foi de que eh um assassino, ou pelo menos em potencial. Agora parem um momento e reflitam sobre todas as buscas que voces ja fizeram na internet. Pensem em todos os termos em que voces ja digitaram no Google e respondam: voces se sentiriam confortaveis se outras pessoas pudessem ver tudo pelo o que voces ja buscaram na internet? Buscas curiosas dos usuarios AOL podem ser conferidas (em ingles) nos sites Slate e plentyoffish.

Mas porque o Google grava e armazena estes 'search logs'?

A empresa oferece varias justificativas como prevenir fraudes, otimizar o sistema, melhorar a qualidade das buscas, etc. Todavia, o principal motivo eh: Profiling (que sera amplamente discutido adiante). O Google elabora um perfil de cada usuario pra poder oferecer as propagandas personalizadas (target advertising). Entao, se voces achavam que receber anuncios sobre coisas que voces podem estar interessadas era um bom negocio, agora voces sabem as consequencias e como isso aftea a sua privacidade. Alem de saber simplesmente se voce esta interessado em um carro esportivo, o Google tambem sabe se voce esta gravida, se gosta de pornografia, se eh usuario de drogas, seus habitos alimentares, sua profissao, sua preferencia sexual, religiosa, enfim, seus segredos mais intimos. De certa forma, ele sabe mais sobre voce do que voce mesmo! Tudo muito bem guardado por 18 meses. E o seu direito a privacidade? Pelo jeito, isso fica um pouco de lado por enquanto, afinal, estamos na era digital.

Esta tem sido uma extensa batalha entre a Comissao Europeia e o Google, para que a empresa norte-americana ao menos reduza consideravelmente o periodo de armazenamento dos 'search logs' e opere com maior transparencia, justificando de forma razoavel a necessidade de armazenamento destes logs. E, melhor ainda, que eles jamais sejam associados a um usuario ainda que com um numero aleatorio, para que escandalos como o caso AOL nao tornen a se repetir. Nesta queda de braco, ate o momento, Google nao tem demonstrado qualquer sinal de recuo, mas a guerra continua.

Por fim, voce ainda pode estar se perguntando: mas qual o problema se o Google sabe tudo isso sobre mim? Como ele pode usar estas informacoes? Ai comeca a nossa Teoria da Conspiracao, nos proximos capitulos.




Nenhum comentário: