quinta-feira, 28 de agosto de 2008

IP address - Personal Information?

Endereco IP - Informacao Pessoal?

O Artigo 2a, da Diretiva Europeia sobre Protecao de Dados define dados pessoais como: "qualquer informacao relacionada a uma pessoa natural identificada ou identificavel (sujeito); uma pesssoa identificavel eh alguem que pode ser identificado, direta ou indiretamente, em particular por referencia a um numero de identificacao ou por um ou mais fatores especificos a sua identidade fisica, psicologica, mental, economica, cultural ou social." (traducao livre)

Isso significa que informacao (dado) pessoal eh qualquer dado que possa levar a identificacao de um individuo que traga em si caracteristicas sobre ele. Desta forma, numero do RG, CPF, telefone; endereco, local de trabalho, descricao fisica, fotografia, dados bancarios, por exemplo constituem dados pessoais. Tanto a comunidade (mais rigida) quanto a legislacao dos paises que fazem parte da OECD (incluindo o Brasil) possuem legislacoes internas que garantem a protecao de dados pessoais. No caso do Brasil, ainda nao ha uma legislacao especifica. A protecao deste bem juridico pode ser encontrada em legislacoes esparsas, como a Constituicao Federal e o Codigo de Defesa do Consumidor, i.e.

A polemica no entanto surge quando se trata de informacao pessoal em ambiente eletronico. Ha algum tempo tema de grande discussao em territorio europeu foi o caso de endereco de IP (Internet Protocol). Toda vez que voce acessa um site, manda um email, seu endereco IP fica registrado pelo seu provedor de internet (ISP). Eh atraves do IP que os usuarios podem ser rastreados quando cometem algum crime na internet. Desta forma, na ha necessidade de dizer que o IP pode identificar um usuario. Contudo, a Suprema Corte Francesa, por razoes obscuras, em um acordao em 2006 disse que o IP nao constitui dado pessoal, pois ele identifica um computador, e nao um individuo. Bem, sem menosprezar as razoes dos Doutos Magistrados, mas talvez naquele dia eles devem ter tomado Bordeaux em quantidade excessiva. Se seu raciocinio estiver correto, entao um numero de telefone nao eh dado pessoal, pois identifica um telefone e nao uma pessoa. Um endereco residencial identifica uma casa, um numero de RG identifica um cartao, e por ai vai.

Felizmente esta foi uma decisao isolada em territorio frances, visto que os outros Tribunais todos reconheceram a pessoalidade do endereco de IP. Assim provedores de internet devem tratar o IP dos usuarios com o mesmo cuidado de todos os outros dados, sob pena de responder civil e criminalmente.

Alguns casos curiosos a respeito podem ser citados:

1- Na Alemanha, a legislacao local permite aos ISP (Internet Service Provider) armazenar os dados dos usuarios (inc. IP) apenas por 6 meses. Apos isso eles devem ser apagados de forma irreversivel. O caso foi que um cidadao postou em um blog um comentario que "incitaria a violencia", o que eh considerado crime. Assim, durante o processo criminal a autoridade judicial pediu ao ISP a identificacao do usuario atraves do IP. O ISP forneceu, o usuario foi identificado, julgado e condenado ao pagamento de multa. Acontece que quando o ISP forneceu as informacoes sobre o usuario ja haviam passado 6 meses. Assim, o condenado processou o ISP por armazenar informacoes por mais de 6 meses. Ganhou. No final, o ISP teve que pagar a multa que o usuario tinha sido condenado a pagar, acrescida de danos morais. Interessante, nao?

2- Na China um homem foi condenado a prisao perpetua por ter fornecido "segredos de seguranca nacional" a alguem no outro lado do mundo por email. O interessante que a unica prova da autoria do crime foi o IP apontando que o email foi enviado do computador do usuario. Todavia, este alegou que varias pessoas poderiam ter usado seu computador. Nao teve acordo. O dono da maquina nao conseguiu apontar o verdadeiro culpado. Condenado. Entao voce le que o Tribunal Frances acha que IP nao constitui dado pessoal (!) Interessante.

Na mesma Franca (nada contra o pais, alias.. so um pouquinho), a ministra (esqueci do que) esta tentando aprovar uma proposta que autoriza a identificacao dos usuarios de internet que baixam arquivos protegidos por direito autoral, e banimento da rede. Isso mesmo, fez download ilegal (atire a primeira pedra aquele que nunca fez) - nao tera mais acesso a internet! Justo? Fica a criterio de cada um. O que nao pode eh deixar as pobres gravadoras e estudios de Hollywood diminuirem seus lucros (quando penso nos coitados, ate me inspiro em fundar uma ONG de ajuda ao pobrezinhos). Milhares de pessoas sem acesso a internet nao tem problema!

So pra constar, em uma opiniao emitida em marco desde ano, o WP29 (Article 29 Working Party, orgao especial da Comissao Europeia para a protecao de dados pessoais) considerou que nao so IP mas tambem cookies constituem dados pessoais, tendo em conta que podem identificar um usuario.

quarta-feira, 27 de agosto de 2008

Dataveillance

Monitoramento de dados

acabo de ler no site da Folha de Sao Paulo a seguinte manchete: "CPI da Pedofilia quer que Microsoft monitore crimes no MSN". Logo me pergunto quantos leitores compreendem a seriedade da noticia. A primeira vista isso pode ate parecer uma avanco na identificacao e punicao de pedofilos na internet. Contudo ha muito mais em jogo nas entrelinhas da medida.
Anteriormente falamos exaustimavente sobre os riscos do monitoramento de internautas com o intuito de identificar possiveis "terroristas" adotado em alguns paises. Agora a pergunta: qual a diferenca entre a busca por terroristas em outros paises e a busca por pedofilos no Brasil? Nenhuma! As consequencias sao as mesmas. Com tal medida nao so os pedofilos estara em risco, mas a privacidade de todos os internautas estara prejudicada.

O que os senadores propoem a Microsoft eh que a empresa desenvolva um software capaz de detectar automaticamente messagens que podem estar relacionadas ao abuso de criancas. Assim, se alguem digitar no MSN algo do tipo "fotos de criancas molestadas" o software reconhece como um possivel criminal, grava detalhes do usuario (IP, server logs) e pode encaminhar as autoridades policiais. Mais uma vez, a priori, pode ser uma boa solucao no combate a este tipo de barbarie. Por outro lado, se voce (cidadao comum, totalmente avesso a pornografia infantil) digitar algo no MSN relacionado com a "lista negra dos termos dos pedofilos" voce podera ser taxado como suspeito. Suas proximas conversas no MSN serao vigiadas. Frases como "comunista come criancinha" (palavras-chaves: come + criancinha) podem ser suficientes para ter seu nome na listas de suspeitos.


Indo mais alem, este seria o comeco. Com o software em operacao, as autoridades publicas poderiam incluir
mais adiante outros termos relacionados a drogas, trafico, assassinatos, fraudes, etc. Desta forma, seria como se todas as nossas conversas fossem grampeadas. Teremos que falar por codigo como os criminosos de verdade, com medo de ser incluidos na "lista negra".

No cenario mundial, a Simens acaba de desenvolver um software chamado
Intelligence Platform, que tem a funcao de coletar dados de computadores ligados a internet como ligacoes telefonicas, dados bancarios, email, dados pessoais, etc. Este programa ja foi adquirido por 90 paises para o uso na "vigilancia no trafego da internet". Isso nada mais eh do que o software que a CPI pede a Microsoft em uma escala astronomica, pois nao apenas seu MSN sera vigiado, mas toda sua atividade online. Tudo em prol do combate ao terrorismo!

A conclusao nos dois casos eh uma so:

Nao ha duvidas de que tanto a pedofia quanto o terrorismo sao terriveis atentados contra a humanidade. Contudo, o que se deve pesar eh o que esta sendo sacrificado para que se possa "prevenir" estes crimes (que na realidade nao podem ser completamente evitados). Viver em uma sociedade sem abusos contra criancas e sem atentados terroristas eh importante. Todavia, viver um uma sociedade sem privacidade, sob constante vigilancia eh pior que os dois crimes juntos. A vigilancia preventiva afeta nao alguns, mas todos os cidadaos. Todos sao suspeitos ate que se prove o contrario. Em um futuro nao muito distante, as pessoas comecarao a temer a expressao de suas ideias. Em um governo totalitario, qualquer forma de expressao pode ser severamente punida. E quem consegue se comunicar com as pessoas nos dias de hoje sem o uso da internet? A vigilancia online eh mais eficiente que escutas telefonicas, microfones ocultos ou detetives particulares. O que voce ve, le ou pensa, com quem voce fala, tudo pode ser monitorado. E como estas informacoes serao usadas? Isso ate podemos prever, mas so o tempo nos dira o risco desta conduta.

Mais uma vez lembrando: mais importante do que preservar a vida, eh viver a vida com qualidade. Caso contrario nao ha sentido em viver.

Espero que o recado tenha ficado claro.

segunda-feira, 25 de agosto de 2008

Profiling II

Como Profiling eh um hot topic, vamos falar um pouco mais sobre esta pratica.

No post anterior vimos que as empresas de internet usam e abusam da pratica de profiling. Vimos tambem que isso pode ter serissimas consequencias em relacao da privacidade dos usuarios, bem como o risco do mau uso destas informacoes por autoridades publicas. Mas entao, o que aconteceria se da noite para o dia profiling fosse banido, o uso de cookies expressamente proibido e tivessemos o fim dos anuncios personalisados?

Em um topico anterior vimos que a razao pela qual tantos servicos online sao completamente gratis eh pelo fato de os usuarios fornecerem seus dados pessoais, que posteriormente sao comercializados para a venda de anuncios personalisados. Se de repente todos os usuarios bloqueassem o recebimento de cookies em seu navegador, muitos portais da internet entrariam em colapso (incluindo Google, Yahoo, Financial Times, etc.). Isso porque eles perderiam sua principal fonte de renda.

Consequencia: ou eles comecariam a cobrar pelo servico direto dos usuarios (pagemento pelo servico de buscas, conta de email, mapas, etc) ou teriam que fechar as portas (ou neste caso, os sites).

Nao precisamos voltar muito atras no tempo pra lembrar de quando conteudo na internet estava associado ao pagamento por ele. Folha de Sao Paulo, UOL, Terra, e os mais diversos jornais forneciam conteudo apenas para assinantes (a precos consideraveis). Hoje ainda ha areas restritas em portais, mas podemos afirmar que ao menos 70% do conteudo eh aberto a todos os usuarios. Por que? Gracas aos anuncios personalisados, cookies, profiling, etc.

Quando estava lendo um blog sobre cookies (quase como este, mas um pouco mais profissional), o autor do blog dizia o seguinte:

- nos, defensores da privacidade na internet, odiamos cookies? SIM! Mas se voce esta lendo este blog agora sem pagar nada por isso eh gracas aos cookies que lhe estou enviando neste exato momento.

O fato eh que a internet depende dos cookies e do profiling. Mas como evitar o seu abuso? Esta ainda eh uma questao a ser resolvida. Como todo remedio, em doses corretas, profiling pode fazer bem, usado sem moderacao, pode causar danos irreparaveis. Assegurar este equilibrio ainda eh um desafio.

So para esclarecer, o Blogger.com (que hospeda o que voces leem agora), eh tambem propriedade do Google. Assim, os cookies que voces recebem neste momento nao eh em favor do autor (que nada recebe por isso, a nao ser a satisfacao de dividir ideias), mas da empresa norte-americana. Mas nao se preocupem, isso tambem ocorre quando acessam o Orkut, youtube, gmail, etc. Um a mais, ou a menos nao faz muita diferenca.

quinta-feira, 21 de agosto de 2008

Profiling

Profiling eh um termo que pelo menos por hora nao encontrei traducao em portugues. Nao que o termo nao possa ser traduzido, mas Profiling tem sido usado no Brasil pra descrever a pratica. Traudzir o temo, pelo menos por hora, seria como chamar o mouse de rato.

O termo Profiling apresenta diferente definicoes, entre as que mais nos interessam no contexto temos duas:

1- tecnica de vigilancia de dados que embora pouco "compreendida" tem sido amplamente usada. Isso significa gerar suspeitos ou prospectos dentro de uma populacao numerosa envolvendo certas caracteristicas sobre uma classe em particular, ou pessoa, de acordo com experiencias passadas. (Roger Clarke. Profiling: 1993)

2- tecnica usada por empresas na internet (principalmente ferramentas de busca e marketing online) para classificar os usuarios em um determinado grupo. Assim, estas empresas coletam dados dos usuarios com o fim de tracar um perfil de cada um. Apos analise das informacoes armazenadas, cada usuario eh incluido em um certo grupo para fins de marketing personalizado (como visto anteriormente).

Profiling, como qualquer outra tecnica, possui seu lado bom e ruim. Atraves desta "classificacao" das pessoas, eh possivel as autoridades publicas descobrirem pessoas com tendencias a desenvolver determinadas doencas, identificar fraudadores do fisco, possiveis criminosos, conhecer melhor as caracteristicas e necessidades da populacao de um determinado local, etc. No setor privado as empresas podem conhecer melhor os eus clientes, sabendo quais os produtos eles estariam interessados, podendo assim economizar tempo e dinheiro com a promocao de sua mercadoria.

O lado ruim da tecnica sao varios e possivelmente catastroficos. Os efeitos imediatos do profiling podem ser numerados em: arbitrariedade, discriminacao e pre-julgamento, inversao do onus da prova, clima de suspeicao, desrespeito a lei e ao processo legal, potencial repressao por um governo totalitario, dentre inumeros outros.

Isso porque com a tecnica de profiling, todo cidadao esta sendo incluido em uma determinada categoria de pessoas, mesmo sem saber, sem acesso e sem poder opinar sobre isso. Como ja disse anteriormente, provavelmente Google sabe que voce (ou melhor, o usuario do seu computador) eh homem, entre 25 e 30 anos, solteiro, sem filhos, com renda entre $1000 e $2000, fa de esportes, carros e revista em quadrinhos. Desta forma voce esta classificado em uma determinada categoria. Como ele sabe disso? Nos posts anteriores eu expliquei como tracker cookies e server logs podem revelar seus habitos na internet. Assim, de acordo com suas buscas online e paginas visitadas ele pode saber todas as suas preferencias e tracar seu perfil de acordo com elas.

E porque isso eh tao mal?

Vamos imaginar hipoteses: por algum motivo voce eh suspeito de ter assassinado sua esposa. Entao, o promotor de justica faz um pedido ao seu provedor de internet sobre as paginas que voce vistou recentemente. Pedido deferido pelo magistrado. Resultado da busca: voce visitou a pagina "como assassinar a sua esposa" que eu me referi em um post anterior. Voce nao queria matar ninguem, mas voce achou curioso quando leu no Blog "como assassinar a sua esposa" e clicou para conferir. O que temos aqui? No tribunal do juri o ilustrissimo promotor de justica ira apresentar como prova cabal que voce eh o assassino baseado no seu despretensioso "clic" em uma pagina. - inversao do onus da prova.

Este foi so um simples exemplo, mas vamos pensar grande. Algum governo paranoico (sim, mais uma vez estou me referindo aos EUA) resolve consultar seu habito na internet para decidir se voce eh um terrorista ou nao. Infelizmente voce acessou algumas vezes os sites do Michael Moore, buscou pelo termo Bin Laden, digitou a palavra bomba no seu blog. Pronto, voce esta na lista de terroristas da CIA. Se voce vier do oriente medio, situacao ainda mais grave, pois a tortura eh licita nos EUA em casos de suspeita de terrorismo. Entao meu caro, em uma sessao de tortura voce confessa ate que matou Jesus Cristo.

Paranoia minha? Nao! Deles!!

Mes passado a Suecia (o primeiro pais a implementar a nivel nacional legislacao sobre protecao de dados e provacidade em 1971) aprovou a alteracao na Lei que permite a interceptacao de qualquer meio de comunicacao SEM necessidade de mandado judicial. A privacidade das pessoas nunca esteve tao proxima do fim total! Certamente George Orwell errou o ano (1984), mas estou comecando a acreditar que sua obra nao era ficcao, mas premonicao. Em 2008, estamos cada dia mais proximos do ano de 1984.

PS: no livro 1984, Geroge Orwell descreve um romance que tem como cenario um pais dominado pela tirania. Em 1884, as pessoas nao podem ter qualquer relacao afetiva com outra pessoa e por isso os protagonistas, apaixonados, encontram serios problemas, pois nenhum cidadao pode agir de acordo com sua propria vontade, mas a vontade do Estado. Para isso, o governo Big Brother implementa televisores "duas vias" em que o telespectador assiste a TV da mesma forma que um supervisor assiste ao telescpectador em seu trabalho, residencia, nas ruas, nos bares, etc. Cada cidadao eh constantemente vigiado 24 horas por dia. Ninguem pode fazer qualquer coisa que desrespeite as normas do governo autoritario.

quarta-feira, 20 de agosto de 2008

Data Protection as Property Rights

Protecao de dados como direito de propriedade.

Se alguem lhe parar na rua e perguntar seu nome completo e o numero do seu RG, voce daria? Certamente nao! Mas, se lhe oferecerem 100 reais pelo seu nome completo e numero do RG? Nao? e R$200, R$1.000, R$1.000.000? Tenho certeza que esta informacao teria um preco. Para alguns menor, para outros maior, mas enfim, todos teriam seu preco. A prova disso pode ser notada em programas como Big Brother, em que os participantes abrem mao completamente de sua privacidade em troca de uma quantia em dinheiro. Ou seja, eles vendem o seu direito a privacidade. Meu professor na Universidade de Hannover, Prof. Dr. Wolfgang Kilian, um dos precursores do direito a protecao de dados na Alemanha, sustenta a tese em que em um futuro proximo, o direito a privacidade vai ser tratado simplesmente como um bem material, em que o individuo pode comercializar como quiser.

Em uma palestra com um membro da Organizacao dos Consumidores Europeus (BEUC), a palestrante levantou uma questao que realmente me fez refletir. Os usuarios da internet nos dias de hoje estao acostumados a ter todos os servicos onlines gratis. Desde conta de email, servico de buscas, mapas, noticias, TV, VoIP, Softwares, etc... tudo sem qualquer custo. O que ninguem para pra pensar eh que todos estes servicos possuem um custo operacional. Assim, se o usuario nao esta pagando pelo servico, como entao as empresas online estao obtendo seus lucros (ou ao menos cobrindo seus custos)? A resposta eh simples - o usuario paga pelo servico com seus dados pessoais!

Toda vez que voce abre uma conta de email, recebe noticias pelo email, baixa um programa da internet, voce entrega algumas informacoes ao seu respeito, como no minimo nome e email. Assim, seus dados poderao ser comercializados por aquele portal por inumeros motivos, mas principalmente maketing. Assim, seus dados pessoais sao a sua moeda de troca. Voce se importa? A maioria nao. Quase todos ainda preferem forncer seu email a pagar R$ 20 mensais para ler as noticias online. Eu tambem. Contudo, eh importante que o usuario tenha conhecimento disso, e tenha a escolha. Livre arbitrio, presente divino que tem sido desrespeitado pelas e-companies.

Ainda eh importante lembrar que estes dados pessoais precisam ser manipulados de forma legal, clara e moral pelas empresas. A Diretiva Europeia 95/46/EC, sobre a Protecao de Dados cuida exatamente disso, que em todos os Estados Membros da Uniao todo aquele que manipular dados pessoais devera fazer-lo respeitando a Diretiva, que estabelece regras para assegurar a privacidade dos cidadaos europeus. Essas medidas incluem a completa proibicao de tranferencia de dados pessoais para paises fora da Europa, a nao ser que o pais tenha uma legislacao adequada que possa garantir essa seguranca. Ate o momento apenas 3 paises fazem parte da lista de "satisfatoriamente seguros", alguem advinha quais?

1- Canada,
2- Ilha de Man,
3 - Argentina. (isso mesmo, Argentina!)

Qual a importancia disso?

Se uma empresa multinacional (um banco i.e.) possui filiais em varios paises, nao eh possivel transferir dados dos seus clientes da sede na europa para o Brasil legalmente. Todavia, para a filial estabelecida na Argentina - no problem! Claro que ainda ha outras maneiras, todavia muito mais custosas, de se proceder quando esta transferencia eh necessaria (atraves de acordos inspecionados e sujeitos a aprovacao de um orgao da Comissao Europeia).

Assim, um pais estando na lista daqueles que "se preocupam com a privacidade de seus cidadaos", nao so favorece a populacao e seu direito maximo (privacidade), como tambem o crescimento economico. Porque isso ainda nao existe no Brasil? well well well... pergunte ao seu parlamentar!

terça-feira, 19 de agosto de 2008

opt-in opt-out

Opt-in: optar por um servico
Opt-out: optar por NAO receber um servico.

Para explicar melhor podemos cosiderar o exemplo da doacao de orgaos no Brasil (me corrijam se estiver enganado). Antes era um sistema opt-in, ou seja, o doador tinha que expressar a vontade de doar seus orgaos quando falecesse. Hoje, o sistema eh opt-out, pois a pessoa deve expressar (registrada no RG) a vontade de NAO doar seus orgaos. Ficou claro?

Assim os sistemas opt-out tem gerado uma grande polemica em relacao a privacidade na web. Mais uma vez referindo aos "target advertising", cookies, spams, etc, quase todos eles adotam o sistema opt-out, ou seja, se voce NAO quiser receber anuncios personalisados (o que implica no rastreamento de todas as suas atividades online) voce deve acessar o site que lhe rastreia e optar por nao ser alvo de suas operacoes. Assim, por exemplo, a maior empresa de advertising online DoubleClick (que recentemente foi integrada ao Google) oferece uma pagina para que os internautas decidam por nao receberem seus cookies, os quais servem para registrar os sites acessados pelos usuarios com o proposito de criar um perfil para serem adequados os anuncios.

O que? voce nunca ouviu falar da DoubleClick? Voila! Entao entre nas configuracoes de seu navegador e confira na lista de cookies - aposto 10 bolinhas de gude que estara la o nome DoubleClick. Eu sei, voce nunca acessou um site chamado DoubleClick, mas nao importa. O que a empresa de anuncios faz eh o seguinte: ela trabalha para varios sites importantes da internet (os maiores). Assim, quando voce acessa a pagina do Google, por exemplo, a DoubleClick lhe envia seus cookies, chamados "trackers". Entao toda vez que voce acessar um outro site parceiro da empresa (sao milhares... muito mais do que voce imagina), o site vai reconhecer o seu cookie DoubleClick e vai saber que voce eh o mesmo usuario, registrando a sua visita. Desta forma a empresa sabe que voce (leia-se "o usuario numero xxxxxx") acessou tambem este site. Isso continua em todo site que voce acessar, ate a formacao de seu perfil. Depois de algum tempo a empresa sabe que voce (o numero xxxxx) gosta de ler a Folha de Sao Paulo pela manha, ver a previsao do tempo a tarde e quem sabe um pouco de pornografia a noite. Esta la, tudo registrado.

Invasao de privacidade? 100%!!! Mas a empresa alega que os usuarios sao livre para acessar a pagina e optar por nao fazer parte do sistema. Agora, voce sabia disso? Voce sabia que estava sendo rastreado? Sabia que tem a oportunidade de optar por nao ser rastreado? Se sua resposta for nao, nao se preocupe, voce faz parte dos 99,99% dos internautas que nao sabem disso. E se voces acessarem e optarem por nao receber mais cookies DoubleClick, problema resolvido? No way! Ainda ha varias outras empresas que possuem exatamente o mesmo sistema. Desta forma voce teria que entrar na pagina de todas elas para "opt-out".

Por esta razao, os defensores da privacidade online de forma alguma podem concordar com um "opt-out" system como sendo privadamente correto. Por isso eu vos digo, mesmo sem saber, todos estamos sendo catalogados, julgados e divididos em grupos, isso o que chamamos: Profiling.

segunda-feira, 18 de agosto de 2008

When your privacy is at stake





Quando a sua privacidade esta em jogo?




No post anterior vimos a quantidade de dados pessoais dos usuarios que as ferramentas de busca (Google) armazenam! Assim, estes provedores podem saber mais sobre voce que voce mesmo. A razao principal pela qual o Google que conhecer seu usuario tao profundamente eh para poder lhe oferecer um produto que ele estara possivelmente interessado. Como disse anteriormente, teoricamente nao ha nada de errado nesta conduta, porem, esta pratica adotada pelo gigante das buscas online tambem pode trazer uma gravissima consequencia.

Em 2006, no famoso caso Google X USA Government, inplicitamente veio a tona o quanto as informacoes pessoais coletadas pelo Google podem ter consequencias catastroficas. Acho que nao eh necessario comentar o quanto o governo norte-americano eh paranoico e a sua politica de que "todos sao terroristas ate que se prove o contrario". Bem, o que aconteceu neste caso foi que as autoridades judiciarias daquele pais requisitaram ao Google, por meios juridicos e legais, o historico das buscas por pornografia infantil na web. A empresa se negou a fornecer tais dados, alegando que eram dados pessoais e que, se fossem entregues desta forma, a empresa perderia a credibilidade e a confianca dos usuarios. Eh claro que o governo norte-americano nao gostou nem um pouco da resposta, acusando o Google de desrespeitar o poder judiciario (situacao grave em qualquer pais). O fato eh que em uma pesquisa do site news.com mais de 85% dos internautas concordaram com a negativa do Google - entre eles, EU.

Isso nao significa que as pessoas concordam com pornografia infantil, mas o fato eh que se o Google comecar a fornecer dados sobre os usuarios toda as vezes que o governo de qualquer pais requerer, isso podera significar a maior afronta a liberdade individual que ja existiu na historia. Nunca a vida privada das pessoas esteve tao facilmente acessivel as autoridades publicas. Se voce juntar um governo paranoico com informacoes (sem contexto) sobre usuarios, voce tera uma imensa lista de suspeitos que a partir dai serao intensamente vigiados. Quando trabalhava na minha tese de mestrado, eu mesmo busquei pelo termo"pornografia infantil" para ver quantos resultados o Google mostraria. Assim, aos olhos do governo dos EUA eu seria possivelmente um criminoso, depravado, doente, etc, sendo que nem mesmo cliquei em nenhum link mostrado nos resultados. Por isso foi importante o Google dizer NAO! as autoridades publicas norte-americanas.

A conlcusao neste caso pode ser interpretada como, esta batalha o Google (consequentemente - os uruarios) venceu. Mas quem pode garantir que amanha o Google nao ira ceder? Assim, se voce alguma vez na sua vida ja buscou por palavaras como "bomba' "Bin Laden" "Bush idiota" muito bem, bem vindo a lista de terroristas da CIA - voce eh um deles!

Esta teoria da conspiracao pode ser fundamentada pelo fato de que, em entrevista ao site News.com o porta-voz do Google prestou as seguintes informacoes quando perguntado:
- Se alguem (autoridade publica) lhe der um "mau" termo (como "terrorismo", "drogas", etc), voce pode dizer o IP dos usuarios que buscaram por aquele termo?
A resposta foi SIM!, e ainda;
-Se alguem lhe der um endereco de IP ou cookies, voce pode dizer os termos que este usuario procurou recentemente?
Mais uma vez a resposta foi afirmativa.

O que isso quer dizer?

Bem, digamos que o Governo "Big Brother" decide que todos que usam uma droga chamada "Vidagra" (sic) eh uma pessoa ma, muito ma! Assim, por meios juridicos (legalmente) ele requere ao Google o IP de todos os usuarios que procuraram por aquele termo. Entao, "Big Brother" (is watching you) sabera todas as pessoas que buscaram por "vidagra" na internet, nao importando se a pessoas fazia uma pesquisa sobre o termo, se outra pessoa buscou pelo termo naquele computador, enfim, de forma alguma o dono daquele computador estaria interessado em adquirir ou usar "vidagra". Nao importa, para o "Big Brother", ele eh uma pessoa ma, muito ma!

Da mesma forma, se o "Big Brother" quer investigar uma so pessoa em particular (adversario politico, ou qualquer outra razao), ele pede ao Google uma lista com todos os termos procurados por aquele pessoa (atraves do IP ou cookies), e a empresa pode fornecer todo o historico daquele usuario. Assim, "Big Brother" vai saber tudo (tudo mesmo) sobre ele.

Nao ha como prever quando um governo se tornara "Big Brother" (em referencia do livro de Orwell - 1984), por isso, o que se pode, e se deve, fazer eh evitar que estas informacoes pessoais fiquem guardadas, pois elas representam a maior arma de um governo tirano contra os cidadaos. Esta eh a razao da constante batalha Comissao Europeia X Google, em que a empresa norte-americana continua vencendo, sem ceder a pressao da autoridade europeia para que dados dos usuarios sejam permanentemente excluidos.

Enquanto isso, meu conselho eh: deletem seus cookies, usem protetor solar e torcam para que o pior nao aconteca. E nao se esquecam:

"Google is watching you"!!!

quinta-feira, 14 de agosto de 2008

Privacy and Search Engines

No posto abaixo (se nao leu ainda, recomendo ler antes de ler este) foi explicado como as ferramentas de busca baseiam seus negocios. Basicamente, oferecendo anuncios aos internautas de produtos que eles estariam pessivelmente interessados. A priori, esse sistema parece uma otima ideia, onde no fim todos saem ganhando, nao fosse pela privacidade pessoal em risco. Como? Vamos passo a passo.

Como disse anteriormente, quando voce busca por um termo no Google, ele grava algumas informacoes chamadas "search logs", que sao:


www-az3.proxy.aol.com - 03/Jun/2008 10:16:22 – http://www.google.com/search?q=travel – MSIE 6.0; Windows NT 5.1 - 740674ce213e9d9

Onde:

www-az3.proxy.aol.com
(endereco de internet)
03/Jun/2008 10:16:22
(data e horario da busca)
http://www.google.com/search?q=travel
(a busca, contendo o termo "travel")
MSIE 6.0; Windows NT 5.1
(o navegador e o sistema,
MS Internet Explorer 6 on Windows XP)
740674ce213e9d9
(unico cookie ID, ligado ao seu navegador da
primeira em que voce visita o site)

Esses search logs, no caso do Google, sao armazenados por 18 meses(!) Assim, por todo este periodo o provedor de buscas online tem todas as suas buscas armazenadas e facilmente acessiveis. Assim, ele sabe o que voce buscou, data e horario, seu navegador (explorer, mozila firefox) e seu IP address. Na realidade eles nao sabem que eh voce especificamente, mas sabem que alguem usando o seu computador (facilmente localizavel pelo IP address) fez tais buscas na internet. Imaginem a infinidade de informacoes ao seu respeito podem ser extraidas destes dados armazenados. Se voce nao consegue imaginar, vamos a um exemplo prat
ico - the AOL case.


The AOL case

Em agosto de 2006 o provedor AOL divulgou uma lista com todos os termos pesquisados pelos usuarios pelo periodo de 3 meses para propositos academicos, assim as pessoas poderiam ver o que os usuarios tem procurado na internet. Essa lista foi divulgada assim:

Todas as buscas estavam ligadas a um numero aleatorio que foi atribuido a cada usuario. Assim, por exemplo, usuario 123456789 buscou pelos termos x, y, z nos dias a, b, c. O numero dado a cada usuario era aleatorio, nao possuira qualquer dado sobre IP address, cookies, nada. O provedor AOL pensou que nao haveria problema nenhum em divulgar tal lista, desde que o nome dos usuarios foram anonimizados.

Resultado: em poucos minutos o jornal The New York Times pode identificar um dos usuarios como sendo a Sra. Thelma Arnold. Uma viuva que mora no estado da Georgia, EUA. Ela buscou por termos como "cachorros que urinam em todo lugar", " homem solteiro de 60 anos" e outros mais. So entao AOL se deu conta do terrivel engano. Mas como foi possivel identificar o usuario? Bem, mesmo quando os search logs sao associados com numeros anonimos, ainda assim deles eh possivel extrair informacao pessoal. Tendo em conta que as pessoas muitas vezes digitam seus proprios nomes, de familiares e amigos, numeros de telefone, cartao de credito, RG, CPF.... tudo para verificar quanta informacao ao seu respeito esta disponivel na internet. Associe todos estes termos, com busca por "previsao do tempo em Leuven, Belgica" e voce sabera onde alguem mora. Associe constante busca por "empregado Microsoft" e voce tem o local de trabalho. Associe buscas por "como comprar drogas online" e voce tem uma situacao no minimo embaracosa. Associe busca por "como praticar aborto em casa" e voce tem um crime e um autor.

Um dos usuarios AOL, numero 17556639, buscou por termos como "“how to kill your wife” (several times), “dead people”, “pictures of dead people”, “killed people”, “dead pictures”, “ murder photo”, “photo of death”, “www.murderdpeople.com”, “decapitated photos”, “car crashes” and “car crash photo”. O que isso quer dizer? Que descobrimos um assassino? Como eu disse no comeco deste blog, informacao sem o devido contexto pode ser extremamente perigosa. Imagine que o usuario acima estava escrevendo um livro de ficcao e buscava ideias de como assassinar seus personagens. No entanto, a sua impressao dele(a) provavelmente foi de que eh um assassino, ou pelo menos em potencial. Agora parem um momento e reflitam sobre todas as buscas que voces ja fizeram na internet. Pensem em todos os termos em que voces ja digitaram no Google e respondam: voces se sentiriam confortaveis se outras pessoas pudessem ver tudo pelo o que voces ja buscaram na internet? Buscas curiosas dos usuarios AOL podem ser conferidas (em ingles) nos sites Slate e plentyoffish.

Mas porque o Google grava e armazena estes 'search logs'?

A empresa oferece varias justificativas como prevenir fraudes, otimizar o sistema, melhorar a qualidade das buscas, etc. Todavia, o principal motivo eh: Profiling (que sera amplamente discutido adiante). O Google elabora um perfil de cada usuario pra poder oferecer as propagandas personalizadas (target advertising). Entao, se voces achavam que receber anuncios sobre coisas que voces podem estar interessadas era um bom negocio, agora voces sabem as consequencias e como isso aftea a sua privacidade. Alem de saber simplesmente se voce esta interessado em um carro esportivo, o Google tambem sabe se voce esta gravida, se gosta de pornografia, se eh usuario de drogas, seus habitos alimentares, sua profissao, sua preferencia sexual, religiosa, enfim, seus segredos mais intimos. De certa forma, ele sabe mais sobre voce do que voce mesmo! Tudo muito bem guardado por 18 meses. E o seu direito a privacidade? Pelo jeito, isso fica um pouco de lado por enquanto, afinal, estamos na era digital.

Esta tem sido uma extensa batalha entre a Comissao Europeia e o Google, para que a empresa norte-americana ao menos reduza consideravelmente o periodo de armazenamento dos 'search logs' e opere com maior transparencia, justificando de forma razoavel a necessidade de armazenamento destes logs. E, melhor ainda, que eles jamais sejam associados a um usuario ainda que com um numero aleatorio, para que escandalos como o caso AOL nao tornen a se repetir. Nesta queda de braco, ate o momento, Google nao tem demonstrado qualquer sinal de recuo, mas a guerra continua.

Por fim, voce ainda pode estar se perguntando: mas qual o problema se o Google sabe tudo isso sobre mim? Como ele pode usar estas informacoes? Ai comeca a nossa Teoria da Conspiracao, nos proximos capitulos.




Search Engines

As ferramentas de busca nos dias de hoje tem sido a aplicacao mais usadas na internet, superando ate mesmo o velho email. Pode reparar no seus proprios habitos online: quantas vezes voce acessa seu email por dia e quantas vezes voce abre o Google para procurar uma receita, site, explicacao sobre alguma coisa, previsao do tempo, noticias, etc. Sem duvida, as ferramentas de busaca online sao extremamente necessarias quando se navega na internet. Elas indexam o conteudo das paginas na internet e em fracoes de segundos podem disponibilizar milhoes de paginas relacionadas com o termo buscado pelo usuario.

Para ilustrar o o crescimento e a importancia destas destas empresas, vamos usar expemplos concretos. Ha 6 anos, quando se falava em empresa de IT, qual o primeiro nome que nos vinha a cabeca? A grande maioria com certza deve responder Microsoft. E hoje? Bom, se voce nao respondeu Google voce faz parte da imensa minoria. Esse crescimento gigantesco do Google pode ser comprovado na tentativa desesperada da Microsoft em tentar comprar a Yahoo! para poder ter uma maior competitividade. Mas agora vem a pergunta crucial: a Microsoft eh uma empresa gigantesca que desenvolve e comercializa (basicamente) programas de computador (o bom e velho Windows). E o Google? O que produz? Como pode uma companhia valer tanto dinheiro se voce jamais pagou para utilizar seus servicos? Busca, email, blog, mapas, etc - tudo eh oferecido gratuitamente para os usuarios da internet. Entao, de volta a pergunta - de onde vem o capital da empresa?

A importancia da resposta esta diretamente relacionada com o topico deste blog: e-privacy. O que o Google vende? resposta: VOCE! Como assim? Vamos entender como isso tudo funciona por partes:

1- O maior produto vendido pelo Google sao os 'target advertising' (anuncios personalizados). Quando voce navega pelas paginas da internet voce pode notar que inumeros anuncios sao mostrados na tela das paginas que voce visita. Se voces comecarem a reparar, estas propagandas estao relacionadas com as suas preferencias. Se voce eh homem, provavelmente jamais recebeu uma propaganda sobre maquiagem, ou coisa assim. E porque? porque as empresas de propaganda online trabalham com suas preferencias para oferecer um produto em que voce pode estar interessado. Isso eh bom? Talvez! Eh como voces assistirem televisao e nos intervalos ver apenas comerciais sobre coisas que lhe atraem, feitos especialmente pra voce. Voce nao precisa perder tempo assistindo ao comercial do remedio pra fungos nos pes, ou do iogurte que faz ir ao banheiro se voce nao tem estes problemas. Mas eh claro, ha o lado ruim da coisa.

e o que o Google tem a ver com isso?

2- Toda vez que um usuario busca por uma palavra no Google, o site grava alguma informacao sobre voce (isso sera melhor detalhado quando falarmos sobre Search Logs adiante). Atraves do uso de cookies, o site sabe que voce eh o mesmo usuario que visitou aquela pagina anteriormente. Ele nao sabe a sua identidade, mas sabe que voce eh o numero xxxxxx. Assim, ele grava que o numero xxxxx buscou pelas palavras: "carro importado" "acessorios pra carro" "citroen C4 esportivo" "carros velozes". Pronto! Para o Google o usuario xxxxx eh interessado em caros caros, esportivos e velozes. Assim este usuario ira receber propaganda sobre este tipo de carros porque ha uma grande chance de ele adquirir este tipo de produto, ou no minimo clicar na propaganda para conferir o produto. Isso no entando nao se limita a busca na internet, mas tambem se extende aos videos que voce assiste no youtube, suas preferecinas no Orkut, e varios outros sites adquiridos pelo Google.

3- A maioria dos anuncios vendidos pelo Google sao do tipo "pay per click". Ou seja, a empresa paga ao Google pela propaganda de acordo com o numero de internautas que clicaram no link do anunciante. Assim, quanto maior a chance do usuario clicar no anuncio, maior o lucro do Google. Se voces repararem, em quase todas as paginas da internet visitadas voces verao escrito em algum lugar "ads by Google". Isso significa que embora voce esteja acessando o site da Folha de Sao Paulo, os anuncios ali sao fornecidos pelo Google de acordo com suas consultas nas paginas ligadas a empresa. Mais uma vez, atraves dos cookies, quando voce acessa a Folha, o site sabe que voce eh o numero xxxxx e que gosta de carros esportivos. Assim, mesmo naquele site os anuncios serao sobre carros.

Com uma fatia do mercado mundial de buscas de aproximadamente 80%, Google sabe o que os internautas do mundo todo estao interessados. Assim, tambem domina o mercado de anuncios online (extremamente lucrativos). Em outras palvras, imaginem o Google como um oraculo. Voce quer vender um produto Y, entao vai e pergunta ao oraculo: quem estaria interessado? O oraculo lhe fornece (a um preco razoavel) uma lista das pessoas ao redor do mundo que seriam potenciais compradores para este produto. Assim, todos vivem felizes para sempre: o anunciante, o comprador e, claro, o bem remunerado oraculo.

Entao isso parece um bom negocio para todos, certo? Nao! Nao exatamente. O que esta em jogo aqui eh a privacidade do usuario.

Mas o que isso tem a ver com privacidade?

Agora que voces sabem (se ainda nao sabiam) como as empresas de ferramentas de busca obtem seus lucros, a privacidade fica para o proximo post.

quarta-feira, 13 de agosto de 2008

introduction



Comecando com uma breve introducao ao titulo do blog: "e-privacy". O termo se refere a privacidade de individuos em meios tecnologicos, principalmente a rede mundial de computadores. Varios experts no assunto ja afirmaram que com o popularizacao da internet, privacidade se tranformou em um luxo inatingivel. Ninguem esta a salvo dos tentaculos da internet. De fato, se voce parar para pensar por um momento, ha 20 anos, se voce precisasse de informacoes sobre uma determinada pessoa, que meios voce usaria para as encontrar? Eu, nascido na decada de 80, confesso que nao me ocorrem muitas ideais, ou melhor, nenhuma. Hoje, alguns minutos em frente ao computador eu voce pode descobrir ate a marca do cigarro que alguem fuma.

Ha algumas semanas eu li uma reportagem em que um jornalista resolveu fazer uma experiencia, pedidino a um amigo que ficasse por 24 horas sem acesso a internet ou celular. Neste tempo, ele teria que executar algumas tarefas que parecem extremamente simples para qualquer cidadao, mas penosas sem o auxilio da tecnologia. Uma delas era descobrir o nome do livro e autor em que se encontra escrito um certo trecho do livro (nao me recordo agora). 15 segundos seriam necessarios para tal tarefa, mas sem uma ferramenta de busca, isso se trona quase impossivel. Neste caso, a "cobaia" foi a uma livraria e tentou procurar em livros que achou que o seu amigo poderia ter extraido. Nao me recordo se conseguiu ou nao, mas o fato eh que isso provou o quanto hoje todos somos extremamente dependentes da internet.

Como toda forma de prazer e comodidade sempre traz uma consequencia, a internet virou uma ameaca constante a vida privada das pessoas. Nao pensem que estando longe do orkut vai fazer voce viver no anonimato. Ja experimentaram digitar seu proprio nome no Google pra ver o que acontece? Muitos de voces ficarao surpresos cm a quantidade de informacao ao seu respeito pode ser encontrada. Eu mesmo descobri que jogava tenis na Universidade de Hannover. Curiosidade - eu nao jogo tenis! Joguei duas vezes, mas estou registrado como praticante do esporte naquela Universidade. Ai vem o segundo problema da e-privacidade, informacoes sobre voce sem estar no contexto, podem criar uma descricao que nem sempre esta de acordo com a realidade. Neste exemplo, alguem procurando informacoes ao meu respeito, certamente iria pensar que eu sou um praticante assiduo do esporte, quando na verdade mal sei contar os pontos.

Hoje em dia inumeros paises (incluindo o Brasil) possuem legislacao sobre que asseguram o direito a privacidade do cidadao. Isso inclusive esta assegurado na Declaracao Universal dos Direitos Humanos (artigo 12). "Ninguem deve ser sujeito a arbitraria interferencia a sua privacidade..." (traducao livre). Este direito inclui a restricao de informacoes pessoais sobre individuals disponiveis online. Todavia, o que acontece com o surgimento da Web 2.0 eh o fato de que os proprios usuarios disponibilizam informacao pessoal a seu respeito na internet. Sim, a lei garante que ninguem podera desrespeitar o seu direito a privacidade, mas o que fazer no caso em que as proprias pessoas querem renunciar a este direito? Este vem sendo o problema enfrentado pelos membros da Comissao Europeia do departamento de Justica, Liberdade e Seguranca. Quanto mais eles tentam conter as informacoes pessoais disponiveis na internet, mais os proprios usuarios disponibilizam estas informacoes eles mesmos. Como prevenir isso? Como evitar que as pessoas revelem toda a sua vida no Orkut, Facebook, Myspace, etc?

Em uma escola da Alemanha, um professor entrou na pagina do facebook dos seus alunos e imprimiu o perfil de todos eles. No dia seguinte colocou em edital na escola. Resultado - os alunos ficaram todos supresos e envergonhados porque todos podiam ler informacoes ao seu respeito, incluindo se estavam comprometidos ou solteiros, o que gostavam, o que nao gostavam, e inumeros outros dados pessoais. Todos foram reclamar ao professor, argumentando que ele nao tinha o direito de "invadir a sua privacidade daquela forma". Bem, o que eles esquecem (e a maioria dos internautas tambem) eh que todas aquelas informacoes estavam disponiveis para qualquer um que acesse o facebook! De certa forma, muitos ainda nutrem a ideia de anonimato na internet, enquanto o usuario ja deixou de ser anonimo ha muito tempo (mais especificamente, desde o tempo do bate-papo UOL, em que nunca se sabia quem era o usuario do outro lado).

Ai fica a dica: quando fizerem seu perfil em qualquer network engine (orkut, facebook, etc), refiltam por um momento se voces dariam todas aquelas informacoes a seu respeito para um estranho que encontrassem na rua. Aquilo que voces nao falariam para um estranho qualquer, nao escrevam no perfil. Lembrem-se da quantidade de estranhos que estarao lendo sua pagina. Lembrem-se que a internet nao eh mais um bate-papo UOL, em que tudo o que se escreve fica entre voce (anonimo) e um outro anonimo teclando do outro lado. Lembrem da quantidade de pessoas ao redor do mundo que podem saber mais sobre voce do que voce gostaria (e isso inclui seus amigos, pais, filhos, chefe, empregados, namorada, marido, etc.). Por fim, lembrem-se que de fato - ninguem esta a salvo dos tentaculos da internet!

terça-feira, 12 de agosto de 2008

chewbacca defense


Antes de comercar com a introducao do conteudo do blog, eu gostaria de citar a famosa "chewbacca defense" (defesa chewbacca) em referencia ao episodio "Chef Aid" do South Park.

Na verdade isso vai ser muito util adiante, quando a frase "it does not make sense" (isso nao faz sentido) for constantemente utilizada.

Nao, South Park nao eh apenas perda de tempo.. este episodio em particular, um dos meus favoritos, foi citado ate mesmo pelo jornal britanico The Register e tambem esta na Wikpedia . Alias, para todos os advogados de plantao, esta eh uma tatica obrigatoria a se aprender. (sim, South Park tambem eh cultura)

Sim, para aqueles que nao aguentam mais de curiosidade, so conferir "Chewbacca Defense" (legendas em portugues):


No fim voces verao que este blog "does not make sense"!!!

Proximo post - introducao a "e-privacy"

beginning

Tendo em conta minha vocacao para espalhar minha "teoria da conspiracao" entre os amigos em reunioes, churrascos e outros eventos, achei que criar um blog seria uma boa forma de poder demonstrar de forma escrita que a teoria nao eh assim tao improvavel.

Optei por escrever este blog em portugues porque, de fato, ha inumeros blogs sobre e-privacidade em outros idiomas, mas nao em portugues. Assim, poderia trazer as leitores de minha patria amada um pouco do que acontece la fora em relacao a privacidade dos internautas.

Desde ja, peco deculpas pela escrita sem acentos (culpa do teclado), e pelo meu portugues que a cada dia parece ficar mais pobre. Tambem ao fato de ainda nao saber como traduzir algumas expressoes para o portugues, portanto, se alguem tiver a paciencia de ler e for adiante - por favor, sintam-se livres para me corrigir ou fazer sugestoes.

A intencao deste blog nao eh chocar os leitores nem fazer com que todos fiquem paranoicos a cada click no mouse, mas mostrar que por traz de cada pagina visitada, cada palavra digitada na rede mundial de computadores, "ha muito mais do que sonha sua va filosofia".

Recentemente eu finalizei minha tese de mestrado na Alemanha sobre protecao de dados em ferramentas de busca (Data protection issues of search engines). Durante a pesquisa para esta tese eu confesso que eu mesmo varias vezes fiquei extremamente surpreso com o quanto Google sabe sobre voce, ate mais do que voce mesmo. Agora tento dividir um pouco da minha constante pesquisa com possiveis leitores no Brasil, sejam da area juridica, IT ou apenas aqueles que se interessem pelo tema. Para isso, tentarei usar uma liguagem menos tecnica, e textos objetivos, para que possam ser compreendidos por todos, como uma leitura facil e - eventualmente agradavel.

Por favor, peco aos leitores que comentem, questionem, critiquem, enfim, sintam-se a vontade para debater... e me coloco a disposicao para eventuais perguntas...

Enjoy!