AOL har tilsynelatende offentliggjort detaljer om Internett-søk utført over en periode på tre måneder av hundretusenvis av abonnenter, noe som vekker bekymringer om personvern.
Dataene, tilsynelatende gjort tilgjengelig for forskningsformål, er ikke lenger tilgjengelig på nettsiden, men detaljer om dataene ble sitert av teknologibloggsiden Techcrunch, og siden som lenker til den ble bufret av Googles søkemotor.
Den bufrede kopien av siden sa at dataene omfattet rundt 19 millioner nettsøk utført av 658 000 brukere fra mars til mai. Siden advarte om seksuelt eksplisitt språk i noen av søkene, og sa om dataene: «Denne samlingen er distribuert kun for ikke-kommersiell forskningsbruk." Siden inneholdt en lenke til en komprimert kopi av dataene arkiv.
Siden spurte forskere som brukte dataene om å sitere en forskningsoppgave (PDF) med tittelen "A Picture of Search" basert på dataene, som navngir to AOL-ansatte som medforfattere.
AOL-tjenestemenn i London er klar over problemet, sa de mandag morgen. De hadde ingen ytterligere kommentarer, og henviste spørsmål til selskapets amerikanske hovedkvarter. Nådd i USA hadde ikke selskapets tjenestemenn en umiddelbar kommentar.
Utgivelsen av slik informasjon utgjør alvorlige personvernproblemer. Store søkemotorselskaper kjempet mot en forespørsel om lignende data om brukersøk i fjor fra det amerikanske justisdepartementet.
Den amerikanske regjeringen ønsket å bruke dataene til å sjekke effektiviteten til en føderal lov rettet mot mindreåriges tilgang til skadelig materiale. I januar sendte den inn en begjæring til domstolen om å tvinge Google til å etterkomme stevningen og levere et "tilfeldig utvalg" på 1 million nettstedsadresser funnet i søkemotorindeksen.
Den spurte også selskapet om teksten til alle forespørsler som ble sendt inn på søkemotoren i løpet av en bestemt uke. America Online, Yahoo og Microsofts MSN ble også stevnet, og etterkommet i varierende grad.
Den påståtte utgivelsen av AOLs data har utløst bekymring for hvordan de kan brukes etter den utbredte utgivelsen. Mens den opprinnelige siden er borte, har dataene siden blitt gjort tilgjengelig på flere andre nettsteder.
Dataene er verdifulle fra et markedsundersøkelsesperspektiv, sa David Bradshaw, hovedanalytiker ved Ovum. Normalt blir lignende typer datasett bare utgitt til pålitelige forskere, ikke allmennheten, sa han.
Selv da blir den resulterende forskningen utgitt som en gruppe med aggregert statistikk, som maskerer tegn på individuelle brukeres oppførsel, sa han.
"Jeg synes dette i beste fall var dumdristig og en fullstendig katastrofe eller enda verre for AOL," sa Bradshaw. "Hvis jeg var en AOL-bruker, ville jeg vært oppe i armene."
Forskerne som brukte dataene skrev i en introduksjon at bruker-IDer ble erstattet med et anonymt nummer. Observatører uttrykker imidlertid bekymring for om brukere kan spores basert på deres spørsmål.
Dataene inneholder også tidspunktet da en bestemt spørring ble utført. Hvis en bruker klikket på et resultat, ble rangeringen av elementet registrert, sammen med domenedelen av URL-en (uniform ressurslokalisering).
Utgivelsen av AOL-dataene førte til en rekke kommentarer på blogginnlegg dedikert til problemet.
Ben Noble fra Aberystwyth, Wales, skrev i et blogginnlegg at dataene er anonyme nok til at «det fortsatt er en mengde fornektelse, men det er forferdelig at noen skal settes i den posisjonen at de må nekte hva som helst."
Noble skrev at AOL kunne ha en fil som kobler anonyme brukere til deres ekte ID og deres søk.
Dataens offentlige utgivelse kan bryte med AOLs personvernpolicy, sa Sean McManus, kontaktet etter å ha lagt ut en kommentar om problemet.
McManus, som sa at han ikke bruker AOL som en ISP (Internet Service Provider), undersøkte AOLs personvernpolicy etter å ha funnet den gjennom et Google-søk.
"Jeg tror det store problemet er om dataene i det hele tatt skal være tilgjengelige," sa McManus. "Brukere har en rimelig forventning om personvern når de bruker Internett, spesielt siden de bruker Internett på betingelse av AOLs egen personvernpolicy."