AOL heeft blijkbaar details vrijgegeven van zoekopdrachten op internet die gedurende een periode van drie maanden zijn uitgevoerd door honderdduizenden van zijn abonnees, wat aanleiding geeft tot bezorgdheid over de privacy.
De gegevens, kennelijk beschikbaar gesteld voor onderzoeksdoeleinden, zijn niet meer beschikbaar op de website, maar details van de gegevens werden geciteerd door de technologieblogsite Techcrunch, en de pagina die ernaar linkte, werd in de cache opgeslagen door de zoekmachine van Google.
De in de cache opgeslagen kopie van de pagina zei dat de gegevens ongeveer 19 miljoen zoekopdrachten op het web omvatten, uitgevoerd door 658.000 gebruikers van maart tot mei. De pagina waarschuwde voor seksueel expliciet taalgebruik in sommige zoekopdrachten en zei over de gegevens: “Deze verzameling is alleen gedistribueerd voor niet-commercieel onderzoek.” De pagina bevatte een link naar een gecomprimeerde kopie van de gegevens archief.
De pagina vroeg onderzoekers om de gegevens te citeren
een onderzoeksdocument (PDF) getiteld "A Picture of Search", gebaseerd op de gegevens, waarin twee AOL-medewerkers als co-auteurs worden genoemd.AOL-functionarissen in Londen zijn op de hoogte van het probleem, zeiden ze maandagochtend. Ze hadden verder geen commentaar en verwezen vragen door naar het Amerikaanse hoofdkantoor van het bedrijf. Bereikt in de VS, hadden bedrijfsfunctionarissen niet onmiddellijk commentaar.
Het vrijgeven van dergelijke informatie brengt ernstige privacyproblemen met zich mee. Grote zoekmachinebedrijven vochten vorig jaar tegen een verzoek om vergelijkbare gegevens over zoekopdrachten van gebruikers door het Amerikaanse ministerie van Justitie.
De Amerikaanse regering wilde de gegevens gebruiken om de effectiviteit te controleren van een federale wet die gericht is op de toegang van minderjarigen tot schadelijk materiaal. In januari diende het een motie in bij de rechtbank om Google te dwingen te voldoen aan zijn dagvaarding en een "willekeurige steekproef" van 1 miljoen website-adressen die in zijn zoekmachine-index waren gevonden, over te dragen.
Het vroeg het bedrijf ook naar de tekst van alle zoekopdrachten die tijdens een bepaalde week op de zoekmachine waren ingediend. America Online, Yahoo en MSN van Microsoft werden ook gedagvaard en werden in verschillende mate nageleefd.
De vermeende vrijgave van de gegevens van AOL heeft geleid tot bezorgdheid over hoe deze zouden kunnen worden gebruikt na de wijdverbreide vrijgave. Hoewel de oorspronkelijke pagina verdwenen is, zijn de gegevens sindsdien beschikbaar gesteld op verschillende andere websites.
De gegevens zijn waardevol vanuit het perspectief van marktonderzoek, zegt David Bradshaw, hoofdanalist bij Ovum. Normaal gesproken worden vergelijkbare soorten datasets alleen vrijgegeven aan vertrouwde onderzoekers, niet aan het grote publiek, zei hij.
Zelfs dan wordt het resulterende onderzoek vrijgegeven als een reeks geaggregeerde statistieken, die tekenen van het gedrag van individuele gebruikers maskeren, zei hij.
"Ik denk dat dit op zijn best roekeloos was en een complete ramp of erger voor AOL", zei Bradshaw. "Als ik een AOL-gebruiker was, zou ik de strijd aangaan."
De onderzoekers die de data gebruikten, schreven in een inleiding dat gebruikers-ID's werden vervangen door een anoniem nummer. Waarnemers uiten echter hun bezorgdheid over de vraag of gebruikers kunnen worden gevolgd op basis van hun zoekopdrachten.
De gegevens bevatten ook het tijdstip waarop een bepaalde zoekopdracht is uitgevoerd. Als een gebruiker op een resultaat klikte, werd de positie van het item geregistreerd, samen met het domeingedeelte van de URL (Uniform Resource Locator).
De vrijgave van de AOL-gegevens leidde tot talloze reacties op blogberichten die aan de kwestie waren gewijd.
Ben Noble uit Aberystwyth, Wales, schreef in een blog dat de gegevens zo anoniem zijn dat “er nog een zekere mate van ontkenning, maar het is verschrikkelijk dat iemand in de positie moet worden gebracht om te moeten ontkennen iets."
Noble schreef dat AOL een bestand zou kunnen bezitten dat anonieme gebruikers koppelt aan hun echte ID en hun zoekopdrachten.
De openbare vrijgave van de gegevens kan in strijd zijn met het privacybeleid van AOL, zei Sean McManus, met wie contact werd opgenomen nadat hij een opmerking over de kwestie had geplaatst.
McManus, die zei dat hij AOL niet als ISP (Internet Service Provider) gebruikt, onderzocht het privacybeleid van AOL nadat hij het had gevonden via een Google-zoekopdracht.
"Ik denk dat het grote probleem is of de gegevens überhaupt beschikbaar moeten zijn", zei McManus. "Gebruikers hebben een redelijke verwachting van privacy wanneer ze internet gebruiken, vooral omdat ze internet gebruiken op voorwaarde van AOL's eigen privacybeleid."