Toch is de 'ontmaskering' van de anonimiteit van deze datastromen niet per definitie schadelijk, vinden de onderzoekers. Omdat je door analyse van deze data sneller criminele activiteit op kunt sporen, zou de veiligheid van het internet verbeterd kunnen worden, aldus Microsoft.
De wetenschappers lieten zien dat in 62 procent van de gevallen HTTP user-agent informatie herleid kan worden naar een host. Combineer je die informatie met een IP-adres, dan is de nauwkeurigheid 80,6 procent. Als de user-agent informatie enkel wordt gecombineerd met de eerste twee of drie cijfers van een IP-adres, dan nog is de nauwkeurigheid 79,3 procent, zeggen de onderzoekers.
Gedeelde computers minst anoniem
Computers die gebruikmaken van meerdere user-ID's zijn het makkelijkst te herleiden naar een enkele host. Dit is bijvoorbeeld het geval voor gedeelde bedrijfscomputers en computers die door meerdere gezinsleden gebruikt worden. In zulke gevallen schiet de nauwkeurigheid van het bepalen van de single host omhoog naar 92,8 procent.
De analyse van deze als anoniem beschouwde informatie is gedaan op basis van het Hotmail- en Bing-verkeer in de maand augustus 2010. Daarbij zijn de data van honderden miljoenen gebruikers onder de loep genomen. De opdracht van de onderzoekers was na te gaan in hoeverre een klein stukje gelogde informatie te herleiden is naar een computer.
'Anonimiseren werkt niet'
Ze toonden aan dat ook door bedrijven geanonimiseerde data informatie kan lekken. Zo is het vervangen van IP-adressen door een IP-kengetal (een afkorting) onvoldoende om de locatie van de host af te schermen, aangezien deze alsnog valt af te leiden uit andere loginformatie.
De onderzoekers hebben in hun onderzoek in detail beschreven hoe uit de logbestanden van Hotmail en Bing computers in kaart gebracht konden worden. Ze konden niet nagaan welke activiteiten individuen ondernamen, maar wel is het patroon van geaggregeerde activiteiten te zien en kunnen de implicaties hiervan onderzocht worden.
Volgens de wetenschappers is er geopereerd binnen de grenzen van de privacypolicies van Microsoft en wordt vanwege deze policies de ontgonnen informatie niet beschikbaar gemaakt voor externe onderzoekers.
Cookies weghalen helpt niet
In het onderzoek werd daarnaast duidelijk dat internetproviders van 88 procent van de apparaten die een site bezoeken, de cookie weghalen en opnieuw de site bezoeken vastgesteld kan worden dat het om hetzelfde apparaat is. Dat kan gedaan worden door de andere gegevens die worden achtergelaten bij een bezoek naast de cookieinformatie te leggen. Zelfs wanneer je de browser hebt geconfigureerd om in privé-modus te werken - modi die zijn gebouwd om de privacy van internetters te beschermen - dan nog kan je provider bijna altijd zien waar je wanneer bent geweest.
"Uit onze analyse blijkt dat gebruikers die niet geïdentificeerd willen worden meer moeten doen dan alleen de cookies verwijderen", zeggen de onderzoekers. In sommige omstandigheden is juist het verwijderen van de cookies voldoende om een bepaalde host te traceren. "Ongewoon gedrag zoals voor iedere request de cookies verwijderen kan een host afbakenen ten opzichte van andere hosts."
Advies
Voor wie desondanks zo anoniem mogelijk wil blijven surfen, geven de onderzoekers een aantal tips:
• Gebruik een browser met een populaire user-agent string. Hierdoor wordt gebruik van de string minder bruikbaar om jouw machine te identificeren.
• Zorg ervoor, zelfs bij gebruik van anonieme routing via bijvoorbeeld Tor, dat je tools als Torbutton gebruikt om je identiteitinformatie te beheren.
• Overweeg het gebruik van proxies.
Reageer
Preview