信息來源:cnBeta
近年來科技公司掌握了關于人們的大量數(shù)據(jù),若它們落入壞人手中,可能帶來巨大危險。為了應對這種危險,歐洲頒布了《通用數(shù)據(jù)保護條例》 (GDPR),給予用戶更大的“訪問權(quán)限”。按照規(guī)定,任何公司都應向用戶提其收集和托管的個人數(shù)據(jù)。此外,這些公司應該以一種便于用戶及時閱讀的方式提供數(shù)據(jù),并提供足夠的背景信息,以便用戶了解公司是如何收集和使用這些信息的。
GDPR的原意是,當用戶了解公司掌握了關于其哪些數(shù)據(jù),就可以利用它來做出明智的決定,比如決定你是否想提供這些數(shù)據(jù),并在他們未經(jīng)用戶同意的情況下收集數(shù)據(jù)時,讓這些公司付出代價。
然而,問題在于,公司在提供這些數(shù)據(jù)時往往非常吝嗇。畢竟,如果它們的服務本質(zhì)上是“強迫同意”(谷歌最近因此而被罰款5000萬歐元),那么它們可能不想讓用戶輕易看到其收集了多少用戶的個人數(shù)據(jù)。科技記者約翰·波特(Jon Porter)決定測試四家在歐盟運營的最大科技公司提供的“訪問權(quán)”:蘋果、亞馬遜、Facebook和谷歌。他的發(fā)現(xiàn)表明,雖然用戶可以獲得原始數(shù)據(jù),但實際上卻很難理解它們,也很難依據(jù)這些數(shù)據(jù)做出明智的決定。
按照英國數(shù)據(jù)保護監(jiān)管機構(gòu)ICO的規(guī)定,公司必須應用戶要求提供所有個人數(shù)據(jù),即任何與個人相關的已識別或可識別數(shù)據(jù)。信息必須以“簡明、透明、易懂和易于獲取的形式,使用清晰明了的語言”,以“常用的電子格式”提供給個人。這聽起來很簡單,但四大科技巨頭是如何做的呢?
最初,波特很容易下載了自己的數(shù)據(jù)。谷歌和蘋果的數(shù)據(jù)下載服務都可以讓你選擇要下載的數(shù)據(jù)。Facebook沒有,但這三家公司都很容易讓人在各自的網(wǎng)站上找到個人數(shù)據(jù)。與此同時,在亞馬遜上獲取數(shù)據(jù)則有點兒繁瑣,需要在該網(wǎng)站的“聯(lián)系我們”頁面中挖掘,以查找隱藏在列表末尾的選項。而波特等了30天才收到相關鏈接,以便下載其數(shù)據(jù)。
然而,當波特查看收到的數(shù)據(jù)時,事情開始變得一團糟。有些文件的標簽模棱兩可,而其他文件的存儲格式則讓人頭疼不已。實際上,找出波特正在查看的數(shù)據(jù)并不像想象的那樣簡單。
谷歌的位置跟蹤數(shù)據(jù)尤其難以理解。該公司曾多次因跟蹤安卓用戶而受到批評,即使他們關閉了操作系統(tǒng)中的主要位置跟蹤功能。歐洲七個國家的消費者團體已經(jīng)就此向各自的數(shù)據(jù)安全監(jiān)管機構(gòu)提出了投訴,利用GDPR賦予的權(quán)限下載個人數(shù)據(jù),應該是可以檢查這些服務是否使用某些技巧來收集更多數(shù)據(jù)的方法,也應該是讓谷歌等公司承擔責任的一種手段。
但是當你實際查看數(shù)據(jù)時,這些信息卻很難查看和理解。波特來自谷歌的所有位置數(shù)據(jù)都包含在61MB的JSON文件中,并且使用Chrome打開它時,卻顯示出令人困惑的字段數(shù)組,這些字段標有“timestimpms”、“l(fā)attudeE7”、“l(fā)ogitudeE7”和關于其是坐在原地還是坐在某種交通工具中的評估。
波特表示,他毫不懷疑,這是谷歌已經(jīng)關聯(lián)到其帳戶上的所有位置歷史信息,但沒有上下文,這些數(shù)據(jù)沒有任何意義。他必須認真努力才能開始理解這些數(shù)字,并將其導入到另一個軟件中以進行正確的解析。如果GDPR的目的是讓人們對從公司那里收集的數(shù)據(jù)有更多的控制和理解,那么谷歌下載的這部分數(shù)據(jù)幾乎沒有什么用。如果你想把數(shù)據(jù)輸入到另一個系統(tǒng)中,JSON是很棒的。但是如果你想評估谷歌有多少數(shù)據(jù)并據(jù)此做出明智的數(shù)據(jù)隱私?jīng)Q定,它們就不那么有用了。
當涉及到其他文件時,波特甚至不清楚最初看的是什么數(shù)據(jù)。位于ADS文件夾中、名為“My Activity”的4GB HTML文件,可能向他展示了許多與谷歌收集到的廣告跟蹤數(shù)據(jù)相關的內(nèi)容,但是這里沒有注釋或元數(shù)據(jù)來解釋它。
到目前為止,這些文件是整個數(shù)據(jù)下載中最令人困惑的內(nèi)容,也是最重要的文件。它們包含了許多潛在廣告商想要得到的個人信息,谷歌應該更加努力地解釋這些信息的內(nèi)涵。該公司已經(jīng)提供了Index HTML文件來概述用戶的數(shù)據(jù),那么為什么不在其中包含有關每個文件內(nèi)容的信息呢?
盡管仍存在問題,但蘋果在數(shù)據(jù)發(fā)布方面的表現(xiàn)要好于谷歌。蘋果提供的大多數(shù)數(shù)據(jù)都是易于閱讀和理解的文件類型,比如CSV、TXT和JPG,其中只有幾個JSON文件。但是,當你進入這些文件時,仍然有很多信息是很難理解的。
比如名為“Apple ID帳戶信息”的文件,里面似乎包含11條關于波特蘋果帳戶中幾乎相同的記錄,所有這些記錄都是在2014年完全相同的日期創(chuàng)建的,但蘋果卻沒有解釋它們是什么。另一個標題模棱兩可的CSV文件“Apps and Service Analytics”似乎包含了波特在App Store中每次搜索的完整列表,但它的空單元格太多,當他看到6.7MB大小文件時,才注意到其中有數(shù)據(jù)存在。
盡管能夠聽取所有的Alexa請求令人毛骨悚然,但亞馬遜在展示數(shù)據(jù)方面做得要好得多,不過這可能只是因為它對個人的支持相對較少所致。在大多數(shù)情況下,亞馬遜提供的文件和文件夾都有明確的標簽,盡管該公司仍有些工作要做,以更好地標記其電子表格的內(nèi)容。
具有諷刺意味的是,F(xiàn)acebook實際上擁有這四家服務中最容易理解的數(shù)據(jù)。首先,F(xiàn)acebook提供的每個文件都是HTML文件,每個文檔都被分類到清楚標記的文件夾中,索引文件為用戶提供每個文檔所包含內(nèi)容的概述。這些文件本身有清晰的布局和格式,瀏覽它們感覺就像是在Facebook上瀏覽一個頁面,盡管其中一個頁面完全存儲在用戶的計算機上。
Facebook的下載包括很長的索引文件,為用戶顯示在哪里可以找到其所有信息
看到Facebook存儲的用戶個人數(shù)據(jù)數(shù)量時,令人感覺毛骨悚然,但至少你很清楚這些信息是什么,而不是根據(jù)每個文件的內(nèi)容來猜測。
在實驗結(jié)束時,波特在所聯(lián)系的四家服務中找到近138GB的數(shù)據(jù)。其中,1.1GB來自Facebook、392MB來自亞馬遜、254MB來自蘋果。雖然谷歌有72.5GB的數(shù)據(jù)可供波特下載,但其中絕大多數(shù)是他的Google Drive和Google Photos的備份,分別為44.3 GB和25.7 GB。波特剩下的谷歌數(shù)據(jù)只有2.5GB。
在試圖梳理和理解所有內(nèi)容后,很明顯,如果這些公司想要讓我們真正控制自己的數(shù)據(jù),那么它們和管理它們的GDPR法規(guī)還有很長的路要走。能夠下載數(shù)據(jù)是一回事,但要使它變得有用,就意味著要更加努力地確保下載的內(nèi)容對于普通人來說更容易理解。至少,這意味著這些公司應該提供更好的索引來告訴用戶哪些數(shù)據(jù)包含在哪個文件中,但也意味著它們能以自己的方式來組織這些文件的內(nèi)容。