據美國國家電視網NBC報道,IBM在未經當事人許可的情況下,從網絡圖庫Flickr上獲得了接近100萬張照片,藉此訓練人臉識別程式,並與外部研究人員分享。

報道稱,IBM所獲得的100萬張照片,雖然攝影師可能獲准拍攝照片當中的人物,但是這些人並不知道自己的照片被用於訓練人臉辨識程式。一位攝影師對NBC表示,「我拍攝的人沒有一個知道他們的照片用於這種用途」。

這些照片最初並不是IBM匯總的——這都屬於9,920萬照片集合的一部份,這個集合名為YFCC100M,由Flickr前東家雅虎匯總,以供研究之用。所有照片都按照創作共享協議分享,可以在一定限制條件下自由使用。

但用於訓練人臉識別系統可能並不符合規定。事實上,IBM之前曾經開發過一款視頻分析產品,可以使用人體攝像機來判斷人類的種族。但該公司否認藉此進行種族歸檔。

事實上,IBM最初的意圖是為了避免人工智能對某些群體形成偏見。但無論如何,普通人的確很難了解自己的照片是否包含在訓練資料庫中,也很難要求IBM刪除。因為IBM將這個資料庫設為私密,只允許進行學術或企業研究時使用。不過IBM在隨後發出的聲明中稱它非常重視個人隱私,「數據集只能由經過驗證的研究人員訪問,並且只包含公開可用的圖像」,IBM還補充說,「個人可以選擇退出此數據集。」

報道還指出,IBM只是許多探索人臉識別技術的科技公司之一,其它企業也曾經在沒有經過許可的情況下使用普通人的照片。例如,Facebook就提供80萬張人臉照片供研究人員下載。◇