隨著人臉識別數據是否侵犯人權的議題在國際延燒,微軟(Microsoft)日前悄然刪除其最大的公共人臉識別數據庫,美國史丹福大學(Stanford University)和杜克大學(Duke University)也相繼刪除了面部識別數據。
據《金融時報》報道,在微軟使用旗下最大數據庫的數天之後,該公司悄悄從互聯網上,撤下他們面向全球面部識別系統的數據庫資料,刪除大約1,000萬張人臉信息。微軟表示,「這個網站的目的是為了學術需求。後來交由不再與微軟合作的員工營運,現在(網站)已被移除。」
這個數據庫名為MS Celeb,於2016年發佈,被微軟稱之為全球最大的公共面部識別數據庫,擁有超過1,000萬張圖像,將近10萬人的面部信息。MS Celeb主要用於訓練多個國家地區的面部識別系統,其中包括:軍事研究人員和商湯科技(SenseTime)、曠視科技(Megvii)等中國公司。
根據人工智能論文中的引文可見,已經有多個商業組織在使用MS Celeb數據庫,IBM、松下電氣(Panasonic)、阿里巴巴、輝達(Nvidia)、日立、商湯科技、曠視科技均有使用。而商湯科技和曠視科技都是中共新疆政府的設備供應商,當地大批維吾爾人和穆斯林少數民族被當局追蹤、關押在拘留營中。
由於數據庫所使用的照片,沒有徵得照片當事人的同意,微軟根據《知識共享許可協議》(Creative Commons license)將他們的面部數據信息從搜索引擎和影片中去除。
除了微軟刪除人臉數據庫資料以外,另有兩個學術單位也刪去了相關數據,包括由杜克大學研究人員建造的Duke MTMC監控數據庫,和史丹福大學的Brainwash數據庫。
Brainwash數據庫使用的信息來自三藩市下海區的Brainwash咖啡館的顧客,他們通過直播相機拍攝登門的消費者。史丹福大學發言人表示,在其中一位研究者提出要求後,已經刪除了數據庫,該校致力保護學校和社區的個人私隱。
杜克沒有回應評論請求。
這三個數據酷的侵權問題都是由柏林研究員亞當·哈維(Adam Harvey)所發現,他的百萬像素(Megapixels)項目記載了諸多數據庫的詳細信息以及使用方式。哈維調查發現,微軟本身已經使用這些數據庫來訓練面部識別的計算。
微軟將數據庫命名為「Celeb」(名流),表明它所概括的面孔是公眾人物的照片。經媒體查證,MS Celeb確實包括了一些特別人物、媒體人的信息,例如:基姆·澤特(Kim Zetter)《連線》雜誌的高級記者,報道涉及網絡犯罪、公民自由、私隱和安全等主題。阿德裏安·陳(Adrian Chen)和《監視資本主義時代》作者肖沙娜·朱伯夫(Shoshana Zuboff)。
哈維指出,微軟利用「名人」(celebrity)一詞來包括僅僅只是在網上工作,並在數位世界擁有知名度的人。
當《金融時報》聯繫被收錄在數據庫的當事人時,他們未意識到自己的照片已經被收錄。科技類別作家亞當·格林菲爾德(Adam Greenfield)說,「我絕不是一個公眾人士,我沒有辦法放棄我的私隱權。」「這表明微軟無法讓自己的研究人員保持誠信和正直,在員工離職之前報廢(數據庫)。」
阿蘭·圖靈研究所(Alan Turing Institute)技術政策研究員邁克爾·維爾表示表示,微軟可能違反歐盟通過的《一般資料保護法》(General Data Protection Law),該法規於去年生效,MS Celeb數據庫在法規生效後投入使用。
對此,微軟表示,該網站已經刪除,尚不清楚《一般資料保護法》是否帶來影響。
儘管數據庫已被微軟刪除,但仍可供以前下載過的研究人員和公司使用。哈維表示,它仍然在開源網站上分享。#
------------------
🏵️《九評》20周年👉🏻 https://hk.epochtimes.com/category/專題/退黨大潮
💎成為會員 📧訂閱電子報
https://hk.epochtimes.com/subscribe
🔔下載大紀元App 接收即時新聞通知
🍎iOS:https://bit.ly/epochhkios
🤖Android:https://bit.ly/epochhkand