當今是一個「DNA表型」的時代,也就是說,利用某人的基因數據,人們能夠獲得其生理特徵,比如眼睛、皮膚和頭髮的顏色。隨著機器學習技術的應用,有關DNA表型的研究在去年獲得了迅速發展,或許,科學家們很快就能用DNA信息重塑人的整個面部形象。 

去年,一家名為「人類壽命」(Human Longevity)公司的研究人員詳細測定了約1,000人的生理特徵。他們將所有的基因組進行排序,並結合數據做出了一些模型,從而能預測3D面部結構、聲音、生理年齡、身高、體重、身體質量指數以及眼睛和皮膚顏色。 

這項研究受到了很多知名科學家的強烈抵制,包括被稱作「基因組黑客」的埃利奇(Yaniv Erlich)。因為該研究只是預測基於性別和血統的「平均臉」,而不是個體的獨特臉部特徵。而且這種基於少數的種族混合人群的判斷方法也備受指責。 

在埃利奇看來,即使對面部特徵有了準確預測,如果想要用它在現實世界中識別某人,還必須建立一個龐大的數據庫,其中應包含想要識別的每一個人的身高、面部形態、數字語音辨識及人口統計資料,否則將無法做到識別個體。 

數據庫開發 應對恐怖份子

澳洲政府目前正在建立這樣一個名為「能力」(The Capability)的數據庫,也就是生物特徵和面部識別系統,它能將閉路電視的錄像與護照和駕照的信息相匹配。該數據庫開發的初衷只是用於應對恐怖份子,但已有報道說,可能有些公司已經得到了其收費服務。 

同時,澳洲稅務局也剛剛發起一種語音識別服務,如果將其與「能力」項目相結合,澳洲就會成為一個利用生物特徵與面部識別進行監控的國家。印度目前也在部署名為Aadhar的系統,而中國在面部識別方面更是走在世界前列。 

目前的多數法醫DNA圖譜技術都依賴於「匿名的」、將特徵與數據庫進行匹配的標記,卻幾乎無法揭示嫌疑人的其它特徵。隨著基因組技術的發展,法醫們希望在該方面會有所突破。 

現在有若干公司在提供DNA表型收費服務,比如Parabon NanoLabs。該公司聲稱能夠利用DNA準確預測某人的生理特徵,而且已經服務於警方。但Parabon的能力卻受到質疑,因其電腦代碼不是開放的,採用的手段也並未公之於眾。 

DNA面部重塑能力 顯著提升

對該技術而言,有些特徵相對比較容易預測,比如利用較少的幾個基因變異就能預測眼睛的顏色。而有些特徵則要涉及到許多基因變異,預測起來就非常複雜,如頭髮的顏色。但隨著複雜的機器學習技術在大數據庫上的應用,科學家們利用DNA進行面部重塑的能力也會得到顯著提升。 

其實,使用任何DNA證據都存在造成司法誤判的風險。Parabon聲稱,他們提供的資料需要和其它調查信息結合使用,以縮小嫌疑人範圍。該公司還聲明說,他們的面部重塑技術不應與面部識別系統一起使用。這些技術在未來相結合併非不可能,但其範圍的擴大卻會帶來基因數據的私隱問題。 

如何在未來保護我們DNA數據的私隱性,也就意味著我們需要採取一些方法對其進行偽裝,比如基因組的偽裝或加密平台等。而人類對遺傳密碼了解得越多,對基因數據私隱的保護就越為困難。◇