據(jù)媒體報道,有賣家在網(wǎng)上以兩角一張的價格售賣幾十萬張戴著口罩的臉部照片。這些照片部分是“網(wǎng)絡爬蟲”從網(wǎng)上搜集到的面部照片,另一部分則是人們上班打卡或進出小區(qū)門禁時拍的面部照片。買家買這些照片,主要用于訓練算法的精準度,也有可能用于申請信用貸款,甚至注冊公司。
疫情之下,一些科技公司紛紛研發(fā)出針對戴口罩場景下的人臉識別技術(shù),給人們帶來了便利,也減少了摘口罩帶來的病毒感染風險。但對于那些本就擔心人臉識別技術(shù)會造成數(shù)據(jù)泄露的人來說,這卻讓他們更加憂慮:即便戴上口罩也阻擋不了人臉數(shù)據(jù)泄露。上述媒體的報道,讓他們的憂慮變成了現(xiàn)實,同時,也暴露出人臉數(shù)據(jù)泄露存在于這項技術(shù)從研發(fā)到應用的每個環(huán)節(jié)。
人臉識別技術(shù)是基于對人面部大量特征點的提取來做出判斷。而對于戴口罩的人,只能提取其眼睛、眉毛等區(qū)域的特征點,無法進行全臉掃描。目前,戴口罩人臉識別技術(shù)的主要實現(xiàn)方法是通過模型訓練加強對眼睛、眉毛等重點區(qū)域的識別,也有的通過圖像重構(gòu)網(wǎng)絡將戴口罩的人臉圖像重構(gòu)為未戴口罩的人臉圖像,進而通過比對實現(xiàn)人臉識別。
無論是哪種實現(xiàn)方法,都需要有人臉數(shù)據(jù)的積累,且數(shù)據(jù)越海量,往往越能提高精準度。這些海量數(shù)據(jù)從哪里來的?上述報道提供了一個線索:大量人臉數(shù)據(jù)被非法售賣,用于訓練算法的精準度。雖然并不能將買家與研發(fā)新技術(shù)的公司對號入座,但是推出新技術(shù)的公司應該公布訓練所需人臉數(shù)據(jù)的來源。
科技是中立的,但如果用于研發(fā)的基礎數(shù)據(jù)都不明不白,就很難說清楚這項技術(shù)究竟是天使,還是魔鬼。此外,不能排除一些不法分子也在研發(fā)這項技術(shù),他們購買數(shù)據(jù),訓練算法的精準度,就是為了更方便地破解人臉密碼。
這些基礎數(shù)據(jù)可能泄露于保存、傳輸、應用等各個環(huán)節(jié)。這既有技術(shù)本身存在漏洞的原因,也有人為竊取的原因,甚至有些是監(jiān)守自盜,負責管理數(shù)據(jù)的人售賣數(shù)據(jù)的新聞并不鮮見。盡管具體到單個數(shù)據(jù)泄露案例,可能會找到原因,但是大量泄露數(shù)據(jù)綜合在一起,背后原因錯綜復雜,很難說清楚到底是怎么泄露的。
人臉的不可更改性,讓很多人對人臉識別技術(shù)持保守態(tài)度。去年底發(fā)布的《人臉識別落地場景觀察報告(2019年)》顯示,在個人信息泄露頻發(fā)的態(tài)勢下,超過七成的民眾對網(wǎng)絡運營者的安全保障能力存有疑問,擔心人臉數(shù)據(jù)泄露。去年一位大學教授被杭州野生動物園強制使用人臉識別入園,更是一怒之下將后者告上法庭。
人臉識別技術(shù)所需基礎數(shù)據(jù)的采集如何規(guī)范?技術(shù)應用的邊界在哪,如何把握合法性和正當性?目前還沒有一個明確的說法。有關(guān)部門監(jiān)管也存在一定困難,更多的要靠行業(yè)自律,這讓數(shù)據(jù)泄露存在很大的不確定性。
盡管很多科技公司宣稱人臉識別技術(shù)已經(jīng)準備好了,戴口罩人臉識別技術(shù)也已經(jīng)應用于一些公司,但如何防范人臉數(shù)據(jù)泄露,卻很少提及。事關(guān)個人隱私安全的大事,在社會規(guī)制沒有準備好之前,應該嚴格限制應用的范圍,并征得用戶同意。高筑安全防線,再推廣應用不遲。畢竟,臉可能是人們最后一道隱私防線,這個密碼被破解,后果將不堪設想。