直接面向消費者的基因檢測使數以百萬計的人能夠確定他們的血統(tǒng)并深入了解他們對遺傳疾病的遺傳傾向。雖然個人基因分型信息是安全存儲的,但有些人同意共享他們的基因組數據以供進一步研究。
這種數據共享引起了對基因組隱私的一些合理擔憂。例如,黑客是否可以根據從開源網絡平臺合法下載的基因型數據重新識別一個人——也許構建一張他們的臉的照片?
2017 年,基于基因組學的健康情報公司 Human Longevity 和其他研究小組報告說,根據 DNA 預測一個人的面部外觀是可行的。
對這項工作的隱私風險影響很感興趣,圣路易斯華盛頓大學的教職員工 Yevgeniy “Eugene” Vorobeychik 是應用博弈論確定數據共享設置中的隱私風險的專家,他進行了自己的研究。
“我們想看看這些結果能在多大程度上推廣到現實世界,”麥凱維工程學院計算機科學與工程副教授 Vorobeychik 說。“我們探討了是否有可能在更實際的情況下證明這些擔憂是真實的。”
Vorobeychik 和他的合著者——華盛頓大學研究生 Rajagopal Venkatesaramani 和范德比爾特大學生物醫(yī)學信息學教授 Bradley Malin——發(fā)現將人臉和基因組聯系起來的任務平均比之前報道的要困難得多。他們于2021 年 11 月 17 日在《科學進展》上發(fā)表了他們的發(fā)現。
在這項研究中,他們開發(fā)了一種方法,通過將這些與公開發(fā)布的面部圖像相關聯,從 OpenSNP 基因組共享平臺獲得的 126 個基因組精心策劃的數據集中計算重新識別個體的風險。具體來說,他們使用神經網絡模型來預測可見的身體特征,例如頭發(fā)、眼睛和膚色以及性別,然后使用這些信息以及已知的基因型-特征相關性來對可能的基因組-面部匹配進行評分。
早期的表型關聯研究使用在具有專業(yè)質量照明的實驗室環(huán)境中拍攝的高質量照片。另一方面,Vorobeychik 的團隊使用社交媒體網站上的真實照片進行了研究。
“我們所做的是為這些不同類型的視覺特征構建概率模型,并通過對特定基因組和特定面孔之間的匹配質量進行評分來基本上連接點,”Vorobeychik 解釋說。“然后我們使用該評分系統(tǒng)來預測哪些比賽最有可能。”
總體而言,他們的結果表明,有時可以將公共面部圖像與公共基因組數據聯系起來,但成功率遠低于先前研究論文在理想化環(huán)境中所建議的。
標簽:
免責聲明:本文由用戶上傳,如有侵權請聯系刪除!