研究人員已經開發出一種新的方法,使用人口 大數據追蹤 新冠病毒的傳播,並建立了新的風險評估模型,以及識別新冠病毒的高風險地點,這是向公眾提供有價值的 大數據追蹤 工具包,讓衛生專家和政策制定者,能在新的疫情爆發期間實施傳染病控制。

 

 大數據追蹤 遷模式

香港大學商學院商學院市場營銷學副教授賈傑森博士(Jayson Jia)是該研究的主要作者,他的合著者使用了中國一家主要國家航空公司提供的全國性數據來追踪武漢市的人口遷移從2020年1月1日至2020年1月24日,這段時間涵蓋了春節之前每年春雲大規模遷徙到該城市封鎖以控制該病毒的時間。追踪了超過1100萬人通過武漢前往中國31個省和地區的296個縣的動向。

 

大數據追蹤模型與傳統不同

與依賴於歷史數據或假設的常規流行病學模型不同,該團隊使用的是有關實際運動的實時數據,其重點是總體人口流動,而不是個人跟踪。數據包括研究期間在武漢至少花費2個小時的任何手機用戶。一旦用戶打開手機,就會檢測到位置。由於僅使用匯總數據,而沒有使用任何個人數據,因此不會對消費者隱私造成威脅。

 

透過大數據追蹤病毒分佈

賈博士的研究團隊將人口流量數據與截至2020年2月19日在中國確認的新冠病毒確診病例的數量和位置相結合,表明疾病中心的人類活動的相對數量(在本例中為武漢地區)直接預測了相對數量。新冠病毒病例數的頻率和地理分佈。研究人員發現,他們的模型可以從統計學上解釋96%的新冠病毒分佈。

然後,研究團隊使用這種經驗關係來構建新的風險檢測工具。利用人口流量數據,研究人員基於從風險源(即疾病中心)到達的人數,創建了“預期成長模式”。因此,該團隊通過將病例的預期成長,與中國每個城市的確診病例的實際數量進行對比,從而開發出一種新的風險模型,即“社區傳播風險”。

“如果確診病例多於預期病例,則社區傳播的風險更高。如果預期病例少於報告的病例,則意味著該市的預防措施特別有效,或者可以表明中央政府的進一步調查正在開展。需要消除因測量不準確而可能帶來的風險。”賈博士解釋說。“我們的研究表明,人的地理流量勝過其他指標,例如人口規模,財富或與風險源的距離,以表明爆發的嚴重程度。”

賈博士目前正在與研究人員一起探討將該工具應用於其他國家/地區的可行性,並將其擴展到存在多個新冠病毒震中的情況。該小組正在與其他國家電信運營商合作,並尋求其他數據合作夥伴。

該 大數據追蹤 的研究合著者為香港中文大學深圳主席教授賈建民(通訊作者);耶魯大學社會與自然科學斯特林教授Nicholas A. Christakis;陸新,中國長沙的國防科學技術大學,和瑞典斯德哥爾摩的卡羅林斯卡研究所;西南交通大學運元學院 徐葛,湖南工商大學。