如何快速重建流行曲線與指揮中心公信力/從「校正回歸」之亂談起

更新時間: 2021/05/25 20:34
中央流行疫情指揮中心天天召開記者會說明狀況。資料照片

劉玠暘/醫師、流行病學研究者

從五月上旬關注華航機師與諾富特飯店案、至獅子王茶裏王與葡萄王,台灣的疫情讓海外遊子的我們同感驚愕與憂心。5月22日,「校正回歸」的各種梗圖與笑話突然如雪片般飛來,淹沒FB與LINE,中央流行疫情指揮中心(指揮中心)從台灣人的信任中樞而一夕面臨危機。在疫情肆虐之際,CECC是疫情監測、防疫策略與醫療救助,乃至政府公信力的核心;如何快速重建台灣民眾信心並團結防疫步伐,是今日管控疫情之關鍵。

病人要歸到哪一天?影響疫情判定的流行曲線

對於任何疫情的監測,最重要的指標就是流行曲線(epidemic curve),即以發病時間為橫軸、新增病例數(incidence cases)為縱軸所作的變化圖,舉凡病因與傳播的分析、政策介入成效的評估等,皆根據疫情流行曲線判斷,故其影響防疫決策甚鉅。

流行曲線實務上就是把所有病人歸入其發病時間所屬間隔(time interval,通常以日為單位),製成直方圖(histogram)。至於每個病人的發病時間如何定義?從接觸病原到確診,一個病人通常會經歷:出現症狀、就醫、採檢送驗、診斷(疑似或確定病例)、通報等階段,而理論上是以最早出現臨床表徵或症狀的時間為準。此資料取得有賴醫師問診、或衛生單位的疫情調查。由於是主觀認定為主,可能有些許回憶偏差(recall bias),但因為是相當近期的記憶,誤差不會很大;比較困擾的是,對於無症狀卻檢驗陽性者,當下難以判定。

依本次疫情的特質,多數病人於就醫(含篩檢站)當日即進行採檢,而抗原或抗體檢測(快篩)或核酸檢測(PCR)皆有採檢時間可查,故該時間較具客觀性與一致性。由於法定傳染病規範,即便未見PCR結果,當日也可能因快篩陽性或符合「極可能病例」定義之臨床與流行病學條件,即做出(疑似)診斷並通報。

就診斷程序而言,最後才是確診日,也是各國政府公告數據的主要來源。但由於確診定義所需之PCR檢測(或病毒分離)費時較久,即便一切順利,確診日也約較採檢日晚兩天。台灣在今年四月以前,由於病例極少,延遲時間幾乎固定,以確診日作為發病日畫出的流行曲線僅僅平移而形狀不變(亦即僅僅延後而趨勢不變),故其參考價值不受減損。然自五月中旬起,由於檢驗塞車或行政流程卡關,未排除的疑似病例就逐漸堆積,以致各確診病例延遲時間不一,部分積單(backlog)多達四、五日,也因此在大清倉後,引起「校正回歸」之亂。其實,世界各國多在去年即碰到此現象,更有檢驗室週末不開門或輪值人員較少、獨居者在家過世後才確診、地方分權的美國各州上報中央的作法不一等問題,加劇確診病例時間延遲問題,使流行曲線的建立更加困難。

這幾天台灣政府致力於精簡流程,擴大檢驗量能。但只要疫情繼續升溫,上述問題仍會出現。所幸各國過去一年已發展不同對策,以便在每日公布新增確診人數的同時,又能忠實反映流行曲線,可酌為參考。

以下謹列出筆者認為有效的三種方式,及各做法之利弊分析:

一、基於「採檢日」之滾動式修正

滾動式修正的想法十分簡單,就是在每天新增確診人數中,把理論上應該歸於前幾天的病例補回去,許多國家如日本、美國自去年以來皆一貫如此,故我國自5/22以來採取之做法絕非新創。但「校正回歸」一詞意味不明又非專業術語,回歸又易誤為統計學上之迴歸(regression)分析,建議將之改為回溯,或以補登、追加等一般用語即可。至於指揮中心以「採檢日+2」推估每個確診個案「理想狀態(沒有塞車)下的確診日」,在統計學上屬於「插補法」(imputation,或譯作設算法),泛指有一筆資料(此處為理想確診日)缺失時,以其他相關資訊輔助推估的各種方法。此做法之優點可避免與指揮中心之過往公告產生斷裂,但應注意,只要有塞車情形,最近數日之確診數皆會低估,且越接近當日往往越被低估,直接判讀上易誤以為疫情有所改善。另外,指揮中心所謂「今日」確診案例究竟是+0、+1、+2、還是+3?為尋求一致性,應考慮將今後所有新增確診案例都以採檢日+2,等於是直接用採檢日作為基準。

二、以通報單上「發病日期」為準

如同流行曲線之定義,法定傳染病通報單上所填寫之發病日期即以症狀起始日為準,但對於無症狀卻檢驗陽性者,尚無明確共識,但據筆者曾任臨床醫師的經驗,直覺上會填寫採檢日。如此做法,恰好符合台大陳秀熙教授強調的,以快篩採檢日、陽性日或PCR採檢日(三者通常為同日)作為發病日。「有症狀依症狀起始日、無症狀依採檢日」的乍看有失一致性(其實,無症狀陽性者可視為症狀起始日晚於採檢日),但如同陳教授所言,英國病毒株於隱性感染期間傳播力已經很強,因此在公衛防疫上是有意義的。

若疾管署能明定「發病日期」之填寫標準、各醫療院所與篩檢站詳加診治與繕寫通報單、民眾積極配合病史詢問與疫調,這個做法能最輕易並完美地還原真正的流行曲線。但在判讀上應注意:因為疫情是持續進行中,所有的病例都是到確診時才有辦法列入流行曲線、回推至發病日,故得出之流行曲線必然會滾動式修正,且最近兩三天的確診數會低估,應謹慎判讀、進行修正。縱然如此,其即時性實與前述(一、)之作法相當。

三、近七日(或十四日)平均數或總和

這方法可以簡單地化解塞車問題造成的流行曲線失真,畢竟在一週內的延遲,本來就會計入近七日的總和或平均數內,毋須借助前述「插補法」回推「理想確診日」。

此法又稱為「動態平均」,本質上是一種將曲線平滑化(smoothing)的數據處理方式,故對單日的新增確診數較不敏感,其好處是較不受無意義的隨機波動影響,但缺點是對於有意義的短期變化會有所低估,這統計學上是以增加偏誤為代價降低變動量(bias-variance tradeoff)。降低變動量的效果,能縮小各國或各州通報方式的差異所造成的影響,故方便跨地域的比較,因此英國、美國、著名資料科學網站Our World in Data皆予採用。

不過,「動態平均」低估短期變化之偏誤,會造成在新爆發之疫情與短期介入成果的評估上,有失疫情監控之即時性。以台灣近二週的情形而言,每天確診數都可能變化很大,且剛升上第三級警戒不到十天,因此「近七日平均確診數」較不適用。而較適合中長期監測使用。另外應注意的是,「近七日平均確診數」反映的其實是「三天前」(近七日的中點)的「理想確診數」,故其曲線等於是比「以確診日作為發病時間」之流行曲線又再慢三天。

指揮中心應提供預估確診數,並以之修正流行曲線

對於台灣北中南東各地區、各縣市之疫情比較分析時,往往疫情較嚴重(如近日之雙北)之區域,檢驗塞車會較嚴重,流行曲線的失真也會較嚴重,而以上三者皆有助於修正此問題,指揮中心可以考慮提供多種方案。但不論何種做法,限於檢驗時間,對於最近幾日之新增確診數必定有所低估,甚或導致誤以為疫情有所趨緩!因此,需要進一步建立預測模型(prediction model)以修正。

據查,疾管署每日皆有公告當日與去年至今累積之通報數、排除數、確診數等。以前者扣掉後兩者可算出未確定之疑似個案,但仍看不出這些未確定者中有多少是「塞在車陣之中」。

因此,指揮中心每日應更新「應歸屬於各日(根據發病日期、採檢日、或確診日)之未確定個案數」,配合屬於這幾天疑似個案中,目前已知之確診率,建立預測模型,方能及早預估各日最終確診個案數、修正流行曲線。換言之,指揮中心於每日公告當日確診個案數時,也應同時提供當日之預估追加確診數,再說明回溯追加於前幾日之確診數;使民眾每天收看指揮中心記者會時,能夠信任「當日確診數+預估數」之可靠性,而不用擔心明天、後天又會回溯追加多少個案數。因此得以快速重建政府之公信力。

而日後當確診個案數確認後,更能以之驗證預估值的準確性,這才是學理上真正的「迴歸校正」(regression calibration)!

另外,網路上有些人士提出以每日採檢之陽性率作為疫情偵測指標,但筆者須提醒,影響採檢陽性率之變因太多,非專家根據當時情況、與其他數據交叉比對,難以正確解讀。尤其目前的採檢因其所屬地區之不同(重災區或零星個案區)、自願或非自願、快篩或PCR等等因素,且這些因素皆在變動中,造成計算陽性率之分母有很大的歧異,更難以正確解讀。

以2021抗疫的成果,輝映2020防疫的成功!

過去一年多來,中央疫情指揮中心每天召開記者會,對於新發病例逐案說明其感染源追蹤、染疫前後足跡等疫調結果,如此高度透明化的作業模式,贏得了民眾對政府的空前信任。也因全國人民高度配合,加之政府充分尊重專業,方能一直提出具前瞻性之政策規劃,並嚴謹縝密的執行。正向循環之下,達致近乎奇蹟般的防疫成效,傲視國際。

如今防疫出現破口,民眾信心受挫在所難免,但當外界喻為「摔下神壇」,筆者卻認為民主體制本來就不應該有神壇存在。台灣民主已歷三十載,逐漸告別青澀走向成熟,民眾對於政府問責,乃分所當為;對於執政團隊或個別官員的優秀表現,我們當然讚賞喝采,但不應盲目崇拜,遑論造神。對外國媒體報導,更毋須患得患失。在嚴謹防疫的同時,念茲在茲減少干預、保障隱私,是民主國家、自由社會的展現。

筆者於海外所見,歐美學者對於台灣獨步全球防疫績效,多認為是反映了台灣公民素質與政治社會體制的健全,令身居海外的我們也不禁感到十分自豪。

防疫是每一位台灣人的公民責任與成就。危難當頭,不要忘記這份光榮感,讓我們心連心(抱歉,不能手牽手)、讓舉世再一次刮目相看。

BannerBanner