【投書】疫情指揮中心數據的科學解讀

嬴南雄/工程PhD/科學論政人

從5月22日起,除了公布當天COVID-19的確診數之外,我國疫情指揮中心每日1400時的記者會特別額外加了「校正回歸」資料,把應該屬於過去的確診數回填(Back Log)到正確日期的確診數。

這樣一來,我國疫情確診數就不適單單每天有新數據了,而是除了每天的新數據外,還會「更新」過去數據。

這其實是個相當科學的作法,只是指揮中心捨棄已存在的科學慣用名詞的Backfill或Backlog(回填或回補),卻自行發明了「校正回歸」一詞,搞得大家霧煞煞的。

無論如何,這代表了數據不確定性!

這個每天大張旗鼓的記者會在6月5日的今天所宣布的「扣掉校正回歸數的35例,共統計出476本土確診例」,其實只告訴人民一件事:「6月5日至少有476本土例;而且這個數字在未來的日子裡還會上升,但具體會上升多少,目前還沒譜」!

因此,身為科學人的筆者覺得應該有義務協助指揮中心讓台灣人民看懂這套「滾動變化式數據」。

一、每日確診數

圖一是從此次疫情前的5月10日到6月5日間,由指揮中心所提出的當日確診數(也就是尚未被校正回歸的原始數據)。圖二則是從5月22日開始校正回歸後累計到6月5日的數據。

放在一起(圖三),正常肉眼一看就知道,「回歸,差很大」

圖一、5/10-6/5尚未被校正回歸的原始數據

圖二、5/10-6/5校正回歸後累計數據

圖三、圖一、二並列後顯示「差很大」

二、校正誤差數與%

直接看數據,知道差很大,那該如何判斷到底疫情的發展是朝上、朝下、還是穩定呢?

我們是著從「校正誤差」來看看是否可看出端倪。

圖四呈現出每日與前一日的校正誤差百分比走勢,表一則是計算值。圖四很顯的呈現出每條曲線都是在最末(右)端往上翹,也就是愈接近當日,誤差越大!

圖五則把圖四的陡峭區框出來,這清楚顯示上翹區大約有3-4個轉折點(也就是日數)。這代表著到目前為止的第一個小結論:「校正回歸數據必須有3-4天才會穩定」

圖四、每日與前一日的校正誤差百分比走勢

表一、每日與前一日的校正誤差百分比計算值

圖五、每日與前一日的校正誤差百分比走勢圖之陡峭區

三、滾動式平均誤差

圖六呈現當日的前3天(與7天)校正誤差平均值;套具現代話來說,這也稱為「滾動式誤差」。紅圈框出了誤差較高的突出區;這也代表了數據尚未穩定區。以白話來說,就是只能參考,不能據以為推論或做成結論!

這個突出區顯示出與圖五一致的現象,大約有3個突出點。這進一步肯定了本文第二節所得出的第一個小結論:「校正回歸數據必須有3-4天才會穩定」

圖六、3天(與7天)的校正「滾動式平均誤差」

四、結論

依本文第一小結論,將僅供參考的最後三天數據隱去(紅色橢圓框),並將直覺走勢以直線標示出,我們得到圖七所示之顯而易見(Trivial)結論:疫情仍未能以「減緩中」這詞來形容。

因此,良心建議,「國產疫苗必須加速進行Phase 3檢驗」、「外國(尤其是醫療規定最嚴謹的美國疾管中心,US CDC)機構認證的疫苗要盡速大量進口,大量施打,無論是政府採購或是民間捐贈」。

圖七、校正回歸後數據走勢

照片來源:臉書

《更多CNEWS匯流新聞網報導》

老人肺炎不只怕新冠病毒 日常出現這障礙恐陷死亡率5成威脅!

「有疫苗官員先打」高嘉瑜斥金管會自私自利 躲辦公室下指導棋

【文章轉載請註明出處】