麻醉醫師成爲平息霍亂的英雄!John Snow 如何在沒有儀器的年代發現傳染源來自飲用水而不是瘴氣?(上)

·7 分鐘 (閱讀時間)

難以戰勝的人類感覺

1831 年,倫敦爆發了第一次霍亂大流行。小災進城,大災離城,在巨大死亡陰影的籠罩下,城市的居民都成群結隊向鄉村逃亡。這個時候,斯諾(John Snow,1813-1858)還是一名學徒,他目睹了出城的人流造成交通大壅塞,人走城空,正常的生活被傳染病快速摧毀,這些場景令他心如刀割。

他是一名麻醉醫生,這種傳染病跟他關係不大,但醫者仁心,他開始關注研究這種病。

當時的人們都傳言,霍亂是經由空氣傳播的,城市裡無處不在的臭味和瘴氣是這種傳染病的根源。

1848 年,倫敦爆發了第三次霍亂大流行。斯諾發現,霍亂患者的最初症狀都是腹瀉嘔吐,「如果真的是瘴氣傳播,為什麼最先被感染的不是鼻子和肺,而是腸胃?又為什麼一家人當中會有倖存者,接觸病人的醫生也不會被傳染?」

斯諾斷定,霍亂一定是經口腔進入腸胃的。他推測這極有可能是因為喝了不乾淨的水。但當時的科學設備看不到水裡的微生物,被霍亂弧菌汙染的水,看起來完全和正常的水一樣,仍然純淨透明。斯諾無法說服身邊的人相信他的判斷。

斯諾需要的顯然是更多的證據。他深入疫區,挨家挨戶敲門詢問患者和喝水有關的資訊。他發現了一個驚人的事實,1848 年至1849 年霍亂爆發期間,倫敦市共有 7,466 人死亡,其中 4,001 人都居住在泰晤士河南岸,這意味著南岸的死亡率接近 0.8%,是市中心區的 3 倍,而倫敦西邊和北邊的死亡率僅僅只有 0.1%。

對此,瘴氣論的流行解釋是,泰晤士河南岸聚居了大量的勞工階層,汙濁的空氣導致死亡率更高。

(延伸閱讀:南丁格爾是「數據視覺化」天才!她如何用一張圖表拯救無數人生命?)

斯諾認為這個解釋是錯誤的,他舉出反證說,倫敦東區比泰晤士河南岸聚居了更多的民工,是全倫敦最貧窮、最擁擠的地方,但死亡率只有泰晤士河南岸的一半。

斯諾認為真正的原因是,南岸的倫敦人都飲用泰晤士河的水,而北岸倫敦人的飲用水來源並不僅限於泰晤士河,而是有多個來源。他分析了各個來源,發現死亡的數據和供水的路線有高度相關性。

斯諾的調查數據表明,飲用A公司水的家庭有 1,263 人死於霍亂,而飲用B公司水的家庭只有 98 人死於霍亂。當然,單純比較死亡的絕對人數是不公平的,因為有些地區的人多,有些地區的人少,斯諾又拿每一萬戶的死亡人數做對比,結論是飲用A公司水的家庭,每一萬戶死亡人數約是B公司的 8.5 倍(315 除以 37)。

飲用不同供水公司的水,每一萬戶死亡人數就會有高達 8.5 倍的差距,這究竟是什麼原因?斯諾又進一步追蹤了兩家公司的水源,他發現A公司在流經倫敦市中心的泰晤士河下游取水,B公司則在上游取水,而當時泰晤士河已經被霍亂患者的排泄物汙染了。

斯諾進行的飲用水源分析(時報出版提供)

倫敦市政府的戶籍登記處有名統計學家,叫法爾(William Farr,1807-1883),他的職責就是記錄人口的最新變化,例如出生、結婚和死亡。這個法爾非常了不起,他在戶政部門工作30幾年,建立了完善的倫敦出生和死亡人口記錄體系。

法爾對斯諾的觀點半信半疑,他提出:要測定水源對霍亂的影響,必須要有兩組居民,這兩組人生活在同一海拔高度、活動於同一空間、吃的東西一樣、日常活動也要相同,僅僅一方面不同,那就是喝的水,但在現實中的倫敦,顯然找不到這樣的實驗條件。

然而,斯諾認為,實驗已經擺在眼前。兩家公司的管道都通向所有的街道,進入幾乎所有的院落和小巷,無論貧富,無論房子大小,兩家公司都等而視之地提供自來水服務,而接受不同公司服務的客戶,他們在生活條件或職業方面也無明顯的區別,特別是他們都被同樣的「瘴氣」圍繞,為什麼有的生病,有的沒事呢?

1849 年,斯諾把這些調查和發現編寫成一本小冊子《霍亂的傳播方式》,正式提出水汙染是霍亂流行的真正原因:「再也設計不出比這更好的實驗方式,讓我們澈底地檢測水對霍亂的影響,整套實驗設計已現成地擺在研究者面前,而且這一實驗的規模相當大,多達 30 萬名不同性別、年齡、職業階層和地位的人,從上流人士到底層窮人,被分成了兩組,他們不僅不能主動選擇,而且在大多數情況下對這種選擇毫不知情。」

一組得到乾淨的水,而另一組得到被汙染的水,所以斯諾得出結論:水源不乾淨,才是霍亂傳播的真正原因。

斯諾的論斷是天才式的。他在「隨機對照實驗」的概念遠遠尚未產生的時代,就在現實中發現了一次科學實驗。科學的實驗機制要到 20 世紀初才被統計學家確立。但斯諾的這些論述只獲得極少數的人相信,這本小冊子總共才賣出去幾十本。

大眾對瘴氣論深信不疑,畢竟,嗅覺是人類一種最原始的感覺,我們相信自己的感覺,就像哥白尼時代的人相信地球是靜止的一樣。人類對感官的迷信可謂根深蒂固,只有一流腦袋才能將數據當作「感覺的替代品」,透過數據來感知我們自己的身體和外部環境。

(延伸閱讀:打造完美奶茶 SOP!奶茶要好喝,應該先倒紅茶還是牛奶?)

斯諾告訴法爾,為什麼光看死亡人數,瘴氣論好像很正確?那是因為在海拔高的地方,人口密度往往較低,因此死亡人口總數更少;但真正的原因不是這些地方遠離瘴氣,而是居民遠離了泰晤士河下游,水源較為乾淨。

他甚至得出結論說,如果A公司將其取水口移到泰晤士河上游,就可以挽救 1,000 多人的生命!斯諾最終說服了法爾,在他的統計當中增加一個新的變數:死亡者的飲用水源。

同樣是數據分析,為什麼只有斯諾才能洞察真正的因果關係?我想這源自於他對事實和規律持之以恆的細密追蹤。很多時候,流於表面的觀察都無濟於事,最高水準的成就來自一步一腳印的追蹤和不罷休。

「實事求是」,事,就是事實;是,則是規律。實事求是即透過事實分析並發現事物的規律。斯諾的方法,可以總結為實「數」求是:把事實記錄下來,再透過全面細密的數據來尋找規律。

接下篇

(延伸閱讀:誰發明的電話比較厲害?是曾因為玩火把自家倉庫燒掉的愛迪生 還是一生為聽障人士付出的貝爾)

*本文摘自《數商:向阿里巴巴前副總裁學習數據時代的生存商數》,時報出版出版。

【作者簡介】

涂子沛

大數據先鋒思想家,曾在美國學習、工作多年,2014 年從矽谷回到中國,出任阿里巴巴集團副總裁。2018 年創建數文明科技,同時擔任伊斯佳股份董事、人民網和國地科技獨立董事。

著有《大數據》、《數據之巔》、《數文明》、《給孩子講大數據》、《給孩子講人工智能》等作品,相關著作累計銷售已突破100萬冊。

大學畢業於華中科技大學計算機系,研究所畢業於中山大學、卡內基梅隆大學,獲公共管理碩士和訊息技術科學碩士學位。

更多上報內容:

增設永和、土城、新莊快篩站 侯友宜稱「新北防疫旅館一直夠用」

美國驚傳出現「殭屍蟬」 歷經17年若蟲階段、終迎來羽化成蟲