無失真壓縮鼻祖去世了,沒有他就沒有今天的Zip、PNG、MP3、PDF……

無失真壓縮鼻祖去世了,享年86歲。

他就是Abraham Lempel,來自以色列的科學家。

正是因為他和同事發明的LZ77/LZ78壓縮演算法,才有了Zip、GIF、PNG、TIFF、MP3、PDF等直到今天還在流行的檔案格式。

他生前曾就職的的以色列理工學院評價他為“學院成立100年來最偉大的研究員之一”,並稱很少有科學家“像他一樣在技術發展以及我們的日常生活領域中都產生了如此大的影響”。

無數網友為他的離世哀悼。

有人還表示:

我的研究生論文主題是HTML壓縮,裡面都還寫有他的名字呢。

共同發明LZ77/LZ78,徹底改寫資料壓縮領域

Lempel教授於1936年出生於波蘭。

23歲的時候他進入以色列理工學院,經過八年的學習,拿到博士學位。

就在畢業十年之際,41歲的他成為母校的全職教授,負責電氣工程和電腦科學專業的教學(隨後又擔任了三年電腦學院院長)。

這一年,正是他和同事Jacob Ziv發明LZ77演算法的那一年,也就是1977年(下圖左為Ziv,右為Lempel)。

正如其名,“LZ77”中的“L”代表Lempel教授,“Z”代表他的同事Ziv教授,“77”則是發明年份。

如果你是電腦專業的學生,LZ77演算法一定出現過你的課本之上。

它的特點包括簡單、易於實現,可以針對任何資料格式進行無失真壓縮,完全區別於此前已經誕生的各種失真壓縮演算法。

它主要採用的是基於字典的方式進行壓縮。

簡單來說,就是把資料中可以組成“短語”的一串字元加入“字典”,然後再有匹配的字元出現就採用標記來代替,由此就能實現壓縮的目的。

在具體操作中,該演算法會將資料分為“滑動窗口”和“資料緩衝區”

每次處理資料的時候,先把一部分資料預載入緩衝區,然後依次載入滑動窗口區(有長度限制)。

如果後進入的字元在滑動窗口裡面出現匹配的時候,就記進當前的短語字典中。

隨著滑動窗口的不斷向前,字典會不斷變化,不停地滑動字元向前,尋找到更多與字典中的短語匹配的選項,然後用帶有含義的標記符進行標記,最終就可以得到一段壓縮好的表示結果。

例子如下圖所示,粉色為滑動窗口區,藍色為緩衝區。

從上面的原理我們可以看出,LZ77的壓縮比比較高,但由於要不停地找匹配選項,壓縮過程有一些耗時,但又由於解壓速度又非常快(標記會說明匹配項的明確位置),總體還是算得上非常高效的。

兩位教授就以論文的形式將他們這一成果公佈了出來。

很快,在1978年,他們又對77演算法進行了更新,誕生了同樣著名的LZ78,也就是LZ77的第二個版本。

不管後來大家如何“修修補補”,衍生出更加高效和完善的LZSS、LZW、LZH等新演算法,它們的原理都和Lempel教授和Ziv教授的思想沒有什麼差別。

因此,在這些演算法上誕生的TIFF、PNG、ZIP、MP3等廣為流傳的壓縮檔案格式,都得感謝這兩位老爺子的貢獻。

這不,2004年,IEEE就宣佈LZ77和LZ78演算法成為電氣和電子工程的“歷史里程碑”

Lempel教授也因為所作貢獻,拿了不少獎項,包括IEEE資訊理論學會技術創新金禧獎和2007年的IEEE Richard W. Hamming獎章,後者主要表彰他在“資料壓縮方面的開創性工作”。

57歲被惠普聘用,貢獻了8項專利

在改寫資料壓縮領域之後,Lempel教授並沒有“閒著”。

1993年,已經57歲的他被惠普公司聘用。

僅過了一年,他就出來創立了惠普以色列實驗室(HP Labs Israel),並擔任其董事長直到71歲。

在此期間,惠普以Lempel教授的名義註冊了8項專利。

如今,Lempel教授已於上週日(2月5日)辭世,離87歲生日就還差一週時間。

悼念。

訃告地址

https://www.technion.ac.il/en/2023/02/technion-mourns-prof-abraham-lempel/

參考連結

[1]https://www.ynetnews.com/business/article/hjdfzoa2o

[2]https://twitter.com/search?q=Abraham%20Lempel&src=typed_query

本文來自微信公眾號“量子位”(ID:QbitAI),作者:豐色,36氪經授權發佈。

本文經授權發布,不代表36氪立場。

如若轉載請註明出處。來源出處:36氪