「社群媒體傾聽」在台灣通常被稱為「網路聲量」，這幾年大行其道，廣泛獲得應用，不只商界、政界都趕著追逐這波流行，連社會科學或商學的學術界也開始生產結合理論與這門應用技術的論文。然而，檢視當前的網路聲量應用與研究，卻發現一個非常嚴重的欠缺：信度。

信度指的是測量工具的穩定程度。信度高，就意味著不同人、甚至不同平台來測量都會得到相同的結果；反之，信度低，就表示不同人或不同平台的操作，答案就不同。科學研究絕對不可無信，偏偏網路聲量領域幾乎很少提到信度。

網路聲量雖然是一門新的技術，但原理一點也不新。美國學者拉斯威爾在70年前就主張對文詞進行計量研究。如今隨著電腦與網際網路的盛行，文詞激增，所以催生新的研究工具。由於電腦與網際網路的登場，出現了巨量文件，這對於研究人類行為來講具有前所未見的重要意義，社群媒體分析法因此應運而生。有學者認為這工具就像是生物學裡的顯微鏡、天文學裡的望遠鏡。

然而，業界幾家主要的社群媒體傾聽平台，似乎都未交代其信度；即使是社會科學領域目前採用社群媒體分析法當工具的相關論文，似乎也未見檢視信度，而是把平台提供的數據直接拿來使用。

筆者這學期帶著研究生檢視網路聲量分析的具體情況，發現最單純的情感分類，也就是情緒正負比，都出現不少問題。

事實上，這些問題早就有研究者先指出：文本是由人所創，並由人解讀，因此不具客觀性，同樣的文本可能有很多不同的意義；甚至同樣語句，在不同時空背景，遇到人口變項不同的對象，例如族群、年齡、性別等，都可能出現不同解讀。更刁鑽的是隱含或寓義，甚至是反諷，這些早就是語言學關注的課題，現在成為網路聲量經常踩雷之處。

研究生在課堂操作上就發現反諷在情感分類時常常被錯置，一看就知道是在酸，應該歸類為負面情緒，平台卻歸類為正面情緒。甚至有時很明顯的誇讚文字，例如「謝謝」，卻被平台歸類為負面情緒，難以理解。不知道使用過網路聲量的業者或學者，是否曾具體檢視產出數據的正確程度？以上這些，都攸關信度。

傳統內容分析法的信度，採用相互同意度，一般以0.8為高信度。社群媒體分析法不可無信。網路聲量的信度應怎麼測量？多高的正確比例可以算高信度？在社群媒體傾聽蓬勃發展的今天，信度的研究與透明應該是一項重要的優先課題。（作者為國立台灣藝術大學廣播電視學系教授）