“實(shí)驗(yàn)驗(yàn)證,95%的用戶使用兩周后效果明顯”;
“統(tǒng)計顯示,服用某保健品的人群比同地區(qū)平均壽命高出2歲”;
“超過75%的用戶在同類產(chǎn)品中更加偏愛本品牌”;
數(shù)字時代,似乎有數(shù)據(jù)說話的廣告總是更能令人信服,尤其是當(dāng)廣告語還出自一個穿著白大褂、戴眼鏡的中年帥大叔之口。
可是“電視醫(yī)生”們口中的數(shù)字當(dāng)真是鐵證如山嗎?就讓壹讀君來帶你看看這些“科學(xué)實(shí)驗(yàn)”背后的貓膩,原來那些言之鑿鑿的數(shù)字,也許通通只是一個無關(guān)緊要的語氣助詞。
比三分之二提高兩倍的75%的壹讀君|何滿子
1. 糖丸效應(yīng)
作為醫(yī)藥界最著名、波及最廣泛的理論,糖丸效應(yīng)告訴我們:當(dāng)人們以為自己服用了藥物、但其實(shí)只是服用了糖丸的時候,由于心理作用,糖丸也可能產(chǎn)生和藥物類似的治愈效果。
“糖丸”(placebo)一詞來自拉丁語,意為“吾將取悅”,并且從16世紀(jì)開始就被發(fā)現(xiàn)、被研究。到了18世紀(jì),英國生物學(xué)家John Haygarth第一個以科學(xué)實(shí)驗(yàn)證明了糖丸效應(yīng)的存在:當(dāng)時一位美國醫(yī)學(xué)家Perkins號稱發(fā)明了一種神奇的金屬針,可以“吸走疼痛根源的有毒電流”,從而治療風(fēng)濕痛和腫脹,并且成功案例無數(shù),還申請了專利。
于是John Haygarth從Perkins那里買了一支神奇金屬針,用它和隨便的一支普通針交替給病人治療。結(jié)果發(fā)現(xiàn),Perkins神奇金屬針的治療效果,和任何一支普普通通的銅針或者銀針的治療效果,并無差別。
Perkins發(fā)明的“可以消腫的神奇金屬針”
所謂的“神奇金屬”以及那些治愈病例,完全是病人的心理作用。
這種因病人的心理作用而產(chǎn)生治療效果的“糖丸效應(yīng)”,廣泛地出現(xiàn)在醫(yī)藥界的每個角落,譬如在一個實(shí)驗(yàn)中,病人被告知自己吃下了刺激藥物,隨后便不同程度地出現(xiàn)了心率加快、血壓升高、反應(yīng)速度驟增的現(xiàn)象;另一個試驗(yàn)中,病人被告知吃下了安眠藥,隨后就出現(xiàn)了完全相反的身體變化——在兩個實(shí)驗(yàn)中,病人吃下的都是糖丸。
也正是因?yàn)檫@個原因,在現(xiàn)在藥物的功效測試中,“糖丸對照組”成了必不可缺的部分。只有當(dāng)服下真正藥物的病人組比服下糖丸的病人組產(chǎn)生明顯優(yōu)越的結(jié)果時,才能表示藥物真的具有某種療效。
而廣告里僅憑用戶的自我反應(yīng),覺得自己比使用前有精神、腿不疼、皮膚變白,很可能完全是糖丸效應(yīng)在作祟。
2. 向均數(shù)回歸(Regression to the mean)
如果用戶的自我感覺不夠科學(xué),那么選取客觀指標(biāo)的數(shù)據(jù),是否就完全值得信賴了?先來聽聽“向均數(shù)回歸”(regression to the mean)再說。
“向均數(shù)回歸”理論由Sir Francis Galton提出,指的是在統(tǒng)計學(xué)上,如果第一次測量時某個變量的數(shù)值非常極端,那么第二次測量時它一般都會向平均值靠攏。
舉個例子:一百個人擲骰子。擲骰子是一個完全隨機(jī)的狀況,第一輪下來,我們從一百人中選出成績最好的5個人。然后進(jìn)行第二輪,以同樣的規(guī)則再擲一輪骰子,那么第一輪成績最好的那5個人,幾乎不可能仍舊是擲得最好的那五個。也就是說,他們第二輪的表現(xiàn)一定不如剛才好,他們的成績,必然要向平均成績靠攏。
同樣地,第一輪最差的5個人,也不大可能仍舊最差,他們也會向平均成績靠攏。
多次測驗(yàn)中,第一次結(jié)果偏極端的會在接下來的測驗(yàn)中向平均值靠攏,就是“向均數(shù)回歸”理論的核心。這種統(tǒng)計理論在生活中隨處可見:父母身高都很高的小孩,通常會比父母矮;而父母都很矮的小孩,通常則比父母高——他們都在“向均數(shù)靠攏”。
同樣地,提高考試成績、降低膽固醇含量這些“奇效”,也可能只是向均數(shù)回歸的結(jié)果:如果我們選取一個班里成績最差的1/3進(jìn)行實(shí)驗(yàn),他們在第二次考試時肯定不可能還是最差的1/3,只要他們之中有幾個人跳出了這個范圍,這個1/3的群體就會產(chǎn)生成績的進(jìn)步。
而1994年《臨床化學(xué)》雜志上發(fā)表的論文中也驗(yàn)證了,如果在醫(yī)院選出膽固醇測試中含量最高的人,不管他們吃不吃藥、改不改變生活方式,過半個月,都會出現(xiàn)膽固醇指數(shù)降低的現(xiàn)象,這也是一個極端群體在“向均數(shù)回歸”。
當(dāng)然,上學(xué)考試、膽固醇不是擲骰子,不可能所有人的多次檢測都在平均值上下均等地浮動,但是這種統(tǒng)計學(xué)規(guī)律依然存在。而許多學(xué)習(xí)輔助工具只挑選成績最差的學(xué)生進(jìn)行實(shí)驗(yàn)、降脂降壓藥只跟蹤血脂血壓極端超標(biāo)的人群,它們所測出的“提高”,很大程度上只是極端人群在自然而然地“向均數(shù)回歸”。
3、關(guān)聯(lián)關(guān)系,不是因果關(guān)系
在所有科學(xué)實(shí)驗(yàn)的偽數(shù)據(jù)和偽結(jié)論中,邏輯關(guān)系的判斷錯誤是隱藏最深,卻出現(xiàn)頻率最高的一個,甚至于許多真正的科學(xué)家和社會學(xué)家在寫論文、著書立說的時候,都會犯這樣的錯誤。
關(guān)聯(lián)關(guān)系不能代表因果關(guān)系,這句話的意思其實(shí)十分好理解:A與B兩個變量可能呈現(xiàn)出某種一榮俱榮、一損俱損,或者兩者此消彼長的聯(lián)系,但是僅僅靠這種聯(lián)系,并不能說明他們之間有因果關(guān)系:我們?nèi)耘f不知道是A導(dǎo)致了B,還是B導(dǎo)致了A,還是他們誰也沒有導(dǎo)致誰,只是受了一些共同因素的影響而呈現(xiàn)出表面的關(guān)聯(lián)。
意思很好懂,但是把表面的關(guān)聯(lián)關(guān)系當(dāng)作因果關(guān)系,作為“噱頭”的說法,在生活中隨處可見:
上過大學(xué)的人,比沒上過大學(xué)的年薪高50%
經(jīng)常運(yùn)動的人,幸福指數(shù)更高
xxx的用戶比同齡人顯得更年輕……
薪水拿的多,是因?yàn)樯狭舜髮W(xué),還是上大學(xué)的人本身就更聰明、更渴望提升自我?
幸福指數(shù)高,是因?yàn)榻?jīng)常運(yùn)動,還是去健身房的人本身就有錢有閑、身體健康?
不難猜出,許多廣告中的數(shù)字里說的,服用某某保健品,或者實(shí)施某種健康/飲食計劃的人群壽命比平均水平更長,很可能是因?yàn)槟切┛匣ㄥX去吃保健品、合理膳食和調(diào)整生活作息的人,本身就有更好的生活狀態(tài):他們經(jīng)濟(jì)優(yōu)裕,營養(yǎng)良好,可能住在更安全、安靜的高端社區(qū),不會從事高危的勞動工種,不用受奔波勞累熬夜之苦,有條件旅游、放松,并且比普通人更注重保養(yǎng)、關(guān)注自己的健康。endprint
這樣的人,本身就比平均水平活得長。
同樣地,“從某校走出了近三十位英國首相”,也實(shí)在說不清到底是學(xué)校的教育成果,還是那些學(xué)生們本來就將成為政治精英,而某校只是挑選了他們?nèi)雽W(xué)。
壹讀君也可以說,本文的讀者智商水平比未讀過的人高20%。難道是這篇文章驟然提高了讀者的智力?當(dāng)然不是。更可能地,是只有智有余力的人才會點(diǎn)開并且詳讀這篇推送。本文只是選擇了一批高智商的讀者,并沒有帶給讀者的智商以任何改變。
與之同理,大多數(shù)昂貴的保健品,只是通過市場定位和營銷手段選擇了高收入人群作為自己的用戶,而非真正給這批用戶帶來了任何提升。它們只是選擇了優(yōu)秀的樣本,而并沒有把隨機(jī)樣本變得優(yōu)秀。
4、偏心的實(shí)驗(yàn)
前面所說的三種錯誤推導(dǎo)的共性,是僅僅通過觀察得出結(jié)論,而沒有控制變量、進(jìn)行對比試驗(yàn),導(dǎo)致不可控因素太多、結(jié)論完全不可信。
不過即使是由實(shí)驗(yàn)室對比驗(yàn)證過的“科學(xué)數(shù)字”,其中也可能摻雜著貓膩:只要稍微調(diào)整一下實(shí)驗(yàn)環(huán)境,幾乎就能得到自己想要的任何結(jié)果。
70%的用戶在同類產(chǎn)品中更喜歡本品牌;
產(chǎn)品盲測中,xx品牌被75%的用戶選中;
聽起來是不是都無比熟悉?這些數(shù)字,其實(shí)都很好做到。
比如說,大多數(shù)廣告沒有透露實(shí)驗(yàn)人群的選擇標(biāo)準(zhǔn)。在百事大樓里采訪純果樂(百事出品)和果粒橙(可口可樂出品)的青睞度,在漢堡店測試炸雞和壽司的喜愛度,以及在政協(xié)食堂調(diào)查民意,都可以嚴(yán)重地將結(jié)果的天平往一方傾斜。
實(shí)驗(yàn)人員還可以巧妙地調(diào)控實(shí)驗(yàn)環(huán)境,譬如在炎熱的海灘,將自己品牌的冰鎮(zhèn)果汁與其他品牌的常溫果汁放在一起,顯然自己的將更受歡迎。
乃至于到了實(shí)驗(yàn)結(jié)果的統(tǒng)計階段,依然可以挑挑揀揀:還舉可口可樂vs百事可樂的例子,在大部分人盲測時分不出區(qū)別的情況下,合理的結(jié)果應(yīng)該在50比50左右。倘若有100個人參加實(shí)驗(yàn),那么統(tǒng)計學(xué)上的隨機(jī)謬誤最多導(dǎo)致48比52的誤差,可是如果一共只調(diào)查五個人,那么喜好的傾向最少就是60比40、甚至可能制造出80比20這樣的懸殊差距??!
在自己品牌的支持度隨機(jī)占上風(fēng)的時候使調(diào)查戛然停止,是一個十分有效的控制結(jié)果的手段——反正看廣告的人也不會關(guān)心它們的取樣范圍到底有多大。
糖丸效應(yīng)、向均數(shù)回歸、邏輯錯誤和偏向性實(shí)驗(yàn),給出的都看似是貨真價實(shí)的數(shù)字,但也是千真萬確的偽科學(xué)。所以千萬不要掉以輕心!生活從來就是一道隨時出現(xiàn)的思考題。
參考資料
1. Booth C (2005). "The rod of Aesculapios: John Haygarth (1740-1827) and Perkins' metallic tractors". Journal of medical biography. 13 (3): 155–161
2. Galton, F (1889). Natural Inheritance. London: Macmillan
3. Marcovina SM, Gaur VP, Albers JA (1994). Biological variability of cholesterol, triglyceride, low- and high-density lipoprotein cholesterol, lipoprotein(a), and apolipoproteins A-I and B. Clinical Chemistry. 40:574–78.
4. Franz H. Messerli, M.D. (2012). “Chocolate Consumption, Cognitive Function, and Nobel Laureates” New England Journal of Medicine. 367:1562-1564endprint