據(jù)中國報告大廳了解,數(shù)十年來,有關(guān)政治決策應(yīng)該依靠科學(xué)的要求早已成為老生常談。但是,在從能源到健康再到環(huán)境等諸多領(lǐng)域中,將科學(xué)應(yīng)用于政治決斷的過程依然存在一系列問題。
英國劍橋大學(xué)動物系保護(hù)生物學(xué)教授William J. Sutherland、數(shù)學(xué)科學(xué)中心的David Spiegelhalter,以及澳大利亞墨爾本大學(xué)的Mark Burgman如今提出了應(yīng)該成為公務(wù)員、政治家、政治咨詢顧問和記者教育一部分的20條概念。
“當(dāng)然,其他人也許會有不同的列表。我們認(rèn)為,一旦能夠充分理解這20個概念,社會將向前邁出一大步。”他們在《自然》雜志上撰文指出。
差異和偶發(fā)原因變化?,F(xiàn)實世界的變化難以預(yù)測??茖W(xué)在很大程度上是要尋找究竟是什么引發(fā)了人們看到的模式,為何這個十年比過去更熱以及為何一個地區(qū)的鳥類比其他地區(qū)更多。此類趨勢有許多解釋,因此研究的主要挑戰(zhàn)是梳理出有趣過程的重要方面,例如,氣候變化對鳥類種群的影響。而重要方面往往隱含了其他的許多變化原因,例如農(nóng)業(yè)集約化、入侵物種,以及影響出生和死亡的偶發(fā)事件等。
沒有測量是準(zhǔn)確的。實際上,所有的測量值都存在某些錯誤。如果測量過程被重復(fù),人們可能會記錄到不同的結(jié)果。在某些情況下,測量誤差可能比實際偏差要大。如果你被告知上月的經(jīng)濟(jì)增長了0.13%,那么也有可能實際經(jīng)濟(jì)在收縮。
偏見很普遍。實驗設(shè)計或測量工具可能產(chǎn)生一個給定方向的非典型結(jié)果。例如,在街上、家里或通過網(wǎng)絡(luò)調(diào)查詢問人們的投票行為,涉及的樣本可能是不同的人群,他們會有不同的回答。另外,研究還可能因期望值而出現(xiàn)偏差:參與療法實驗的人可能假設(shè)自己會有不同的經(jīng)歷,因此出現(xiàn)行為偏差。
更大樣本量通常更好。從大量觀察中提取的平均結(jié)果與從少量觀察中獲得的結(jié)果相比通常更具信息量。換言之,當(dāng)我們在積累證據(jù)時,我們的知識量在提高。當(dāng)研究被大量自然變異和測量錯誤環(huán)繞時,這尤為重要。例如,一個藥物試驗的參與者多達(dá)數(shù)萬人時,其結(jié)論的有效性要比僅有數(shù)百人參加的類似實驗更高。
相關(guān)性不蘊含因果聯(lián)系。假設(shè)一個事件引起另一個事件,十分吸引人,但是,相關(guān)性可能純屬巧合,或者可能是由第三個事件引起的兩個事件的共同結(jié)果—— 一個“混合”或“潛伏”變量。例如,生態(tài)學(xué)家曾認(rèn)為有毒藻類會殺死河里的魚,但實際藻類并沒有引起魚的死亡。
回歸意味著能夠誤導(dǎo)。至少在某種程度上,數(shù)據(jù)的極端模式很可能是由偶然或錯誤引起的異常現(xiàn)象。接下來的數(shù)據(jù)可能沒有那么極端。例如,測速相機(jī)被放置在交通事故頻發(fā)地段,但是事故率的減少并不是因為這架相機(jī),無論如何發(fā)生率都可能降低。
數(shù)據(jù)外的推斷都有風(fēng)險。在一個給定范圍內(nèi)發(fā)現(xiàn)的模式未必適用于其他范圍。例如,當(dāng)變化速率比現(xiàn)有物種的進(jìn)化史更快,或極端氣候可能完全是新型的時候,預(yù)測生態(tài)系統(tǒng)對氣候變化的應(yīng)答將非常困難。
注意基礎(chǔ)概率謬誤。用一個不完美的測試來確定一種狀態(tài)的能力,取決于該狀態(tài)發(fā)生的可能性(基準(zhǔn)利率)。例如,一個進(jìn)行血液測試的人,有99%的準(zhǔn)確率患有一種稀有疾病且測驗呈陽性,但是他們也可能不會患這種病。如果10001個人進(jìn)行測試,其中只有1人有病,那個人幾乎可以肯定有一個陽性結(jié)果,但也可以說有100個人(1%)會患病,即使他們沒患病。
對照是重要的。除了特定療法沒有施用外,一個對照組的處理方法與實驗組是完全一樣的。沒有對照組就很難確定一個給定療法是否有效。對照可以幫助研究人員確信沒有混雜變量影響結(jié)果。
隨機(jī)化避免偏見。只要有可能,實驗應(yīng)該隨機(jī)分配個人或團(tuán)體。對照兒童的教育成就時,采用健康計劃的父母與未采取的父母可能會出現(xiàn)偏斜,例如,受教育越好的家庭越傾向于參與該項目。一個精心設(shè)計的項目應(yīng)隨機(jī)選擇接受項目的人。
尋求復(fù)制而非偽重復(fù)。能夠被獨立研究小組重復(fù)的研究結(jié)果可能更可靠。幾個這樣的實驗結(jié)果可能合并成系統(tǒng)回顧和薈萃分析,從而提供該主題的總體觀點,這比任何獨立的研究更具統(tǒng)計功效。
科學(xué)家是人??茖W(xué)家在推動自己的工作方面有既得利益,通常出于身份和進(jìn)一步研究,盡管有時也因為直接的經(jīng)濟(jì)收益。這可能導(dǎo)致有選擇地報告結(jié)果和偶爾夸大其詞。同行評議并不絕對可靠:報紙編輯更喜歡正面結(jié)果和新聞價值。多樣化、事件的獨立信源和復(fù)制更能令人信服。
意義是重大的。用P表示的統(tǒng)計顯著性表示一個結(jié)果發(fā)生的偶然性。P=0.01意味著一個治療的效果發(fā)生的概率是1%,但實際上可能并沒有效果。
從無意義中分離不出影響。統(tǒng)計上的顯著結(jié)果的缺失,并不意味著沒有潛在影響:它意味著沒有發(fā)現(xiàn)影響。一項小型研究可能沒有能力發(fā)現(xiàn)一個真正的區(qū)別。
效應(yīng)量很重要。小規(guī)模應(yīng)答不太可能被發(fā)現(xiàn)。一個重復(fù)多次的研究可能導(dǎo)致具有統(tǒng)計顯著性的結(jié)果,但只是有一個較小的效應(yīng)量。不過,一個效應(yīng)量的影響因素是生物學(xué)、物理學(xué)或社會學(xué)問題,而不是統(tǒng)計學(xué)問題。上世紀(jì)90年代,《流行病學(xué)》期刊要求作者在遞交的手稿中不要使用統(tǒng)計顯著性,因為作者通常會曲解顯著性實驗的意義,從而為公共健康政策提供無效或誤導(dǎo)的建議。
研究相關(guān)性會限制概括。從動物到實驗室試驗再到人類的概括過程存在限制。
感覺影響風(fēng)險感知。概括地講,風(fēng)險可以被認(rèn)為是某段時間里一個事件發(fā)生的可能性,乘以該事件可能出現(xiàn)的結(jié)果。人們的風(fēng)險感知受到許多東西的不成比例的影響,其中包括事件的稀有度、他們認(rèn)為能在多大程度上控制,以及風(fēng)險自發(fā)與否等。例如,美國人將家里擁有手槍的風(fēng)險低估了100倍,卻把住宅附近有核反應(yīng)堆的風(fēng)險擴(kuò)大了10倍。
依賴關(guān)系改變風(fēng)險。計算極端潮汐、暴雨等單個事件的風(fēng)險存在可能性。但是,如果是相互關(guān)聯(lián)的事件(例如風(fēng)暴引起潮汐或大雨阻止工人進(jìn)入某地),那么它們同時發(fā)生的概率比預(yù)想中的高。信用評級機(jī)構(gòu)斷言,次級抵押貸款集團(tuán)有一個非常低的違約風(fēng)險,是2008年信貸市場崩潰的重要因素。
挖掘或遴選數(shù)據(jù)。人們能夠?qū)κ录M(jìn)行安排,以便支持某個觀點。要解釋孕婦食用酸奶和后代出現(xiàn)哮喘兩者之間的關(guān)系,一個是需要了解作者是否著手測驗這個單獨的假設(shè),或者利用巨大數(shù)據(jù)集得出結(jié)論。相比之下,希格斯玻色子的證據(jù)與研究人員多么努力地尋找它有關(guān)。
極端測量可能產(chǎn)生誤導(dǎo)。任何測量(例如給定學(xué)校的效益)將顯示天賦能力(教師能力)差異產(chǎn)生的可變性,加上樣本(孩子),加上偏見和測量誤差(不同學(xué)校的產(chǎn)出結(jié)果可能采用不同的測量方法)。但是,由此產(chǎn)生的變化通常只解釋天生能力的差異,但忽略了其他因素。這變成不確定的陳述描繪一個極端產(chǎn)出(及格率翻倍),或者用平均值比照極端量級(學(xué)校X的及格率是國家平均值的3倍)或范圍(最高或最低的學(xué)校之間的差異為 x倍 )。
更多科學(xué)行業(yè)研究分析,詳見中國報告大廳《科學(xué)行業(yè)報告匯總》。這里匯聚海量專業(yè)資料,深度剖析各行業(yè)發(fā)展態(tài)勢與趨勢,為您的決策提供堅實依據(jù)。
更多詳細(xì)的行業(yè)數(shù)據(jù)盡在【數(shù)據(jù)庫】,涵蓋了宏觀數(shù)據(jù)、產(chǎn)量數(shù)據(jù)、進(jìn)出口數(shù)據(jù)、價格數(shù)據(jù)及上市公司財務(wù)數(shù)據(jù)等各類型數(shù)據(jù)內(nèi)容。
本文來源:報告大廳
本文地址:http://158dcq.cn/info/66421.html