市場溢價、社會過程與統計至上主義◎謝宇、吳曉剛│陳宗延譯

市場溢價、社會過程與統計至上主義◎謝宇吳曉剛│陳宗延譯

Market Premium, Social Process, and Statisticism

原載於American Sociological Review, Vol. 70, No. 5 (Oct., 2005), pp. 865-870

http://www.jstor.org/stable/4145364

 

回應Jann

 

統計是一項強大然而潛在危險的工具。超過20年前,已故的Otis Dudley Duncan (1984:226)告誡過我們關於「統計至上主義(statisticism)」的危險:「計算是做研究的同義詞之想法,統計是科學方法論的完全或充分基礎之天真信念,統計公式是為了評估不同實質理論的相對價值之類而存在之迷信。」Duncan的警告長期被理解為適用於做量化研究的社會學家。然而,他的顧慮也同等地適用於量化研究的讀者,特別適一些仔細的讀者。

在我們早先的作品中(Wu and Xie 2003),我們問的問題是,「市場會獲益(pay off)嗎?」我們的重點在於市場部門中工人的潛在異質性(potential heterogeneity)。使用了工作的歷史資料,我們在市場部門中區別出兩種工人:早鳥(early birds)和後進者(later entrants)。我們關注的是早鳥和後進者聚攏(pooling)的可能性,即使他們作為國家部門的滯留者(stayer)各自有相同的教育收益(education returns),可能會使在市場部門教育收益顯得比在國家部門較高。我們的主要經驗結果,也由Jann所驗證的,顯示後進者而非早鳥,比滯留者有顯著較高的教育收益。

Jann(2005)的評論的要旨是,在區別早鳥與後進者和滯留者的資料中,統計檢定力(statistical power)不足[1]。這點是技術上有效的(valid),儘管只在狹隘的「虛無假設顯著性檢驗(null hypothesis significance testing)」的統計典範中,而那在近數十年來飽受嚴重批判(例如,Cohen 1994)。一個基本問題是任何差異有足夠資料,都一定會變成「統計顯著」。已故的John Tukey (1991:100)對此典範有以下說法:「統計學家典型地詢問錯誤的問題──且樂於以謊言答覆,通常是一個徹底的謊言。他們問『AB的效應是否不同』,而他們樂於回答『不』……[我們知道] 對任何AB而言──在某些小數點的(decimal)地方──AB的效應總是不同」。

    在最後的分析中,我們和Jann不一致之處和統計方法的技術性正確度無關,而是關於統計方法應如何被用於社會學研究。我們是統計方法論不應與指引研究的實質關懷分離之觀點的強烈信仰者。Jann對我們作品的「方法論」批評是方向錯誤的,恰恰因為它狹隘地為方法論的,對實質研究問題和潛在的社會過程都缺乏理解。如後所示,實質研究問題使他對早鳥和後進者之間差異的檢驗成為不相關的。

    公平地說,Jann不應為掉入「統計至上主義」的陷阱而被單獨挑出,因為這類習慣在當今社會學是如此廣佈,以致於經常讓量化研究很不吸引人。Jann的評論顯明了一種對量化社會學者共同的誘惑:倚賴罐頭的(canned)統計檢驗而非實質知識。因此,我們利用這個機會汲取一個對我們所有人的教訓:只有結合對涉及的社會過程的實質理解,統計方法才能導致富有成效的研究。

    在基礎的層次上,吳和謝(Wu and Xie (2003))的研究是描述性的。我們貫穿全文強調這點,藉由警示讀者,當單一群體中的工人事實上是異質時聚合的危險(danger of aggregation)。儘管我們質疑市場化本身(marketization per se)「造成(caused)」教育收益較高的盛行看法,我們從未意圖讓我們的統計分析超過一種描述性的習用。在這類習用中,正式的統計檢定在統計檢定力不足時可以是有信息的。當缺乏強大的統計資訊時,實質知識應該佔優勢。

    在他的評論中,Jann3個群體加以討論──滯留者、早鳥和後進者──彷彿他們是對稱的,就像實驗設計中那樣。這麼做,他借用了通常用於與實驗設計相關的變異數分析(analysis of variance (ANOVA))的多群體比較的語言。然而,因為我們處理的是觀察資料,我們關注的是社會過程產生的組間(between-group)和組內(within-group)異質性。這3組的收益體制(earnings regimes)起因於清楚地不對稱的累積歷史過程(圖1),而因此應該在分析中被如此對待。有如3個實驗條件般對這3組加以比較,是既不恰當又誤導的。

    1呈現了一幅在1996年當代中國生命史與社會變遷(Life Histories and Social Change in Contemporary China)調查中應答者類型的模式流程圖,資料被吳和謝(Wu and Xie (2003))使用。Y軸代表雇用部門(employment sector)(國家vs.市場),而X軸代表歷時。我們做了市場部門是吸收狀態(absorbing state)的方便假設,這樣就不會有從市場部門到國家部門的逆向轉換(reverse transition[2]。在1978年,在中國經濟改革之始,1,197位應答者在國家部門工作。到了1987年,11%轉換到市場部門(d = 1),且被稱為「早鳥」。在剩下的1,068名國家部門中的工人與1878年和1987年間開始進入部門的522名新進者中,16%轉換進入市場部門(d = 2),且被稱為「後進者」[3]。剩下的1,337名應答者被稱為「滯留者」。

吳和謝(2003)文需部分為造成Jann的困惑負責,因為他的再分析是以吳和謝(2003)收入取對數對教育、部門及其交互作用的迴歸為原型。吳和謝(2003)對於教育對部門的差異收益的延伸討論,使教育看起來好像是因果因素(causal factor),而部門是共變量(covariate)。然而,我們真正的研究問題是關於對部門的收入差異,而教育是混淆項(confounder)。讓我們重探一個被Jann引述和強調的段落(Wu and Xie 2003:430)

2個假說的關鍵差異是對早鳥的處置(treatment)。在假說1中,早鳥被歸類在後進者中,因為他們共享了在市場部門之中的共同特徵……在假說2中,早鳥被歸類在滯留者中,因為這兩類工人正接近聚合,相對於被選擇性地徵募進市場部門的後進者。

Jann 假設「被歸類在」一語在此意味「共享相同的教育係數」。這是錯誤的,如吳和謝(Wu and Xie (2003:431))的圖1所示。例如,早鳥和後進者是可能在收入和教育分佈上不同,但是與滯留者有著相同的教育收益,不過將早鳥和後進者歸類在一起仍能讓在市場部門中的工人得到比在國家部門中的滯留者得到較高的教育收益。

[圖1]  中國勞動市場轉換流程圖,1978-1996年(Flow Chart of Labor Market Transitions in China, 1978-1996) [圖請見原文]

 

    讓此探尋推進,讓我們以因果推論語言中明確的反事實(counterfactuals)重新概念化(reconceptualize)實質問題。(Heckman 2005; Holland 1986; Manski 1995; Winship and Morgan 1999)。假設我們對於進入市場部門對在1996年的未來收益的因果效應有興趣。概念上,在此安排中有2個因果問題:(1) 早期轉換的效應為何?(即,d = 1)以及(2) 晚期轉換的效應為何?(即,d = 2)。當然,這兩個問題是內在地不對稱的。第二個問題只對那些沒有經過過早期轉換的工人有意義,而第一個則牽涉到那些經歷早期轉換和那些沒有經歷的人之間的反事實比較,無論後來他們發生甚麼事。借用帶有隨時間變化的(time-varying)處置的因果推論的標記方式(Brand and Xie 2005),讓Ydi標記第i個人的可能收入,若此人在時間d (d=1, 2, ∞)做出轉換,其中d= ∞標記此人到研究結束前並未做出轉換(即,滯留者)。注意對一個做出早期轉換(d=1)的人而言,反事實結果應遵循「前瞻序列期待(forward-looking sequential expectation)」(Brand and Xie 2005)的原則,一種晚期轉換(d=2)和滯留(d=∞)的結合。我們因此定義第一個問題的平均因果效應為 

E(Yd=1)E(Yd>1)E(Yd=1)[E(Yd=2)P2 + E(Yd=∞)(1 – P2)]  (1)

 注意轉換機率為條件的,因此P2 = P(d = 2 I d > 1)

    對第二個問題,比較較為簡單,牽涉到兩個體制特定(regime-specific)的手段:

E(Yd=2)E(Yd>2)E(Yd=2)E(Yd=∞)  (2)

要計算方程式12定義的量是永不可能的,因為我們僅觀察到對每個工人而言的三個可能結果之一。要推論因果性,引入忽略性(ignorability)假設是必要的,這必須被視為暫定的,因為不太可能在現實中有效。忽略性假設主張,所有與轉換相關的系統性差異,可以用一組觀察而得的共變數(X)加以概括(Rosenbaum and Rubin 1984) 

    給定這個假設,預期可以在觀察而得的共變數,包括教育,的基礎上被估計。如方程式12所示,為了因果分析我們需要4個條件預期:E(Yd=1X)E(Yd>1X)是給第一個方程式,而E(Yd=2X)E(Yd>2X)是給第二個方程式。忽略性假設意味
E(Yd=1X)在早鳥中、E(Yd=2X) 在後進者中、以及E(Yd>2X)在滯留者中可被估計。然而,E(Yd>2X),作為兩個條件預期的加權總和,應同時從後進者和滯留者中被估計。給定P2很小(在.16),一個對E(Yd>1X)的粗糙近似值就能從滯留者中被估計(即,給予滯留者完全的權重)。這個近似值是對吳和謝(2003)的分析策略的一種詮釋。因為後進者相對於早鳥去比較,僅構成恰當群體的一小部分,如Jann建議的去直接比較後進者和早鳥的意義就很小。

    為顯明這個重新概念化的效益,我們進行了傾向分數分析(propensity score analyses)。因為篇幅限制,我們在討論中僅呈現最重要的發現。操演的完整的結果在他處報告(Xie and Wu 2005)。借用因果推論文獻的行話(jargon),我們在我們的研究中考慮了兩個「處置」:對市場部門的早期進入,和對市場部門的晚期進入。對第一個處置,「控制」組包含沒有進行早期進入的工人,因此包括滯留者和後進者。對第二個處置,「控制」組僅包含滯留者。傾向分數法讓我們在單一向度上概括所有處置組和控制組之間的差異:接受特定處置的機率。我們接著計算在每個傾向分數階層中對收入的平均處置效應。

   從這個傾向分數分析中有兩個主要發現。第一,晚期轉換的傾向模型不同於早期轉換的,因為做轉換的機制改變了。人力資本和政治資本的度量如教育、黨員資格、年資和幹部鏈結負相關地預測了早期轉型進入市場部門的機率,這模式在晚期轉型中卻遠較不明顯。 

    第二,我們發現晚期轉換的市場進入的處置效應和早期轉換的非常不同。對早期轉換,我們發現在任何傾向分數階層中對收入沒有效果。對晚期轉換,估計的處置效果西對較大,且對4個最低的傾向分數階層皆顯著不同於0。我們將結果呈現於圖2。如果我們將不同的階層在同質性效應的假設下,以一個整體的處置效應歸類在一起,估計是236元人民幣(中國貨幣),標準差54,造成高度顯著的t4.36。然而,同質性處置的假設明顯地被圖2觀察到的向下(downward)趨勢違反了。用階層線性模型(hierarchical linear model),我們發現處置效應的大小強烈地且負相關地依賴於傾向分數,階層排序的一單位變化(即,跨越一個傾向分數階層),與處置效應中94元人民幣的減少相關(一個顯著的關係,其t=-3.6)。亦即,晚期轉換進入市場部門的益處,在那些最不可能做出轉換的人之中最大,且隨做出轉換的傾向遞減。

    對於「市場會獲益嗎?」的問題,這些新結果得不出簡單的答案。我們沒有發現一種對收入的一般市場效應。相對地,這些效應在兩個向度上不同。第一,驗證了吳和謝(2003)較早的結果,我們再次發現沒有早期市場轉換的溢價的證據,而晚期轉換進市場部門則與較高收入相關。更有甚者,我們證明了即使在後進者中,在市場部門工作的益處隨做出轉換的傾向而劇烈減少。因此,我們重分析的概括發現是,市場溢價僅限於否則做出轉換進入市場部門的概率很低的後進者。他們是誰? 

    在所有概率中,這些低傾向的後進者是在國家部門做得特好的工人。成本效益分析顯示,對一個做出從國家部門到市場部門轉換的人,自願進入市場的益處需超過滯留在國家部門的。在國家部門表現良好且不太可能失去他們工作的工人,有保持原狀的良好誘因。對他們,市場部門的吸引力必須充分大於他們在國家部門已經享有的好處的補償。因此,只有那些有著最佳市場機會的人們會真的做出轉換。我們在吳和謝(2003:435)中以圖表強調這些個體,以自願後進者指涉他們。這些結果顯明一種對忽略性假設的典型違反,內生性問題(problem of endogeneity)。個體在預期結果的基礎上選擇他們的「處置」,這在工人之中並同質。這種對社會過程的洞見,永遠不可能在Jann那類的分析中產生。他的批判聚焦於一種在早鳥和後進者間的不恰當比較,是他以實質知識為代價而倚賴沒有提供信息的統計檢定的結果。就其本身而論,Jann的統計操演對於理解吳和謝(2003)報告的、在經驗模式背後的社會過程,貢獻很少。 

 [圖2]  依傾向階層對收入的市場處置效應:後進者vs.滯留者(Market Treatment Effect on Earnings by Propensity Stratum: Later Entrants versus Stayers.) [圖請見原文] 

注意:散佈圖中的數字,為後進者(處置組)和滯留者(控制組)之間收入比較的t值;t < 1.96表示一個傾向分數階層中,處置和控制組之間的收入沒有顯著差異。擬合直線(linear fit)是基於階層線性模型評估(帶有1級模型斜率的2級模型作為迴歸於傾向階層排序的結果);傾向階層排序的效果統計上顯著(t = -3.6)

 

謝宇(Yu Xie)密西根大學社會學統計學Otis Dudley Duncan講座教授;在社會研究所(Institute for Social Research)的人口研究中心(Population Studies Center 和調查研究中心(Survey Research Center)的研究教授;以及在中國研究中心(Center for Chinese Studies)的兼任教職(Faculty Associate)。他的主要興趣是社會階層化、人口學、統計方法、中國研究和科學社會學。他的出版著作包括與Daniel Powers合著的《分類數據分析的統計方法》(Statistical Methods for Categorical Data Analysis(Academic Press 2000),與Kimberlee Shauman合著的《科學界的女性:職涯過程與結果》(Women in Science: Career Processes and Outcomes(Harvard University Press 2003),以及與Kimberly Goyette合著的《美國亞裔的人口統計描述》(A Demographic Portrait of Asian Americans(Russell Sage Foundation and Population Reference Bureau 2004)

吳曉剛(Xiaogang Wu)香港科技大學(Hong Kong University of Science & Technology (HKUST)的社會科學助理教授。他的研究興趣包括社會階層化與流動、勞動市場與經濟社會學,以及組織。他曾於《美國社會學評論》(American Sociological Review)、《社會力》(Social Forces)和《人口學》(Demography)中發表。他目前的研究應用因果模型以檢驗中國的階層化過程和結構性不平等之間的關係。他最近接受一項3年期補助,由香港研究資助局(Research Grants Council of Hong Kong)授與,以研究改革年代中國中教育機會近用的社會不平等。

 

參考文獻

Brand, Jennie E. and Yu Xie. 2005. "Time-Varying Treatments, Time-Varying Effects: Causal Effects in a Longitudinal Setting." Annual Winter/Spring Meeting of Sociological Methodology Section, American Sociological  Association,  April 22, Chapel Hill, NC. Cohen, Jacob. 1994. "The Earth Is Round (p < .05)." The American Psychologist 49:997-1003.

Duncan, Otis  Dudley.  1984.  Notes on Social Measurement, Historical and Critical. New York: Russell Sage Foundation.

Heckman, James J. 2005. "The Scientific Model of Causality." Department of Economics, University of Chicago, Chicago, IL. Unpublished manuscript.

Holland, Paul W. 1986. "Statistics and Causal Inference" (with discussion). Journal ofAmerican Statistical Associatio
n 81:945-70.

Jann, Ben. 2005. "Earnings Returns to Education in Urban China: A Note on Testing Difference among Groups." American Sociological Review 70:860-864.

Manski, Charles. 1995. Identification Problems in the Social Sciences. Boston, MA: Harvard University Press.

Rosenbaum, Paul R. and Donald B. Rubin. 1984. "Reducing Bias in Observational Studies Using Subclassification on the Propensity Score." Journal of American Statistical Association 79:516-24.

Tukey, John W. 1991. "The Philosophy of Multiple Comparisons." Statistical Science 6:100-16.

Winship, Christopher and Stephen L. Morgan. 1999. "The Estimation of Causal Effects  from Observational Data." Annual Review of Sociology 25:659-707.

Wu, Xiaogang and Yu Xie. 2003. "Does the Market Pay Off? Earnings Returns to Education in Urban China." American Sociological Review 68:425-42.

Xie, Yu and Xiaogang Wu. 2005. "Market Premium, Social Process, and Statistical Naivety: Further Evidence on Differential Returns to Education in Urban China." PSC Research Report 05-578, Population Studies Center, University of Michigan, Ann Arbor, Michigan.


[1] 是第一作者向Jann建議,他對吳和謝(2003)文的問題應抽換詞彙為一個統計檢定力不足的問題。

[2] 亦即,我們從圖1排除了少量「市場輸家(market losers)」,因為這個群體大小很小(Wu and Xie 2003)。這個分類我們是基於吳和謝對市場部門的全面措施。

[3] 在此,275名工人,包括82名在吳和謝(2003)原文中於1987年後進入勞動力的的「後進者」從分析中被捨棄。

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google photo

您的留言將使用 Google 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s