什麼是「抽樣誤差」?為何外國媒體報導的跟老師教的不一樣?
我們想讓你知道的是
華郵、ABC在描述其民調方法時特別強調其抽樣誤差是在「納入設計效應」(including design effects)之後計算所得。什麼是「設計效應」?
美國總統大選進入最後一周時,許多媒體紛紛在搖擺州進行民調,其中佛羅里達是選情極其緊繃的大州。《華盛頓郵報》、《ABC》於10月24日~10月29日在該州民調的結果顯示:在824位可能投票的選民中,川普領先拜登50~48個百分點,因為抽樣誤差為±4.0%,報導結論佛州選情難分難解。
《紐約時報》於10月27日~10月31日在該州民調的結果則顯示:在1451位可能投票的選民中,拜登領先川普47~44個百分點,其抽樣誤差為±3.2%。兩個民調相隔只2~3天,拜登從落後2個百分點轉為領先3個百分點,這領先程度有統計顯著性嗎?(佛州開票96%的結果:川普51.2%,拜登47.8%。)
這裡有兩個相關問題要先解決:
- 第一、樣本數N=1451為何抽樣誤差是±3.2%?這個數字對嗎?一般民調若樣本數在N=1000左右,抽樣誤差不是大約±3%嗎?為何紐時的樣本數高達N=1451,抽樣誤差不是更低反而更高?
- 第二、如果抽樣誤差低於±3%,那拜登在佛州領先川普超過抽樣誤差,便可以說這差距有統計顯著性嗎?
什麼是「抽樣誤差」?
首先解釋第一個問題。所謂「抽樣誤差」(margin of error)指的是當母體比例為π時,重複抽取許多樣本所得樣本比例P的標準差乘以1.96。更詳細地說:當母體比例為π時,重複抽取許多樣本數為N的樣本會得到許多不同的P值,這些P值的分佈稱作P的「抽樣分佈」(sampling distribution)。
根據中央極限定裡,P的抽樣分佈是以π為中心的常態分佈,其變異量是π(1-π)/N。我們若以π為中心取一個區間(π-m, π+m)讓P落在區間內的機率為95%,則代表此區間寬度的m即為95%信心水平之下的抽樣誤差,其公式為:
雖然這個公式可以適用於任何的π值,在沒有特別資訊的情況下,一般以π=0.5來計算MOE。
舉例來說,《聯合報》在2019年12月12日~14日實施了一個民調,它在報導中特別就調查方法報告如下:
「調查於12月12日至14日晚間進行,成功訪問1110位合格選民,另291人拒訪;在95%信心水準下,抽樣誤差正負3.0個百分點以內。採全國住宅及手機雙電話底冊為母體作尾數隨機抽樣,藉由增補市話無法接觸的唯手機族樣本改善傳統市話抽樣缺點,調查結果依廿歲以上性別、年齡及縣市人口結構加權,調查經費來自聯合報社。」
同樣的,《蘋果日報》在報導其於2019年12月27日~29日實施的民調時也提到:
「本次民調由《蘋果新聞網》委託台灣指標公司執行,經費來源是《蘋果新聞網》,調查對象為設籍在全國22縣市且年滿20歲民眾,調查期間為12月27日至29日,採用市內電話抽樣調查,並使用CATI系統進行訪問。市內電話抽樣依縣市採分層比例隨機抽樣法,再以電話號碼後2碼隨機抽出,成功訪問1069位受訪者,在95%信心水準下,抽樣誤差為±3.0%。」
依上述公式分別代入N=1110及N=1069可得MOE=2.94%、3.00%,正是報導所說的「抽樣誤差正負三點零個百分點以內」、「抽樣誤差為±3.0%」。
紐時在佛州的選前最後民調的樣本數N=1451要高出1110甚多,為何它所報告的抽樣誤差反而較大?我們若把N=1451套入上式,不是應該得到MOE=2.57%嗎?為何紐時說是3.2%?
其實不只紐時,華郵、ABC民調的抽樣誤差4.0%也超過了以N=824套入上式所算得的3.41%。為何美國媒體計算民調抽樣誤差與基本統計學教科書所教的算法不一樣?華郵、ABC在描述其民調方法時特別強調其抽樣誤差是在「納入設計效應」(including design effects)之後計算所得。什麼是「設計效應」?
什麼是「設計效應」?
這個問題牽涉到「有效樣本數」(effective sample size)的概念。所謂「有效樣本數」並不是統計分析中除去遺漏值之後的「有效N」(valid N),而是在調整受訪者代表性之後的「加權樣本數」(weighted sample size)。下面我會說明:紐時所報告的抽樣誤差其實是根據「有效樣本數」調整過的抽樣誤差,也就是納入設計效應之後算得的抽樣誤差。
一般民調樣本因為不是使用「簡單隨機抽樣」(simple random sampling)得到的結果,母體中每人被抽到的機率並不一致。因此,樣本中某些族群的代表性並不能反映它們在母體中的代表性。為了讓各族群在樣本中的代表性和母體一致,樣本必須經過加權處理。
上述《聯合報》和《蘋果日報》的報導,便報告了它們民調的抽樣設計和加權的概略步驟。一般民調機構會把加權所使用的權重存為資料中的一個變數,其數值代表樣本中每個受訪者所代表族群的權重。
例如「台灣選舉與民主化研究」2020年民調資料合併檔(TEDS2020)中,便有這樣的一個權值變數w,它的值介於0.295至3.474之間,其變異範圍反映了各族群在原樣本中的代表性,與它們在母體中的代表性差異的程度。
由於加權的關係,原來的樣本數已不能有效反映加權後的樣本數,因此有所謂「有效樣本數」(effective sample size)的概念,有效樣本數的計算方式因加權方式而異,抽樣理論大師Leslie Kish建議了一個粗略的算法:
除非根本沒有加權,否則這個公式一定小於N,也就是加權後的有效樣本數會比原樣本數小。以TEDS2020原樣本數N=2847為例,ESS=2359,也就是加權後的有效樣本數,只有原樣本數的83%。
我們如果以加權後的有效樣本數來計算抽樣誤差,則調整後的抽樣誤差,會比根據原樣本數算出的抽樣誤差還大。這個差異,可以說是因為實際樣本之抽樣設計背離簡單隨機抽樣而造成的結果,我們定義「設計效應」(design effect)為:
由於抽樣誤差之平方與樣本數成反比,上式也可導出:
再以TEDS2020為例,DE=1/0.83=1.21。換算可以得到加權後的抽樣誤差,是原抽樣誤差的1.1倍。
跟據紐時所報告的加權後的抽樣誤差,以及由原樣本數所算出的簡單隨機抽樣之抽樣誤差,我們可以算出佛州民調的設計效應:
這設計效應比TEDS2020要高出很多!這可能是因為TEDS採用分層隨機抽樣面訪,其設計比起新聞媒體採用電話+手機有所不同。有了設計效應的估計值,我們就可以算紐時佛州民調的有效樣本數了:它的ESS=936,只有原樣本數的三分之二。相對而言,華郵、ABC的佛州民調的設計效應是DE=1.37,其有效樣本數是ESS=600.
如果我們以N=936算基於簡單隨機抽樣設計的抽樣誤差,它會恰恰是紐時所報告的3.2%。以N=600來算的話,抽樣誤差就剛好是ABC、華郵所報告的4.0%。
值得注意的是:如果紐時效仿《聯合報》用原樣本數N=1451計算抽樣誤差,這2.57%的誤差值,可能會讓很多讀者誤以為拜登領先川普的3個百分點,已經超過超過抽樣誤差,因而具有統計上的顯著性。紐約時報的分析家沒有這樣做,這是他們的嚴謹之處。
以「有效樣本數」算候選人支持度差距的顯著性
然而選舉用的對比式民調還有第二個問題:一般媒體通常只報告單一比例的抽樣誤差,而對比式民調著重的不是單一比例,而是兩位候選人所獲支持度比例的差距。此差距的抽樣誤差與單一比例的抽樣誤差完全不一樣,它可以達到單一比例抽樣誤差的兩倍或更多。
關於對比式選舉民調的抽樣誤差,我曾寫過一篇文章指出一般媒體在報導時的錯誤解讀,並提出一個計算正確抽樣誤差的公式。這篇文章請見〈對比式選舉民調的錯誤解讀〉
佛州民調結果拜登領先川普47-44。我們現在可以用有效樣本數來算拜登領先差距的抽樣誤差了。我在網上提供了一個速算表,歡迎讀者下載使用。
計算的結果是抽樣誤差高達6.03%:拜登領先的差距其實還在誤差範圍之內。
注意:如果以原樣本數N=1451代入速算表,則抽樣誤差為4.91%,比6.03%要小得多。
後記
台灣的媒體在報導對比式民調的結果時,似乎都像《聯合報》、《蘋果日報》一樣報告以「簡單隨機抽樣」為假設的單一比例抽樣誤差,而未考慮設計效應。這個抽樣誤差本來就太小,再加上對比所產生的問題,可以說是雙重的誤導!
外國媒體的民調報導近年來有進步。除了一般會報告根據設計效應調整過的抽樣誤差以外,有些民調機構也報告了對比式民調抽樣誤差的正確解讀方式。有興趣的讀者可以參考Pew Research Center這篇解釋抽樣誤差的文章:〈5 Key Things to Know about the Margin of Error in Election Polls 〉。
延伸閱讀
責任編輯:朱家儀
核稿編輯:翁世航
Tags:
AI賦能設計起飛,Pinkoi執行長顏君庭以Samsung Galaxy S24旗艦系列拓展國際設計生態圈
我們想讓你知道的是
翻開 Pinkoi 名片背後,一句簡潔的「Design the way you are」映入眼簾,這正是 Pinkoi 共同創辦人暨執行長顏君庭創立公司的初衷:希望每個人都能用好的設計,實踐獨特的自我風格與生活樣貌。近年來, Pinkoi 不僅成功將設計生態圈拓展至國際,也串接 AI 引擎服務,成功以科技力搶攻消費者心佔率,讓跨境銷售零距離。
擁抱科技力,Pinkoi自建AI模型 極致個人化體驗
2011年發跡於台灣的Pinkoi,產品聚焦於生活風格及設計相關,如今已是擁有超過625萬名會員的國際電商平台,設計館來自全球77個地區、消費者遍及全球150個國家。為搶攻全球文化創意產業商機,去年底, Pinkoi搭上AI科技浪潮, 正式推出「生活風格智慧模型」,以大規模個人化為主要場景,打造個人化商城,讓設計師得以更有效率的行銷商品。
「自建AI模型,就是為了打造獨特的個人化體驗。」出身美國矽谷科技業的顏君庭,談起自家創建的AI服務,眼神閃爍著光芒。他指出,「 Pinkoi站上以設計品為主力,而設計品常常是各國民眾的興趣、風格、價值主張、地域性文化的延伸,所以相較於一般電商,我們更需要深入經營在地市場,了解設計師與消費者的需求。」
透過自建AI模型,不僅讓Pinkoi業績大幅成長,消費者在平台的瀏覽時間也提升近三成、創造1.5倍的商品點擊率,有效提升品牌黏著度。顏君庭笑稱,日本市場對於 Pinkoi甚至有「沼る」的美譽,盛讚平台商品獨特、令人忍不住著迷而長久駐足。
智慧即時翻譯、筆記智慧助理 跨國商務人士最得力的行動幫手
對新科技趨之若鶩的顏君庭,近期則對三星電子最新推出的智慧型手機深深著迷,它就是首款結合全方位Galaxy AI應用的Samsung Galaxy S24旗艦系列 。
身為跨境電商平台的領導者,顏君庭經常需要走訪世界各地,最近剛結束日本差旅的他,直言Samsung Galaxy S24 Ultra簡直是他的「貼身得力助理」。
「智慧即時翻譯的功能,真的是領先所有同業的最大亮點!」顏君庭表示,不會日文的他,過去在日本如果要打電話訂餐廳、旅館,都需要請朋友或同事幫忙,或是透過其他翻譯軟體來回轉譯,過程十分曲折。
「這次去日本有Samsung Galaxy S24 Ultra,我可以直接按手機通話,開啟翻譯功能,我講英文,對話就會直接翻譯成日文,對方回應日文,也會轉回成英文,等於我們可以直接溝通,這點完全解決過去一直無法被解決的痛點,」顏君庭興奮地說道。
『智慧即時翻譯』與『智慧自動摘要』功能,對時常參與跨國團隊會議的顏君庭,更是省時省力。他指出,雖然團隊主要溝通語言為英文,但有些交流討論常會運用到日文、韓文等多國語言,「如果請一個即時口譯,對公司的營運成本來說非常高,請同事翻譯,頂多也只能簡譯。有了Samsung Galaxy S24旗艦系列,我們可以把對話錄下來,透過 AI 即時翻譯成指定語言的文字,好像大家即時的聊天、參與討論。」
「這對帶領跨國團隊很有幫助,有時用自己的母語討論,更能直接的表達想法,有效增進團隊的情感凝聚力,」顏君庭說。
筆記智慧助理也是日理萬機的顏君庭很喜歡的功能,他表示,每天要閱讀的文件相當多,現在只要輕輕觸碰手機螢幕幾下,就能快速獲得資料的精簡版本,筆記智慧助理還會自動排版、校正拼音,甚至在內文上方生成條列式的摘要,亦可將手寫字轉為文字,自動排版、生成重點摘要,將重要訊息直接佈達給團隊執行,「幫我省下很多時間。」
搜尋圈,一圈即搜:助力Pinkoi團隊精簡工作流程
Samsung Galaxy S24旗艦系列 對於審核Pinkoi平台產品,更是如虎添翼。顏君庭表示, Pinkoi對於產品審核非常嚴格,從設計本身到圖片拍攝,都要求出自設計師原創。因此,每當設計師上架產品,團隊須將圖片投遞到不同的平台,透過「以圖搜圖」的方式,確認有無相似物件。
「現在不用這麼麻煩了,我直接用S Pen觸控筆 圈起Samsung Galaxy S24 Ultra上的圖片,就可以立即搜尋,」他笑著說:「剛開始拿到S Pen 還有點納悶,因為使用經驗停留在過去,但實際使用才發現,意外的好用!」
顏君庭表示, Pinkoi站上商品多達110萬項,內部會議討論時,有時沒辦法很精確的說出品牌或風格,透過Samsung Galaxy S24旗艦系列「搜尋圈」一圈即搜的功能,就可以很快速找到商品的細節,或類似的品項,讓團隊得以更快速聚焦討論。
極致攝影 超強續航力 捕捉靈感不斷電
創業這10餘年來,顏君庭還是保有實地探訪台灣、各地市集的習慣,他也喜歡以手機拍攝,紀錄新發現的品牌或設計概念。「 Samsung Galaxy S24 Ultra拍照的內建相機非常厲害,白天晚上都不需要用到濾鏡,」顏君庭也分享智慧相片編輯 的妙用,他指出,差旅移動中隨手拍照,常常會拍到不想要的物品或背景,這時只要用 Samsung Galaxy S24旗艦系列內建的生成式相片編輯功能,輕鬆選取物件,即可移動或擦除,AI還會自動填充背景,「完全不用擔心照片拍得不好。」
此外,顏君庭也分享長途差旅的重要需求,他表示,由於海外出差行程滿檔,經常是清晨六點到深夜的行程,旅途中還需要拍照紀錄、開線上會議、收發即時通訊等,常因爲忘記帶手機充電線,需要跟店家開口要求幫忙充電,「 Samsung Galaxy S24的高續航力也解決這個痛點,一整天高度使用竟然都還有電,讓我很放心。」
Samsung Galaxy S24的簡潔設計,也讓他印象深刻。「我很喜歡S24超窄邊框的設計,讓整個手機畫面更清晰,不會被邊框干擾。」而深紫色的新色也十分特別,顏君庭分享到,「礦物在華人文化中有特別的寓意,例如這次拿到的深紫色非單調的色塊,而是帶有類似紫水晶的礦物感,也有點帶來事業與生活上的好運,整體設計很時尚,很符合商務人士的需求。」
建立「亞洲設計生態圈」串聯跨界連結設計
顏君庭會依據不同的使用需求變換裝置,例如隨身攜帶的手機,方便解決訊息、拍照、筆記或翻譯等即時需求,有較完整的工作時間時,則可用畫面較大的Samsung Tab S9平板接續處理。利用「快速分享」功能,跨裝置傳遞檔案,相互串聯。
「『智慧生態圈』(Samsung Galaxy Ecosystem )串連的模式,我認為很符合商務上的使用習慣,手機用來快速紀錄靈感、平板 進一步編輯;跨裝置的傳送省去了等待,又可以發揮每個裝置的優勢,讓我充分利用時間,」顏君庭說。
面對日益競爭的市場,顏君庭以三星電子的智慧生態圈裝置策略巧妙比喻, Pinkoi將持續致力建造「亞洲設計生態圈」,未來兩年亦將更專注在跨境市場銷售,聚焦協助台灣設計師共同推展至日本市場。
如同Samsung Galaxy S24旗艦系列運用A科技力作為解方,解決消費者的痛點,顏君庭也將帶領Pinkoi ,強化AI運用,將更美好的生活與使用體驗,傳遞給更多消費者。
了解更多:https://pse.is/5wumgr
本文章內容由「Samsung」提供