?

理清概念關鍵點 讓錯誤不再重演
——辨析二項分布與超幾何分布

2021-09-07 08:03甘肅省天水市清水縣第六中學741400何少杰
中學數學研究(廣東) 2021年15期
關鍵詞:二項分布次品概率

甘肅省天水市清水縣第六中學(741400) 何少杰

在人教A 版數學選修2-3 中學生分別學習了超幾何分布和二項分布兩節內容,由于近年筆者在所在學校連續擔任高三復讀班數學教學工作,在接連幾年的??奸喚磉^程中發現,對超幾何分布和二項分布發生混用的現象普遍存在.盡管是不同屆的學生,卻在同一類問題中栽了跟頭,這不由得引發了我的反思: 如何消除學生心中的疑惑,避免在這一類問題上重蹈覆轍,讓錯誤不再重演! 為此我翻閱了不同教材中對兩種分布的定義,查閱了相關資料,對兩種分布的區別與聯系進行了整理,并對為何錯解中的結果正確進行了說明.

一、題目、錯解與問題

題目1某精準扶貧幫扶單位, 為幫助定點扶貧村真正脫貧, 堅持扶貧與扶智相結合, 幫助精準扶貧戶利用互聯網電商渠道銷售當地特產蘋果.蘋果單果直徑不同單價不同,為了更好的銷售, 現從該精準扶貧戶種植的蘋果樹上隨機摘下50個蘋果測量其直徑,經統計,其單果直徑分布在區間內(單位mm),統計的莖葉圖如圖所示:

(Ⅰ)從單果直徑落在[72,80)的蘋果中隨機抽取3 個,求這3 個蘋果單果直徑均小于76mm 的概率;

(Ⅱ)以此莖葉圖中單果直徑出現的頻率代表概率.直徑位于[65,90)內的蘋果稱為優質蘋果,對于該精準扶貧戶的這批蘋果,某電商提出兩種收購方案:

方案A:所有蘋果均以5 元/千克收購;

方案B:從這批蘋果中隨機抽取3 個蘋果,若都是優質蘋果,則按6 元/千克收購; 若有1 個非優質蘋果,則按5 元/千克收購;若有2 個非優質蘋果,則按4.5 元/千克收購;若有3個非優質蘋果,則按4 元/千克收購.

請你通過計算為該精準扶貧戶推薦收益最好的方案.

題目2新冠疫情期間,停課不停學,各學校組織上網課的同時為了解學生的課外學習時間,教育局從某所學校高二年級1000 名學生中隨機抽取了100 名學生,調查了一周的課外學習時間X.其中X ~N(9,1.32).

(Ⅰ)估計本周該高二年級學生課外學習時間在10.3 小時以上的人數(保留整數);

(Ⅱ)從本校高二年級學生中隨機抽取5 人,求恰有3 人的課外學習時間超過10.3 小時的概率(結果保留兩位小數).

??奸喚碇邪l現不少學生在兩道題的第(Ⅱ)問出現了下面的錯解:

題目1(Ⅱ)的錯解方案B 中,50 個蘋果中有40 個優質蘋果,記Y為隨機抽取的3 個蘋果中優質蘋果的個數,隨機變量Y的取值為0,1,2,3.則

方案A 中5 元/千克收購價相當于B 方案中隨機抽取3個蘋果有2 個優質蘋果.因為EY=所以通過比較可知方案B 收益更好.

題目2 (Ⅱ)的錯解由(Ⅰ)知在高二年級1000 名學生中, 課外學習時間在10.3 小時以上159 人, 不超過10.3小時共841 人, 記Y為隨機抽取的5 人中課外學習時間在10.3 小時以上的人數, 則Y服從超幾何分布, 所以P(Y=3)=

為了分析錯解,我們再給出兩問的正解.

題目1(Ⅱ)的正確解法方案B 中,由題意以此莖葉圖中單果直徑出現的頻率代表概率,從這批蘋果中隨機抽取1 個蘋果,取出優質蘋果的概率為記Y為隨機抽取3 個蘋果中優質蘋果的個數,則Y ~B(3,因此,得到

方案A 中5 元/千克收購價相當于B 方案中隨機抽取3個蘋果有2 個優質蘋果.因為EY=所以通過比較可知方案B 收益會更好.

題目2(Ⅱ)的正確解法由(Ⅰ)知在高二年級1000 名學生中,任取1 人,學習時間超過10.3 小時的概率為0.1587,記Y為隨機抽取的5 人中課外學習時間在10.3 小時以上的人數,則Y ~B(5,0.1587),所以P(Y=3)=C35·(0.1587)3·(1-0.1587)2≈0.03.

??家院笪覍@兩道題為何學生會出現誤判兩種分布的情況進行了考查, 發現他們主要出現了下面的幾個問題:(1)第1 題中對“從這批蘋果中隨機抽取3 個蘋果”理解出現偏差,錯解中一部分學生把“這批蘋果”錯誤的理解為隨機摘下的50 個蘋果,屬于審題不嚴造成的錯解.(2)兩道題中一部分學生看到“抽取”二字,不分青紅皂白馬上肯定地認為考查的是超幾何分布,造成錯解.(3)有一部分學生考慮到了抽取的方式是無放回抽取,符合超幾何分布的抽樣模型,所以他認為一定是超幾何分布,而沒有考慮到盡管都是無放回抽樣,但總體數目都很大,抽取少量樣本時可以認為每一次抽樣中條件都未發生改變,是典型的二項分布,屬于對兩種分布的概念不清造成的錯解.那么這兩種分布的本質區別是什么? 為何它們的數學期望一致呢? 如何在解題時避免誤判呢?

二、剖析兩種分布的不同點與相同點,關注概念本質區別與聯系

1.概念不同

超幾何分布 一般地, 在含有M(M≤N)件次品的N件產品中, 任取n(n≤N)件產品, 離散型隨機變量X表示這n件產品中的次品數, 則事件{X=k}發生的概率P(X=k)=, (k= 0,1,2,··· ,m), 其中m= mⅰn{M,n}且n≤N,M≤N,n,M,N ∈N*,于是隨機變量X的分布列具有表1 的形式,則稱隨機變量X服從參數為n,M,N的超幾何分布,記作X ~H(n,M,N).

表1

二項分布 一般地, 若一次試驗只有兩個可能的結果A或, 事件A發生的概率為p, 事件發生的概率為q=1-p,在n次獨立重復試驗中,離散型隨機變量X表示這n次獨立重復試驗中事件A出現的次數,則事件{X=k}發生的概率P(X=k)=,其中k=0,1,2,··· ,n,0<p <1,于是隨機變量X的分布列具有表2 的形式,則稱隨機變量X服從參數為n,p的二項分布,記作X ~B(n,p)

表2

2.隨機試驗的條件不同

超幾何分布在試驗過程中必須給定總體數,而且總體必須由數目明確的“正品”與“次品”兩類構成.

二項分布進行的試驗無需知道總體數.

3.隨機試驗類型與特點不同

超幾何分布進行的隨機試驗是在含有M(M≤N)件次品的N件產品中,任取n(n≤N)件產品,它包含了n次試驗,是滿足古典概型的隨機試驗,即每個基本事件發生的可能性都相等,基本事件的總數是有限的.這n次試驗中第一次是從N件產品中任取1 件,第二次從N -1 件產品中任取1 件,……,因此每一次試驗都會相互影響,不是獨立重復試驗.

二項分布進行的隨機試驗是在同一條件下進行的n次獨立重復試驗.

4.隨機試驗的模型與結果不同

超幾何分布進行的隨機試驗是無放回抽樣模型,每一次試驗的結果數較多,比如在有3 件次品的10 件產品中任取1件產品,不同的結果有種.

二項分布進行的隨機試驗是重復試驗,所以每次抽取條件不變,可以理解為有放回抽樣模型.而且每一次試驗只有兩個對立的結果A或,稱為伯努利試驗.

5.隨機變量X表示的事件不同

超幾何分布中離散型隨機變量X表示抽取出的這n件產品中的次品數.所以事件{X=k}表示抽取的n件產品中有k件次品,n-k件正品.

二項分布中離散型隨機變量X表示這n次獨立重復試驗中事件A出現的次數,即成功次數.所以事件{X=k}表示n次獨立重復試驗中事件A出現了k次,事件出現了n-k次.

6.隨機變量X表示的事件概率計算公式不同

超幾何分布進行的隨機試驗是滿足古典概型的隨機試驗,所以事件{X=k}發生的概率P(X=k)=其中k=0,1,2,··· ,m,m=mⅰn{M,n}.

二項分布中進行的是獨立重復試驗, 滿足獨立事件的概率乘法公式, 所以事件{X=k}發生的概率P(X=k)=(1-p)n-k,其中k=0,1,2,··· ,n.

7.隨機變量X的概率計算條件不同

超幾何分布概率計算會在題設中給出抽樣個數n、總體數N,會給出或可求出總體中兩類產品中的“次品”數M.

二項分布概率計算會在題設中暗示給出或者可求出成功概率p.

8.隨機變量X的數學期望公式不同

(1)若X ~H(n,M,N),則EX=

證明由

則EX=為從含有M件次品的N件產品中取出一件次品以后, 抽取n -1 件產品的不同取法種數, 故所以,證畢.

(2)若X ~B(n,p),則EX=np.

證明同①有則

所以EX=np,證畢.

因為在n次獨立重復試驗中A事件發生的概率為p,所以可以理解為一次隨機試驗中A事件平均發生p次,則在n次獨立重復試驗中A事件平均發生np次.

9.兩種分布的相同點

(1)兩者都是離散型隨機變量分布,且隨機變量都只能取非負整數值.

(2)錯解與正解中兩者的數學期望會相等.正因為如此,在抽樣問題中出現答案貌似“正確”, 但卻是錯解的現象以后,有些同學甚至很堅定地認為自己的錯解是正確的.究其原因是在題目中取到“次品”概率p=所以錯誤的解法也會得到正確的期望值.

10.兩種分布之間的聯系

當總體數N較小時,無放回抽樣中按照超幾何分布計算的概率與有放回抽樣中按照二項分布計算的概率差異比較明顯,當總體數N不斷變大時兩種分布計算的概率逐漸接近,當總體數N無限或很大時,此時無放回抽取少量樣品對次品率的影響很微小,次品率p此時是一個穩定值,兩種分布計算的概率相等,即

證明因為

又n,k是常數,則

因此判斷兩種分布時, 不能機械地以抽樣方法來判定,對于總體數N很大的這種抽取,盡管是無放回抽樣,但超幾何分布已經近似為二項分布了,我們都把它看成是n次獨立重復試驗,按照二項分布來解題.

三、如何避免發生兩種分布的誤判

要避免發生兩種分布的誤判,除了需要在知識方面強化對兩種分布概念的理解與辨析,理清概念的本質區別,提高對兩種分布的辨識力之外,筆者發現學生還普遍存在審題不嚴的問題,由于概率統計題目包含文字較多,加之部分題目中條件可能會以圖表的形式給出,在緊張的考試過程中,他們就更加難以從繁冗的已知條件中找準關鍵字句提取重要信息,往往憑借并不完善的經驗選取概率模型解題,但基于兩種分布在一定的條件下可以相互轉化的特點,學生在解題時極易發生兩種分布的誤判,所以為了避免發生誤判還需培養良好的審題習慣,找準題目中的關鍵字句進行分析,跳出題目設置的“陷阱”,走出認識誤區.那么為了讓錯誤不再重演,如何審題才能避免發生兩種分布的誤判? 通過以上對兩種分布的概念解讀,不難發現在判斷兩種分布時需要做到以下五“看”:

(1)看總體數是否給出,未給出或若給出總體數較大一般考查二項分布.

(2)看一次抽取抽中“次品”概率是否給出,若給出或可求出一般考查二項分布.

(3)看一次抽取的結果是否只有兩個結果,若只有兩個對立的結果A或,一般考查二項分布.

(4)看抽樣方法,如果是有放回抽樣,一定是二項分布;若是無放回抽樣,需要考慮總體數再確定.

(5)看每一次抽樣試驗中,事件是否獨立,事件發生概率是否不變,若事件獨立且概率不變,一定考查二項分布,這也是判斷二項分布的最根本依據.

四、總結與建議

概率統計本身是一部分既難教又難學的知識,其中不乏一些似是而非又違背直觀感覺的易混內容,就高中階段學生的認知水平而言更加難以駕馭.而教材作為眾多專家智慧的結晶,是廣大教師與學生的第一手資料,其中的案例都是經過仔細挑選,反復錘煉過的經典案例,這些案例都承載著很強的教育功能,很多高考題目源于教材中的經典案例,這就要求教師在教學中從教材出發,緊扣概念,深入鉆研教材中的經典案例,把握好不同知識之間的內在聯系與本質區別.

對于高中教材中出現的容易混淆的基本概念: 隨機性、確定性;頻率、概率;穩定于、趨近于;古典概型、幾何概型;互斥事件、獨立事件等,作為新增教學內容,初學概率統計時非常容易將新概念聯系到自己的生活經驗中,往往這些概念在生活中的定義與數學定義不完全一致,會有一定的偏差,從而產生認識誤區,所以教學時應該結合具體實例對學生的認知加以引導,對錯誤的認知加以矯正,通過具體實例加深對概念的理解,最終走出誤區,徹底吃透概念.事實上,概念教學應該是數學教學的重中之重, 概率統計的教學也不例外,因為數學概念是數學思維形成的起點,對數學概念的理解與運用是數學思維能力得以發展的核心.

對于高中教材中出現的三種離散型隨機變量服從的分布: 兩點分布、二項分布、超幾何分布,最關鍵的是要讓學生正確區分其對應的隨機試驗模型,理清概念的關鍵點,讓他們意識到這三種分布的聯系.當獨立重復試驗中的試驗次數n=1 時,二項分布就會化為兩點分布,超幾何分布的極限分布是二項分布;對于概率模型的正確選擇,可以嘗試分類集中訓練,讓學生通過具體的問題情境感知到它們之間的區別與聯系,在教師的指導下逐漸有所感悟.

對于高中教材中出現的連續型隨機變量分布——正態分布,可以在教學時指出當二項分布中成功概率p= 0.5 時,二項分布的分布圖是對稱的,這種情況下當n逐漸增大時,二項分布從分布圖可以看到會越來越接近于正態分布,也就是說二項分布的極限分布是正態分布,了解這些知識不僅可以讓他們更清楚地認識概念的源與流,從而提高對幾種分布的辨識能力,避免發生模型混用的錯誤,而且還能為以后學生的進一步學習奠定良好的基礎.

猜你喜歡
二項分布次品概率
怎 樣 找 次 品
二項分布與超幾何分布的區別與聯系
“找次品”方法背后的道理
找次品
概率與統計(一)
概率與統計(二)
找次品
深度剖析超幾何分布和二項分布
概率與統計(1)——二項分布與超幾何分布
概率與統計(1)
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合