第十三 統(tǒng)計案例
高考導(dǎo)航
考試要求重難點擊命題展望
1.理解隨機抽樣的必要性和重要性,會用簡單隨機抽樣方法從總體中抽取樣本,了解分層抽樣和系統(tǒng)抽樣方法.
2.了解分布的意義和作用,會列頻率分布表,會畫頻率分布直方圖、莖葉圖,理解它們各自的特點,理解樣本數(shù)據(jù)標(biāo)準(zhǔn)差的意義和作用,會計算數(shù)據(jù)標(biāo)準(zhǔn)差,能從樣本數(shù)據(jù)中提取基本的數(shù)字特征(如平均數(shù)、標(biāo)準(zhǔn)差),并作出合理的解釋,會用樣本的頻率分布估計總體分布,會用樣本的基本數(shù)字特征估計總體的基本數(shù)字特征,理解用樣本估計總體的思想,會用隨機抽樣的基本方法和樣本估計總體 的思想解決一些簡單的實際問題.
3.會作兩個有關(guān)聯(lián)變量的散點圖,會利用散點圖認(rèn)識變量間的相關(guān)關(guān)系,了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程,了解回歸的基本思想、方法及其簡單應(yīng)用.
4.了解獨立性檢驗(只要求2×2列聯(lián)表)的基本思想、方法及其簡單應(yīng)用. 本重點:1.三種抽樣方法的區(qū)別、聯(lián)系及操作步驟.2.樣本頻率分布直方圖和莖葉圖.3.用樣本估計總體的思想.
本難點:回歸直線方程與獨立性檢驗. 統(tǒng)計多數(shù)以選擇題和填空題形式考查,大題只在個別省的考題中出現(xiàn)過.難度屬于基礎(chǔ) 題和中檔題.考點往往集中體現(xiàn)在抽樣方法、頻率分布圖表這兩個方面.另外,應(yīng)注意統(tǒng)計題反映出的綜合性與應(yīng)用性,如與數(shù)列、概率等的綜合,用統(tǒng)計方法提供決策、制定方案等,以此考查學(xué)生搜集處理信息及分析解決問題的能力.
知識網(wǎng)絡(luò)
13.1 抽樣方法與用樣本估計總體
典例精析
題型一 抽樣方法
【例1】某校有教師200人,男學(xué)生1 200人,女學(xué)生1 000人,用分層抽樣的方法從所有師生中抽取一個容量為n的樣本,已知女學(xué)生抽取的人數(shù)為80人,則n的值為 .
【解析】根據(jù)分層抽樣的意義,
n200+1 200+1 000=801 000,解得n=192.
【點撥】現(xiàn)實中正確的分層抽樣一般有三個步驟:首先,辨明突出的統(tǒng)計特征和分類.其次,確定每個分層在總體上的比例.利用這個比例,可計算出樣本中每組(層)應(yīng)抽取的人數(shù).最后,必須從每層中抽取獨立簡單隨機樣本.
【變式訓(xùn)練1】從某廠生產(chǎn)的802輛轎車中隨機抽取80輛測試某項性能.請合理選擇抽樣方法進(jìn)行抽樣,并寫出抽樣過程.
【解析】第一步,將802輛轎車用隨機方式編號.
第二步,從總體中剔除2輛(剔除方法可用隨機數(shù)表法),將剩余的800輛轎車重新編號(分別為001,002,003,…,800),并分成80段.
第三步,在第一段001,002,…,010這十個編號中用簡單隨機抽樣抽出一個(如005)作為起始號碼.
第四步,將編號為005,015,025,…,795的個體抽出,組成樣本.
題型二 頻率分布直方圖
【例2】(2 010湖南)如圖是某城市通過抽樣得到的居民某年的月均用水量(單位:噸)的頻率分布直方圖.
(1)求直方圖中x的值;
(2)若將頻率視為概率,從這個城市隨機抽取3位居民(看作有放回的抽樣),求月均用水量在3至4噸的居民數(shù)X的分布列和數(shù)學(xué)期望.
【解析】(1)依題意及頻率分布直方圖知0 .02+0.1+x+0.37+0.39=1,解得x=0.12.
(2)由題意知X~B(3,0.1),因此
P(X=0)=C03×0.93=0.729,
P(X=1)=C13×0.1×0.92=0.243,
P(X=2)=C23×0.12×0.9 =0.027,
P(X=3)=C33×0.13=0.001,
故隨機變量X的分布列為
X0123
P0.7290.2430.027 0. 001
X的數(shù)學(xué)期望為E(X)=3×0.1=0.3.
(或E(X)=1×0.243+2×0.027+3×0.001=0.3)
【點撥】從頻率分布直方圖讀取數(shù)據(jù)時,要特別重視組距,縱坐標(biāo)是頻率除以組距,故長方形的面積之和為1.
【變式訓(xùn)練2】如圖是容量為100的樣本的頻率分布直方圖,試根據(jù)數(shù)據(jù)填空:
(1)樣本數(shù)據(jù)落在[10,14)內(nèi)的頻數(shù)為 ;
(2)樣本數(shù)據(jù)落在[6,10)內(nèi)的頻率為 ;
(3)總體落在[2,6)內(nèi)的頻率為 .
【解析】(1)樣本落在[10,14)內(nèi)的頻數(shù)為0.09×4×100=36.
(2)樣本落在[6,10)內(nèi)的頻率為0.08×4=0.32.
(3)樣本落在[2,6)內(nèi)的頻率為0.02×4=0.08,所以總體落在[2,6)內(nèi)的頻率約為0.08.
題型三 平均數(shù)、方差的計算
【例3】甲、乙兩人在相同條下各射靶10次,每次命中環(huán)數(shù)如下:
甲 4 7 10 9 5 6 8 6 8 8
乙 7 8 6 8 6 7 8 7 5 9
試 問誰10次射靶的情況較穩(wěn)定?
【解析】本題要計算兩樣本的方差,當(dāng)樣本平均數(shù)不是整數(shù),且樣本數(shù)據(jù)不大時,可用簡化公式計算方差.
=110(4+7+…+8)=7.1,
=110(7+8+…+9)=7.1,
s2甲=110(42+72+…+82-10×7.12)=3.09,
s2乙=110(72+82+…+92-10×7.12)=1.29,
因為s2甲>s2乙,所以乙10次射靶比甲10次射靶情況穩(wěn)定.
【點撥】平均數(shù)反映了數(shù)據(jù)取值的平均水平;標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動的大小,標(biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度就越大,越不穩(wěn)定;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定.
【變式訓(xùn)練3】(2010北京市東城區(qū))在一次數(shù)學(xué)統(tǒng)考后,某班隨機抽取10名同學(xué)的成績進(jìn)行樣本分析,獲得成績數(shù)據(jù)的莖葉圖如右圖.
(1)計算此樣本的平均成績及方差;
(2)現(xiàn)從此樣本中隨機抽出2名學(xué)生的成績,設(shè)抽出分?jǐn)?shù)為90分以上的人數(shù)為X,求隨機變量X的分布列和均值.
【解析】(1)樣本的平均成績 =80;
方差為s2=110[(92-80)2+(98-80)2+(98-80)2+(85-80)2+(85-80)2+(74-80)2+(74-80)2+(74-80)2 +(60-80)2+(60-80)2]=175.
(2)由題意,隨機變量X=0,1,2.
P(X=0)=C27C210=715,P(X=1)=C13C17C210=715,P(X=2)=115.
隨機變量X的分布列為
X012
P
E(X)=0×715+1×715+2×115=35.
總結(jié)提高
1.統(tǒng)計的基本思想是用樣本估計總體.這就 要求樣本具有很好的代表性,而樣本良好客觀的代表性,則完全依賴抽樣方法.
2.三種抽樣方法中簡單隨機抽樣是最基本的抽樣方法,是其他兩種方法的基礎(chǔ),它們的共同點都是等概率抽樣.適用范圍不同,要根據(jù)總體的具體情況 選用不同的方法.
3.對于總體分布,總是用樣本的頻率分布對它進(jìn)行估計.
4.用樣本估計總體,一般分成以下幾個步驟:
先求樣本數(shù)據(jù)中的最大值和最小值(稱為極值),再確定合適的組數(shù)和組距,確定分點(每個分點只屬于一組,故一般采用半開半閉區(qū)間),然后列出頻率分布表(準(zhǔn)確,查數(shù)據(jù)容易),畫頻率 分布直方圖.
13.2 兩變量間的相關(guān)性、回歸分析和獨立性檢驗
典例精析
題型一 求回歸直線方程
【例1】下表是關(guān)于某設(shè)備的使用年限(年)和所需要的維修費用(萬元)的幾組統(tǒng)計數(shù)據(jù):
x23456
y2.23.85.56.57.0
(1)若y對x呈線性相關(guān)關(guān)系,求出y關(guān)于x的線性回歸方程y= x+ ;
(2)估計使用年限為10年時,維修費用為多少?
【解析】(1)因為 xiyi=112.3, x2i=4+9+16+25+36=90,且 =4, =5,n=5,
所以 =112.3-5×4×590-5×16=12.310=1.23, =5-1.23×4=0.08,
所以回歸直線方程為y=1.23x+0.08.
(2)當(dāng)x=10時,y=1.23×10+0.08=12.38,
所以估計當(dāng)使用10年時,維修費用約為12.38萬元.
【點撥】當(dāng)x與y呈線性相關(guān)關(guān)系時,可直接求出回歸直線方程,再利用回歸直線方程進(jìn)行計算和預(yù)測.
【變式訓(xùn)練1】某工廠經(jīng)過技術(shù)改造后,生產(chǎn)某種產(chǎn)品的產(chǎn)量(噸)與相應(yīng)的生產(chǎn)能耗(噸標(biāo)準(zhǔn)煤)有如下幾組樣本數(shù)據(jù).
x3456
y2.5344.5
據(jù)相關(guān)性檢驗,y與x具有線性相關(guān)關(guān)系,通過線性回歸分析,求得回歸直線的斜率為0.7,那么y關(guān)于x的回歸直線方程是 .
【解析】先求得 =4.5, =3.5,由 =0.7x+a過點( , ),則a=0.35,所以回歸直線方程是 =0.7x+0.35.
題型二 獨立性檢驗
【例2】研究小麥種子經(jīng)滅菌與否跟發(fā)生黑穗病的關(guān)系,經(jīng)試驗觀察,得到數(shù)據(jù)如下表所示:
種子滅菌種子未滅菌 合計
黑穗病26184210
無黑穗病50200250
合計76384460
試按照原試驗?zāi)康淖鹘y(tǒng)計分析推斷.
【解析】由列聯(lián)表得:
a=26,b=1 84,c=50,d=200,a+b=210,c+d=250,a+c=76,b+d=384,n=460.
所以2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=460×(26×200-184×50)2210×250×76×384≈4.804,
由于2≈4.804>3.841,
所以有95%的把握認(rèn)為種子滅菌與否與小麥發(fā)生黑穗病是有關(guān)系的.
【變式訓(xùn)練2】(2010東北三 省三校模擬)某 研究小組為了研究中學(xué)生的身體發(fā)育情況,在某學(xué)校隨機抽出20名15至16周歲的男生,將他們的身高和體重制成2×2的列聯(lián)表,根據(jù)列聯(lián)表的數(shù)據(jù),可以有 %的把握認(rèn)為該學(xué)校15至16周歲的男生的身高和體重之間有關(guān)系.
超重不超重合計
偏高 415
不偏高312 15
合計71320
附:獨立性檢驗臨界值表
P(2≥k0)0.0250.0100.0050.001
k0 5.0246.6357.87910.828
(獨立性檢驗隨機變量2值的計算公式:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d))
【解析】由表可得a+b=5,c+d=1 5,a+c=7,b+d=13,ad=48,bc=3,n=20,運用獨立性檢驗隨機變量2值的計算公式得2=20×(48-3)25×15×7×13=54091≈5.934,
由于2≈5.934>5.024,所以有97.5%的把握認(rèn)為該學(xué)校15至16周歲的男生的身高和體重之間有關(guān)系.
總結(jié)提高
1.在研究兩個變量之間是否存在某種關(guān)系時,必須從散點圖入手.
2.樣本的隨機性導(dǎo)致由線性回歸方程所作出的預(yù)報也具有隨機性.
本文來自:逍遙右腦記憶 http://m.yy-art.cn/gaosan/37904.html
相關(guān)閱讀:第十二章立體幾何(高中數(shù)學(xué)競賽標(biāo)準(zhǔn)教材)