您好,欢迎来到刀刀网。
搜索
您的当前位置:首页统计学复习题1要点

统计学复习题1要点

来源:刀刀网
第一章绪论一、填空

1、统计数据按测定层次分,可以分为分类数据如果按时间状况分,可以分为

、顺序数据和数值型数据;

0.35 ,

截面数据和时间序列数据

2、由一组频数2,5,6,7得到的一组频率依次是如果这组频数各增加20%,则所得到的频率3、已知一个闭口等距分组数列最后一组的下限为则最后一组的上限可以确定为

0.1 、0.25 、0.3 和不变

600,其相邻组的组中值为580,

0,其组中值为620 。

0.2,0.25,0.6,0.75,1,观察样本总数为

5

35

15

Q.D

4、如果各组相应的累积频率依次为

100,则各组相应的观察频数为___20 5、中位数Me可反映总体的

25___。可反映总体的

5 。

离散

集中趋势,四分位差

程度,数据组1,2,5,5,6,7,8,9中位数是5.5,众数为6、假如各组变量值都扩大数扩大为原来的2倍。四、计算题

1、某班的经济学成绩如下表所示:43 77 84

55 77 86

56 78 87

56 79 88

59 80 88

60 81

67 82 90

69 83 90

2 倍,而频数都减少为原来的

1/3 ,那么算术平均

73 83 95

75 83 97

(1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数(2)计算该班经济学成绩的众数、四分位差和离散系数。

(3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么?(4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布?(3)上四分位数和下四分位数所在区间?4、对成年组和青少年组共

成年组

按身高分组(cm)

150~155 155~160 160~165 165~170

人数(人) 22 108 95 43

500人身高资料分组,分组资料列表如下:

青少年组

按身高分组(cm)

70~75 75~80 80~85 85~90

人数(人) 26 83 39 28

170以上32 90以上24

合计300 合计200

要求:(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数。

(2)说明成年组和青少年组平均身高的代表性哪个大

6、设甲、乙两单位职工的工资资料如下:

甲单位

月工资(元)600以下600-700 700-800 800-900 900-1000 1000-1100

合计

职工人数(人)

2 4 10 7 6 4 30

月工资(元)600以下600-700 700-800 800-900 900-1000 1000-1100

合计

乙单位

职工人数(人)

1 2 4 12 6 5 30

?为什么?

要求:试比较哪个单位的职工工资差异程度小。

8、一家公司在招收职员时,首先要通过两项能力测试。在分数是

A 项测试中,其平均

100分,标准差是15分;在B项测试中,其平均分数是400分,标准

差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该位应试者哪一项测试更为理想?KEY: 1、(1)77,80.5,68.5,87.25 (2)83,18.75,0.173

(3)中位数,是数据分布明显左偏又是顺序数据。(4)左偏

组中值

身高(cm) 频数fy yf

x

22 152.5 -2 -44 150~155

155~160 108 157.5 -1 -108

95 162.5 0 0 160~165 165~170

170以上合

43 32 300

167.5 172.5

1 2

43 -45

y^2 4 1 0 1 4

(y^2)f 88 108 0 43 128 367

令y

yx

xab

x162.5

5

yffaby

2

45

300

162.55*(

0.15

0.15)

161.75

y

yff

2

367300

y

x

1.223

y

2

标准差:

y

5

2

1.0957

1.0957

5.4

b

y

标准差变异系数:

C

5.4784X

161.75

0.03387

成人组的平均身高为161.75cm,标准差为5.4784cm,标准差系数为0.03387。青少年组身高

频率fy yf y^2 (y^2)f 组中值

(cm) 70~75 26 72.5 -2 -52 4 104 75~80 83 77.5 -1 -83 1 83 80~85 85~90 90以上合计令y

yx

xab

39 28 24 200

x82.55

82.5 87.5 92.5 0 1 2 0 28 48 -59

0 1 4 0 28 96 311

yffaby

2

59200

2

0.295

0.295)

81.025

82.55*(

y

yff

311200

y

x

1.555

y

2

标准差:

y

5

2

1.2116

1.0957

6.

b

y

标准差变异系数:

C

6.058X

81.025

0.074767

成人组的平均身高为81.025cm,标准差为6.058cm,标准差系数为0.074767。(2)成年组平均身高与青少年组平均身高相比,其平均数的代表性大些,因为其标准差系数小。6、解:x甲

xff

2705033

819.70(元);    x乙

2600030

866.67(元)

=138.14(元);          

138.14819.70

16.85%;         

=124.05(元)

V乙=

124.05866.67

14.31%

V甲=

 V甲

一、填空题

V乙,所以乙单位职工工资差异程度小

习题

样本量

2

第二章统计量及其分布

X的方差取决于1、简单随机抽样样本均值

原来的50%,则样本容量需要扩大到原来的

2、设

和总体方差_,要使X的标准差降低到4 倍。

X1,X2,

20.99

,X17是总体N(,4)的样本,S是样本方差,若(17)33.4,

2

20.995

P(S

2

a)0.01,则

a__32。

(注:3、若X4、已知

(17)35.7,

20.99

(16)32.0,

20.995

(16)34.2)

t(5),则X服从_F(1,5)______分布。

F0.95(10,5)4.74,则F0.05(5,10)等于____0.21_______。

样本量。

的增加,不论

5、中心极限定理是说:如果总体存在有限的方差,那么,随着这个总体变量的分布如何,抽样平均数的分布趋近于四、计算题1、从正态总体

正态分布

N(52,6.3)中随机抽取容量为

x的分布;

2

36的样本,要求:

(1)求样本均值

(2)求x落在区间(50.8,53.8)内的概率;(3)若要以99%的概率保证|x

52|2,试问样本量至少应取多少?

这个简答题,我到时候发照片给你们吧!

第三章参数估计习题

一、填空题

1、无偏性、有效性和一致性2、总体X~N(,1

无偏估X1

3

13X1

13X2

2

是对估计量最基本的要求。

),(X1,X2,X3)是来自X的一个容量为3的样本,三个

21X2,X152

1

X23

1X23

13

13X3,X1351

X3计量中,最有效的一个是6

X3。

3、在一批货物中,随机抽出100件发现有16件次品,这批货物次品率的置信水平为95%的置信区间为

(0.088,0.232)。

4、若总体X的一个样本观测值为0,0,1,1,0,1

,则总体均值的矩估计值为

0.5 ,总体方差的矩估计值为 0.25 5、小样本,方差四、计算题

2

未知,总体均值的区间估计为

xt

S

12

n

1、已知某苗圃中树苗高度服从正态分布,今工作人员从苗圃中随机抽取测得苗高并求得其均值

株,

62厘米,标准差为8.2厘米。请确定该苗圃中树苗平均

95%。

8.2

62

2.01

高度的置信区间,置信水平1、解:x

z1

s

/2

n

621.96

该苗圃中树苗平均高度的置信水平为第四章假设检验

95%的置信区间为(59.99,.01)厘米。

填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章)一、

填空

拒真错误

纳伪错误

,单侧检

H0接受

1、在做假设检验时容易犯的两类错误是

2、如果提出的原假设是总体参数等于某一数值,验

3、假设检验有两类错误,分别是是

真实的,却由于样本缘故做出了叫第二类错误,它是指原假设H0的错误。

这种假设检验称为双侧检验

若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为

拒真错误也叫第一类错误,它是指原假设

拒绝

H0是假的, 却由于样本缘故做出

H0的错误;和纳伪错误

4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值显著性水平的,该原理称为

。小概率原理。

α,则α称为

5、假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生

6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm,标准差为1.6cm,想知道这批零件的直径是否服从标准直径

5cm,在显著性水平α下,否定域为

下面有答案

7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为H0:t≥1000 H1:t<1000(用H0,H1表示)8、一般在样本的容量被确定后,犯第一类错误的概率为

,犯第二类错误的概

率为,若减少,则增大

20

9、某厂家想要调查职工的工作效率,工厂预计的工作效率为至少制作零件的要求下,问该工厂的职工的工作效率

6、1.25>z

12

个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05

(有,没有)达到该标准。

二、计算

1、下面是某个随机选取20只部件的装配时间(单位:分)

9.8 10.4 10.6 9.6 9.7 9.9 10.9 11.1 9.6 10.2 10.39.6 9.9 11.2 10.6 9.8 10.5 10.1 10.5 9.7 设装配时间的总体服从正态分布,参数均未知(=0.05),可否认为装配时间的均值为10?

2、某厂家声称其产出的原件使用寿命不低于1000小时,现在从一批原件中随机抽取25件,测得其寿命的平均值为950小时。一直这种原件的寿命服从正态分布,标准差为100小时。试求在显著性水平为0.05下,确定厂家的声明是否可信?4、在一批产品中抽 40 件进行调查,发现次品有 6 件,试按显著水平为 0.05 来判断该批产品的次品率是否高于 10 %。KEY:

1、假设检验分双边假设检验与单边假设检验,进行假设检验时要注意由问题所问进行区分。由题设知总体下检验假设H0:

10,H1:

X~N(,10

xsn

2

2

),,

2

均未知,要求在水平(=0.05)

t

0

(1)因

2

未知,采用t检验,取检验统计量为:

0.05,xs

0

(2)由于n=20,x=10.2,s=0.51,

t

tn1

t0.025(19)

2.0930

t

2

n1

(3)绝对域为:(4)经计算2、解:HO:

H1::

z

x

t1.75

n

2.0930即检验统计量不落在拒绝域内,故在水平

10。

0.05下接受原假设H0,即认为装配时间均值可认为是

1000cm <1000cm

9501000

~N(0,1)代入数值,得到z==-2.5

100

25n

=1.96

2

在显著性水平=0.05时,Z

Z>Z, 拒绝原假设HO。结论:该厂家的声称不可信。

2

4、解:提出假设:H0:p≤10%

H1:p>10%

建立检验统计量:

pp0

z

p0(1p0)

n

P=6/40=0.15 n=40

∴Z=1.05

对于显著性水平0.05,查正态分布表得1.65,故接受原假设,可以认为该批产品的次品率不高于18%

一、填空

1、现象之间普遍存在的相互关系可以概括为两类:一类是系。

2、在简单回归分析中,因变量3、若相关系数为4、线性回归方程5、线性回归方程单位四、计算

1、下表是一小卖部某6天卖出热珍珠奶茶的杯数与当天气温的对比表.

气温(℃)杯数y

现在的问题是:如果某天的气温是些?

2、某种商品的需求量如下数据:

y(斤)和商品价格

2

函数关系回归平方和

,另一类是相关关。

y的总离差可以分解为和残差平方和

r=0.92,表示两变量之间呈强正关系。

?100.5x中,截矩?0的意义是当x=0时,y的期望值为10。y

?120.8x中,斜率?yX每增加一个单位,y平均下降0.8个1的意义是

x

26 20

18 24

13 34

10 38

4 50

-1

-5℃,这天小卖部大概要准备多少杯热珍珠奶茶比较好一

x(元)有关,现取得

2

10对观测数据经计算得

x

60,

y800,x390,y67450,xy

?y

4500

a

bx(3)解释b的意义。

要求:(1)计算相关系数;(2)求y 对x 的线性回归方程3、某地区某企业近

8年产品产量与生产费用的相关情况如下表所示:

生产费用

年份1997 1998

产品产量(千吨)1.2 2.0

x

(万元)y62 86

1999 2000 2001 2002 2003 2004

3.1 3.8 5.0 6.1 7.2 8.0

80 110 115 132 135 160

要求:(1)分析产品产量与生产费用的相关关系;

参:

四、计算题。

1、解:为求回归方程,先计算有关数据:序号1 2 3 4 5 6 Σ

xi26 18 13 10 4 -1 70

yi 20 24 34 38 50 230

x

2i

y

2i

xiyi

520 432 442 380 200 - 1910

676 324 169 100 16 1 1286

400 576 1156 1444 2500 4096 10172

由表中数据得:

x=11.67

y=38.33

2xi

Sxx

ni1ni1

nx

2

=469.33

Sxyxiyi

nxy

= -773.33

将以上数据代入,于是可得

Sxy?b

Sxx

-1.65

??ybxa

57.56

于是得到回归方程

y

57.56-1.65

x

-5℃,这天小卖部大概要准备珍珠奶茶=

y(斤)

2

如果某天的气温是如下数据:

57.56-1.65×(-5)=66杯

10对观测数据经计算得

2. 某种商品的需求量和商品价格x(元)有关,现取得

2

x

60,

y800,x390,y67450,xy4500

3、答案:(1)相关系数r

10*450010*390

60

2

60*80010*67450

800

2

=-0.9325;

?(2)回归方程y

140

10x;

1元,需求量平均减少

10斤。

(3)该商品价格每增加125、解:(1)计算相关系数

r

84544636.48800

8207.54

36.4

2

8104214008800

2

0.9697

因此可判断出产品产量与生产费用是正相关的。(2)建立一元回归模型:

?b0y

b1x

b1b0

xx(x

yx)

2

y

128.9599

yb1x

513.2323

?y

513.2323128.9599x

一元线性回归模型为:

第七章时间序列分析

一、填空

1、下表为两个地区的财政收入数据:

年份1997 1998

A地区财政收入(亿元)

40 60

B地区财政收入(亿元)

7 11

则A地区财政收入的增长速度是A地区财政收入的增长0.07

1%的绝对值为

50% ,B地区财政收入的增长速度是0.4 ,B地区财政收入的增长

57.14% ,1%的绝对值为

2、已知环比增长速度为7.1%、3.4%、3.6%、5.3%,则定基增长速度是 20.81% 。

3、年劳动生产率r(千元)和职工工资y (元)之间的回归方程为y120110x,这意味着年劳动生产率每提高

1千元时,职工工资平均

增加110元

4、拉氏价格或销售量指数的同度量因素都是选基期,而派许指数的同度量因素则选期。

5、动态数列的变动一般可以分解为四部分,即趋势变动、规则变动。

季节变动、循环变动和不

四、计算题

1、以下为某高校某专业

年份报考人数(人)

年份报考人数(人)

1991 1111 1999 1290

15年报考考生人数的历史数据:

1992 1145 2000 1306

1993 1146 2001 1323

1994 1183 2002 1358

1995 1213 2003 1388

1996 1244 2004 1402

1997 1282 2005 1432

1998 1282

要求:用一次线性模型预测该学校2006年报考人数。

2、已知某化肥厂近年生产情况,请填入表中空缺的指标值并计算年平均增长量、年平均发展速度

年份

产量(吨)

累计增长量(吨)

定基发展速度

(%)

1998 1999 2000 2001 2002 2003

100

100

20

125

120 130

环比发展速度(%)

1、解:

(1)画散点图。

可以看出,数据大致成线性模型。

(2)对数据运用线性模型进行拟合:得到最终拟合方程为:其中,调整的

ytb0bt1

?ty

1097.622t

823.8F0.05(1,13),则方程通过显著性检验,拟合效果

R

2

0.9922,F

很好。标准误差为9.19。

2006年时,t

(3)将拟合模型进行预测分析。当得2、解:

年份1998 1999 2000 2001 2002 2003

产量(吨)

100 120 125 150 195 200

16,代入方程:

1449.6人。

?ty

1097.622t

?y16

1449.6,即2006年预测考生人数将达到

累计增长量(吨)

__ 20 25 50 95 100

定基发展速度(%)

100 120 125 150 195 200

环比发展速度(%)

__ 120 104 120 130 103

平均增长量=100/5=20吨平均发展速度=5√200

统计指数分析

一、填空题

1. 指数是表明社会现象复杂经济总体的数量对比关系的相对数。2. 指数按其指标的作用不同,可分为数量指标指数

质量指标指数

,二是

平均指数

3.总指数的编制方法,其基本形式有两种:一是综合指数4. 编制质量指标综合指数,一般是以数量指标5. 编制数量指标综合指数,一般是以质量指标四、计算分析题

1.根据已给三种商品资料(见下表)商品

计量单位

基期q0

甲乙丙合计

公斤件盒____

8000 2000 10000 ____

销售量

报告期q1

8800 2500 10500 ____

为同度量因素,并将其固定在报告期。

为同度量因素,并将其固定在基期

,对销售额的变动进行计算和分析。

价格(元)基期p0

10.0 8.0 6.0 ____

报告期p1

10.5 9.0 6.5 ____

销售额(元)基期q0p0

报告期q1p1

2.某厂三种产品的产量情况如下:产品

计量单位

出厂价格(元)基期

报告期

基期

产量

报告期

A B C

件个公斤

8 10 6

8.5 11 5

13500 11000 4000

15000 10200 4800

试分析出厂价格和产量的变动对总产值的影响。3.某商业部门商品价格和商品销售量的资料如下:

产品皮鞋服装单帽

计量单位双件顶

商品价格(元)基期22.0 11.0 4

报告期19.8 11.0 3.8

基期120 200 110

商品销售量

报告期120 240 132

要求:①计算三种商品销售总额的总指数;

②计算三种商品的物价总指数;③计算三种商品的销售量总指数;

④分析以上三种指数的经济联系(从相对数和绝对数

的形式进行因素分析。

这三道题到时候发照片给你们!

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- gamedaodao.com 版权所有 湘ICP备2022005869号-6

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务