
抽样技术
-
2023年3月4日发(作者:螺栓型号)-
-.-总结资料-
一、抽样的类型1
(一)非概率抽样1
1.非随机抽样的含义1
(二)概率抽样3
2.概率抽样的程序3
(三)多段抽样5
二、简单随机抽样〔SRS〕5
(四)抽样方案设计5
(五)抽选方法6
三、分层随机抽样6
四、比率估计的性质8
(六)比率估计的近似方差8
(七)分层随机抽样下的比率估计9
(八)比估计量与回归估计量的比拟:10
五、样本量在各层的分配10
(九)比例分配10
(十)最优分配10
(十一)Neyman〔曼〕分配11
(十二)样本量确实定11
一、抽样的类型
(一)非概率抽样
主要依据研究者的主观意愿、判断或是否方便等因素
抽取样本;误差大,难以估计,代表性小,适合探索性研
究。主要有:偶遇抽样、判断抽样、定额抽样、雪球抽样
1.非随机抽样的含义
它是在不确定总体中,按照非随机原则选取样本,并用这局部样本指标的调查结果,来判
断总体指标的一种抽样类型。
-
.z.
非随机抽样的围.当对调查的总体不够清楚,或者太复杂,不适于采取随机抽样时,
则,就需要用非随机抽样来抽出样本;
.适用于经常性的调查和方便灵活的调查。
a)偶遇抽样
方便抽样或自然抽样,指研究者根据现实情况,以自己方便的
形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近、
最容易找到的人作为对象。或者说研究可以得到的一组个体.
适用围
〔1〕可用于经常性的市场调查;
〔2〕可用于正式市场调查之前的试验调查;
〔3〕任意调查适用于同质总体。
优点:方便、灵活,简便易行,及时取得所需资料,节约时间
和费用本钱低
缺点:因为个体差异性,抽样误差很大,结果不够可靠,应用
价值较低
b)判断抽样
研究者根据研究目标和自己的主观分析来选择和确定他们认为可以提供所需要信息的人作
为样本。
含义:又称立意抽样法,它是指由市场调查的专家依据自己的判断来选取样本的一种方法。
适用围:总体的构成单位差异较大而样本数又很小的情况
优点:因为是按照调查人员的需要来选定样本,所以较好地满足了特殊的调查需要。
缺点:如果调查人员在选取样本时主观判断出现偏差,则判断抽样极易发生较大的抽样
误差。
采用判断抽样法应注意的问题:
一要选好专家,二要应竭力防止挑选极端情况的样本,“多数型〞、“平均型〞
两种具体做法专家判断选择样本:平均型
统计判断选择样本:多数型
利用调查总体的全面统计资料,按照一定的标准选择样本
如进展现场访问,任意选择一群消费者或者营业人员进展谈话,了解他们对商品质量的看法
或购置动向。
举例:在街头向过路行人做访问调查;上门对一栋大楼的每个公司进展访问式调查;在柜台
销售商品过程中向购置者做询问调查等〔样本的选取完全随调查人员的方便而定〕
理论依据:认为被调查的母体中的每一个个体都是一样的
注意:适用于非正式的探测性调查,或调查前的准备工作。
配额抽样法和判断抽样法既有联系又有区别
二者的联系是:配额抽样实质是一种“分层〞判断抽样。
-
.z.
二者的区别是:
抽取样本的方式不同:
a配额抽样是分别从各个控制特征的层次抽取假设干个样本
b判断抽样是从总体中的*一层次中抽取假设干个符合条件的典型样本
二者的侧重点不同;
a配额注重“量〞的分配
b判断抽样注重“质〞的分配
复杂程度不同:
a配额抽样方法复杂精细
b判断抽样方法简便易行
2.适用围:通常适用于小型的市场调查
3.步骤:〔1〕选择“控制特征〞作为细分总体的标准;
〔2〕将总体按“控制特征〞组成假设干子总体;
〔3〕决定各子总体样本的大小;
〔4〕选择样本单位。
c)雪球抽样
在无法了解总体情况时,从少数成员入手调查并询问其他符合条件的人,再找这些人所知道
的人。
(二)概率抽样
依据概率论的根本原理,按照随机原则进展抽样;
主要有:简单随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样
2.概率抽样的程序
1。界定总体:围与界限
2。制定抽样框:收集总体中全部抽样单位的,并
对统一编号。分段、分层抽样时则要分别建立起几
个不同的抽样框
3。决定抽样方案:确定抽样方法、样本规模、主要目
标量的准确程度
4。实际抽取样本:按照选定方法从抽样框中抽取一个
个抽样单位,构成样本
5。评估样本质量:质量、代表性、偏差
将可得到的反映总体中*些重要特征及其分布的资料与
样本中的同类指标进展比照。
-
.z.
d)简单随机抽样
单纯随机抽样:按照等概率原则直接从含有N个元素的总
体中随机抽取n个元素组成样本〔N>n〕。
常用的方法:抽签、随机数字表
优点:可能产生代表性样本
缺点:不容易做
1.编号难
2.必须能够接触到被选中的个体
3.成分比例难
e)分层抽样
将总体中的所有单位按照*种特征或标志划分为假设
干类型或层次,在每个类型或层次中采用简单随机抽
样或系统抽样的方法抽取一个子样本,共同构成研究
的样本.
优点:
1.在不增加样本规模的前提下降低抽样误差,提高抽样精度,增大代表性
2.便于了解总体不同层次的情况,以及对总体中的不同层次进展单独研究或者进展比拟.
注意:
1.分层的标准问题
2.分层的比例问题
f)系统抽样
等距抽样或机械抽样,将总体的单位编号排序后,按照固定的
间隔抽取个体组成样本的方法.
步骤:
1.制定抽样框
2.计算抽样间隔:K=N/n
3.在第一组K个个体中随机抽取一个个体A.
4.在抽样框中每隔K个个体抽取一个个体.
5.将n个个体合起来构成样本.
优点:简便易行
条件:抽样框应该是随机排列的.
注意2种情况:
1.抽样框中的个体排列具有*种次序或等级
2.抽样框中的个体排列具有与抽样间隔对应的周期性分布.
整群抽样
从总体中随机抽取一些小群体,将小群体的所有元素构成
样本.
-
.z.
对小群体的抽取可采用简单随机抽样、系统抽样、分层抽
样的方法。
优点:
1。简化抽样过程
2。降低收集资料的费用
3。扩大抽样围
缺点:代表性比拟差
(三)多段抽样
g)多阶段抽样
多级抽样或分段抽样,按照抽样元素的隶属关系或
层次关系,把抽样过程分为几个阶段进展。
步骤:
1。以大群为单位编制抽样框
2。抽取假设干大群
3。以小群为单位给每个大群编制抽样框
4。分别从每个大群中抽取小群
5。根据需要重复3、4步骤
6。得到根本元素,构成研究样本
优点:方便易行
二、简单随机抽样〔SRS〕
(四)抽样方案设计
第一、确定抽样调查的目的、任务和要求;
第二、确定调查对象的围和抽样单位;
第三、确定抽取样本方法;
第四、对主要抽样指针的精度提出要求;确定必要的样本数;
第五、确定总体目标量的估算方法;
第六、制订实施总体方案的方法和步骤。
简单随机抽样的抽取原则:
〔1〕按随机原则取样;
〔2〕每个抽样单元被抽中的概率都是的或事先确定的;
〔3〕每个抽样单元被抽中的概率都是相等的。
在实际工作中,更多的采用不放回简单随机抽样。
符号
大写符号表示总体的标志值,
-
.z.
用小写符号表示样本的标志值
(五)抽选方法
1.抽签法
2.随机数法——随机数表、随机数骰子、摇奖机、计算机产生的伪随机数
随机数表法:
N=327n=5
讨论:
(1)总体编号为1~35,在00~99中产生随机数,假设=00或>35,则抛弃重抽。
(2)总体编号为1~35,在00~99中产生随机数,以除以35,余数作为被抽中的数,如果
余数为0,则被抽中的数为35。
A.对总体均值的估计
以样本均值作为总体均值的估计
性质1:对于简单随机抽样,是无偏估计。
对于有限总体的方差定义:
性质2:对于简单随机抽样,的方差
式中:
fnN
为抽样比,
1f
为有限总体校正系数。
性质3:
Vy
的样本无偏估计为:
大样本下,抽样调查估计量渐进正态
B.对总体总量的估计
C.三、对总体比例的估计
*一类特征的单元占总体单元数中的比例P.
将总体单元按是否具有这种特征划分为两类,设总体中有个单元具有A这个特征,
如果对每个单元都定义指标值
总体方差:
估计量
性质5:对于简单随机抽样,是P的无偏估计。的方差为
Vp
PQ
n
Nn
N
1
三、分层随机抽样
分层原则:
1.估计:层单元具有一样性质,通常按调查对象的不同类型进展划分。
pp
-
.z.
2.精度:尽可能使层单元的指标值相近,层间单元的差异尽可能大,从而到达提高
抽样估计精度的目的。
3.估计和精度:既按类型、又按层单元指标值相近的原则进展多重分层,同时到达
实现估计类值以及提高估计精度的目的。
4.实施:抽样组织实施的方便,通常按行政管理机构设置进展分层。
符号说明(关于第h层的记号)
第I条对总体均值的估计
分层样本,总体均值Y的估计
分层随机样本,总体均值Y的简单估计
估计量的性质
性质1:对于一般的分层抽样,如果
h
Y
ˆ
是
h
Y的无偏估计〔Lh,,2,1〕,则
st
Y
ˆ
是
Y的无偏估计。
st
Y
ˆ
的方差为:
性质2:对于分层随机抽样,
st
y是Y
的无偏估计,
st
y的方差为:
单元总数
样本单元数
第个单元的值
层权
抽样比
总体均值
样本均值
总体方差
样本方差
h
N
h
n
hi
y
N
N
Wh
h
h
h
hN
n
f
h
N
i
hi
h
h
y
N
Y
1
1
h
n
i
hi
h
h
y
n
y
1
1
h
N
i
hhi
h
h
Yy
N
S
1
2
2
1
1
h
n
i
hhi
h
h
yy
n
s
1
2
2
1
1
-
.z.
性质3:对于分层随机抽样,
st
yV的一个无偏估计为:
第II条对总体总量的估计
总体总量Y的估计为
如果得到的是分层随机样本,则总体总量的简单估计为:
性质4:对于一般的分层抽样,如果
st
Y
ˆ
是Y的无偏估计,则Y
ˆ
是Y的无偏估计。Y
ˆ
的方差为:
性质5:对于分层随机抽样,Y
ˆ
的方差为
性质6:对于分层随机抽样,YV
ˆ
的一个无偏估计为:
第III条对总体比例的估计
总体比例P的估计为:
L
h
hhst
pWp
1
性质7:对于一般的分层抽样,如果
h
p是
h
P的无偏估计
〔Lh,,2,1〕,则
st
p是P的无偏估计
st
p的方差为:
性质8:对于分层随机抽样,
st
p是P的无偏估计,
因而
st
p的方差为:
性质9:对于分层随机抽样,
st
pV的一个无偏估计为:
四、比率估计的性质
偏倚量会小,如果:
·样本量n很大
·抽样比n/N很大
·xu
很大
·S*很小
·相关系数R接近于1
(六)比率估计的近似方差
•1.与简单估计的比拟
-
.z.
简单估计量无偏,而比率估计量渐近无偏。
因此这里只比拟当n比拟大的情形。
比率估计量优于简单估计量的条件是:
(七)分层随机抽样下的比率估计
如果各层的样本量不小的话,则可以采用各层分别进展比率估计,将各层加权汇总得到总体
指标的估计,这种方式称为分别比率估计量。separateratioestimator
,
1
1
1
x
y
r
,
2
2
2
x
y
r
…….
L
L
Lx
y
r
(h
=1,2,…..L)
分别比率估计量要求每一层的样本量都比拟大,如果达不到这个要求,则它的偏倚
可能比拟大,这时使用联合比率估计量。binedratioestimator
方差的比拟
如果每一层样本量都比拟大,各层R相差较大,则分别比率估计量的方差小于联合比率估
计量的方差。
但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量
的偏倚很大,从而使总的均方误差增大。
回归估计应用的两种情况:
事先确定
设
确实定值为0
,0
是一常数,则:
)(
0
xXyy
Lr
〔1〕
有样本估计
分层抽样中的回归估计
a)分别回归估计
当
h
可以事先确定时,
Lrs
y与
Lrs
Y
ˆ
都是无偏估计的,
-
.z.
)2(
)1(
)(222
2
xhhyxhhyh
h
hh
Lrs
SSS
n
fW
yV
且在)...2,1(
2
Lh
S
S
xh
yxh
h
时到达最小
值)1(
)1(
)(22
2
minhyh
h
hh
Lrs
S
n
fW
yV
当
h
不能事先确定时,
当
h
n较大时,
b)联合回归估计
当事先设定
当不能事先设定
(八)比估计量与回归估计量的比拟:
:
五、样本量在各层的分配
确定样本量:总的样本量,各层样本量
估计量的方差不仅与各层的方差有关,还和各层所分配的样本量有关。
实际工作中有不同的分配方法,可以按各层单元数占总体单元数的比例分配,也可
以采用使估计量总方差到达最小、费用最小。
(九)比例分配
按各层单元数占总体单元数的比例,也就是按各层的层权进展分配.
对于分层随机抽样,这时总体均值的估计是
总体比例的估计是
(十)最优分配
一〕最优分配
在分层随机抽样中,如何将样本量分配到各层,使得总费用给定的条件下,估计量
的方差到达最小,或给定估计量方差的条件下,使总费用最小,能满足这个条件的
-
.z.
样本量分配就是最优分配。
对所有层成立时,到达极小
简单线性费用函数,总费用
由此得出下面的行为准则,如果*一层
·单元数较多
·部差异较大
·费用比拟省
则对这一层的样本量要多分配一些。
(十一)Neyman〔曼〕分配
如果每层抽样的费用一样,最优分配可简化为
这种分配称为Neyman分配。这时,
st
yV到达最小。
(十二)样本量确实定
令
hh
nwn当方差V给定时2
2tYrtdV
当按比例分配时,
hh
Ww
实际工作中,n的计算可以分为两步,先计算:
然后进展修正:
当按Neyman分配时,
VC