调查概论名词解释重点回顾(中级调查分析师资料)

2023-01-24 04:29:15   第一文档网     [ 字体: ] [ 阅读: ] [ 文档下载 ]
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。下载word有问题请添加QQ:admin处理,感谢您的支持与谅解。点击这里给我发消息

#第一文档网# 导语】以下是®第一文档网的小编为您整理的《调查概论名词解释重点回顾(中级调查分析师资料)》,欢迎阅读!
调查,名词解释,分析师,概论,中级

调查:调查就是使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的部分或所有单元中收集感兴趣的指标信息,并将这些信息综合编辑成有用的简要形式的所有活动。

一次性调查:是指只进行一次调查。一般是针对某一具体问题而组织,这个问题一旦解决就无须再做调查。

统计指标说明客观现象数量特征的概念和数值,要有具体的统计范围和相应的计量单位。 目标总体:目标总体就是调查时希望从中获取信息的总体,它是客户所感兴趣的所有单元的集合。

调查总体:调查总体即实际调查所覆盖的总体,在抽样调查中称作被抽样总体,也即抽样框所代表的总体。

抽样框:提供一条辨别和联系调查总体单元的有限途径。因为要从总体中抽选样本,需要一个包括全部总体单元的一个框架,用来代表总体,这个框架就称作抽样框。

不完全覆盖:抽样框不完备的一种常见的情况,他是指目标总体中的某些单位被排除在抽样框之外,也就是抽样框包括不全,遗漏了一些单位。

过涵盖是指抽样框中包含了本来不属于目标总体的单元。

抽样误差指仅根据总体的一部分单元而不是全部单元的调查来估计总体特征所引起的误差。

非抽样误差:是指除抽样误差以外在调查活动过程中所产生的各种误差。

计量误差:指对一个问题所做的回答记录与真值不同。它可能是由于调查问卷设计、调查员被调查者、收集数据的形式或测量工具造成的。

无回答:指调查时未能从指定的被调查者处获得有效的回答。

数据处理误差:指数据收集以后,作估计以前,所有对数据的处理,包括数据的编码、数据的录入、数据的审核及插补等,其中任何一个步骤所产生的误差。

多重抽样框:是指当单个抽样框不完备时,采用两个或两个以上抽样框的组合。

调查对象:我们要调查的社会经济现象的总体,也就是应收集其资料的那些单位的总体。 名录框:定义为一份所有总体单元的实际的或者概念的名录清单。

区域框:是其单元由地理区域构成的一种特殊的名录框,也称地域框,有时区域框还以地图的形式出现。

自填式问卷调查:就是设计好问卷以后,送到被调查者手中,由被调查者自行填写回答。 派员面访调查派员面访调查是派调查员与被调查者面对面进行的一种调查方式。这种面访又可以分为标准式访问和非标准式访问。 电话调查:电话调查式调查人员利用电话这种通讯工具与被调查者进行语言交流,从而获取信息,采集数据的一种调查方法。 直接观察法:直接观察法式由调查员在现场对被调查者的情况直接观察,记录以取得有关信息的一种调查方法。

小组座谈法:小组座谈法式采用小型座谈会的形式,从调查对象中挑选一组有代表性的人,在主持人的组织下,就某个专题进行讨论,从而获得对有关问题的深入了解。 网络调查:网络调查式通过网络来进行调查获取信息,具体又可以分为电子邮件调查和网页调查。

计算机辅助电话访问指电话调查时采用计算机作辅助工具它可以把调查过程和数据录入过程结合在一起。

问卷:是专门为从被调查者那里获得有关某个主题的信息而设计的一组或一系列问题。 问卷的有效性:又称效度,它是指问卷能准确得反映客观事物特征或属性的程度。 问卷的可靠性:又称信度,它是指问卷测量结果的一致性或稳定性。





开放式问题:是指被调查者用自己的语言来回答问题,它允许被调查者提供他所愿意提供的任何答案。

封闭式问题:是通过检查回答框或者从问卷提供的答案中选择适当的答案来回答。封闭式问题限定被调查者只能从专为某问题所列的答案或选项中做出选择。

二项选择问题是封闭式问题中最简单的一种只有两种答案通常是判断“是”或“否”的问题用于把被调查者分为两个对立的组。 多项选择题:若问卷提供给被调查者选择的选项多于两个,既是多项选择题,如果只能从这些选项中选择一个,称为单选问题,如果允许被调查者科选择一个或多个答案,则称为多选问题。

问卷排序问题:问卷中要求被调查者根据问题中的提示将所有回答选项进行排序,这种问题称为排序问题。

敏感性问题是指所要调查的问题涉及到被调查者的隐私或不愿意公开如实回答的问题。 随机化回答方法:是用来对敏感性问题进行调查的特殊方法,他可以对被调查者的回答起到保密的作用。

列名水平:也称定类尺度,它是将客观事物按其质的特性来进行辨别或划分,它是一种最粗略最低级的度量水平。

顺序水平:又称定序尺度,它是对现象之间的等级或顺序差别的一种度量。他将观察的单元分成类别,而且确定类别的顺序。 间隔水平:又称定距尺度,它不仅将客观现象区分类别,进行排序,还能计算类型之间的差别是多少。

比率水平又称定比尺度,除了具有上述三种度量水平的特性以外,还可以计算两个度量值之间的比率,因此也是最高级的度量水平。 李克特量表:是一种度量对客观事物态度的方法,当客观事物是由一组反映态度的问题组成,先对每一个问题的满意程度进行打分,然后将各项打分进行加总。所以又称加总打分的度量方法。

语意差别量表:是一种对客观事物态度的度量方法,它是由一系列语意相反的形容词组成评价体系,每一组形容词之间分为若干个等级,用数字表示,或在每对相反的形容词之间适当位置描点显示满意程度。

斯塔普尔量表:在语意差别量表基础上加以改进的一种度量态度的方法,它用一个形容词来代替语意相反的两个形容词;通常用110的数字来反映满意程度。

图示量表:用几何图形来度量态度的一种方法。具有比较直观的特点。将不同态度表示为图上的不同点或不同的图形,然后由被调查者凭直觉进行选择。

总体和样本:在抽样调查中,熬夜是目标总体还是被抽样的总体,总是指研究对象的全体,它是由研究对象中的元素(总体单元)组成的。这里的单元有时是指研究对象的实体,有时是指原班人马数量指标。样本是指抽样时按照抽样的规则所抽中的那部分单元所组成的集合

参数:在抽样调查中,参数是指总体的数量特征。通常我们关心的参数有:总体平均数、总体问题、总体比例和总体比率等

估计量和估计值估计量:是样本观察值的函数,用它来对总体参数进行估计,是一个随机变量,通常围绕参数摆动。实际的抽样调查中样本只能抽取一次,根据某具体样本计算的结果称作估计值。

入样概率:是指在一定的抽样方式下,某个具休样本或某个单元被选中为样本的概率 抽样比:是指样本的容量n与总体的容量N之间的比率。通常用f表示,即:f=n/f

抽样分布:是指样本估计量的分布。它是对参数区间估计的依据。

抽样方差和抽样标准误:抽样方差是衡量估计量差异大小的一个指标,也就是该估计量这一抽样分布的方壮工。(所有的估计值和它

的平方数之间离差平方的平均数)抽样方差

的平方根就是抽样标准误。

精确性精确性是指在抽样中若反复抽样其结果的差别大小,差别愈小其精确性就愈高,它反映在抽样方差或抽样标准误的大小 精度通常是一个相对的概念,因此可用相对方差或相对标准误来表示。有时精度还结合置信度来表示,即在定置信度条件下的(1-相对误差),这时精度就愈高愈好

抽样效率:是指两个抽样方案在样本容量相同的情况下抽样方差之比。当某个估计量的抽样方差与另一个估计量的抽样方差比较时,则称抽样方差小的估计量效率比较高。 设计效果是以简单随机抽样为基础反映某个设计的抽样方案抽样效率的一个指标。它是设计抽样方案的方差与亲本量相同情况下简单随机抽样的方差之比。当设计效果小于1时,说明设计方案的效率高于简单随机抽样。 随意抽样又称任意抽样。即在抽选样本时几乎没有或完全没有计划,以随意的方式时行。如“街道拦截”访问法,调查人员可以在街道上抽选 一个碰巧路过的人进行调查。 判断抽样:一种非概率抽样。由调查的组织者或对总体有很好了解的专家决定总体中哪些单元应该入样,以这样的样本来推断总体。因此这种抽样很大程度上依赖于调查主观判断能力。

配额抽样:这是一种最常见的非概率抽样,抽样是根据总体的结构从各个子总体中选取特定数量的样本单元,这种特定数量的比例关系就称作配额。

志愿者抽样:就是抽取志愿者作为样本,被调查者都是志愿的,由于志愿者和非志愿者之间往往是有差别的,因此用来推断总体的有偏的。但它可用于焦点座谈等探索性研究。 滚雪球抽样:适用于某种较为稀少的个体进行抽样,而且我们已经知道其中某些个体并有可能与其接触,那么就有可能通过询问这些个体,获得与他们类似的个体。这样所得的样本就像滚雪球那样增大。这也是一种非概率抽样。

简单随机抽样:是一种最基本的概率抽样方式。假设调查总体共有N个单元,从中随机抽取n个单元为样本,使得每个可能的样本都有相同的概率被抽中。这种抽样方法就称作简单随机抽样。

系统抽样:是对研究的总体按一定的顺序排列,每隔一定的间隔抽取一个单元的抽样方法。因此又叫做等距抽样。设总体单元数为N,要从中抽取n个单元作样本,先要计算出抽样间隔k=N/n,然后在1k之间取一rr ,r+k,r+2k,„„,根据不同的特点又有圆形系统抽样和对称等距抽样。

PPS抽样:又称与规模大小成比例的概率抽样,是一种不等概率抽样,即单元的规模愈大,被抽中的概率愈大。如果研究的变量与单元的大小相关,PPS抽样就能提高精度。抽选的译意风随机放回的PPS抽样,系统PPS抽样和随机系统抽样法。

整群抽样:的抽样单元是由基本单元所组成的群体,抽选时直接抽取若干个群作为样本,并对群内的所有基本单元进行调查。

分层抽样:也称分类抽样,这种抽样方法是在抽样之前将总体划分为同质的、互不重叠的若干子总体,也称为层,然后在每个层中独立随机地抽取样本。因此,也称分层随机抽样。如果在分层时把同质的单元分在一个层中,就可以提高抽样效率。

多阶抽样:也称多级抽样,它是用两个或更多个连续的阶段抽取样本的过程。第一阶段抽取的单元称为初级或一级抽样单元,第二阶段抽取的单元称为次级划开二级抽样单元,依次类推。 多相抽样是先抽一个有很多单元的大样本,收集基本的辅助信息,然后在这个大样本中抽一个子样本收集更详细的信息,并结合辅


助信息,做出更精确的估计。多相抽样还可以用在一项调查中不同问题的数据收集费用差异很大的情形。

无偏性:是指估计量的数学期望等于待估的总体参数。它的直观含义是指某个具体的估计值,由于随机的原因,对总体参数进行估计时,可能出现偏高或偏低,但如果把所有的样本都抽出来,将估计值进行平均就应该等于总体参数。

有效性:在抽样估计中的含义就是要求估计值尽可能精确,也就是抽样方差要尽可能小。如果估计量A的抽样方差小于估计量B的抽样方差,我们就说估计量A的效率高于估计B或者说估计量A比估计量B更加有效。 点估计:若从总体中抽取一个样本,用样本的估计值直接对总体的有关参数作一个数值点的估计,这种估计方法称做点估计。 区间估计:在对总体参数进行估计时,给出总体参数的一个取值范围,同时说明这一结论的可靠性,也即置信概率,这种估计方法称做区间估计。 置信概率在对总体参数进行估计或检验时,给出结论的可靠性,通常称做置信概率。也就是说基于统计量的抽样分布,有多大的概率来保证结论是正确的。

置信区间:在参数估计时,根据估计值给出总体参数的一个取值范围,这一范围往往与一个置信概率相联系,这个取值的范围就称做置信区间。

权数:在抽样估计时要给每一个样本单元或样本的回答单元赋予一个权数,说明它代表的总体单元数,这就是权数。设计权数其实就是样本单元的入样概率的倒数。

自加权设计:在进行一项抽样设计时如果所有样本单元的设计权数都相同,那么称这样的抽样设计为自加权设计。

事后分层分层抽样可以提高抽样效率,但有时在数据收集之前可能得不到分层合适的抽样框信息,无法进行分层。但如果可从其他方面获得分层信息,那么在数据收集后,可以利用数据收集的结果,选用其中合适的变量对收集到的样本进行分层,从而对样本的权数进行调整,这种方法称做。

一致性:指随着样本的无限增大,样本的估计量就等于待估的总体参数。

大数定理使用样本估计基础。中心极限定理则奠定了样本估计对总体参数进行区间估计的理论基础。

根据正态分布的性质,随机变量落在平均数两侧1个标准范围内的概率为68.3%2个标准范围内的概率为95.45%. 估计精度:是指估计值要求达到的精确程度。精度可以用绝对数来表示,通常用抽样方差或标准差来反映,也可以用在一定置信度的误差限来反映;

调查回答率:是用回收到的有效问卷数占计划样本量的百分比来表示的。

比例分配:也称等比例分配,即在分层抽样的样本量分配到各层时按照各层的单元数进行分配。

Y成比例分配即在分层抽样把样本量分配到各层时,根据各层总量Y的大小进行分配,

Y的平方根成比例分配分层抽样将样本量分配到各层的一种方法,其分配系数为 最优分配:当分层抽样各层单元的调查费用不全相同,以及层与层的方差变化很大的情况下,分配样本的一种方法。该方法可以在相同样本量的情况下,费用最省。

奈曼分配:分层抽样分配到各层的样本时,规模和方差较大的层将分配到更多的样本单元。它是最优分配的一种特例,即各层调查费用都相同的最优分配。其分配系数为 方差相等时的最优分配:最优分配的另一种特例,即各层的方差都相等的最优分配。由于各层的方差通常是不等的,所以这种分配方法较少使用。





不等比例分配:这是相对于等比例分配而言,即各层的抽样比例是不相同的。除了与N比例的分配以外,其余的各种分配都是不等比例分配。如奈曼分配、最优分配等均为不等比例分配。

超额分配:在分层抽样设计中,使用最后分配、奈曼分配、与Y成比例分配等分配方法时,均有可能出现某些层分配的样本单元数超过了总体单元数,这种情况称作超额分配。 层(内)的方差:是指分层抽样中各层的方差,如果是按照总体各单元计算的称作层内

总体方差;通常用样本进行估计,其估计量

S2s

2是样本方差,用h

h表示。 影响精度的因素:总体指标的变异程度;总体大小;样本设计和所用的估计量;回答率。 总样本量固定:这种原则是先确定总的样本n,然后再将确定的总样本量以某种方式分配到各层。

给定变异系数:确定总样本量n的另一个准则是在给定总体估计值精度水平的情况下,

h1,2,,L



n

h,是估计值的变异系数不超过事先估计的值C

ˆ

影响精度的因素:总体指标的变异程度;总体大小;样本设计和所用的估计量;回答率。 总样本量固定:这种原则是先确定总的样本n,然后再将确定的总样本量以某种方式分配到各层。 数据收集数据收集是调查中收集每一个 抽中的单元(住户,农场,企业,学校等)个体数据时的过程。

编制名录:是位于一个具体的地理区域内的所有单元(例如住户、农场、商店、学校、医院等)建立一个名录,以便于抽样或调查,编制名录就是创建这个名录清单的过程。 寻踪:在调查的现场操作时,仅根据抽样框的信息还不能多样本单元定位;更详细需要尽快寻找和确定,这一工作称做寻踪。其目的是对样本单元进行定位;更新抽样框中单元的基本识别信息。确认样本单元是否仍在调查范围内。

追问:是适当调查人员在调查过程中感到被调查的答案没能卯足问题是的进一步提问的技巧。

解决率:是调查过程中监控运作过程中需要计算的一个指标,用来衡量调查员的计划完成情况。

解决率=已解决的样本单元数/样本单元总数 回答率:也是对调查过程和调查结束后反应调查工作质量进行监控的一个指标。

回答率=回答单元数量/在范围内已解决的单元数+未解决的单元数

代理访问:某些调查由于被调查者不在,有关信息可以从另一位有文化的家庭成员那里获得,这就是所谓的代理回答

数据处理:把调查中收集到的数据转换为适合汇总制表和数据分析的形式。

编码:是给问题的每一项答案赋予一个数值代码,以便于数据录入和作进一步处理的过程。

数据录入是将回答转化成可以机读的形式。采用纸张式收集数据方法时数据录入是在数据收集完毕之后进行;采用计算机辅助数据收集方法时,数据录入在数据收集的同时进行的。

审核:是应用各种检查规则来辨别缺失、无效或不一致等造成数据记录的潜在错误。 净化:是把调查过程中在问卷上写的备注加以核查清楚。这些备注通常是因为调查人员事先不知道开放式问题的编码规则或是其他原因临时的记录,在调查结束到后进行审核和净化。

梳理:是在调查结束后将问卷交到调查办公室后进行的,梳理时一种补充的审核。它包括辨认手写的回答,解读调查人员所做的标记,统一度量单位等。通话四还包括确认调查人员是否已经完成对问卷的所有现场操

作。

选择性审核:是为了避免花过多的时间和经费对最后的估计并无太大影响的数据而采用有重点的审核。

插补:就是解决在审核过程中辨别出来的数据缺失、无效与不一致等问题的过程。插补要改变一些回答,并对审核过程中发现的所有缺失信息的记录进行补充和代替,确保得出内在一致的记录。

离群值:是一组数据中那些看起来与数据集中的其他观察值不一致的一个观察值或一组观察值。

前向插补:利用前期数据进行的插补称为前向插补。它是用前期调查的数据来作为当前调查的缺失数据的插补值,是比率或回归插补的一个特例。

有效性审核:是检查被调查者回答的语句语法是否正确,检查包括是否规定在填数字的地方填上了非数字的字符以及问卷中的回答是否有缺失等错误。

一致性审核是检查不同问题之间的关系是否正确,它基于不同问题或同一问题的不同部分之间的结构关系、逻辑性和合法性来进行。 分布审核:是试图通过数据的分布来辨别数据是否正常,来辨识是否有些数据远远脱离分布的正常范围,即有些数据是否为离群值。因此有时也称为统计审核或离群值的检测。 普通统计表:一般有四个主要部分组成,即表头、行标题、列标题和数字。必要时可以在表达的下方附加一些解释。

频数分布表:即把原始数据按不同的对象进行分类然后计算各种不同类别中对象出现的次数,也称频数。如果把频数按算成相对数,称频率。

频数及其分布:频数也叫次数,它是指观察值落在各个类别的个数。 简答


本文来源:https://www.dywdw.cn/7bcd7a07915f804d2b16c13a.html

相关推荐
推荐阅读