二炮医院-
医学统计学第七版部分课后答案及解析
第二章
1.
答: 在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,
中位数。
均数反映了一组观察值的平均水平,
适用于单峰对称或近似单峰对称分布资料的平
均水平的 描述。
几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化
(
等比关系
)
,
此时不宜用算术均数描 述其集中位置,而应该使
用几何均数(
geometric
mean
)。几 何均数一般用
G
表示,适用于各变量值之间成倍数
关系,分布呈偏态,但经过对数变换 后成单峰对称分布的资料。
中位数和百分位数:
中位数(
med ian
)就是将一组观察值按升序或降序排列,位次居中的数,常用
M
表
示。 理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈
偏态分布或不规则分布 时集中位置的描述,也适用于开口资料的描述。
所谓“开口”资
料,是指数据的一端或者两端有 不确定值。
百分位数
(
percentile
)
是一种位 置指标,以
P
X
表示,一个百分位数
P
X
将全部观察
值分为两个部分,理论上有
X
%的观察值比
P
X
小,有(
100-
X
)%观察值比
P
X
大。故百
分位数是一个界值, 也是分布数列的一百等份分割值。显然,中位数即是
P
50
分位数。
即中位数 是一特定的百分位数。常用于制定偏态分布资料的正常值范围。
2.
答:常用来描述 数据离散程度的指标有:极差、四分位数间距、标准差、方差、
及变异系数,尤以方差和标准差最为常用 。
极差
(
range
,
记为
R
)
,
又称全距,
是指一组数据中最大值与最小值之差。
极差大,
说明资料的离 散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如
用以说明传染病、食物中毒等的 最短、最长潜伏期等。其缺点是:
1.
不灵敏;
2.
不稳
定。
四分位数间距(
inter-quartile r ange
)就是上四分位数与下四分位数之差,即:
Q
=
Q
U
-
Q
L
,
其间包含了全部观察值的一半。所以四分位数间距又可 看成中间一半观察值
的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于 描
述偏态分布资料的离散程度。
极差和四分位数间距均没有利用所研究资料的全部信 息,
因此仍然不足以完整地反
映资料的离散程度。
方差(
variance
)和标准差(
standard
devi ation
)由于利用了所有的信息,而得
到了广泛应用,常用于描述正态分布资料的离散程度 。
变异系数(
coefficient of variance
,
CV
)亦称离散系数(
coefficient of
dispersion
),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位, 常
用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。
3.
答:常用的相对数指标有:比,构成比和率。
比(
ratio
),又称相对比,是
A
、
B
两个有关指标之比,说明
A为
B
的若干倍或百
分之几,它是对比的最简单形式。其计算公式为
比=< br>A
/B
率
(rate)
又称频率指标,用以说明某现象发生 的频率或强度。常以百分率
(
%
)
、千
分率(‰)、万分率
(1/
万
)
、十万分率< br>(1/10
万
)
等表示。计算公式为:
率
?
实际发生某现象的观察
单位数
?
比例基数(
K
)
可能发生某现象的观察
单位总数
构成比
(propor tion)
又称构成指标,
它说明一种事物内部各组成部分所占的比重
或分布,常 以百分数表示,其计算公式为:
构成比
?
某一组成部分的观察单位数
?
100%
同一事物内各组成部分的观察单位总数
4.
答:当比较两类事物的总率时,如果此两同类事物的 内部构成,特别是某项能影
响指标水平的重要特征在构成上不同,往往会高估或低估总率。在这种情况下 ,直
接进行两个总率的比较,会产生错误的结论。此时,必须首先设法消除这种内部构
成上的差 别,
才能进行比较。
统计学上将这种方法称为率的标准化
(standardizat ion
method
of
rate)
,即采用统一的标准对内部构成不 同的各组频率进行调整和对比的
方法,调整后的率为标准化率,简称为标化率。
5
(
1
)
编制频数分布表并绘制频数分布图,简述这组数据的分布特征;
组段
108
111~
114~
117~
120~
123`
126~
129~132
合计
35.00
30.00
25.00
频数
3
10
22
38
20
18
7
2
120
频率
(%)
2.5
8.33
18.33
31.67
16.67
15
5.83
1.67
100
;
累计频
数
(%)
2.5
10.83
29.17
60.83
77.5
92.5
98.33
100
组中值
109.5
112.5
115.5
118.5
121.5
124.5
126.5
129.5
F
r
e
q
u
e
n
c
y
20.00
15.00
10.00
5.00
0 .00
108.00
111.00
114.00
117.00
(
2
)
计算中位数、均数、几何均数,用何者表示这组数据的集中位置好?
答
:< br>X
?
?
3
?
109.5
?
10
?< br>112.5
?
22
?
115.5
?
38
?< br>118.5
?
20
?
121.5
?
18
?< br>124.5
?
7
?
126.5
?
2
?
139.5
?
/120
120.00
123.00
''heigh t (cm)''
126.00
129.00
132.00
135.00
=119.4135
X
g< br>?
lg
?
1
?
?
?
lg3
?
109.5
?
lg10
?
112.5
?
lg
22
?
115.5
?
lg38
?
118.5
?
lg
20
?
121.5
?
lg18
?
124.5< br>?
lg7
?
126.5
?
lg
2
?
139.5
?
/120
?
?
=119.25125
M
d
?
116.63
用均数较好
.
(
3
)
计算极差、标准差,用何者表示这组数据的离散趋势好?
答
:
极差:
22.62
四分位数间距:
5.915
标准差:
4.380736
用标准差表示较好
.
6
.答 :本例频数分布为偏态分布,长尾拖向
x
轴正方向,故为正偏态。适宜用中位数
表示其 平均水平,中位数为
4
,四分位数间距为
4
。
7.40< br>名麻疹易感儿童接种麻疹疫苗后一个月,血凝抑制抗体滴度如下表。试计算平
均滴度。
抗体滴度
1:4
1:8
1:16
1:32
1:64
1:128
1:256
1:512
人数
1
5
6
2
7
10
4
5
几
何
均
数
:
exp((ln(4)+5×ln( 8)+16×ln(16)+2×ln(32)+7×ln(64)+10×ln(128)+4×ln(256 )+5
×ln(512))/40)
=
128
第三章
1
正态分布与标准正态分布的区别:
正态分布是一簇单峰分 布的曲线,μ
和
σ
可以有任意取值;标准正态分布是一条单
峰曲线,μ
和
σ
有固定的值,μ=0,σ=1。
2 u = (x-
μ)/σ= (μ
-
σ
-
μ)/σ=
-1
查标准正态分布表,得
Φ(
-1)=0.1587
,所以小于
μ
-
σ
者所占的比例为
15.87%
。
3
医学参考 值范围的含义:
是根据正常人的数据估计绝大多数正常人某项指标所在的范
围。选定同质的正常 人作为研究对象。
所谓正常人是指不具有影响所测指标的因素或疾
病的那类同质人群。
确定原则:①选定同质的正常人群作为研究对象
②控制检测误差
③判断是否分组
④单、双侧问题
⑤选择百分界值
⑥确定可疑范围
方法:①正态分布法:适用于服从正态分布或近似正态分布的资料
②百分位数法:适用于不服从正态分布的资料
③对数正态分布法:适用于对数正态分布的资料
4
如果资料服从正态分布 ,
那么双侧
95%
正常值范围为
μ±1.96σ;如果资料不服从正
态分布,那么双侧
95%
正常值范围就不能用正态分布来做。
5 1
人以下的概率:P(x≤1)=P(0)+P(1)=C
10
0
0.2
0< br>0.8
10
+C
10
1
0.2
1
0.89
=0.375
8
人以上的概率:
8
8
2
9
9
1
10
10
0 5
P(X≥8)=P(8)+P(9)+P(10)=C
10
0.2
0. 8
+C
10
0.2
0.8
+C
10
0.2
0.8
=
7.79×10
6
二项分布的应用条件:
①观察单位只能有互相对立的两种结果之一。
②已知发生某一结果的概 率
π
不变,其对立结果的概率则为
1-
π
③
n
次试验在相同的条件下进行,且各观察单位的结果互相独立,即每个观察单位的
观察 结果不会影响到其他观察单位的结果。
7
二项分布和正态分布之间的关系:
随着
n
的增大,
二项分布逐渐逼近正态分布。
当
nπ
较大 时,二项分布
B(n,π)近似正态分布。
举例:病人的治愈与不治愈, 理化检验结果的阴性与阳性,个体的发病与不发病等属
于二项分布资料;
某地区
12< br>岁男孩的身高,某学校同年级女生的体重等属于正态分布。
第四章
1
标准差
标准误
不同:
意义上:
描述一组变量值的离散程
描述样本均数的离散称度
度
应用上:
1
、标准差越小,说明变量
1
、标准误越小,说 明样本
值围绕均值分布越紧密,均
均数和总体均数的差异越
数的代表性越好。
小,用样本均数估计总体均
数的可靠性越大。
2
、
x?
u
?
s
估计变量值的分
2
、用
x
?
t
?
s
x
估计总体均数
与
n
的关系:
相同:
1
、都是描述变异度的统计指标
2
、
?
x
?
布范围。
n
越大,标准差越稳定
的可信区间。
n
越大,标准误越小
?
x
n
?x
与
?
x
成正比,与
n
成反比;
3
、
n
一定时,同一组资料,标准差越大,标准误也越大。
2
α
水准是在假设检验之前确定的,说明按不超过多大的误差为条件作结 论,是犯Ⅰ型
错误的最大风险,是事前概率;
P
值是指由
H
0
所规定的总体作随机抽样,获得等于大于
现有样本获得的检验统计量值得概率。标明以多大的误差拒绝
H
0
,是事后概率。
3
①配对设计的差值的总体均数的 可信区间表达公式:
d
?
t
?
,
n
?
1< br>s
d
2
2
?
?
1
?
?
1
1
?
1
1
2
2
?
1
x
1
?
x
2
?
t
?
,
?
?
?
两均数差值的总体均数的可信区间表达公 式:
?
?
?
2
?
2
1
1
2
?
?
②可以用可信区间回答假设检验的问题。
可信区间估计与假设检验时统计学中两种重
要的、独特的思维方式,它们在原理上相通,均基于抽样误 差理论,只是考虑问题的角
度不同。例如:样本均数与总体均数的比较,用可信区间的估计方法,观察由 样本信息
估计的总体均数的可信区间是否包含已知的总体均数,
即可推断该样本是否来自已知均
?
n
?
s
?
n
n
n
?
s
n
n
二炮医院-
二炮医院-
二炮医院-
二炮医院-
二炮医院-
二炮医院-
二炮医院-
二炮医院-
本文更新与2021-01-27 07:40,由作者提供,不代表本网站立场,转载请注明出处:http://www.xapfxb.com/yuer/430077.html
-
上一篇:2020年新编免疫规划试卷含答案名师精品资料
下一篇:腰椎病诊疗方案(1) (1)