当前位置:
首页 > 教材教辅 > 大学 > 定性资料统计分析及应用pdf/doc/txt格式电子书下载

定性资料统计分析及应用pdf/doc/txt格式电子书下载

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

定性资料统计分析及应用pdf/doc/txt格式电子书下载

书名:定性资料统计分析及应用pdf/doc/txt格式电子书下载

推荐语:

作者:胡良平,王琪

出版社:电子工业出版社

出版时间:2016-03-01

书籍编号:30468287

ISBN:9787121277672

正文语种:中文

字数:168000

版次:1

所属分类:教材教辅-大学

全书内容:

定性资料统计分析及应用pdf/doc/txt格式电子书下载






前言


众所周知,统计资料从性质上可粗分为定量资料与定性资料两大类,从功能上又可分为原因变量与结果变量两大类。在一个实际问题中,只有原因变量及其取值的统计资料没有什么实用价值,故很少有人关注它们;而仅有结果变量及其取值或者同时具有原因变量与结果变量及其取值的统计资料是最为常见的,也是人们最常分析的定性资料。其中,结果变量是定量变量的统计资料,常简称为“定量资料”,而结果变量是定性变量的统计资料,常简称为“定性资料”。根据每次分析的结果变量的个数来命名统计分析方法时,又有“一元”与“多元”定量资料或定性资料统计分析方法之称。


现有已出版的统计学教科书涉及的内容包罗万象(科研设计、质量控制、统计表达与描述、定量和定性资料统计分析、统计软件的应用、结果解释、结论陈述等),但在每个具体内容模块方面都不够深入和全面,这对于希望全面系统学习和掌握某一知识领域的读者来说,是有失偏颇、不尽如人意的。


本书从三种不同的视角,全面系统地向读者介绍定性资料的统计分析方法、应用场合、SAS实现、输出结果的解释和结论的陈述:第一,从一水平与多水平模型统计分析角度;第二,从非重复测量设计与重复测量设计定性资料统计分析角度;第三,从一元定性资料与多元定性资料统计分析角度。


依据统计分析方法的名称来划分,本书所涉及的统计分析方法有定性资料的广义差异性分析(包括ROC曲线分析)、定性资料的广义线性模型和非线性模型分析、定性资料的聚类分析、定性资料的项目反应模型分析、定义资料的转移模型分析、定性资料的对应分析和Shan-non信息量分析。


在本书即将出版之际,真诚感谢北京东直门医院高颖主任医师、教授,是她将我们的研究团队带进了中医药研究的973课题,使我们有机会接触、了解和学习到很多中医药方面的科学问题和宝贵的临床资料,使本书所介绍的定性资料统计分析方法在实际临床应用方面如虎添翼、生动活泼,恰似一场及时喜雨。最后,我们感谢直接和间接为此书付出过辛勤劳动的所有同志和朋友!


由于编者水平有限,书中难免会出现这样或那样的不妥,甚至错误之处,恳请广大读者不吝赐教,以便再版时修正。为便于与读者沟通和交流,特呈上我们的电子邮箱地址和有关网址:lphu812@sina.com;www.statwd.com;www.huasitai.com。


胡良平


于北京军事医学科学院


2015年8月14日

上篇 非重复测量设计定性资料统计分析方法


第1章 一维与二维列联表资料的常规统计分析


本章主要内容是用SAS软件实现单因素设计一元定性资料的统计分析。与单因素设计一元定量资料类似,该类资料从设计类型上分为单组设计、配对设计、成组设计、单因素多水平设计。值得一提的是,本章还对基于一个定量诊断指标如何确定最佳的“诊断点”问题进行了详细介绍,此内容就是临床医师常用的“ROC曲线分析”问题,它是四格表资料统计分析方法和诊断指标联合使用的产物。


1.1 单组设计一维表资料总体率的区间估计及其假设检验


1.1.1 问题与数据


【例1-1】 为了调查某工厂产品生产合格率的情况,随机抽取1000件该厂产品进行检验,发现其中978件合格、22件不合格。已知业内相同产品的生产合格率为98%,问该工厂产品合格率是否低于业内平均水平?


1.1.2 对数据结构的分析


例1-1的资料中所有观测对象未按其他因素分组,它们均处在同一个组中,而观测变量是一个二值变量(即“合格与否”)。因此从设计类型角度来看,它属于单组设计一元定性资料。


1.1.3 分析目的与统计分析方法的选择


例1-1的研究的目的是要考察1000件产品所代表的总体与业内相同产品所代表的总体,在产品合格率上的差别是否有统计学意义,由于结果变量是二值变量,所以可以用基于二项分布原理推导出的假设检验方法对数据进行统计处理。


1.1.4 SAS程序中重要内容的说明


分析例1-1的资料所需的SAS程序(程序名为TJFX1_1.SAS)如下:

定性资料统计分析及应用pdf/doc/txt格式电子书下载

【程序说明】 数据步,建立名为tjfx1的数据集,group是分组变量,count是频数变量。过程步,调用FREQ过程,用TABLES语句加变量group表示绘制一维列联表;binomial选项表示按照二项分布原理对统计量进行计算和检验,用“(p=0.98)”指定标准率的大小,最后用WEIGHT语句指定频数变量count。


1.1.5 主要分析结果及解释


group的二项分布比例=1


比例0.9780


渐近标准误差0.0046


95%置信下限0.9689


95%置信上限0.9871


以上给出了group=1,即1000 件产品所代表总体的产品合格率估计值及其95%置信区间,合格率为0.9780,置信区间为(0.9689,0.9871)。


H0 检验:比例=0.98


比例0.9780


H0 下的渐近标准误差0.0044


Z-0.4518


单侧 Pr< Z0.3257


双侧 Pr>|Z|0.6514


以上是进行二项分布检验所得到的结果,其原假设H0是“1000件产品所代表的总体与业内相同产品代表的总体,产品合格率之间无差别”。


根据二项检验结果,Z=-0.4518,P=0.6514>0.05,在检验标准α=0.05条件下,不拒绝原假设,即不能认为两总体的产品合格率差异有统计学意义。因此,可以认为该工厂的产品合格率与业内平均水平基本相同。


1.2 配对设计四格表资料的多种诊断指标的计算和一致性与对称性检验


1.2.1 问题与数据


【例1-2】 设有一种能准确诊断血友病的方法(称为金标准),用它对34名血友病隐性携带妇女和34名健康妇女检测的结果作为标准对照,对每位受试者再用欲比较优劣的试验方法检测。两种方法对每位受试者的样品检测的结果按配对的形式整理成表1-1的形式。

表1-1 试验方法与金标准对血友病的诊断结果

定性资料统计分析及应用pdf/doc/txt格式电子书下载

1.2.2 对数据结构的分析


例1-2的资料是配对设计四格表资料,即同一患者的样品均由两种方法来诊断,且诊断结果是相互对立的两种。整理成这种配对四格表形式,可以直观地看出诊断结果一致和不一致的频数分布情况。


1.2.3 分析目的与统计分析方法的选择


对例1-2的资料进行分析的目的可以有以下三种:其一,描述性统计分析,即计算多种诊断性指标(如敏感度、特异度等12项诊断性指标);其二,考察试验方法检测结果与金标准结果是否一致,需要选用的统计分析方法称为一致性检验或Kappa检验;其三,考察试验方法测定的结果与金标准测定的结果不一致部分之间的差别是否具有统计学意义,从而可以回答试验方法相对于金标准而言,是假阳性错误率高呢还是假阴性错误率高,需要选用的统计分析方法称为McNemar χ2检验。


1.2.4 SAS程序中重要内容的说明


若资料分析目的为前述的第一个,则所需的SAS程序(程序名为TJFX1 2A.SAS)如下:

定性资料统计分析及应用pdf/doc/txt格式电子书下载

【程序说明】 数据步,建立名为TJFX2 A的数据集,通过INPUT语句产生4 个变量去读取4个原始的频数。


若分析资料的目的为前述的后两个,则所需的SAS程序(程序名为TJFX1 2B.SAS)如下:

定性资料统计分析及应用pdf/doc/txt格式电子书下载

【程序说明】 数据步,建立名为tjfx2 B的数据集,通过变量A、B、F分别读入行号、列号、四格表中每个格子中的实际频数。过程步,调用FREQ过程,指定频数变量F,用TABLES A*B语句表示编制二维列联表;AGREE选项是配对四格表输出McNemar χ2统计量的关键选项;TEST KAPPA语句用于对Kappa系数进行假设检验。


1.2.5 主要分析结果及解释


(1)TJFX2A.SAS的输出结果如下:

定性资料统计分析及应用pdf/doc/txt格式电子书下载

(2)TJFX2B.SAS的输出结果如下:


McNemar 检验


统计量(S)


0.1429


自由度


1


Pr > S


0.7055


以上是McNemarχ2检验的输出结果,此处使用的是未进行校正的计算公式,S=0.1429,P=0.7055。


简单Kappa系数


Kappa0.7941


渐近标准误差0.0737


95%置信下限0.6497


95%置信上限0.9385


以上给出了Kappa值及其渐近标准误、95%置信区间的上限和下限。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

H0 检验:Kappa=0


H0 下的渐近标准误差0.1212


Z6.5513


单侧 Pr> Z<0.0001


双侧 Pr>|Z|<0.0001


以上是对原假设“Kappa=0”的假设检验结果,Z=6.5513,P<0.0001。


经McNemar χ2检验,得出试验方法与金标准的测定结果不一致部分的差异没有统计学意义定性资料统计分析及应用pdf/doc/txt格式电子书下载,说明两种检测方法所得结果中不一致部分差异很小。经Kappa检验,两种检测方法所得结果的观测一致率与期望一致率之间的差异有统计学意义,说明两种检测方法所得的结果具有一致性。由于Kappa系数的具体取值为0.7941,其95%置信区间为(0.6497,0.9385),可以认为Kappa值尚属于中等大小,说明两种检测方法的一致性在统计学上有一定意义,但其实际价值是否很高,需要根据专业知识对预期的Kappa值进行界定。


1.3 一种试验方法与金标准比较的诊断试验配对设计四格表资料统计分析与ROC曲线分析


【例1-3】 假定有一组资料,见表1-2。用金标准方法确诊患有RMSF疾病的患者有21例,未患RMSF疾病的其他患者24例。由临床专业知识可知,血钠水平的高低可能与是否患有RMSF疾病有较强的关联性。不仅如此,还得知患了RMSF疾病,其血钠水平有降低的趋势。现在的分析目的是:希望找到血钠水平的合适诊断点(Cut-off Point),据此作出的诊断(即判断受试者是否患了RMSF疾病)结果,以金标准诊断的结果作为参照,具有同时使诊断的灵敏度和特异度都达到相对高的数值,由它们共同决定的Youden指数达到最大值。为实现前述分析目的,第一步需要利用宏程序绘制ROC(Receiver Operation Characteristic,受试者工作特征)或(Relative Operating Characteristic,相对工作特征)曲线(它是结合不同诊断点下所得到的灵敏度和特异度对整个诊断系统进行综合评价的一种方法)并计算ROC曲线下的面积;第二步就是从 ROC 曲线左上角找到最高点,此点的纵坐标数值就是灵敏度,横坐标数值就是1-特异度,此最高点就是基于血钠水平诊断RMSF疾病的诊断点。


【分析与解答】 表1-2可以被视为一个“单因素两水平设计一元定量资料”,通常,采用单因素两水平设计一元定量资料t检验或秩和检验,就可得出两组中血钠的平均值或平均秩之间的差别是否有统计学意义,但这个分析结果对寻找诊断点毫无价值!实现前述分析目的的统计分析方法有两个:采用ROC曲线分析法;采用判别分析法。

表1-2 45例患者的血钠水平

定性资料统计分析及应用pdf/doc/txt格式电子书下载

(1)采用ROC曲线分析法的思路及其SAS实现


将两组血钠值由小到大排序,从最小的数值开始,依次用每个血钠值为假定的诊断点,小于等于此假定诊断点的受试者被判定为“RMSF患者”,否则被判定为“非RMSF患者”,于是就能获得一张类似于表1-1 的四格表。例如,分别以最小值124、大约的中位数134 和最大值143为假定的诊断点,就能获得对应的四格表资料,分别见表1-3~表1-5。

表1-3 以血钠值124为假定诊断点得出试验方法与金标准对RMSF疾病的诊断结果

定性资料统计分析及应用pdf/doc/txt格式电子书下载

表1-4 以血钠值134为假定诊断点得出试验方法与金标准对RMSF疾病的诊断结果

定性资料统计分析及应用pdf/doc/txt格式电子书下载

表1-5 以血钠值143为假定诊断点得出试验方法与金标准对RMSF疾病的诊断结果

定性资料统计分析及应用pdf/doc/txt格式电子书下载

在表1-2 中,不同的血钠数值共有19 个,故可以列出19 张四格表,其中的3 张见表1-3~表1-5。用ROC曲线分析法分析此资料时,所需的SAS程序(程序名为TJFX1 3A.SAS)如下:

定性资料统计分析及应用pdf/doc/txt格式电子书下载

定性资料统计分析及应用pdf/doc/txt格式电子书下载

SAS官方网站提供了“绘制 ROC 曲线”(http://support.sas.com/kb/25/addl/fu-sion25018 4 rocplot.sas.txt)和“用非参数方法比较ROC 曲线下面积”(http://support.sas.com/kb/25/addl/fusion 25017 6 roc.sas.txt)的两个宏程序,前者主要介绍如何快速绘制出比SAS说明文档中更加美观实用的ROC曲线,后者主要介绍如何检验ROC曲线下面积与0.5的差异有无统计学意义。假定这两个程序ROC.SAS和ROCPLOT.SAS分别保存在C盘的ROC文件夹中。


%include宏命令可以将程序 ROCPLOT.SAS 调入本 SAS 程序;在本 SAS 程序中,将rmsf选项中的“1”视为患有疾病,并将绘制ROC曲线所需的数据输出到roc1数据集中,将每个观测值年龄的预测概率数据输出到outp数据集中,并将预测概率命名为phat;对ROCPLOT宏程序,outroc指定的数据集要与proc logistic 的outroc 数据集相同;out 指定的数据集要与proc logistic的output中的out数据集相同;p指定的预测概率的名称要与output中p所命名的名称相同;id标记ROC曲线上的原始数值。


主要输出结果如下:

定性资料统计分析及应用pdf/doc/txt格式电子书下载

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上是第一部分主要输出结果:rmsf=1与rmsf=0分别代表患RMSF疾病与非患此病的人数为21人和24人,且以rmsf=1为拟考察的事件,即采用结果变量为二值变量的一重logis-tic回归模型来拟合此资料,血钠水平是一个定量的影响因素。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上是第二部分主要输出结果:假定血钠水平这个自变量前的回归系数为0,三种假设检验算法得到的χ2 值不尽相同,但对应的P值都小于0.0005,说明血钠水平这个自变量对诊断是否患有RMSF疾病具有统计学意义,即具有一定的诊断价值。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上是第三部分主要输出结果:表明截距(48.5423)和斜率(-0.3625)分别与0比较,差别都有统计学意义,由此结果可以写出一重logistic曲线回归方程如下:

定性资料统计分析及应用pdf/doc/txt格式电子书下载

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上是第四部分主要输出结果:优势比OR=0.696,其95%置信区间为[0.569,0.851]。此值是这样计算出来的:OR=e-0.3625 =0.695934≈0.696,其含义是血钠值每上升1个基本单位,患RMSF疾病的风险是原先的0.696,即风险降低了。若取此数值的倒数定性资料统计分析及应用pdf/doc/txt格式电子书下载1.437,即血钠值每下降1个基本单位,患RMSF疾病的风险是原先的1.437倍,即风险升高了。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上是第五部分主要输出结果:c=0.875就是基于血钠值来诊断是否患RMSF疾病所对应的ROC曲线下的面积。


图1-1是第六部分主要输出结果:将ROC曲线图形绘制出来,其纵坐标为灵敏度(Sensi-tivity)、横坐标为 1-特异度(1-Specificity)。显然,从此图的左上角很难确定何处为“最高点”。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

图1-1 分析例1-3的资料所得到的ROC曲线,曲线下面积为0.875

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上是第七部分主要输出结果:是由logistic过程中model语句中的选项“outroc=”生成的数据集roc1。


第1列“Obs”为编号,共有19 个编号,即原始的血钠值中共有19 个不同的数值,其中,最小值为124,最大值为143。


第2列“PROB”为概率。它是什么事件发生的概率呢?是用左边对应编号的那个血钠值作为假定的诊断点进行RMSF疾病诊断,判断为患此病的概率(例如,Obs=1时,na=124,将其代入前面求出的一重logistic曲线回归方程,得

定性资料统计分析及应用pdf/doc/txt格式电子书下载

与结果中的输出结果0.97317之间的偏差是由于手工计算时每一步保留的小数位数较少产生的累计误差所致。


第3~6列分别代表诊断试验给出的阳性例数、阴性例数、假阳性例数和假阴性例数,与Obs=1对应的4个数1、24、0、20就是表1-3中的4个数;与Obs=10对应的4个数15、19、5、6就是表1-4中的4个数;与Obs=19对应的4个数21、0、24、0就是表1-5中的4个数。


第7列“SENSIT”与第8列“1 MSPEC”分别代表“灵敏度”与“1-特异度”,若分别以每行上的这两个数为纵坐标与横坐标数值,就可在直角坐标系中绘出一个点(即假定的诊断点),依次将上述的19个假定的诊断点绘制出来,再用折线将这些点中相邻的两点连接起来,就得到了图1-1中的“ROC曲线”。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

续表

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上是第八部分主要输出结果:是由每个个体的血钠值代入前述求得的一重logistic回归方程计算出来患RMSF疾病的概率。最后一列与第七部分的第2列是一样的,区别在于第七部分只呈现了19个不同的血钠值,而第八部分呈现了所有受试者的血钠值,因为有些受试者的血钠值相同,总共有45例。


Youden指数=灵敏度+特异度-1=灵敏度-(1-特异度),将上述最后两列同一行的两数相减,就得到各行上的Youden指数值,取其最大值对应那行的血钠数值就是全部假定的诊断点中可以被视为真正诊断点的数值。本例中,不同的血钠值由小到大排序后,第11个值对应的Youden指数=0.60714最大,该值对应的灵敏度=0.85714,发病概率为0.40210(在第七部分中,其变量名为“PROB”;在第八部分中,其变量名为“phat”)。


问题是第11个不同的血钠值在原始数据中究竟是多少呢?在第八部分中不难发现,与phat=0.40210对应的有4行,它们的血钠值na=135。


利用如下的SAS程序(程序名为TJFX1 3B.SAS),可以求出最大Youden指数:

定性资料统计分析及应用pdf/doc/txt格式电子书下载

主要输出结果:

定性资料统计分析及应用pdf/doc/txt格式电子书下载

从这部分结果中最后两个数值可知,最大的Youden指数=0.60714,它位于第七部分中第11个观测值。


【例1-4】 沿用例1-3的资料,检验求得的样本ROC曲线下的面积A=0.875与0.5之间的差别是否具有统计学意义。


【分析与解答】 设实现题中要求的SAS程序(程序名为TJFX1 4.SAS)如下:

定性资料统计分析及应用pdf/doc/txt格式电子书下载

定性资料统计分析及应用pdf/doc/txt格式电子书下载

【程序说明】 两个logistic过程步的model语句等号右边是有明显区别的:第1 个写有“na”,表示用血钠值为定量自变量;而第2 个为空格,表示无定量自变量,等价于只有截距项,其对应的ROC曲线下的面积为0.5。


【主要输出结果】 与前面例1-3中输出结果第1部分到第5部分完全相同的内容从略。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上这部分结果表明:logistic回归方程仅含截距时,其与0之间的差别无统计学意义,此时对应的ROC曲线下的面积为0.5。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上部分中,第1行对应用血钠值为诊断指标求得的ROC曲线下的面积,第2行对应不用血钠值为诊断指标(即仅用截距)求得的ROC曲线下的面积为0.5;同时,还分别给出了它们的95%置信区间。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

这两部分呈现的是两条ROC曲线下面积之差为0.375,其标准误为0.0505,其95%的置信区间为[0.2760,0.4740],检验ROC曲线下的面积0.875与0.5之间的差别是否具有统计学意义采用了χ2 检验,得χ2 =55.0926、df=1、P<0.0001,说明采用血钠值对是否患RMSF疾病进行诊断具有统计学意义。


1.4 两种试验方法与金标准比较的诊断试验配对设计四格表资料统计分析与ROC曲线分析


【例1-5】 利用宏程序比较ROC曲线下面积。采用某种金标准,将45例患者中的21例确诊为RMSF(病例组),其余24例确诊为非RMSF(对照组),分别用两种方法测得血钠水平,如表1-6所示,问这两种方法诊断性能之间的差异有无统计学意义?

表1-6 45例患者的血钠水平

定性资料统计分析及应用pdf/doc/txt格式电子书下载

【分析与解答】 将每种检测方法所测得的每个血钠值为假定的诊断点,就能获得一条ROC曲线,于是,本例就有两条ROC曲线。假设各ROC曲线下的面积分别为A与B,问题是如何检验A与B之间的差别是否具有统计学意义。设分析本例定性资料(强调“是否患RMSF疾病”为结果变量)的程序(程序名为TJFX1 5.SAS)如下:

定性资料统计分析及应用pdf/doc/txt格式电子书下载

定性资料统计分析及应用pdf/doc/txt格式电子书下载

【主要输出结果】 与例1-3输出结果相同的部分,即方法1的结果,从略;与方法2对应的输出结果如下。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上是第一部分主要输出结果。此结果表明,截距(32.1316)和斜率(-0.2418)分别与0比较,差别都有统计学意义,由此结果可以写出一重logistic曲线回归方程如下:

定性资料统计分析及应用pdf/doc/txt格式电子书下载

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上是第二部分主要输出结果:优势比OR=0.785,其95%置信区间为[0.676,0.912]。此值是这样计算出来的:OR=e-0.2418 =0.785213≈0.785,其含义是血钠值每上升1个基本单位,患RMSF疾病的风险是原先的0.785,即风险降低了。若取此数值的倒数,则定性资料统计分析及应用pdf/doc/txt格式电子书下载=1.274,即血钠值每下降1个基本单位,患RMSF疾病的风险是原先的1.274倍,即风险升高了。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上是第三部分主要输出结果:c=0.808就是基于血钠值来诊断是否患了RMSF疾病所对应的ROC曲线下的面积。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上是第四部分主要输出结果:呈现方法1和方法2检测的血钠值分别作为假定的诊断点得到的两条 ROC 曲线下的面积 Area(0.8750 与 0.8075)、Area 的标准误(0.0505 与0.0643)、Area的95%置信区间的(下限,上限)分别为(0.7760,0.9740)与(0.6815,9336)。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上是第五部分主要输出结果:两条 ROC 曲线下的面积之差为 0.0675=0.8750-0.8075,差量的标准误为0.0213,差量的95%置信区间为(0.0257,0.1092)。检验两条ROC曲线下面积之差是否具有统计学意义采用了χ2检验,得χ2 =10.0307,P=0.0015,说明两条ROC曲线下面积之差具有统计学意义。相对于方法2而言,若采用基于方法1检测的血钠值去寻找真正的诊断点(na=135),准确度要高一些。

定性资料统计分析及应用pdf/doc/txt格式电子书下载

以上是第六部分主要输出结果:它已被包含在第五部分输出结果之中。


1.5 配对设计扩大形式的方表资料一致性和对称性检验与Kendall\'s Tau-b秩相关分析


1.5.1 问题与数据


【例1-6】 用快速法和ELISA法对同一批样品进行抗体检测试验,结果见表1-7,问这两种检测方法所得结果是否一致?两种方法检测结果之间是否具有线性相关性?

表1-7 两种测定方法同时检测抗体得到的73个样品的检测结果

定性资料统计分析及应用pdf/doc/txt格式电子书下载

1.5.2 对数据结构的分析


例1-6资料的行变量和列变量性质相同且取值水平和含义也相同,它实际上是配对四格表资料的扩大,设计上属于配对设计扩大形式的方形列联表资料,列联表分类上属于双向有序且属性相同的R×C列联表。


1.5.3 分析目的与统计分析方法的选择


例1-6的主要分析目的通常有以下两个:一是回答两种检测方法的结果是否一致,常用的统计分析方法是一致性检验,即Kappa检验;二是回答两种检测方法的检测结果之间是否具有线性相关性,需要使用Kendall\'s Tau-b秩相关分析。当然,还有一个对称性检验,用SAS进行一致性检验的同时也做了对称性检验。


1.5.4 SAS程序中重要内容的说明


为实现前述的两个分析目的,分析例1-6资料所需的SAS程序(程序名为TJFX1 6.SAS)如下:

定性资料统计分析及应用pdf/doc/txt格式电子书下载

第一个过程步用于进行一致性检验:TEST语句中的KAPPA可以用AGREE代替,输出结果比用KAPPA时多了对加权KAPPA进行假设检验的结果;若没有“TEST KAPPA;”语句,仅在“TABLES A*B;”语句后加上AGREE选项,即写成“TABLES A*B/AGREE;”,则仅输出关于简单和加权KAPPA统计量值、渐近标准误和95%置信区间的下限和上限,不对KAPPA系数进行假设检验;若将现在的TEST语句改成“TEST AGREE;”,可同时输出关于简单和加权KAPPA的统计量值、渐近标准误、95%置信区间以及假设检验结果;若将 TEST 语句改成“TEST WTKAP;”,则可输出关于简单和加权KAPPA的统计量值、渐近标准误、95%置信区间,仅给出对加权KAPPA检验的结果。


第二个过程步用于进行Kendall\'s Tau-b秩相关分析,调用CORR过程,加上选项“KEN-DALL”。


1.5.5 主要分析结果及解释


【说明】 此处省略了对称性检验的结果。


简单 Kappa 系数


Kappa0.6994


渐近标准误差0.0658


95%置信下限0.5704


95%置信上限0.8283


以上给出了简单Kappa统计量值及其95%置信区间。


H0 检验:Kappa=0


H0 下的渐近标准误差0.0699


Z10.0044


单侧 Pr> Z<0.0001


双侧 Pr>|Z|<0.0001


以上部分是对原假设“

....

本站仅展示书籍部分内容

如有任何咨询

请加微信10090337咨询

本站仅展示书籍部分内容
如有任何咨询

请加微信10090337咨询

再显示