计算机在数据管理和统计分析上的应用
作者:蒋京伟 李雅珍
单位:蒋京伟 李雅珍(北京市计划生育技术研究指导所 北京100006)
关键词:
990339
伴随着科技领域的迅速发展,对计算机应用的范围也与日剧增,计算机已广泛应用于医学领域,它为大量的资料信息存贮、复杂的统计整理与计算分析等提供了极大的方便,它以高速、准确、灵活方便的运算,在数据管理和统计分析中显示出了广阔的应用前景。本文拟对计算机在医学领域中应用SPSS/PC+软件对各种资料的管理及统计分析作一详述。
1 系统运行环境
IBM/PC,IBM PC/XT或IBM PC/AT等个人计算机或其它与IBM 100%兼容的微型机;10M或10M以上硬磁盘;一个或一个以上软盘驱动器;384K以上RAM;一台彩显或具图形功能的单显、打印机、键盘及其它外设;DOS2.0及其以上版本;统计分析软件SPSS/PC+。
, 百拇医药
2 系统功能
2.1 建立数据文件
应用SPSS/PC+所提供的DATAENTERⅡ软件模块定义数据文件。
① 定义变量 即给变量起名,说明变量的性质(字符型、数字型及小数点位数等)。
② 变量标签 写变量标签的目的是便于在以后的输出结果时清晰,在需要长久保留的资料中也常常写入变量标签。
③ 变量值标签 是对每一个变量值做详细说明。
定义数据文件结束,则可用来存放随后要输入的数据,在此文件中,包括用户定义的许多变量。
2.2 数据的输入
, 百拇医药 数据的输入有两种格式。一种是类似DBASEⅢ的格式,即每屏显示一个记录,逐项输入该记录中的各数据项;另一种是类似Lotus1-2-3的电子工作表形式,屏上显示多个记录,每个记录占一行,每个数据项占一列,两种输入格式可以随时切换,视自己使用方便而定,在输入过程中备有输入查错提示。
2.3 对数据进行逻辑检查
数据输入过程中难免由于输入人员的手误造成数据错误,对数据作逻辑检查有两条途径。
① 频数检查:用Frequency命令对每一个变量做频数,通过频数表即可发现不合理的变量值。
② DEⅡ检查:将系统文件读入DE,在DE的Rule Range中编写变量值的范围,然后执行Cleaning, DE可将不符合Rule Rang的例号打印出来,根据打印的号码即可找到相应的case并加以修改、删除、插入、查找、追加记录等操作。
, http://www.100md.com
2.4 提供方便的操作
① 对输入数据自动进行合理性与一致性检验,检验的条件可以由用户设定。
② 跳跃输入和自动填充输入功能。系统可以按用户的定义在输入数据时自动跳过某些数据项,或者在输入某些数据时自动填充其它有关的数据项,这可以使数据输入的速度加快并减少输入中的差错。
③ 数据交换。可以很方便地与编辑软件、展页软件、数据库软件和其它许多统计应用软件等进行转换,方便用户。
2.5 数据处理
为了使数据符合我们统计计算的要求,常常需要对变量作重新定义,即建立新变量,常用的命令是Compute,另外Select IF作为逻辑选择,使得数据的处理非常灵活,RECODE对变量值进行重新划分。
, http://www.100md.com
2.6 统计分析
① 频率分布是最常用的统计分析命令之一,因为研究统计数据的总体分布特征是统计分析的一项重要的内容。
② 描述统计量和频率分布在执行过程中是密切相连的。其作用是在计算过程所需要的统计量除中位数及众数外,可用简短易读的表式列出结果,使人一目了然。
③ 应用交叉表作两个或两个以上的变数在分项不多的情况下的联合分布,分布表测验两变数的相互联系的程度是否显著。
④ 检验来自正态总体的均值之间是否有显著性差异用独立样本检验过程。检验两样本来自的正态总体的平均数之间是否有显著性差异用配对样本检验过程。
⑤ 应用单向分类方差分析测试一种标志分组对象在同一事物上的表现是否有显著性差异。但要求变量(各因素)所取的各水平都可以人为控制,如难以控制这些因素的影响,为使分析得出正确的结论,可以使用协方差分析。
⑥ 偏态分布可采用中位数进行统计。
3 结束语
应用计算机进行数据管理和统计分析的特点是操作简单,使用灵活,可以随心所欲地对数据进行转换、挑选、剔除、修改、插入及查找等,可靠性强,对数据可进行合法性、一致性检查,确保数据的准确。
收稿日期:1999-01-27, 百拇医药
单位:蒋京伟 李雅珍(北京市计划生育技术研究指导所 北京100006)
关键词:
990339
伴随着科技领域的迅速发展,对计算机应用的范围也与日剧增,计算机已广泛应用于医学领域,它为大量的资料信息存贮、复杂的统计整理与计算分析等提供了极大的方便,它以高速、准确、灵活方便的运算,在数据管理和统计分析中显示出了广阔的应用前景。本文拟对计算机在医学领域中应用SPSS/PC+软件对各种资料的管理及统计分析作一详述。
1 系统运行环境
IBM/PC,IBM PC/XT或IBM PC/AT等个人计算机或其它与IBM 100%兼容的微型机;10M或10M以上硬磁盘;一个或一个以上软盘驱动器;384K以上RAM;一台彩显或具图形功能的单显、打印机、键盘及其它外设;DOS2.0及其以上版本;统计分析软件SPSS/PC+。
, 百拇医药
2 系统功能
2.1 建立数据文件
应用SPSS/PC+所提供的DATAENTERⅡ软件模块定义数据文件。
① 定义变量 即给变量起名,说明变量的性质(字符型、数字型及小数点位数等)。
② 变量标签 写变量标签的目的是便于在以后的输出结果时清晰,在需要长久保留的资料中也常常写入变量标签。
③ 变量值标签 是对每一个变量值做详细说明。
定义数据文件结束,则可用来存放随后要输入的数据,在此文件中,包括用户定义的许多变量。
2.2 数据的输入
, 百拇医药 数据的输入有两种格式。一种是类似DBASEⅢ的格式,即每屏显示一个记录,逐项输入该记录中的各数据项;另一种是类似Lotus1-2-3的电子工作表形式,屏上显示多个记录,每个记录占一行,每个数据项占一列,两种输入格式可以随时切换,视自己使用方便而定,在输入过程中备有输入查错提示。
2.3 对数据进行逻辑检查
数据输入过程中难免由于输入人员的手误造成数据错误,对数据作逻辑检查有两条途径。
① 频数检查:用Frequency命令对每一个变量做频数,通过频数表即可发现不合理的变量值。
② DEⅡ检查:将系统文件读入DE,在DE的Rule Range中编写变量值的范围,然后执行Cleaning, DE可将不符合Rule Rang的例号打印出来,根据打印的号码即可找到相应的case并加以修改、删除、插入、查找、追加记录等操作。
, http://www.100md.com
2.4 提供方便的操作
① 对输入数据自动进行合理性与一致性检验,检验的条件可以由用户设定。
② 跳跃输入和自动填充输入功能。系统可以按用户的定义在输入数据时自动跳过某些数据项,或者在输入某些数据时自动填充其它有关的数据项,这可以使数据输入的速度加快并减少输入中的差错。
③ 数据交换。可以很方便地与编辑软件、展页软件、数据库软件和其它许多统计应用软件等进行转换,方便用户。
2.5 数据处理
为了使数据符合我们统计计算的要求,常常需要对变量作重新定义,即建立新变量,常用的命令是Compute,另外Select IF作为逻辑选择,使得数据的处理非常灵活,RECODE对变量值进行重新划分。
, http://www.100md.com
2.6 统计分析
① 频率分布是最常用的统计分析命令之一,因为研究统计数据的总体分布特征是统计分析的一项重要的内容。
② 描述统计量和频率分布在执行过程中是密切相连的。其作用是在计算过程所需要的统计量除中位数及众数外,可用简短易读的表式列出结果,使人一目了然。
③ 应用交叉表作两个或两个以上的变数在分项不多的情况下的联合分布,分布表测验两变数的相互联系的程度是否显著。
④ 检验来自正态总体的均值之间是否有显著性差异用独立样本检验过程。检验两样本来自的正态总体的平均数之间是否有显著性差异用配对样本检验过程。
⑤ 应用单向分类方差分析测试一种标志分组对象在同一事物上的表现是否有显著性差异。但要求变量(各因素)所取的各水平都可以人为控制,如难以控制这些因素的影响,为使分析得出正确的结论,可以使用协方差分析。
⑥ 偏态分布可采用中位数进行统计。
3 结束语
应用计算机进行数据管理和统计分析的特点是操作简单,使用灵活,可以随心所欲地对数据进行转换、挑选、剔除、修改、插入及查找等,可靠性强,对数据可进行合法性、一致性检查,确保数据的准确。
收稿日期:1999-01-27, 百拇医药