基于回归分析的心脑血管中药复方有效专利影响因素研究(2)
1.3.3数据清洗 数据清洗又称数据规范,是影响专利分析效果至关重要的一步,即对已经检索到的专利文献进行相关性筛选,符合条件的数据纳入分析数据集。前期的检索为逐项进行,优点是保证了数据的查全率,不足之处在于检索到的文献有一些是重复的,还有一些与本研究相关性不大,为了保证数据的查准率,需要对已经检索到的数据进行清洗,即将检索到的专利文献再次筛选,与本研究相关的文献保留,不相关的删除。1.3.4生成样本空间 清洗之后获得的数据生成本研究的样本空间。
1.3.5数据库的建立 使用Excel程序将选定的中药复方心脑血管专利文献有效记录建立数据库,共设置5个自变量:第1个为虚拟编码变量,描述专利权是否转让,编码1表示转让,编码0表示未转让,变量名为transfer;第2个自变量为数值变量,表达专利的从属权利要求数量,以“项”为测量单位,变量名为appurtenant claim;第3个自变量是虚拟变量,描述专利申请书中是否提供了详细的药理、药化等实验数据,分别以编码1和0代表提供与否,变量名为experimental data;第4个自变量是体现专利文件中有无创新剂型的虚拟变量,同样以编码1和0表示有无,变量名为new way;第5个自变量是数值变量 ......
您现在查看是摘要页,全文长 4768 字符。