质量控制
质量控制对于保持数据的完整性和可行性至关重要。从收集点开始,对数据执行的每个操作都有可能引入错误。因此,您必须实现过程,以减少在数据中引入错误的风险,并在错误发生时减轻错误的影响。
可采用多种质量控制策略:
- 映射从收集点到最终格式数据集的整个数据工作流,并将其分解为对数据执行的操作(参见下面的示例)。对于每项措施,确定要应用的质量控制程序。确保质量控制程序得到一致执行,并在相关的地方形成文件。
- 确保操作是可逆的。不要覆盖原始数据;用新名称保存修改后的文件,最好在文件名中使用版本号或日期,以便明确版本标识。
- 标准化并记录你的工作流程,这样其他人就可以遵循你的指示并获得与你相同的结果,例如,通过为数据收集编写一步一步的协议,或为格式化和匿名化采访记录编写指导方针。遵循相关的既定程序,如实验室标准操作程序:这些已经过尝试和测试。
- 如果你正在进行实验科学NBA投注[手机]俱乐部研究,考虑使用在线工具,如协议。它允许您记录、注释和发布有关实验过程的详细信息。您可以在版本控制过程中开发和注释您的协议(在封闭的组中或在公开的组中),并且可以为发布的版本分配doi并从论文的方法部分链接。
- 提前定义数据结构和数据收集表单或模板。例如,建立一个电子表格,在列标题中清楚地标记变量,包括度量单位。在单独的工作表或文档中提供数据输入说明。您的文档应该包括变量的完整定义,以及关于给定变量允许的值的信息(包括缺失的值代码)。
- 利用软件中的任何数据验证功能,例如Excel允许您指定单元格或单元格范围的允许值。
- 重复录入数据和随机抽样检查等方法可以减少误差的发生。
- 检查数据是否有意义。数据可视化可以帮助识别可疑的异常值和异常:趋势线中有一个明显的峰值可能会突出一个可疑的值。
英国数据服务提供质量控制方面的指导。
示例数据工作流
联系我们