数据选择
在开始保存和共享数据之前,您需要确定需要保存的内容。你不太可能需要保存你在NBA投注[手机]俱乐部研究过程中收集或创建的所有数据。因此,您需要选择有价值的数据,并处理其余的数据。
对您的数据进行系统的价值评估,以帮助您对保存什么做出明智的决定,这是很有用的。我们在数据选择和评估清单(PDF)中提供了一套评估标准。本文件旨在供大学NBA投注[手机]俱乐部研究数据档案的潜在存款人使用,但评估标准适用于任何保存选择活动。它们基于NERC数据价值清单中提供的标准,NERC资助的NBA投注[手机]俱乐部研究人员应使用该标准。数字策展中心提供了更详细的评估和选择NBA投注[手机]俱乐部研究数据的指南。
下面是在考虑选择保存数据时需要考虑的一些关键因素。
验证已发表的NBA投注[手机]俱乐部研究结果
需要哪些数据来验证公开记录的NBA投注[手机]俱乐部研究结果,例如通过发表在NBA投注[手机]俱乐部研究文章或包含在博士论文中?测试数据、失败的实验结果和来自故障仪器的数据显然是处理的候选者。处理中间阶段的数据通常是多余的,因为保存原始数据和将它们从一种状态转换为另一种状态的处理记录更为重要。以最终处理格式保存数据可能也很有用。请记住,用于生成、处理和分析数据的代码文件可能构成验证结果所需材料的一部分。
价值
数据的内在价值是什么?例如,环境数据就其时间和地点而言是独一无二的,作为历史记录的一部分具有内在价值。如果这些东西丢了,就再也找不回来了。实验原则上可以重复,数据也可以重现,尽管这样做的成本可能很高。
数据对于其他利益相关者的重用也可能具有特定的价值,例如,因为它们对NBA投注[手机]俱乐部研究有用,或者因为它们可以在产品或服务中重复使用。
体积
一些NBA投注[手机]俱乐部研究可能会产生大量的数据,在100千兆字节(GB)或几兆兆字节(TB)的规模。在这些规模上产生数据的NBA投注[手机]俱乐部研究的例子可能包括大规模高分辨率成像和视频记录,以及复杂系统的计算机模拟,其中原始输出可以达到TB。许多数据存储库没有能力处理非常大的数据集。这种规模的数据的储存、保存和转移带来了技术和财政方面的挑战,以致有意义地保存和分享这种数据产出的成本可能超过任何可能的好处。特别是在计算机模拟的情况下,保留单个输出可能不如保留模型代码和输入参数重要,通过模型代码和输入参数可以再现一组结果。
资助者认识到,某些数据的可保存性可能存在实际限制。UKRI承认,“在某些情况下,保存NBA投注[手机]俱乐部研究数据可能是不可能的或不符合成本效益的。”这将取决于数据的类型和规模,它们在验证已发表结果中的作用,以及它们对进一步NBA投注[手机]俱乐部研究的预期长期有用性”(见《数据政策共同原则》指南,第4页)。
即使在不希望或不可能在数据存储库中存储大量数据输出的情况下,您可能仍然希望保留它们,以供您自己持续使用,和/或能够应请求与他人共享。在这种情况下,您需要将数据存储在个人存储解决方案中(具有适当的备份),并将其注册到University Archive中,以便其他人可以找到关于它们的信息并如何访问它们。有关更多信息,请参阅在何处存档数据的网页。
不能共享的数据
在哪些数据可以共享方面是否存在法律/道德/合同限制?在许多情况下,这并不意味着数据根本不能共享。数据可能需要编辑,例如删除机密或商业特权信息,或者可能需要以某种方式限制访问这些信息。
作为一般规则,您应该只保留匿名数据。例如,你可以保留匿名的笔录,但处理原始的采访录音;您可以保留来自观察性NBA投注[手机]俱乐部研究的匿名定量数据,但不会记录可能识别个体参与者的数据。
如果机密信息或个人数据不能从数据中删除(例如生物特征数据),或者由于披露而造成损害或困扰的风险很大,则可以使用封闭存储以限制访问的方式保存数据。一些数据存储库,例如英国数据服务ReShare存储库,欧洲基因组-表型档案,可以管理对敏感/机密数据的受控访问。该大学的NBA投注[手机]俱乐部研究数据档案也可以提供限制访问选项。如果您想讨论这个问题,请联系我们。
资料选择及评估核对表(PDF)