雷丁大学的cookie政策

我们在reading.ac.uk上使用cookie来改善您的体验,监控网站性能并为您量身定制内容。

请阅读我们的cookie政策,了解如何管理您的cookie设置。

组织数据

实施一个合乎逻辑和一致的系统来组织你的数据文件,可以让你和其他人有效地找到和使用它们,并有助于保持数据的完整性。

数据组织有三个主要要素:

  • 档案系统;
  • 文件命名规则;
  • 版本控制策略。

下面将讨论这些元素。在考虑如何整理个人资料时,请谨记以下原则:

  • 如果现有的惯例和程序满足你的需要,就使用它们。你的NBA投注[手机]俱乐部研究小组或实验室可能已经有了标准的协议。
  • 确保参与项目的每个人都了解并遵守政策。如果不遵守策略或不一致地应用策略,它就没有什么价值。
  • 不断审查你的政策和做法。不要把未分类的文件挂在顶级文件夹下;定期清理和整理文件夹,删除多余的文件。
  • 您可能想要维护一个保留计划,为指定的文件保留和审查周期。如果您正在收集个人数据,则这一点尤为重要,因为这些数据需要在不再需要时合法处理并安全地销毁。一个简单的电子表格可以用作保留时间表。

这些原则适用于任何形式的信息,无论是物理的还是数字的。

下面的指南主要是针对数字信息的存储。有关良好实践的进一步信息,请参阅英国数据服务和麻省理工学院图书馆的数据组织指南。

文件系统

使用逻辑的、分层的文件夹结构来存储文件,按类别对文件进行分组,并从广泛的高级类别下降到这些类别中的更具体的文件夹。没有唯一正确的方法;重要的是,结构要合乎逻辑、易读,并且对其目的有意义。例如,您可以根据任务(例如,工作包,实验)将文件组织到文件夹中,然后是重要的定义属性(例如,位置,样本数,运行,公司名称)或数据类型(例如,原始,处理,最终)。您可能会有单独的高级文件夹来存放数据、管理文档、出版物等。

不要让你的文件夹结构变得太复杂,避免在你的层次结构中有太多的层(三层很舒服;理想情况下,最多不超过四个)。

机密信息,例如参与者记录,应该存储在单独的文件夹中,并具有适当的访问控制。大学网络上文件共享的所有者可以管理对文件共享及其中的文件夹的个人访问权限。有关更多信息,请参阅IT指南(需要登录)。

原始数据和里程碑文档版本应该保存为只读文件,最好保存在单独的文件夹中。如果需要帮助管理文件权限,请联系IT部门。

文件命名

智能地使用文件命名使您和其他人能够轻松地识别文件的内容,并可用于组织和版本控制文件。无论您存储的是数字材料还是物理材料,这个原则都适用。如果您正在生成大量文件,例如通过某些自动化过程,那么它可能非常重要。

你不必强迫所有的文件都有一个严格的约定,但是如果你采用一些基本的标准,它们会帮助你找到和组织文件。例如,通过始终以YYYMMDD格式写入日期,您将能够按时间顺序对文件进行排序。以下建议可以帮助您开发一个可服务的文件命名协议:

  • 使用简短但有意义的文件名,使用有意义的元素,例如ABCProject_Interview_P012_2014-06-18(其中P012是参与者的ID号)。您应该能够通过查看文件名来判断文件中的内容。您可能使用的一些属性包括:项目标识符、数据收集方法或工具、数据类型、位置、主题、日期、版本号。
  • 不要让文件名太长(32个字符应该是最大的)。避免在文件名和文件路径中出现冗余信息。
  • 避免文件名中出现空格;您可以使用_或-来分隔元素,或者使用CamelCase将它们一起运行。
  • 考虑文件的排序顺序,因为这将有助于识别和检索。文件将根据文件名中使用的字符类型进行排序,首先是特殊字符(例如@),然后是数字,然后是字母字符。例如,文件dataffile .txt,如果重命名,将按以下顺序排序@ _dataffile .txt, 001_dataffile .txt, 20190731_dataffile .txt。
  • 将日期从较大的单位反向写入较小的单位(例如20140618)以按时间顺序排序;使用前导零编写数字(例如001,002等,而不是1,2等)以数字排序;
  • 在相关的文件名中嵌入版本控制:日期和时间或版本号将能够准确识别当前和以前的文件版本。

版本控制

版本控制或版本控制是一种记录一个文件或一组文件随时间变化的系统。在处理数字物品时,这一点很重要,因为它很容易修改。如果你在一个NBA投注[手机]俱乐部研究小组中工作,并且彼此之间共享和修改文件,这是必不可少的。由不同的人修改的文件的不受控制的版本很容易激增,导致您无法跟踪数据及其所经历的转换。在最坏的情况下,这可能危及数据的完整性—例如,如果原始数据文件被覆盖。

您可以做一些简单的事情来实现有效的版本控制。并非需要使用以下所有选项。这取决于工作的性质和数据所经历的过程。有关版本控制的更详细指导可从英国数据服务获得。

  • 只允许授权用户修改文件。对文件/存储区域使用访问控制和读/写权限,以限制只有授权用户才能修改文件。
  • 原始数据文件、文件的主版本和里程碑版本应该是只读的,并在指定的权限下存储在单独的指定地点。
  • 将非当前版本的文件存储在单独的文件夹中。您可能不需要保留所有旧版本的文件,但保留里程碑版本或旧主文件可能是一个好做法;
  • 使用Dropbox或谷歌Drive等文件共享服务来同步存储在多个位置的文件版本,或使用版本控制软件,例如Subversion (SVN)、MS SyncToy;
  • 在文档中的版本控制表中记录更改。这应该包含版本号,作者,目的/更改和日期的标题;
  • 使用文件名来标识版本,例如draft, final, v_001。
联系我们

罗伯特·达比,NBA投注[手机]俱乐部研究数据经理

researchdata@reading.ac.uk

电话:0118 378 6161