文件格式
您为数据使用的文件格式可能会影响您对数据的处理以及数据保存和共享的有效性。在实践中,你对文件格式的选择可能取决于你的学科标准,或者你在NBA投注[手机]俱乐部研究中使用的硬件和软件类型,但你应该尽可能遵循最佳实践原则。
英国数据服务提供关于格式化数据的详细建议,包括保存最佳格式的建议。大学提供建议的文件格式(PDF)存放NBA投注[手机]俱乐部研究数据档案的指导。
专有和开放格式
文件格式可以是专有的,如Microsoft Excel和Adobe PDF,也可以是开放的,如逗号分隔值(CSV)或开放文档格式(ODF)。
数据收集和分析的最佳格式可能不是长期数据保存的最合适格式。专有格式可以提供丰富的高度指定的功能,但可能会限制数据的可用性,并且从长远来看是高风险的,因为它们是商业产品,只能在许可下使用并且容易过时。
开放格式可能缺乏丰富的功能,而且更加通用,但它们提供了高可用性,并且长期风险较低,因为没有许可费用,它们的规范是公开的,并且可以由多个软件包呈现。
工作格式和保存格式
对于日常工作,使用适合你的NBA投注[手机]俱乐部研究小组目的和可访问的文件格式。例如,您可以使用Microsoft Excel进行定量数据分析和可视化。
为了长期保存,在可能的情况下,应该以开放或广泛使用的格式存储数据,并在必要时计划从专有格式进行转换。有关下列格式的详细信息,请参阅国会图书馆的格式评估。
合适的保存格式可能是:
- 开放格式,如用于表格数据的CSV、用于文本和文档的ASCII文本(.txt)和PDF/A、用于结构化机器可读信息的带有适当文档类型定义(DTD)的XML、用于图像的JPEG、用于音频的FLAC和用于视频的MPEG-4。这一类包括在文本文件中编码的自描述格式,其中文件包含一个标题,其中包含有关文件主体中报告的变量的信息:示例包括气候系统模型中使用的NetCDF格式,以及表示核苷酸或肽序列的FASTA格式;
- 广泛使用的专有格式,例如用于表格数据和数据库的MS Excel和MS Access,用于文本的MS Word,用于图像的未压缩TIFF 6.0,以及用于音频的MP3或WAV。
例如,可以保留专有格式的原始仪器数据,但也可以或转换为ASCII/CSV格式,以便更广泛地访问;在专有软件(如MATLAB或SPSS)中分析的数据,应以用户无需软件许可即可访问的格式保存。
在某些转换中,您可能会失去丰富的功能和格式,但从长远来看,您有更大的机会保留内容的完整性。如果专有格式提供的更丰富的特性为您的数据增加了价值,那么您也可以始终以该格式保留数据。流行的格式,如Adobe PDF和微软应用程序的格式可能会持续许多年。
图像和视听文件可能需要保存在信息最丰富的级别,以便支持今后的使用,但也可能需要考虑可用性的实际问题。例如,未压缩的TIFF文件将保留最高级别的信息;相比之下,有损压缩格式(如JPEG)虽然保留的信息较少,但具有实际的好处,因为文件大小更小,在线服务速度更快。
NBA投注[手机]俱乐部研究软件
使用开放编程语言(如Python和R)来处理和分析数据比“点击式”专有软件具有功能优势,而且本质上是可复制的。
例如,要对你的数据进行统计分析,你可以使用SPSS,这是一种专有软件,需要许可证。因为操作是通过与图形用户界面交互来执行的,所以没有可以自动执行的操作脚本。任何想要复制你的分析的人都需要访问SPSS,导入你的数据,并根据你提供的信息重建分析。
如果您使用的是免费的编程语言R,那么您可以在不访问专有软件的情况下进行分析,并且您将能够通过将脚本保存到文本文件中来保留完整的分析工作流。你或任何拥有这些脚本的人都可以通过执行代码来重新运行完全相同的分析;因为分析是自动化的,所以它可以保证是可重复的。因为运行分析不需要软件许可证,所以它也是一种更透明的方法。
推荐的档案格式(PDF)