| Forms | Policies & Procedures | Usage Policy
Digital Preservation Banner

Policy

365bet中文档案和特别收藏致力于数字资产的负责任和可持续管理.

  1. 数字保存是一个新的领域,最佳实践和国际标准仍在不断发展. 365bet中文档案和特别馆藏的长期数字保存政策是基于开放档案信息系统(OAIS)参考模型ISO 14721:2003.
  2. 将尽一切努力保存提交给365bet中文档案和特别收藏的数字格式. When submitting, 我们建议遵循我们推荐的文件格式指南,以方便长期保存.
  3. 365bet中文档案和特别收藏将提供长期访问提交的作品, 除了关联的描述性和管理元数据之外, 通过结合以下内容的综合策略:
  • Secure Backups
  • 存储介质刷新(将数据从一个存储介质复制到另一个存储介质)
  • File Format Migration

目前,365bet中文档案和特别收藏致力于保存比特流(二进制数据)。. 在资源允许的情况下,将保持功能和外观.

  1. 提交给365bet中文档案和特别收藏的作品将被分配一个 persistent URL if applicable.
  2. 将每年审查这项政策和其他与保存有关的活动,以确保随着技术和机构实践的发展采用最佳做法和技术.

 Digital Donations

365bet中文档案和特别收藏对365bet中文历史相关的所有数字材料感兴趣. 当地和地区历史也是我们收藏的重点. Photographs, videos, pdfs, word documents, lesson plans, emails, 甚至整个硬盘都是我们数字保存计划的可行资源. 捐赠给我们的数字资产将按照LOC标准进行处理,以确保具有历史意义的出生数字记录的长期生存.  如果你有兴趣为我们的数字保存项目捐款, 请bet365亚洲官网或发邮件给达拉斯A. Suttles at dasuttles@shicel.com

Best Practices

国会图书馆-个人数字档案资源

File Naming Conventions

365bet中文档案和特别收藏推荐以下文件命名指南.

Rule 1. 不要在文件名中使用特殊字符. Including: /:\*?”<>|(){}[]&,.$, etc…

以上字符在各种电子环境中使用. For example, 正斜杠标识Microsoft产品中的文件夹级别, while macs use the colon. 句点用于表示文件格式. 避免使用这些可能导致文件丢失或错误的字符.

Rule 2. 使用下划线和连字符代替空格.

空格在web环境中显示为%20,可能导致链接中断和错误. 使用下划线分隔文件名中的主题、描述和其他字段. 用连字符代替空格来连接单词.  Examples:  VSU File Naming Guide.docx变为VSU%20 File%20 naming %20 guide.docx. Instead try: vsu_file-naming-guide.docx. 

Rule 3. Use lower case letters only.

某些操作系统和电子环境区分大写字母和小写字母. 作为预防措施,请只使用小写字母.

Rule 4. File names should be short. Err on the side of brevity.

长文件名与旧的遗留系统不兼容. For example, 标准光盘上的文件长度最多为8个字符, including the extension.  Additionally, 将数据传输到另一个目录时, 整个文件路径被计算到文件名中. With exceptionally long names, deep in a directory, 如果文件长度超过256个字符,则不允许移动或传输, including their file path. 一般来说,25个字符就足够了. 请记住,文件名不必过于描述性,这就是元数据的作用.

注意:在适用的情况下,始终使用三个字母的扩展名. For example .tiff should be .tif.

Rule 5. File names should be unique to an object*.

当对象从其目录中复制时,应该根据其自身的优点来识别它们. 例如,如果tiff文件在ms54//folklife/turpentine/images/0001.tif and ms899/photos/france/0001.如果从它们的目录中取出,它们将看起来相同,并可能提示覆盖. 命名这些文件的正确方法是ms899_photos_germany_0001.或表示这些字段的字母数字代码. [*注:数字对象可以由多个文件组成. See below.]

具有多个格式版本的记录 同一对象的多个文件格式应该具有相同的名称. For example, pc1928_p082.tif, pc1928_p082.pdf, and pc1928_p082.TXT都表示相同的数字对象. 第一个文件是主tif文件, a pdf for access and usage, 以及具有以UTF-8编码编写的ocr数据的纯文本文档.

如果一个项目有多个数字对象, 比如一张照片的正面和背面, 使用字母数字系统来区分有关联的对象. For example ms899-f101_001a.tif and ms899-f101_001b.tif.

Rule 6.  包括日期和格式一致.

Use the international standard – ISO 8601 to display dates. Either YYYY-MM-DD or YYYYMMDD. 这种格式允许简单的排序,并且可以区分同一记录的不同版本, 例如,在草案和最终文件之间. 您可以将日期添加到文件名本身,或者只添加元数据. 如果您不确定具体日期,请使用1月1日作为默认日期.

Rule 7.  Be Consistent.

Abbreviations, date formats, 其他关键信息应该由部门内的所有数字资产创造者达成一致并加以利用. 跟踪这一点的一个简单方法是创建“自述”.Txt”文件放在文件夹中,解释使用的命名格式-如果不清楚的话.

Rule 8.  Metadata

365bet中文档案和特别收藏强烈建议在你的文件中嵌入元数据. 这很容易做到,在Windows中右键单击文件,选择“属性”,在字段中输入信息并应用. 您可以一次选择多个文件,以加快过程. 此外,在大多数文件创建软件中,“属性”可以在“文件”菜单下找到.  最少要有作者、标题、日期和主题.


 

Subjects and Keywords

365bet中文档案和特别收藏建议遵循 国会图书馆主题标题 list (LCSH) when possible. For photographs, the IPTC Metadata Taxonomies for News is recommended in addition to LCSH. For Geographical locations the 盖蒂地名词典 (TGN) schema should be followed.  学术和大学相关的关键字可以在 在大学档案中使用的同义词典. Abbreviations can be found at http://www.abbreviations.com/.


 

File Formats

File Format Guidelines
Type Access Copies Archival Masters
Textual .pdf, .docx, .csv, .xml, .html, .epub, .mobi .pdf (pdf/a), .odt, .ods, .odp, .xml, .txt (UTF-8),  .oebps
Images .jpg, .png, .svg .tif (Revision 6.0) (LZW Lossless Compression)
Audio .mp3 (320 Kbs, 16-bit) .wav (uncompressed)
Video .mp4 (H.264), .avi, .mov, .mpeg2, . mpeg4 (AAC Audio Encoding)

美国国会图书馆数字格式规划的可持续性

Textual

  • PDF/A 长期保存基于文本的数字对象的首选存档格式是什么. 
  • CSV(和TSV)用于将元数据导入/导出到数据库中.
  • 除PDF/A外,还应使用Open Office格式. 像Microsoft Word或PowerPoint这样的专有文件格式应该被Archive的员工标准化为开放的办公格式.
  • 文本文档应用于库存表、查找辅助工具、OCR输出和注释. 文本文档并不安全,但它们比其他格式更能保证长期的可访问性.
  • XML文档将用于管理和导出具有结构标记的文本对象的元数据. XML允许广泛的自定义,以便来自Dublin Core的元素, PREMIS, MODS, EAD, 和met都可以纳入这个结构.

Audio

  • 音频偏好:24位,高KHz,线性PCM,高数据速率(320kbs). 只对创作者/内容必要时才编码环绕声.

Video

视频的比特流编码(涉及清晰度和保真度)

•较大的图片尺寸优于较小的图片尺寸. 图片大小以水平线和每行样本数表示, 或者作为水平和垂直像素计数.

•高清晰度的内容比标准清晰度的内容更受欢迎, 假设图片大小相等或更大.

•更高的比特率(通常表示为 kilobits or megabits per second)优先于较低的相同压缩方案.

•环绕声编码只有在符合创作者意图时才有必要. 在其他情况下,立体声或单声道是首选.

Normalization and Migration

365bet中文档案馆和特别馆藏将把提交给他们的数字资产标准化为上述格式,如果他们还没有. 原件将保留并标记以进行散列检查. 如果这些格式在使用中贬值,档案馆将迁移到较新的文件格式,尽可能减少视觉影响.

File Compression

ZIP Files:该格式是为跨平台数据交换和一组相关文件的高效数据存储而设计的. ZIP_PK是一个事实上的行业标准,由 PKWARE. 该格式的原始版本是由Phil Katz开发的(因此PKWARE中的“PK”)。. ZIP_PK combines data compression, file management, 以及可移动存档格式的数据加密. ZIP_PK已被用作其他格式规范中的打包或容器格式.  You can use zip files to:

  • 将文件组合成一个单元
  • 加密(密码保护敏感信息)
  • CRC-32验证(验证数据完好无损)
  • Software: 7zip, WinRAR   - Windows 7 & 8建立了一个内置的文件压缩,(How? Right-click on a file or folder, select "Send to -> Compressed (zipped) folder." )
  • 注意:在创建zip文件时,使用LZMA(无损)压缩或Deflate. (Windows does so by default.)

 


Sources

东北文献保护中心“NEDCC数字保护政策模板”

科罗拉多大学数字图书馆元数据最佳实践,版本1.0

德克萨斯大学图书馆,“数字存储库保存政策”."

Library of Congress, 个人数字档案的观点:国家数字信息和保存计划," 2013.

The Library of Congress: DPOE - www.digitalpreservation.gov


Additional Resources

保护照片、文件和其他文件免受自然破坏