简介
文档模式是元数据结构的最高级别。它们允许库管理员控制添加到库的文档或文件。文档模式是将文件分组在一起的一种方式,即使它们在整个库中不同地方进行归档。文档模式管理如何将文件添加到库中,并通过元数据收集有关它们的信息。将文件添加到系统时,用户将使用“文档模式”字段选择与文档关联的模式。所选择的模式将确定所需的元数据和元数据将采用的格式。文档模式也指用于指定IE的页面排版引擎(Trident)以哪个版本的方式来解析并渲染网页代码。切换文档模式会导致网页被刷新,但不会更改用户代理字符串中的版本号,也不会从服务器重新下载网页。切换浏览器模式的同时,浏览器也会自动切换到相应的文档模式。文档模式在在计算机有着广泛的应用,特别在浏览器中,我们常见文档模式有HTML文档模式,XML文档模式。
管理功能文档模式管理以下文档功能:
常规 - 设置模式名称,格式和文档编号约定。
模式成员资格 - 定义哪些组可以访问此模式。
元数据 - 定义应用于文档的元数据字段。
工作流程 - 为属于此架构的文档设置审核和审批流程。
信使 - 将文件发送给外部个人或内部FileHold用户查看和批准。
自定义命名 - 为文档设置命名约定。
自动归档 - 定义库中的目标文件夹。
事件计划 - 确定何时将文档转换为记录,存档或删除文档。
DB查找 - 对模式中的所有元数据字段执行数据库查找。1
文档模式定义语言文档模式定义语言(DocumentSchema Definition Languages, DSDL)是一种进行 XML 验证和核心处理的框架,由独立专家或专家小组制定的各种规范组成,每一种规范针对一个良好定义并具有良好边界的问题域。通过本文研究 DSDL 组成,包括 RELAX NG 和 Schematron,这两者已经找到了各自的发展动力,而其他部分仍处于开发中。
Document SchemaDefinition Languages (DSDL) [ISO 草案标准和 ISO/IEC 标准 JTC 1 SC 34 WG 1] 是一组有关 XML 验证和基本文档组成的规范。DSDL 所体现的理念是使用多种方法进行 XML 验证和核心处理,并且多种方法之间能够互相补充。这并不是指创建一个具有所有这种功能的庞大系统,相反,DSDL 创建了一种集合了各种标准的框架,您可以单独使用这些标准,也可以结合使用于进行 XML 验证。这种方法避免了每个规范自身的复杂性,同时又提供了处理复杂问题的能力。下面列出了组成 DSDL 的 10 部分内容:
第 1 部分:互操作性框架(Interoperabilityframework):该部分是 DSDL 的规范结构图,并对 DSDL 进行了整体概述。
第 2 部分:基于语法的验证(Grammar-basedvalidation):该部分是 ISO RELAX NG。
第 3 部分:基于规则的验证(Rule-basedvalidation):该部分是 ISO Schematron。
第 4 部分:验证方法选择(Selectionof validation candidates):该部分是基于名称空间的处理语言(Namespace-based Validation Dispatching Language, NVDL),一种分解由多个词汇表组成文档的方式,以实现更轻松的验证。该部分一直具有很多投入,但是 James Clark 的名称空间路由语言(Namespace Routing Language, NRL)是其中最主要的投入。
第 5 部分:数据类型(Datatypes):该部分是创建新原语数据类型的框架。Jeni Tennison 的数据类型库语言(Datatype Library Language)是其中一项投入。它定义了一种 XML 语言,可用于定义新类型的词汇表示的正则表达式。从某种程度上说,这是专门为 W3C XML Schema (WXS) 中的分面机制(facet mechanism)提供,但是 DSDL 第 5 部分中最重要的区别是添加了将新数据类型映射到值空间的机制,而 WXS 没有此项内容。事实上,这允许您指定新数据类型的语法和语义,这非常关键。
第 6 部分:基于路径的完整性约束(Path-based integrity constraints):该部分的目的是定义与 WXS 的 xs:unique、xs:key 和 xs:keyref 类似的特性。
第 7 部分:字符表验证(Characterrepertoire validation):该部分的目标是创建一种能够允许模式设计者约束字符集(可以在不同 XML 词汇结构中使用)的语言。目前有很多方法可以表示 RELAX NG 中出现的此类约束,但是尝试对诸如混合内容这类情况应用约束时就会失败。第 7 部分则可以做到这一点,例如,它允许表示这样的约束:“元素和属性名以及 PI 目标应该为基本的 Latin-1”或 “数字不能出现在元素和属性名中”。
第 8 部分:声明性文档操作(Declarativedocument manipulation):这是定义可由多种 XML 语法表示的模式的方法,其基础是一种强大的模式技术,名为 Architectural Forms。
第 9 部分:可识别数据类型和名称空间的 DTD(Datatype- and namespace-aware DTDs):该部分使 DTD 在当前 XML 开发中更为有用,它在最新的模式语言中添加了更加通用的特性。
第 10 部分:验证管理(Validationmanagement):该部分允许您将来自 DSDL 的不同部分组合起来。为预处理和验证文档提供了管道框架(pipeline framework)。2
HTML文档模式IE5.5引入了文档模式的概念,而这个概念是通过使用文档类型(doctype)切换实现的。
HTML文档模式主要分为:混杂模式/怪异模式(quirksmode、标准模式(standards mode)和准标准模式(almost standards mode)。
!DOCTYPE
在所有 HTML 文档中规定 DOCTYPE 是非常重要的,这样浏览器就能了解预期的文档类型,告诉浏览器要通过哪一种规范(文档类型定义 DTD)解析文档(比如HTML或XHTML规范);
!DOCTYPE声明不属于 HTML 标签;tag; 它是一条指令,告诉浏览器编写页面所用的标记的版本。
HTML 4.01 中的 doctype 需要对 DTD 进行引用,因为 HTML 4.01基于 SGML。而 HTML 5 不基于 SGML,因此不需要对 DTD 进行引用,但是需要 doctype 来规范浏览器的行为(html 5简化了这种声明,意在告诉浏览器使用统一的标准即可, 这个统一的标准去哪里找啊,www.w3.org)。
标准模式
对于标准模式,可以通过使用下面任何一种文档类型来开启: