首页 > > 网络编程 > Asp编程 >

Microsoft SQL Server 查询处理器的内部机制与结…

2008-02-23 05:36:23来源：互联网阅读 ()

如果与缓冲区关联的成本大于 0，则迟缓写入器会把成本减 1，并继续检查其他缓冲区。这成本实际上反映的，某计划若是没被使用，它在缓存中还能存在多少个迟缓写入器的检查周期。这种算法，除了如果对象是存储过程则调用 SQL Manager 这一步之外，对缓存中的计划和缓存的数据或索引没有什么区别。迟缓写入器并不知道对象是否存储过程，这种算法很好地平衡了磁盘 I/O 对缓存的使用和存储过程计划对缓存的使用。

您会发现，如果计划的编译成本很高，那么即使很长一段时间都没有被重新使用，也仍然会停留在缓存中，这是因为其初始成本太高了。经常被重新使用的计划也会长期停留在缓存中，这是因为每当它被重新使用时其成本已被重新设置，迟缓写入器不会看到它的成本降为 0。

图 10 显示迟缓写入器处理缓存的流程。

图 10. 迟缓写入器处理缓存的流程

处理客户机的 SQL
下面再看看提交 SQL 语句之后的处理过程。首先，我们将研究客户机向 SQL Server 发送 RPC 事件。因为 SQL Server 收到了 RPC 事件，所以它会知道该事件是某种参数化的 SQL；它是准备/执行模型，或者是 EXECUTESQL。SQL Server 需要构建一个缓存键，以标识这个具体的 SQL Server 文本。如果 SQL Server 处理的是实际的存储过程，则不需要建立它自己的键；直接使用该过程的名称即可。对于通过 RPC 调用发来的简单 SQL 文本，则通过杂凑该 SQL 文本来建立缓存键。此外，该键还要反映一定的状态信息，如某些 ANSI 设置。使所有 ANSI 设置为 ON 的连接和另一个使所有 ANSI 设置为 OFF 的连接，即使它们来自相同的查询，也不能使用相同的计划。处理过程是不同的。例如，如果一个连接把 concat_null_yields_null 设置为 ON，另一个把 concat_null_yields_null 设置为 OFF 的连接，即使它们执行的是完全相同的 SQL 文本，但所产生的结果则完全不同。这样，SQL Server 可能需要在缓存中保存计划的多个版本，每个版本对应于一个不同的 ANSI 设置组合。启用的选项设置是键的一部分，而键字是使用这种缓存处理机制检查对象的核心，因此 SQL Server 建立这种键并用来检查缓存。如果在缓存中没有发现该计划，则 SQL Server 会按照前面介绍的方式编译该计划，并把该计划与键一起存入缓存中。

SQL Server 还需要确定该命令是否是准备操作，这意味着该计划应该只编译但不执行。如果是准备操作，则 SQL Server 会给客户机返回一个句柄，供客户机在以后检索并执行该计划。如果不是一个准备操作，则 SQL Server 提取并执行该计划，就像最初从缓存中找到该计划一样。

准备/执行模型为缓存管理增加了复杂因素。预备给出了今后能够执行该计划的句柄。应用程序可以在几小时或几天之内保持该句柄是激活的，以定期执行计划。即使需要在缓存中为更多的活动计划或数据页面腾出空间，也不能使该句柄无效。SQL Server 实际所做的就是将计划放入缓存，此外还从预备操作中将 SQL 保存到更加紧凑的空间。如果空间紧张，则可按前述的方式释放计划所占用的空间，但仍有 SQL 的副本准备着。如果客户机要执行预备的 SQL，但在缓存中没有找到计划，则 SQL Server 能够检索到该文本并编译它，再将它放回缓存中。这样，缓存中的 16 千字节 (KB) 或更多的页面用来保存可重用的计划，而长期占用的空间或许是存储在其他处的 SQL 代码的 100 或 200 字节。

处理来自客户机的语句时的另一种情况是，查询是作为 SQL 语言事件出现的。除了一点以外，此流程并无太大的差异。在这种情况下，SQL Server 试图使用称为自动参数化的技术。SQL 文本与自动参数化模板相匹配。自动参数化是个棘手的问题，因此，过去一直能够利用共享的 SQL 的其他数据库管理产品，一般并没有提供这一选项。随之而来的问题是，如果 SQL Server 自动地参数化每个查询，那么对于随后提交的某些特定值而言，这些查询中的某些（或绝大多数）将获得非常糟糕的计划。在程序员将参数标记放在代码之中的场合下，其假定是程序员知道所期望的值的范围，并愿意接受 SQL Server 提供的计划。但当程序员实际补充一个特定的值，并且 SQL Server 决定将该值当做一个可变的参数来对待时，所产生的任何适合于某个值的计划可能不适合于后续的值。利用存储过程，通过在过程中放入 WITH RECOMPILE 选项，程序员可以强制产生新的计划。利用自动参数化，程序员无法指出必须为每一个新值开发新的计划。

当 SQL Server 处理自动参数化时，它是非常保守的。被安全地自动参数化的查询有一个模板，并且只有匹配模板的查询才能应用自动参数化。例如，假设有这样一个查询，其中包含带有等于操作符、但没有连接的 WHERE 子句，WHERE 子句中的列带有唯一的索引。SQL Server 知道绝对不会返回一行以上，而且计划将总是使用那个唯一的索引。SQL Server 绝对不会考虑扫描，实际值绝对不会以任何方式改变计划。对于自动参数化而言，这种查询是安全的。

如果查询匹配自动参数化模板，则 SQL Server 自动用参数标记（例如 @p1、@p2）代替文字，并且这就是我们发送到服务器的内容，正如它是 sp_executesql 调用一样。如果 SQL Server 认为该查询对自动参数化并不安全，则客户机将向 SQL Server 发送文字的 SQL 文本，以此作为特定的 SQL。

图 11 显示客户机向 SQL Server 发送请求时的处理流程。

图 11. 处理客户机的 SQL

编译
现在让我们更详细地讨论一下编译和优化。在编译过程中，SQL Server 分析语句，并创建所谓的次序树，即语句的内部表述。这是 SQL Server 6.5 实际保留在 SQL Server 7.0 中的几个数据结构之一。该次序树是正常化的。正常化程序的主要功能是执行绑定。绑定包括检验表和列的存在，以及装载有关表和列的元数据。有关必需的（隐含的）转换信息也附加在次序树上，例如，如果查询试图向数字值添加整数 10，则 SQL Server 将向该树插入隐含的转换。正常化还用视图的定义代替对该视图的引用。最后，正常化执行一些基于语法的优化。如果该语句是传统的 SQL 语句，则 SQL Server 从关于该查询的次序树中提取信息，并创建称为查询图表的特殊结构，设置查询图表是为了使优化器工作非常有效。然后优化该查询图表，一个计划就产生了。

图 12 显示编译过程流程。

图 12. 编译

标签：

版权申明：本站文章部分自网络，如有侵权，请联系：west999com@outlook.com
特别注意：本站所有转载文章言论不代表本站观点，本站所提供的摄影照片，插画，设计作品，如需使用，请与原作者联系，版权归原作者所有