由于xml(可扩展标记语言:extensible markup language)真正的平台无关性,它正在逐渐成为数据传输的主要介质。xml是一种自描述的语言,数据本身就已经包含了元数据,即关于数据本身的信息。例如:“孟子e章1757281793923net_lover1807581793923”这组数据,从字面很难看出它代表什么意思,也不清楚它有几个数据段组成,但是,如果用xml来做如下的描述,我们就可以清楚地看到每个数据段所代表的含义:
<persondata>
<person>
<姓名>孟子e章</姓名>
<身高>175</身高>
<体重>72</体重>
<电话>81793923</电话>
</person>
<person>
<姓名>net_lover</姓名>
<身高>180</身高>
<体重>75</体重>
<电话>81793923</电话>
</person>
</persondata>
从上面的一段xml中,我们不但可以清楚地看到每一个数据代表的是什么意思了,而且还可以知道数据的分割位置。在我们平常的应用中,我们得到的结果可能是数组、集合或记录集的表现形式,我们该如何把它们转换成自描述的xml格式的数据呢?从数据形式上看,xml是简单的纯字符串的文本格式,字符串在传递时是非常简单、快速而且是容易的,数组在通过引用进行传递时有时是很慢的,而且处理起来很麻烦,而集合和记录集都是对象,在处理时会导致计算机性能的下降,并且这些对象都是与特定的平台相关联的,这就要求平台有内建的处理机制来处理对象的操作。xml已经是w3c的标准,是平台无关的,我们的计算机的唯一要求就是能够处理简单的xml字符串,即xml解析器,它能够解析xml字符串,能够通过一种接口很容易地把数据分解成一个个独立的数据段,以便我们能够进行访问。xml解析器都很小,性能也很好,在每种平台上都可以找到。一旦我们接收到xml数据并把它解析成上面的例子的样式后,我们就可以通过xslt(exstensible stylesheet language transformations)把他们转换成不同的表现形式。利用xml的数据格式进行数据传输,将会使我们编写应用程序代码的工作更简单轻松,而且具有良好的可伸缩性。
下面,我们就看看如何来转换我们的数据。我们的例子是在microsoft windows 2000,iis5,msxml3和ado2.6下编写的,样例数据采用microsoft sql server7.0自带的northwind示例数据库。之所以采用sql server7而不采用支持xml的sql server2000,是考虑到通用性的原则,我们的目的是:处理不同类型的数据源得到的记录集,而不仅仅是象sql server2000那样的支持xml输出的数据源。使用ado,是因为它形式多样,可以处理不同类型的数据源;使用xml,是因为它能够快速传输和解析。但本例的处理方法也适合在任何具有micrsoft xml解析器,ado2.5或以上版本的windows,iis,sql server的环境中。
为简单起见,我们仅选择单价小于等于20美圆,库存大于等于20,产品名称小于等于6个字符的产品:
<%
dim objrecordset
set objrecordset = server.createobject("adodb.recordset")
objrecordset.open _
"select productname, unitprice, unitsinstock " _
& "from products " _
& "where unitprice <= 20 " _
& "and unitsinstock >= 20 " _
& "and len(productname) <= 6 " _
& "order by productname", _
"provider=sqloledb;" _
& "data source=somesqlserver;" _
& "initial catalog=northwind;" _
& "user id=myusername;" _
& "password=mypassword;"
%>
现在,我们就用3种方式把我们得到的记录集转换成xml格式。
首先,我们可以遍历整个记录集,采用xml dom(document object model),建立xml节点树:
<%
dim objxmldom, objrootnode, objnode
set objxmldom = server.createobject("msxml2.domdocument")
set objrootnode = objxmldom.createelement("xml")
objxmldom.documentelement = objrootnode
do while not objrecordset.eof
set objrownode = objxmldom.createelement("row")
set objnode = objxmldom.createelement("productname")
objnode.text = objrecordset.fields.item("productname").value
objrownode.appendchild(objnode)
set objnode = objxmldom.createelement("unitprice")
objnode.text = objrecordset.fields.item("unitprice").value
objrownode.appendchild(objnode)
set objnode = objxmldom.createelement("unitsinstock")
objnode.text = objrecordset.fields.item("unitsinstock").value
objrownode.appendchild(objnode)
objrootnode.appendchild(objrownode)
objrecordset.movenext
loop
set objnode = nothing
set objrownode = nothing
set objrootnode = nothing
set objrecordset = nothing
%>
现在,我们就得到了一个xml dom对象。这种方法对于记录集很大时性能并不理想,因为系统内存中要同时保存ado记录集对象和xml dom对象。
第二个办法,遍历记录集,直接生成xml字符串本身:
<%
dim strxml
strxml = "<xml>"
objrecordset.movefirst
do while not objrecordset.eof
strxml = strxml & "<row>"
strxml = strxml & "<productname>" _
& objrecordset.fields.item("productname").value _
& "</productname>"
strxml = strxml & "<unitprice>" _
& objrecordset.fields.item("unitprice").value _
& "</unitprice>"
strxml = strxml & "<unitsinstock>" _
& objrecordset.fields.item("unitsinstock").value _
& "</unitsinstock>"
strxml = strxml & "</row>"
objrecordset.movenext
loop
strxml = strxml & "</xml>"
set objrecordset = nothing
%>
但是,以上两种方法最大的缺陷是不能够重用代码,我们把节点的名字都写死了,如果我们进行不同字段的查询,我们还必须手动更改我们的代码,以满足不同节点的需要。我们下面的方法将变得更加通用。
第三种方法:可重用的方法。
<%
dim strxml
strxml = "<xml>"
objrecordset.movefirst
do while not objrecordset.eof
strxml = strxml & "<row>"
for each varitem in objrecordset.fields
strxml = strxml _
& "<" & varitem.name & ">" _
& varitem.value _
& "</" & varitem.name & ">"
next
strxml = strxml & "</row>"
objrecordset.movenext
loop
strxml = strxml & "</xml>"
set objrecordset = nothing
%>
一个更有效的方法,我们可以直接利用记录集内建的save方法,它能够自动地把记录集的内容转换成xml格式,我们调用save方法后,我们就可以立即释放内存中的记录集对象实例。 save方法有两个参数:一个是xml要保存的地方,一个是指示符,标明数据以何种格式保存。我们可以把数据保存成xml dom对象(ado stream对象),也可以直接保存成asp response对象,为通用起见,我们保存成xml dom,第二个参数用adpersistxml ado常量。方法如下:
<%
const adpersistxml = 1
dim objxmldom
set objxmldom = server.createobject("msxml2.domdocument.3.0")
objrecordset.save objxmldom, adpersistxml
set objrecordset = nothing
%>
这种方法方便快捷,而且不容易出错,对不同的查询,也不用手动更改节点名字。但是,这种方法产生的xml不够简洁,看看它产生的结果:
<xml
xmlns:s="uuid:bdc6e3f0-6da3-11d1-a2a3-00aa00c14882"
xmlns:dt="uuid:c2f41010-65b3-11d1-a29f-00aa00c14882"
xmlns:rs="urn:schemas-microsoft-com:rowset"
xmlns:z="#rowsetschema">
<s:schema id="rowsetschema">
<s:elementtype
name="row"
content="eltonly"
rs:commandtimeout="30">
<s:attributetype
name="productname"
rs:number="1"
rs:writeunknown="true">
<s:datatype
dt:type="string"
dt:maxlength="40"
rs:maybenull="false"/>
</s:attributetype>
<s:attributetype
name="unitprice"
rs:number="2"
rs:nullable="true"
rs:writeunknown="true">
<s:datatype
dt:type="number"
rs:dbtype="currency"
dt:maxlength="8"
rs:precision="19"
rs:fixedlength="true"/>
</s:attributetype>
<s:attributetype
name="unitsinstock"
rs:number="3"
rs:nullable="true"
rs:writeunknown="true">
<s:datatype
dt:type="i2"
dt:maxlength="2"
rs:precision="5"
rs:fixedlength="true"/>
</s:attributetype>
<s:extends type="rs:rowbase"/>
</s:elementtype>
</s:schema>
<rs:data>
<z:row
productname="chai"
unitprice="18"
unitsinstock="39"/>
<z:row
productname="konbu"
unitprice="6"
unitsinstock="24"/>
<z:row
productname="tofu"
unitprice="23.25"
unitsinstock="35"/>
</rs:data>
</xml>
ado自动产生的xml包含了schema信息,它描述这个xml里允许有什么节点和属性以及采用何种数据类型,而且数据节点也增加了名称空间。schema信息在需要数据验证的地方或进行更复杂的处理或许很有用,但是,大多数情况下,我们使用的是瘦客户机,我们不需要schema信息。我们可以利用xslt来分离出我们想要的信息,去掉多余的信息。因此,我们编写下面的“ datacleaner.xsl”:
<?xml version="1.0"?>
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/xsl/transform"
xmlns:s="uuid:bdc6e3f0-6da3-11d1-a2a3-00aa00c14882"
xmlns:dt="uuid:c2f41010-65b3-11d1-a29f-00aa00c14882"
xmlns:rs="urn:schemas-microsoft-com:rowset"
xmlns:z="#rowsetschema">
<xsl:output omit-xml-declaration="yes"/>
<xsl:template match="/">
<xsl:element name="xml">
<xsl:for-each select="/xml/rs:data/z:row">
<xsl:element name="row">
<xsl:for-each select="@*">
<xsl:element name="{name()}">
<xsl:value-of select="."/>
</xsl:element>
</xsl:for-each>
</xsl:element>
</xsl:for-each>
</xsl:element>
</xsl:template>
</xsl:stylesheet>
这个xslt具有可重用的特性,对于不同的查询结果都适用,下面就是如何使用这个xslt的例子:
<%
dim strcleanxml, objxmldom_xslt
set objxmldom_xslt = createobject("msxml2.domdocument")
objxmldom_xslt.load(server.mappath("datacleaner.xsl"))
strcleanxml = objxmldom.transformnode(objxmldom_xslt)
set objxmldom = nothing
set objxmldom_xslt = nothing
%>
经过上面的处理以后,strclaenxml就是我们所想要的xml字符串了。
<xml>
<row>
<productname>chai</productname>
<unitprice>18</unitprice>
<unitsinstock>39</unitsinstock>
</row>
<row>
<productname>konbu</productname>
<unitprice>6</unitprice>
<unitsinstock>24</unitsinstock>
</row>
</xml>
上面这种格式的xml字符串是我们经常见到的节点集的样式,如果您不想把字段处理成节点,而把它处理成属性节点,那么我们只需对datacleaber.xsl稍加改动即可:
<?xml version="1.0"?>
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/xsl/transform"
xmlns:s="uuid:bdc6e3f0-6da3-11d1-a2a3-00aa00c14882"
xmlns:dt="uuid:c2f41010-65b3-11d1-a29f-00aa00c14882"
xmlns:rs="urn:schemas-microsoft-com:rowset"
xmlns:z="#rowsetschema">
<xsl:output omit-xml-declaration="yes"/>
<xsl:template match="/">
<xsl:element name="xml">
<xsl:for-each select="/xml/rs:data/z:row">
<xsl:element name="row">
<xsl:for-each select="@*">
<xsl:attribute name="{name()}">
<xsl:value-of select="."/>
</xsl:attribute>
</xsl:for-each>
</xsl:element>
</xsl:for-each>
</xsl:element>
</xsl:template>
</xsl:stylesheet>
以下是采用了新样式的结果,它比用节点表示字段的长度要短的多了。传输起来速度会更快:
<xml>
<row productname="chai" unitprice="18" unitsinstock="39"/>
<row productname="konbu" unitprice="6" unitsinstock="24"/>
</xml>
到此为止,我们介绍了从ado 记录集得到xml格式数据的几种办法,也得到了最简化的字符串。但是有几个问题你仍然需要注意,有些字段值还有xml里不支持的字符,比如:"<>&,象p&g宝洁公司的名称,chef antons gumbo mix产品名字等,在做转换时要进行编码处理。在microsoft ado 2.6的sdk里有使用save方法时要注意的问题:1,save方法只对open recordset起作用;2,不支持带有advariant,adidispatch,adiunknown类型的字段的记录集的savw;3,当保存分级的记录集( data shapes)有两个限制:不能保存参数化和含有未解决的更新的记录集。
为了更进一步提高性能,你可以把转换工作放到com/com+组件中, asp代码只进行数据的最终表现即可。把业务层、数据层和表现层分开,asp只需要调用数据组件,数据组件调用数据库的存储过程,把结果转换成xml,最后只把简单的xml字符环串回到asp程序里,asp就可以用xslt把xml进行转换,把结果送到浏览器。
