欢迎光临
我们一直在努力

XML简明教程(二)-.NET教程,XML应用

建站超值云服务器,限时71元/月

二、xml基础

   (一)xml术语

    在学习xml之前,我想先给大家介绍一些xml使用的术语。平常我们学习新的语言时,总会遇到许多难以理解的术语,在这里

就先介绍一些主要的给大家。

   元素(elements):代表xml文档中的每一个组件,包含字符、元素或者两者皆有,允许有空元素(empty element)。

   属性(attributes):放在元素后面的数据,代表这个元素的另一种特性和特征。

   统一编码(unicode):一种字符集,包括了全世界各种语言中有用的字符。

   实体:“文本片”,实体也像一个缩写,一个实体可以是一个字符也可以是一个文档的数据,是xml文本的基本单位。

   标记(markup):像标记(tag)、实体引用(entity reference)和声明这样的构件。

   样式表(xsl):描述xml的元数据文件格式的语言(因为css对于xml来讲不够用)。

   序言(prolog):关于文档实例表现形式的信息。

   文档实例(document instance):以元素的层次结构组织的实际文档数据。

   (二)xml语法简介

    1.看一个简单的例子

    这是一个关于库存物品清单的简单例子,大家可以从中发现xml的许多特性,并且可以体会到xml的元数据文件是非常清晰易

读的:

  <!-xml文件示例–>

  <?xml version="1.0" encoding="gb2312" ?>

  <库存清单>

   <!–这里就是注释–>

   <库存物品>

   <名称>毛巾</名称>

   <规格 单位="cm">25*50</规格>

   <生产厂家>中国棉纺厂</生产厂家>

   <生产日期>20010-09-01</生产日期>

   <数量 单位="条">400</数量>

   <进货价 单位="元">2.5</进货价>

   <零售价 单位="元">6.5</零售价>

   </库存物品>

   <库存物品>

   <名称>碗</名称>

   <规格 单位="cm">5*15</规格>

   <生产厂家>中国搪瓷厂</生产厂家>

   <生产日期>20010-09-11</生产日期>

   <数量 单位="个">200</数量>

   <进货价 单位="元">1.5</进货价>

   <零售价 单位="元">4.5</零售价>

   </库存物品>

   <库存物品>

   <名称>筷子</名称>

   <规格 单位="个">1*10</规格>

   <生产厂家>中国搪瓷厂</生产厂家>

   <生产日期>20010-09-11</生产日期>

   <数量 单位="把">200</数量>

   <进货价 单位="元">1.5</进货价>

   <零售价 单位="元">3.5</零售价>

   </库存物品>

  </库存清单>

  

    看过了xml语言的基本格式,下面将详细讲解xml元数据文件的各个组成部分,实际就上面这些而言是非常简单的,当然,我

们要想更清楚的了解和学习xml,就必须清楚地知道这些定义的意义。

    2.声明(declaration)

    xml数据文件的定义不象html那样自由,它是非常严格的,缺少一个就会出错!因为每个xml的解析器第一步要做的事情就是

检查xml文件是否合格,就是“well-formed”,所以大家看到第一句是这样些的:

  <?xml version="1.0" encoding="gb2312" ?>

   注意的是:不能漏掉此句,否则解析器不予解析的!当然里面的encoding可以不用写,缺省是unicode,在此对xml使用的字符编

码作一下说明,大家都应该知道中文和英文的区别吧,呵呵,有人说了,这也太简单了,实际上平时有区别就罢了,结果闹到计算机

上真是比较麻烦,大家用过古董dos的就知道使用汉字在计算机上是一件多么困难的事情,别人26个字母就可以搞定,汉字却要好几万

个。现在的计算机的发展虽然神速,可国际化的问题却一直存在,况且不属英语语系的国家也都有此类问题,因此美国的各大电脑厂

商组成了一个unicode促进会,结合iso的字库标准,推出了unicode,这个编码可以满足绝大多数语系的需要!

    3.元素(elements)和属性(attributes)

    <元素名 属性名=”属性值”>

   <子元素>元素的数据</子元素>

    </元素名>

    大家看上面的这个例子,就能很形象的理解什么是元素什么是属性,但是需要注意的是元素的大小写是不一样的,也就是说<

t></t>和<t></t>不是同一个元素。还有就是元素里的数据,只要是合法的就会完全忠实的成为数据,就如:

    <元素名>这是一个</元素名>

    <!-这是另一个–>

    <元素名>这是一个 </元素名>

    <!-这又是另一个–>

    <元素名>这是一个

    </元素名>

    大家注意到没有,第一、二只差一个空格,第三个则是多了一个回车符,但是这三个数据却是不同的数据,因此大伙在写这

些数据的时候可一定要小心!

    如果大家对于面向对象熟悉的话,一定清楚类也是有属性的,而xml自然也是包括属性的,xml的元素是拥有属性的,而且可

以有许多属性,并且属性值必须使用单引号或双引号包含起来。

    4.注释(comments)

    如果大家编写过程序,就一定知道,看别人的程序是一件非常痛苦的事情。如果别人的程序是没有注释的话,那简直就成了

一种惨无人道的折磨,呵呵,所以,在文档中嵌入关于文档和标记的信息就是很有帮助的。这样不但可以帮助别人也可以帮助自己。

   在xml的注释里是这样的:

  <!-啊,这就是帮助–>

   在这个注释中间,可以放入除了“–”符号以外的所有字符,这稍稍有些不习惯,我们往往会使用这个符号来分离不同组成部分

的文档,在xml的文件里则需要改一改了。

   5.预定义实体

    当我们创建xml时候,有些符号例如“<”等和xml相重的标记,譬如下面的:

    <文章>

   <段落>

   <html>

   <head>

   <title></title>

    </head>

   <body>

   <h1>我们那嘎都是活雷锋</h1>

   <b>老张开车去东北……撞了</b>

   </body>

   </html>

   </段落>

    </文章>

   这样是肯定行不通的,html和xml的定义相重,因为xml有5种预定义的实体,如下:

  &——————-&

  <———————-<

  >——————— >

  &apos;——————‘

  "——————“

   这样再写这些文件就会象下面这样:

  <文章>

   <段落>

   <html>

   <head>

   <title></title>

    </head>

   <body>

   <h1>我们那嘎都是活雷锋</h1>

   <b>老张开车去东北……撞了</b>

   </body>

   </html>

   </段落>

  </文章>

   解析器会自动把这些符号转换成我们所要的文件,但是这样实在是不好看懂,所以就又有了这个cdata。

   6.cdata

    从上面那一节的例子可以看出,使用预定义实体实在是难以看懂,但是有了这个cdata之后,我们就可以让分析器把那些特殊

数据当作普通的数据来处理了!

   cdata的定义如下:

  <![cdata[ 内容 ]]>

   将上节的例子拿来使用:

  <文章>

   <段落><![cdata[

   <html>

   <head>

   <title></title>

    </head>

   <body>

   <h1>我们那嘎都是活雷锋</h1>

   <b>老张开车去东北……撞了</b>

   </body>

   </html>

   ]]>

   </段落>

  </文章>

   这样,解析器就可以解释在这个符号中间的特殊字符了!

赞(0)
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com 特别注意:本站所有转载文章言论不代表本站观点! 本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。未经允许不得转载:IDC资讯中心 » XML简明教程(二)-.NET教程,XML应用
分享到: 更多 (0)

相关推荐

  • 暂无文章