第1章  XML概述

  XML本身并非一种技术,而是标记语言,可支持开发者为Web信息设计自己的标记。如此一来,Web信息便可被XML应用共享。XML是一种标准化的可以在Web上表示结构化信息的文本格式,利用它可以存储有复杂结构的数据信息。随着XML的发展,出现了许多与之相关的技术,如XSL、DTD、DOM、XPath等。

本章知识要点:
了解标记语言产生的历史
了解SGML通用标记语言
掌握HTML超文本标记语言
熟练掌握HTML的页面、文字、表格和表单标记
了解XML产生的必然
掌握XML概念
掌握XML的优势和应用
了解XML的相关技术
熟练掌握编写XML文档

1.1  标记语言

  标记语言(也称置标语言),是一种可以展现出关于文档结构和数据处理细节的文字编码。当今广泛使用的置标语言是超文本置标语言(HyperText Markup Language‎,HTML‎)和可扩展置标语言(eXtensible Markup Language‎,XML‎)。置标语言广泛应用于网页和网络应用程序。

1.1.1  标记语言历史

  为了促进数据的交换和操作,人们早就产生了将文件结构化为标准的格式的动机。1969年,IBM公司开发了一种文档描述语言,用来解决不同系统中文档格式不同的问题。这样,文档的显示和打印可能更少或更多地依赖特殊的硬件,不过这样的系统需要不同的计算机系统,提供专门的软件来显示和打印文档。IBM把自己这种标识语言称作通用标记语言(Genelized Markup Language,即GML)。GML是IBM许多文档系统的基础,包括Script和Bookmaster。IBM提出在各文档之间共享一些相似的属性,诸如字体大小和版面,并且设计了一种文档系统,通过文档中辅加一种标签,从而可以标识文档中的每种元素。

1.1.2  理解标记语言

  传统意义上的标记(markup),我们都应该不会陌生。当我们还在读书的时候,老师改过的试卷,经常是满篇的红色的醒目的对号、错号、问号、波浪线,或者意味深长的评语,这些都是标记。广义上来说,一篇文章中的标点符号、空格也都可以称作是标记。看看韩愈是怎么说的,“句读之不知,惑之不解也”,就是这些语法标记对于帮助我们读懂文章,实在是太重要了。

1.2  通用标记语言SGML

  SGML规定了在文档中嵌入描述标记的标准格式,指定了描述文档结构的标准方法,这是SGML的精华。换句话说,可使用SGML为我们创作的每一种类型的文档设置层次结构模型,可以用“篇”、“章”、“节”、“标题”等描述标记来标识文档结构中的文档元素。SGML是一个包含超文本链接的综合语言,在Web上使用的HTML格式是使用固定标签集的一种SGML文档。

1.3  超文本标记语言HTML

  由于SGML过于繁琐和复杂,而国际互联网的广泛应用,急需要有一种用户易操作的描述语言。超文本标记语言HTML就这样作为SGML的一种简化应用而诞生。HTML超文本标记语言是一种简化的SGML,易学易用的SGML。该语言了提供文本结构与格式,是Web开发的常用语言。

1.3.1  HTML概述

  HTML是一种超文本标记语言,它的英文含义是“Hypertext Marked Language”,是一种用来制作超文本文档的简单标记语言。该语言是有标记组成的语言,标记不区分大小写,大部分标记是成对出现的。HTML不是程序语言,如C++和Java之类,它只是标记语言,我们只要明白了各种标记的含义便算学懂了HTML标记语言,HTML的格式非常简单,只是由文字及标记组合而成,于编辑方面,任何文字编辑器都可以,只要能将文件另存成ASCII纯文字格式即可,当然以专业的网页编辑软件为佳。

1.3.2  HTML页面标记

  学习HTML标记语言,实际就是学习HTML的相关标记。HTML标记根据其设置对象的不同,可以分为页面标记、文字标记、表格标记和表单标记等。其中页面标记主要用来设置HTML文档布局、显示样式和链接等。

标记名称

说明

<html></html>

HTML文档开始和结束标记

<head></head>

HTML文档属性信息标记,通常包含标题、网页作者和关键词信息

<body></body>

HTML文档正文开始和结束标记。该标记包含bgcolortextbackground属性标记

其格式为<body bgcolor=# text=# background=#>

bgcolor

设定HTML文档背景色。其值可以是redblueyellow等,也可以用16进制表示

text

设定HTML文档前景色。其值通bgcolor相同

background

设定背景图片

<a></a>

超级链接标记,通过该标记可以链接其他网页。该标记包含href属性标记

href

设定链接的目标网页

<hr>

设定水平标尺,包含widthsizecolor等属性标记。

width

设定标尺相对于整个网页的相对宽度,其值可以是百分比或具体数字

size

设定标尺大小和粗细,其值为具体数值

color

设定标尺颜色

1.3.3  HTML文字与字体标记

  文本在网页在一个很重要的位置,通过HTML文字和字体标记可以修饰文本,使文本的显示更加的吸引我们。

标记名称

说明

<br>

换行标记,另起一行开始

<p>

段落标记,代表同一个段落的文字,包含align属性标记

align

对齐标记,文本相对于网页的对齐方式。其值可以为centerleftright

<center>

居中对齐标记,文本在网页中间显示

<blockquote>

引用文本标记,如引用名言

<pre>

预定义标记,是源代码的格式呈现在浏览器上

<hn>

标题标记,有6个,分别为h1h6

<font>

字体标记,修饰字体的大小,颜色,字体的名称。包含colorsize等属性标记。

<b>

字体加粗标记,文字样式加粗显示

<i>

斜体标记,文字样式斜体显示

<sub>

下标标记,文字以下标形式出现

<u>

底线标记,文字以带底线形式出现

<sup>

上标标记,文字以上标形式出现

<address>

地址标记,文字以斜体形式表示地址

<ul>

无序列表

<ol>

有序列表

<dl>

定义列表

<dt><dd>

定义列表的标记

<li>

列表项目的标记

1.3.4  HTML表格标记

  表格在网站应用中非常广泛,可以方便灵活的排版,很多动态大型网站也都是借助表格排版,表格可以把相互关联的信息元素集中定位,使浏览页面的人一目了然。所以说要制作好网页,就要学好表格。

1.3.5  HTML表单标记

  表单在Web网页中用来给访问者填写信息,从而能采集客户端信息,同时表单也能够显示后台的信息使网页具有交互的功能。一般是将表单设计在一个HTML文档中,当用户填写完信息后做提交(submit)操作,于是表单的内容就从客户端的浏览器传送到服务器上,经过服务器上的JSP或CGI等处理程序处理后,再将用户所需信息传送回客户端的浏览器上,可以有表单显示信息,这样网页就具有了交互性。

1.4  XML简介

  XML是一个精简的SGML,它将SGML的丰富功能与HTML的易用性结合到Web的用中。XML保留了SGML的可扩展功能,这使XML从根本上有别于HTML。XML要比HTML强大得多,它不再是固定的标记,而是允许定义数量不限的标记来描述文档中的资料,允许嵌套的信息结构。HTML只是Web显示数据的通用方法,而XML提供了一个直接处理Web数据的通用方法。HTML着重描述Web页面的显示格式,而XML着重描述的是Web页面的内容。

1.4.1  XML技术产生背景

  HTML定义了惟一的文件类型,并且标记集不能改动,简单易用却牺牲了语言性能。XML是在一个这样的背景下诞生的,是不是能有一个更中立的方式,让消费端自行决定要如何消化、呈现从服务端所提供的信息?而XML目的即在于提供一个对信息能够做精准描述的机制,藉以弥补HTML太过于表现导向的特点。人们想到开发一种既简洁、功能又强大的SGML的新子集。

1.4.2  XML介绍

  XML是一种元标记语言,所谓“元标记语言”就是开发者可以根据自己的需要定义自己的标记,比如开发者可以定义如下标记<book><name>,任何满足xml命名规则的名称都可以作为标记,这就为不同的应用程序的应用打开了大门。HTML是一种预定义标记语言,HTML只是在一类特定的文件中定义了一种描述信息的方法,它只认识诸如<html>,<p>等已经定义的标记,对于用户自己定义的标记是不认识的。

1.4.3  XML与SGML、HTML比较

  SGML、HTML是XML的先驱。SGML是通用标记语言标准,它是国际上定义电子文件结构和内容描述的标准,是一种非常复杂的文档的结构,主要用于大量高度结构化数据的防卫区和其他各种工业领域,利于分类和索引。同XML相比,定义的功能很强大,缺点是它不适用于Web数据描述,而且SGML软件价格非常价格昂贵。

1.4.4  XML简单例子

  编写一个XML文档,首先需要有一个适合自己的XML编辑工具。在这里,我们介绍几种常用的编辑工具。
Notepad
UltraEdit
XMLSpy

<?xml version="1.0" encoding="GB2312" ?>
<员工名单>
   
<员工>
      
<姓名>123</姓名>
      
<性别></性别>
      
<部门>软件开发部</部门>
      
<工资 币种="人民币">1500</工资>       
   
</员工> 
   
<员工>
      
<姓名>456</姓名>
      
<性别></性别>
      
<部门>办公室</部门>
      
<工资 币种="人民币">1000</工资>       
   
</员工> 
</员工名单>


1.4.5  XML优势

  XML使许多只利用HTML难以解决的任务变得简单,使只利用HTML不可能完成的任务得以完成。因为XML是可扩展的,开发人员喜爱XML有许多原因。到底是哪个更令人感兴趣,取决于每个人的需要。但有一点是肯定的,一旦用上XML,就可以发现,它正是解决许多令人感到棘手的问题的有力工具。XML的优势有下面几个:
1.数据重用
2.数据和表示分离
3.可扩展性
4.语法自由性
5.结构化集成数据

1.4.6  XML应用及发展

  XML可用于各种不同的应用程序,但其实质是:XML是一种表示数据的方式。有时候数据是为数据库准备的,有些时候则是供人阅读的。与这两方面应用相关的技术,比如数据验证和XML转换也已经随着XML自身一起发展起来。
  由于网络应用的飞速发展,XML的发展非常迅猛。出现了DOM(Document Object Model),XSLT(XSL Transformation)等新名词,XML的应用软件也有了飞速的发展,Microsoft、IBM、Breeze、Stilo等公司纷纷推出了自己的或解析器,或开发平台。在Microsoft、IBM、HP等大公司的推动下,目前有两个著名的xml的研究组织,分别是biztalk.com和oasis.org,由他们向W3C提出标准的建议。

1.5  XML相关技术

  XML常用的技术主要包含下面几种:
1.DTD(Document Type Definition)
2.XSL(eXtensible StyleSheet Language)样式单
3.CSS(Cascading Style Sheet)
4.XSLT(XSL Transformation)
5.XPath(XML Path Language)XML路径语言
6.Xlink(XML Link)
7.XML Schema
8.DOM
9.SAX
10.XQL
11.XPointer

>
>
>
>
>
 
>
>
>
>
>
>
>

相关文章:

  • 2022-12-23
  • 2022-01-03
  • 2022-02-12
  • 2021-11-27
  • 2022-12-23
  • 2022-12-23
  • 2021-10-17
  • 2021-04-28
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
相关资源
相似解决方案