XML和JSP都是近两年才出现的技术,目前已经成为了很多程序员的热点话题。XML(可扩展的标记语言)是用来定义文档标记语言的框架,主要用来存储和发送数据信息,以便各种基于WEB的应用之间能更方便的交换数据。而Jsp是服务器端程序动态设计语言,可以用来设计服务器端各种程序如B2B、B2C等各种系统,由于其面向对象、编译执行、健壮等特性,也得到了越来越多的应用。
一个很实用的技术就是如何将XML和JSP结合起来,所幸的是我们不用去写底支持层东西了,因为很多厂商如SUN、IBM等都发布了自己的支持XML的API,其中SUN公司提供了一个支持在Java下使用XML的API-JAXP(JAVATM API for XML Processing Optional Package),这部分API提供了基本的读写、操作XML文档的功能,通过它我们可以很方便的将XML集成到Java应用程序中来。
目前JAXP的版本是1.1,除了基本XML支持外还支持SAX 2.0 、DOM 2和XSL技术。SUN公司提供的JAXP可以在SUN公司的主页http://java.sun.com/xml 下载。
一、 JAXP的安装
1、安装前请确认您用的是JDK 1.1.8 以上版本的Java环境。
2、在http://java.sun.com/xml 下载JAXP1.1的zip版本,解压到硬盘中,假定解压目录为#JAXP11,解压后发现有三个jar文件jaxp.jar crimson.jar xalan.jar,这就是JAXP的核心了。
3、修改系统的表示采用中文字符集,这样我们在下面对于数据就可以使用中文了。
接着就是<个人档案>标记了,这是XML文件中的根元素,也是不可缺少的,而且必须有一个对应的结束标记,在开始和结束标记之间我们就可以定义自己的数据描述了。
嵌套在<个人档案>标记如"<姓名>刘玉锋"就是具体的数据描述了,同根元素一样必须是成对的标记,在标记中间可以是标记对应具体的数值。这种表示方法有点类似于数据库中的记录了,字段名字为"姓名"、"性别"等,上面的XML文件就相当于一个只有一条记录的表"个人档案"。当然在XML文件中可以进行多层嵌套,但这就不在本文的讨论范围了。
当然,这里只是一个特别简单能代表XML的例子,XML的相关内容特别多,如果想更多了解XML的话建议还是看相关的书籍。
三、JSP和XML交互
前面已经说过了,Jsp通过SUN公司的API-JAXP可以实现和XML的交互,那么具体实现主要有两种方法,一种是采用DOM2 API,另外一种是采用SAX2 API。
在这里我们主要讨论JAXP中的SAX(Simple API for XML Parsing)技术,DOM2技术可以看SUN公司相关的文档。
1)关于SAX模型
SAX模型是一种处理XML文件的方法,它是事件驱动的,有些类似于AWT中的事件驱动机制,通过事件驱动来识别XML文档的内容。在API中关于SAX的主要有下面的几个包:
oorg.xml.sax
oorg.xml.sax.helpers
oorg.xml.sax.ext
在前台的Java程序或者是Jsp程序中通过调用这几个包中的API就可以很好地实现Java和XML的交互。
2)关于HandlerBase接口
我们知道在AWT中一般是通过实施ActionListener等接口实现事件的处理的,同样的在SAX中SUN也提供了一个类似的接口HandlerBase来处理XML解析的功能,通过将HandlerBase和XML文件关联可以很好的来处理XML文件。
在实施接口中我们主要重载三个HandlerBase的方法startElement(String tag, AttributeList attrs)、characters(char[] ch, int start, int length)、endElement(String name)。
startElement()在读取一行XML数据的开始标记时候触发,子类必须覆盖这个方法,这样就可以在处理XML节点前先进行自己的处理(比如开始读取或者写入XML文件中的节点时候)。
public void startElement (String name, AttributeList attributes)
throws SAXException
{
// no op
}
参数name代表XML节点名字,attributes代表默认或者特殊的属性,这个方法抛出一个违例org.xml.sax.SAXException。
characters()方法主要用来处理和之间具体的数据,在处理节点数据时候触发,我们可以覆盖这个方法来进行数据操作的处理,可以添加代码读取节点数据值或者是写入节点数据值。
public void characters (char ch[], int start, int length)
throws SAXException
{
// no op
}
参数ch[]代表一个字符数组,start代表字符数组的开始位置,length代表要取的字符数组中ch[]中的元素个数,同样的这个方法抛出一个违例org.xml.sax.SAXException。
endElement()方法在处理节点元素结束的时候触发,也就是碰到标记的时候,我们可以覆盖这个方法来进行数据的收尾工作,比如将节点数据写入到文件中。
public void endElement (String name)
throws SAXException
{
// no op
}
参数name代表XML节点名字,这个方法抛出一个违例org.xml.sax.SAXException
从上面我们也可以看出,三个方法在XML事件处理中的顺序依次为:
startElement()àcharacters()àendElement(String name)
也许还不好理解,不要紧在下面我们将会写一个类myHandler类实现HandlerBase接口,并且覆盖这三个主要的方法来实现我们的XML文件读取操作。
3)关于哈希表
由于程序用到了哈希表,所以在这里先简单的介绍一下哈希表的基本语法以便大家能更好的理解下面的程序。
哈希表HashTable是从Dictionary派生出来的,里面具有一系列的关键字和数值,一个关键字对应一个数值,识别主要是通过对象的哈希代码hashCode识别。
我们程序中用到的方法如下:
put(Object key,Object value)添加一对关键字/数值到哈希表中
get(Object key)根据关键字得到它的值
keys()取得所有关键字并返回一个集合Enumeration
此外,哈希表还具有其他很多有用的方法如长度size()、是否为空empty()、是否重复containsKey()等等,限于篇幅在这里就不进行介绍了。
4) 实施HandlerBase接口
在这里我们编写一个myHandler的类,它用来实施HandlerBase接口,并且覆盖接口的三个主要方法startElement(String tag, AttributeList attrs)、characters(char[] ch, int start, int length)、endElement(String name)以便能对XML文件进行操作。
为了保存数据以便外部程序能够调用本类中的数据,我们采用了哈希表结构来保存解析XML文件后的所有节点名字以及节点的数据值,startElement()方法主要用来读取XML文件中的节点名称,characters()方法主要用来根据节点名称读取节点数据,endElement()方法主要是在一个XML节点处理完毕后将这对节点名称和节点数据保存在哈希表中。
在外部程序中我们只需要调用getTable()方法返回一个哈希表对象就可以读取所有的节点和节点数据值了。
代码不多,而且我在下面添加了很多注释,应该很好看懂了。
myHandler.java文件
file://文件放置在包com.jsp21.www中
package com.jsp21.www;
file://导入相关的java API
import java.io.*;
import org.w3c.dom.*;
import org.xml.sax.*;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.util.Hashtable;
import java.util.Enumeration;
// myHandler类实现HandlerBase接口;
public :\\personal.xml中的xml文件名字换为其他的XML文件看看最后运行效果。
要说明一点的就是本人在最后实际采用的是JAXP1.01版本的API,有可能是本人的系统原因,发现程序在1.1版本下可以编译通过,但运行的时候会出现下面错误(即使JAXP1.1包中自带的例子main.java也这样):
java.lang.NoClassDefFoundError: org.apache.crimson.jaxp.SAXParserFactoryImpl
所以最后换作了1.01版本的JAXP来运行程序,1.01版本的JAXP在上面的地址同样可以下载。
