XML&JSON&正则表达式
XML
XML简介
XML(EXtensible Markup Language),可扩展标记语言
特点
XML与操作系统、编程语言的开发平台无关
实现不同系统之间的数据交换
作用
数据交互
配置应用程序和网站
Ajax基石
XML文档结构
XML标签
XML文档内容由一系列标签元素组成
<元素名 属性名=“属性值”>元素内容</元素名>
属性值用双引号包裹
一个元素可以有多个属性
属性值中不能直接包含<、“、&
不建议使用的字符:‘、>
XML编写注意事项
所有XML元素都必须有结束标签
XML标签对大小写敏感
XML必须正确的嵌套
同级标签以缩进对齐
元素名称可以包含字母、数字或其他的字符
元素名称不能以数字或者标点符号开始
元素名称中不能含空格
XML解析器
解析器类型
非验证解析器
检查文档格式是否良好
验证解析器
使用DTD检查文档的有效性
XML命名空间
XML命名空间的作用
解决在复杂、大型XML文件中,出现名称相同,但是含义不同的元素
解析XML技术
DOM
基于XML文档树结构的解析
适用于多次访问的XML文档
特点:比较消耗资源
SAX
基于事件的解析
适用于大数据量的XML文档
特点:占用资源少,内存消耗小
DOM4J
非常优秀的Java XML API
性能优异、功能强大
开放源代码
DOM解析XML
文档对象模型(Document Object Model)
DOM把XML文档映射成一个倒挂的树
常用接口介绍
DOM解析包:org.w3c.dom
保存XML文件
步骤
获得TransformerFactory对象
创建Transformer对象
创建DOMSource对象
包含XML信息
设置输出属性
编码格式
创建StreamResult对象
包含保存文件的信息
将XML保存到指定文件中
JSON
JSON简介
JSON(JavaScript Object Notation)是JavaScript中的对象表示法
轻量级的文本数据交换格式,独立于JavaScript语言
具有自我描述性
比XML传输速度快
JSON语法规则
数据由名称/值对构成
数据之间由逗号分隔
大括号内为对象
中括号内为数组
JSON字符串转为Java对象
正则表达
正则表达式简介
正则表达式描述了一种字符串匹配的模式,也称规则表达式
常用于检索、替换符合指定模式(规则)的文本
大多数语言都支持正则表达式
Java
Python
JavaScript
……
正则表达式语法-1
正则表达式是由普通字符与特殊字符组成的字符串
普通字符
原义字符、非打印字符
特殊字符
元字符:* + ? $ ^ . | \ ( ) { } [ ]
正则表达式语法-2
非打印字符
正则表达式语法-3
特殊字符
正则表达式语法-4
预定义字符
Java正则表达式
java.util.regex包
Pattern类:表示一个正则表达式,或者说匹配模式
Matcher类:Pattern对象matcher()方法的返回值,表示正则表达式对输入字符串的匹配结果
分组
如何获取字符串“hello”中的字符“e”?
命名分组
如何获取字符串“hello”中的字符“e”?