xpath,xPath 用法总结整理
朋友们,xpath和xPath 用法总结整理是当今热门话题,但是它们的内涵和影响力可能会让人感到困惑。在本篇文章中,我将为你们揭示它们的本质和重要性,希望能够为你们带来新的认识。
xPath 用法总结整理
XPath是一门在 XML文档中查找信息的语言。XPath用于在 XML文档中通过元素和属性进行导航。
上面的XML文档中的节点例子:
路径表达式语法:
XPath使用路径表达式在 XML文档中选取节点。节点是通过沿着路径或者 step来选取的。下面列出了最有用的路径表达式:
以下面这个xml为例子
在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:
谓语用来查找某个特定的节点或者包含某个指定的值的节点。
谓语被嵌在方括号中。
在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:
XPath通配符可用来选取未知的 XML元素。
例子:
选取若干路径
通过在路径表达式中使用“|”运算符,您可以选取若干个路径。
轴可定义相对于当前节点的节点集。
步的语法:
轴名称::节点测试[谓语]
例子:
获取以xxx开头的元素
例子:xpath(‘//div[stars-with(@class,”test”)]’)
获取包含xxx的元素
例子:xpath(‘//div[contains(@id,”test”)]’)
与的关系
例子:xpath(‘//div[contains(@id,”test”) and contains(@id,”title”)]’)
例子1:xpath(‘//div[contains(text(),”test”)]’)
例子2:xpath(‘//div[@id=”“test]/text()’)
运行结果:
常用表达式实例:
也可以学习下其他作者的文章: https://www.jianshu.com/p/1575db75670f
XPath语法
相信写过爬虫的同学,都知道XPath的存在。博主最近在学习 Scrapy的时候,就了解了一下XPath语法,这里给大家简单地介绍一下:
首先我们需要了解几个 XPath术语。
2017/3/3 16:02:29
在 XPath中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。XML文档是被作为节点树来对待的。树的根被称为文档节点或者根节点。
以下面这xml文档为例:
上面例子的节点为:
父:每个元素以及属性都有一个父。例子中<student>的父是<class>;
子:元素节点可有零个、一个或多个子。例子中<class>的子是<student>;
兄弟:拥有相同的父的节点。例子中<name>和<ID>是兄弟;
祖先:某节点的父、父的父,等等。
后代:某节点的子、子的子,等等。
基本值是无父或无子的节点。
上面例子的基本值为:
项目是基本值或者节点。
ok,接下来开始正式讲解 XPath语法(注意,以下表达式当然可以混合使用):
选取此节点的所有子节点。
从根节点选取。
从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
选取当前节点。
选取当前节点的父节点。
选取属性。
对于如下的xml文档(参照 http://www.tuicool.com/articles/iqQFBn)
如果使用:
data= selector.xpath('//div[@id="test2"]/text()').extract()[0]
只能提取到“美女,”;
如果使用:
data= selector.xpath('//div[@id="test2"]/font/text()').extract()[0]
又只能提取到“你的微信是多少?”
到底我们要怎样才能把“美女,你的微信是多少”提取出来?
轻松搞定,没有后顾之忧!!
什么是Xpath及其用法
1. XPath是什么
XPath是一门在XML文档中查找信息的语言。XPath可用来在XML文档中对元素和属性进行遍历。
XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。
XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型。但是XPath很快的被开发者采用来当作小型查询语言。
2. Xml示例可扩展标记语言,标准通用标记语言的子集,简称XML。是一种用于标记电子文件使其具有结构性的标记语言。
在电子计算机中,标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种的信息比如文章等。它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。是Internet环境中跨平台的、依赖于内容的技术,也是当今处理分布式结构信息的有效工具。早在1998年,W3C就发布了XML1.0规范,使用它来简化Internet的文档信息传输。
示例:
<?xml version="1.0" encoding="ISO-8859-1"?>
<book>
<title lang="en">Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>
到底XPath是什么
XPath简介
XPath是一门在 XML文档中查找信息的语言。XPath用于在 XML文档中通过元素和属性进行导航。
什么是 XPath?
XPath使用路径表达式在 XML文档中进行导航
XPath包含一个标准函数库
XPath是 XSLT中的主要元素
XPath是一个 W3C标准
XPath路径表达式
XPath使用路径表达式来选取 XML文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似
XPath标准函数
XPath含有超过 100个内建的函数。这些函数用于字符串值、数值,日期和时间比较、节点和 QName处理、序列处理、逻辑值等等。
XPath在 XSLT中使用
XPath是 XSLT标准中的主要元素。如果没有 XPath方面的知识,您就无法创建 XSLT文档。
XQuery和 XPointer均构建于 XPath表达式之上。XQuery 1.0和 XPath 2.0共享相同的数据模型,并支持相同的函数和运算符。
您可以在我们的《XQuery教程》中阅读更多有关 XQuery的知识。
XPath是 W3C标准
XPath于 1999年11月16日成为 W3C标准。
XPath被设计供 XSLT、XPointer以及其他 XML解析软件使用。
XPath节点
在 XPath中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或成为根节点)。
XPath术语
节点(Node)
在 XPath中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。XML文档是被作为节点树来对待的。树的根被称为文档节点或者根节点。
好了,文章到此结束,希望可以帮助到大家。