Scrapy XPath语法-白红宇

Scrapy XPath语法

阅读量：4486 次

发布时间：2019-06-08

本文共 438 字，大约阅读时间需要 1 分钟。

selectors = response.xpath('[exp]')

返回所有符合exp的语句Selector列表

data = response.xpath('[exp]')[0].extract()

返回Selector列表第一项的内容

'/html/head'

从根节点匹配

'//td/p'

从任意节点匹配

'//td/p/../..'

从任意节点匹配上两级

'//p/a/text()'

匹配文本内容

'//p/a[@colspan="2"]'

匹配属性符合条件

'//p/a/@href'

匹配属性

response.xpath('//p/a/@href').re(".*cnblogs.com.*")

匹配符合正则的部分的列表

参考文献：http://blog.csdn.net/qzc295919009/article/details/42743077

转载于:https://www.cnblogs.com/jhc888007/p/7152648.html

你可能感兴趣的文章

剖析WordPress模板文件【转】

查看>>

20145109 《Java程序设计》第七周学习总结

查看>>

面向面试编程-概念之-分布式与集群的区别和联系

查看>>

Object to xml 2

查看>>

SpringMVC——架构，搭建，SSM搭建，POST请求乱码问题，参数转换器

查看>>

测试驱动开发全功略（转）

查看>>

(2016弱校联盟十一专场10.2) E.Coins

查看>>

关闭蜂鸣最简单的方法

查看>>

第二章 springboot+mybatis

查看>>

Python与数据挖掘学习笔记（1）——Pandas模块

查看>>

mysql_affected_rows()、mysql_fetch_row、mysql_fetch_assoc

CentOS5.5环境下布署LVS+keepalived

查看>>

Google 周三宣布新版Google Trend上线

查看>>

二叉搜索树（搜索二叉树）转换成一个双向链表

查看>>

(转)Linux 系统性能分析工具图解读（一、二）

查看>>

(转)python3之模块io使用流的核心工具

查看>>

阶乘模版

查看>>