博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Scrapy XPath语法
阅读量:4486 次
发布时间:2019-06-08

本文共 438 字,大约阅读时间需要 1 分钟。

  • selectors = response.xpath('[exp]')

返回所有符合exp的语句Selector列表

  • data = response.xpath('[exp]')[0].extract()

返回Selector列表第一项的内容

  • '/html/head'

从根节点匹配

  • '//td/p'

从任意节点匹配

  • '//td/p/../..'

从任意节点匹配上两级

  • '//p/a/text()'

匹配文本内容

  • '//p/a[@colspan="2"]'

匹配属性符合条件

  • '//p/a/@href'

匹配属性

  • response.xpath('//p/a/@href').re(".*cnblogs.com.*")

匹配符合正则的部分的列表

 

参考文献:http://blog.csdn.net/qzc295919009/article/details/42743077

转载于:https://www.cnblogs.com/jhc888007/p/7152648.html

你可能感兴趣的文章
剖析WordPress模板文件【转】
查看>>
20145109 《Java程序设计》第七周学习总结
查看>>
面向面试编程-概念之-分布式与集群的区别和联系
查看>>
Object to xml 2
查看>>
SpringMVC——架构,搭建,SSM搭建,POST请求乱码问题,参数转换器
查看>>
测试驱动开发全功略(转)
查看>>
(2016弱校联盟十一专场10.2) E.Coins
查看>>
关闭蜂鸣最简单的方法
查看>>
第二章 springboot+mybatis
查看>>
Python与数据挖掘学习笔记(1)——Pandas模块
查看>>
mysql_affected_rows()、mysql_fetch_row、mysql_fetch_assoc
查看>>
C语言博客作业--结构体
查看>>
MATLAB 出一张好看的图
查看>>
EmptyRecycle() 清空回收站
查看>>
CentOS5.5环境下布署LVS+keepalived
查看>>
Google 周三宣布新版Google Trend上线
查看>>
二叉搜索树(搜索二叉树)转换成一个双向链表
查看>>
(转)Linux 系统性能分析工具图解读(一、二)
查看>>
(转)python3之模块io使用流的核心工具
查看>>
阶乘模版
查看>>