最新公告
  • 欢迎您光临站盟网(原知事网),一个优质的网站源码基地、精品网站模板和插件。欢迎加入永久SVIP
  • python爬虫中lxml如何测试?

    正文概述 知事网   2020-11-12 11:11   609

    做编程的一个重要环节,就是学会做测试。不然光写代码也是不行的,毕竟代码需要落实到实处才能产生价值。lxml获取网页的知识我们暂且不讲。喜欢实践的小伙伴一定不要错过今天的内容,测试还是非常有意思的。接下来小编带着大家一起l学习xml在python中的测试吧~

    代码:

    from lxml import etree
    html = etree.parse('hello.html')
    print type(html)
    result = html.xpath('//li')
    print result
    print len(result)
    print type(result)
    print type(result[0])

    运行结果

    <type 'lxml.etree._ElementTree'>
    [<Element li at 0x1014e0e18>, <Element li at 0x1014e0ef0>, <Element li at 0x1014e0f38>, <Element li at 0x1014e0f80>, <Element li at 0x1014e0fc8>]
    5
    <type 'list'>
    <type 'lxml.etree._Element'>

    可见,etree.parse 的类型是 ElementTree,通过调用 xpath 以后,得到了一个列表,包含了 5 个

    • 元素,每个元素都是 Element 类型 (2)获取
    • 标签的所有 class
    result = html.xpath('//li/@class')
    print result

    运行结果

    ['item-0', 'item-1', 'item-inactive', 'item-1', 'item-0']

    以上就是python爬虫中lxml测试的一些实例。更多Python学习推荐:PyThon学习网教学中心。


    站盟网 » python爬虫中lxml如何测试?

    发表评论

    还没有评论,快来抢沙发吧!

    如需帝国cms功能定制以及二次开发请联系我们

    联系作者
    请选择支付方式
    ×
    支付宝支付
    微信支付
    余额支付
    ×
    微信扫码支付 0 元