首页 > 软件开发 > 编程语言 >

如何用PYTHON正则表达式来寻找URL

来源:互联网 2023-03-17 00:23:11 470

用PYTHON正则表达式来寻找URLilq办公区 - 实用经验教程分享!

工具/原料

  • PYTHON

方法/步骤

  • 1

    打开JUPYTER NOTEBOOK,新建一个空白的PY文档。ilq办公区 - 实用经验教程分享!

    如何用PYTHON正则表达式来寻找URLilq办公区 - 实用经验教程分享!

  • 2

    #http://ilq办公区 - 实用经验教程分享!

    #https://ilq办公区 - 实用经验教程分享!

    ilq办公区 - 实用经验教程分享!

    这是一般的格式,我们需要找到这样的格式字符。ilq办公区 - 实用经验教程分享!

    如何用PYTHON正则表达式来寻找URLilq办公区 - 实用经验教程分享!

  • 3

    import reilq办公区 - 实用经验教程分享!

    引入regular expression模块,然后才能运用相应的函数。ilq办公区 - 实用经验教程分享!

    如何用PYTHON正则表达式来寻找URLilq办公区 - 实用经验教程分享!

  • 3该信息未经授权抓取自百度经验
  • 4

    urlRegex = re.compile(r'http://')ilq办公区 - 实用经验教程分享!

    首先要在前面加上r来表示raw string。ilq办公区 - 实用经验教程分享!

    如何用PYTHON正则表达式来寻找URLilq办公区 - 实用经验教程分享!

  • 5

    urlRegex = re.compile(r'[a-z]{4}://')ilq办公区 - 实用经验教程分享!

    urlRegex.search(r'http://www.heyheyhey.com')ilq办公区 - 实用经验教程分享!

    http可以用26个字母来代替,然后注明4个字母。ilq办公区 - 实用经验教程分享!

    如何用PYTHON正则表达式来寻找URLilq办公区 - 实用经验教程分享!

  • 6

    urlRegex = re.compile(r'''[a-z]{4}://''')ilq办公区 - 实用经验教程分享!

    urlRegex.search(r'http://www.heyheyhey.com')ilq办公区 - 实用经验教程分享!

    ilq办公区 - 实用经验教程分享!

    建议用三引号来选中比较好。ilq办公区 - 实用经验教程分享!

    如何用PYTHON正则表达式来寻找URLilq办公区 - 实用经验教程分享!

  • 7

    urlRegex = re.compile(r'''\w{4}://''')ilq办公区 - 实用经验教程分享!

    urlRegex.search(r'http://www.heyheyhey.com')ilq办公区 - 实用经验教程分享!

    \w也是可以表示字母的。ilq办公区 - 实用经验教程分享!

    如何用PYTHON正则表达式来寻找URLilq办公区 - 实用经验教程分享!

  • 8

    urlRegex = re.compile(r'''[htps]{4}://''')ilq办公区 - 实用经验教程分享!

    urlRegex.findall(r'http://www.heyheyhey.com*****https://www.heyheyhey.com')ilq办公区 - 实用经验教程分享!

    ilq办公区 - 实用经验教程分享!

    中括号则可以指定字母,两个t只需要写一个。ilq办公区 - 实用经验教程分享!

    如何用PYTHON正则表达式来寻找URLilq办公区 - 实用经验教程分享!

  • 9

    urlRegex = re.compile(r'''^http://$''')ilq办公区 - 实用经验教程分享!

    urlRegex.findall(r'http://www.heyheyhey.com*****https://www.heyheyhey.com')ilq办公区 - 实用经验教程分享!

    urlRegex = re.compile(r'''^http://$''')ilq办公区 - 实用经验教程分享!

    urlRegex.findall(r'http://')ilq办公区 - 实用经验教程分享!

    ilq办公区 - 实用经验教程分享!

    用^和$只能针对字符首尾,不太适用在这里。ilq办公区 - 实用经验教程分享!

    如何用PYTHON正则表达式来寻找URLilq办公区 - 实用经验教程分享!

  • 10

    urlRegex = re.compile(r'''(http)(s?)(://)''')ilq办公区 - 实用经验教程分享!

    urlRegex.search(r'http://www.heyheyhey.com').group()ilq办公区 - 实用经验教程分享!

    ilq办公区 - 实用经验教程分享!

    urlRegex = re.compile(r'''(http)(s?)(://)''')ilq办公区 - 实用经验教程分享!

    urlRegex.search(r'https://www.heyheyhey.com').group()ilq办公区 - 实用经验教程分享!

    ilq办公区 - 实用经验教程分享!

    用问号表示零个或者多个。ilq办公区 - 实用经验教程分享!

    如何用PYTHON正则表达式来寻找URLilq办公区 - 实用经验教程分享!

  • 11

    urlRegex = re.compile(r'''http://|https://''')ilq办公区 - 实用经验教程分享!

    urlRegex.search(r'http://www.heyheyhey.com').group()ilq办公区 - 实用经验教程分享!

    urlRegex = re.compile(r'''http://|https://''')ilq办公区 - 实用经验教程分享!

    urlRegex.search(r'https://www.heyheyhey.com').group()ilq办公区 - 实用经验教程分享!

    ilq办公区 - 实用经验教程分享!

    用|字符表示或者。ilq办公区 - 实用经验教程分享!

    如何用PYTHON正则表达式来寻找URLilq办公区 - 实用经验教程分享!

  • 注意事项

    • 注意不同方法的运用地方

    以上方法由办公区教程网编辑摘抄自百度经验可供大家参考!ilq办公区 - 实用经验教程分享!


    标签: python编程语言

    办公区 Copyright © 2016-2023 www.bgqu.net. Some Rights Reserved. 备案号:湘ICP备2020019561号统计代码