请教一个正则匹配链接和标题的写法

@Ta 01-14 11:13 1049点击

有这么一些富文本,需要提取出 超链接的href值,和在链接中的纯文本标题,
例如以下示例文本

这是一个链接:<a target=6 href="http://baidu.cn" class="test"><span class="666"><b>标题</b></span></a>会话这是一个链接:<a target=6 href="http://baidu.cn" class="test"><span class="666">标题</span></a>呵呵这是一个链接:<a target=6 href="http://baidu.cn" class="test"> 标题 </a>会话这是一个链接:<a href="http://baidu.cn" > 标题 </a>会话

给每个a链接加上一个openWeb的函数 参数是url 和 最里边的文本
想将 a 链接转换为一些 javascript 函数例如

这是链接<a target=6 href="http://baidu.cn" class="test"><span class="666"><b>标题</b></span></a>会话这是一个链

我想转换为

这是链接<a onclick='openWeb("http://baidu.cn","标题")' class="test"><span class="666"> <span class="666"><b>标题</b></span> </a>会话 

这里遇到一个问题,如果一个a链接中有0个或者是多个标签嵌套,那么想要获取最终的纯文本,也就是说贪婪一次或者多次.那么可能就会匹配越界到后边去了 正则方面我比较弱,所以想问一下单纯地正则能否实现
红米Note4超高配版(银色)


啊 我傻逼了 突然想到解析个什么劲 直接传一个 ```this``` 进去,在函数里通过 ```DOM``` 的 ```API``` 去拿 ```href``` 和 ```innerText```
这是链接<a onclick='openWeb(this)' class="test"><span class="666"> <span class="666"><b>标题</b></span> </a>会话 

红米Note4超高配版(银色)

回复列表(9)
  • @Ta / 01-14 10:29
    上xpath吧
  • @Ta / 01-14 10:36

    @水木易安,一看是大佬发的问题瞬间秒懂( ̄∀ ̄)这不是我能解答的问题
    小尾巴我就菜鸡一枚 https://76wp.cn奇乐网

  • @Ta / 01-14 10:59

    @拒绝柳岩99次,刚刚试了一下 xPath 实际上是可以的
    但是我的作用是想将 a 链接转换为一些 javascript 函数例如

    是一个链接:<a href="http://baidu.cn" > 标题 </a>会话

    我想转换为

    是一个链接:<a onclick='openWeb("http://baidu.cn",标题)'> 标题 </a>会话 

    所以不是单纯的提取 还是想还原回去.

    红米Note4超高配版(银色)

  • @Ta / 01-14 10:58

    @寻梦xunm我是菜鸡 粘贴复制一把梭
    红米Note4超高配版(银色)

  • @Ta / 01-14 11:35
  • @Ta / 01-14 13:41

    @Curtion,X-Y Problem
    红米Note4超高配版(银色)

  • Hik
    @Ta / 01-14 20:08
    面向百度编程
  • @Ta / 01-16 16:05

    DOM确实是最好的HTML处理器。

  • @Ta / 01-16 16:45

    @老虎会游泳,没错

    本来想的是 如果没有 DOM 解析器如何使用正则硬实现这样的需求

    结果发现这样的需求可能也只会出现在 html/xml 里
    红米Note4超高配版(银色)

添加新回复
回复需要登录

[聊天-此处没有老虎] TabKey9:牛皮啊!卡1电信直接挂掉了,卡2移动这个图标应该是2g网络