如何对正则表达式整体取反?

来源:百度知道 编辑:UC知道 时间:2024/07/05 13:50:05
(</?[a-zA-Z].*?>)|(<[V][a-zA-Z].*?>)

是对html中的所有标签做选择.
但我想得到除html标签之外的东西,所以需要对上面这整个正则取反,请问应该如何实现,谢谢!

首先指出,在[]里面不需要转义字符\,所以后面半截是[/],不是[\/]

获取html标签以外的东西很简单,变通一下,你想啊,在<>里面的是HTML标签,那么在<>外面的不就是其他文字了吗?

继续变通,非标签文字都是在<>和</>之间的嘛,那样,不是HTML标签的文字部分不就是在>和<里面的东西嘛……

所以匹配规则
>([^<>])*<
这样获取的就是HTML标签外的东西!

用正则对象的replace,如:
RegExp对象名.replace(string,"")

匹配就用那个式子。