| 回复人: babyt(阿泰) ( ) 信誉:100 | 2004-12-03 11:13:00 | 得分:0 | |
用这个函数过滤下你抓到的内容看看
<%
Function RemoveHTML(strHTML)
Dim objRegExp, Match, Matches
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
'取闭合的<>
objRegExp.Pattern = "<.+?>"
'进行匹配
Set Matches = objRegExp.Execute(strHTML)
' 遍历匹配集合,并替换掉匹配的项目
For Each Match in Matches
strHtml=Replace(strHTML,Match.Value,"")
Next
RemoveHTML=strHTML
Set objRegExp = Nothing
End Function
%>
| |||
| Top | |||
| 回复人: pswdf(小邪) ( ) 信誉:108 | 2004-12-03 11:30:00 | 得分:0 | |
用正则替换掉就行。 如果是网址,就那一段不要抓。 | |||
本文介绍了一个用于从文本中移除HTML标签的VBScript函数。该函数使用正则表达式来查找并替换所有HTML标签,使得纯文本能够被清晰地呈现。
&spm=1001.2101.3001.5002&articleId=572610&d=1&t=3&u=dd74c4e3079a4d2cb3f819e2e73591f6)
657

被折叠的 条评论
为什么被折叠?



