ASP采集中获取网页内所需的html代码

来源:互联网 发布日期:2009-09-05
  有时候,需要获取网页的html代码,如新闻采集。采集之前,首页要得到被采集的页面的html代码,然后根据代码,分析出你想要得到的内容,最后将得到的内容保存到自己的数据库中

ASP采集中获取网页内所需的html代码


  function.asp
  《%
  Function getHTTPPage(url)
  On Error Resume Next
  dim http
  set http=Server.createobject('Microsoft.XMLHTTP')
  Http.open 'GET',url,false
  Http.send()
  if Http.readystate《》4 then
  exit function
  end if
  getHTTPPage=bytesToBSTR(Http.responseBody,'GB2312')
  set http=nothing
  If Err.number《》0 then
  Response.Write '《p align='center'》《font color='red'》
  《b》服务器获取文件内容出错《/b》《/font》《/p》'
  Err.Clear|||||  End If
  End Function
  Function BytesToBstr(body,Cset)
  dim objstream
  set objstream = Server.CreateObject('adodb.stream')
  objstream.Type = 1
  objstream.Mode =3
  objstream.Open
  objstream.Write body
  objstream.Position = 0
  objstream.Type = 2
  objstream.Charset = Cset
  BytesToBstr = objstream.ReadText
  objstream.Close
  set objstream = nothing
  End Function
  %》
  index.asp
  《!--#include file='function.asp'--》
  《%
  url='http://www.google.cn'
  response.write getHTTPPage(url)
  %》
您可能感兴趣的商机信息
关于我们 | 联系我们 | 付款说明 | 法律声明 | 服务条款 | 东莞网站建设 | 114城市信息导航 | 找回密码
服务热线:400 612 0769 传真:0769-22020338 版权所有 广东朝阳企讯通科技有限公司 粤ICP备15113932号
在线客服系统

在线咨询