ASP实现小偷程序原理和简单示例

本文介绍了如何使用XMLHTTP组件创建“小偷程序”,这种程序可以从其他网站抓取内容并将其展示在自己的网站上。文章提供了ASP中使用XMLHTTP的具体示例代码。

(一)原理

小偷程序实际上是通过了XML中的XMLHTTP组件调用其它网站上的网页。比如新闻小偷程序,很多都是调用了sina的新闻网页,并且对其中的HTML进行了一些替换,同时对广告也进行了过滤。用小偷程序的优点有:无须维护网站,因为小偷程序中的数据来自其他网站,它将随着该网站的更新而更新;可以节省服务器资源,一般小偷程序就几个文件,所有网页内容都是来自其他网站。缺点有:不稳定,如果目标网站出错,程序也会出错,而且,如果目标网站进行升级维护,那么小偷程序也要进行相应修改;速度,因为是远程调用,速度和在本地服务器上读取数据比起来,肯定要慢一些。

(二)事例

下面就XMLHTTP在ASP中的应用做个简单说明

<%
'常用函数

'1、输入url目标网页地址,返回值getHTTPPage是目标网页的HTML代码
function getHTTPPage(url)
 dim Http
 set Http=server.createobject("MSXML2.XMLHTTP")
 Http.open "GET",url,false
 Http.send()
 if Http.readystate<>4 then
exit function
 end if
 getHTTPPage=bytesToBSTR(Http.responseBody,"GB2312")
 set http=nothing
 if err.number<>0 then err.Clear
end function

'2、转换乱玛,直接用XMLhttp调用有中文字符的网页得到的将是乱玛,可以通过adodb.stream组件进行转换
Function BytesToBstr(body,Cset)
 dim objstream
 set objstream = Server.CreateObject("adodb.stream")
 objstream.Type = 1
 objstream.Mode =3
 objstream.Open
 objstream.Write body
 objstream.Position = 0
 objstream.Type = 2
 objstream.Charset = Cset
 BytesToBstr = objstream.ReadText
 objstream.Close
 set objstream = nothing
End Function

'下面试着调用http://www.3doing.com/earticle/的HTML内容
Dim Url,HTML
Url="http://www.3doing.com/earticle/"
HTML = getHTTPPage(Url)
Response.write HTML
%>

vivi万能小偷程序是以php语言进行开发的网站采集系统,只需要输入目标站地址就能全自动采集,高智能的采集程序,支持98%的站点,规则制作十分简单,菜鸟也能制作采集规则,采集不求人。 功能简介: ·后台配置采集节点,输入目标站地址即可全自动智能转换自动全站采集 ·支持https、支持POST获取、支持搜索、支持cookie、支持代理、支持破解防盗链、支持破解防采集 ·全自动分析,内外链接自动转换、图片地址、css、js,自动分析CSS内的图片使得页面风格不丢失 ·广告标签,方便在规则里直接替换广告代码 ·支持自定义标签,标签可自定义内容、自由截取、内容正则截取。可以放在模板里,也可以在规则里替换 ·支持自定义模板,可使用标签diy个性模板,真正做到内容上移花接木 ·调试模式,可观察采集性能,便于发现解决各种错误 ·多条采集规则一键切换,支持导入导出 ·内置强大替换过滤功能,标签过滤、站内外过滤、字符串替换、等等 ·IP屏蔽功能,屏蔽想要屏蔽IP地址让它无法访问 蜘蛛访问记录 高级功能 ·url过滤功能,可过滤屏蔽不采集指定链接 ·伪原创,近义词替换有利于seo ·伪静态,url伪静态化,有利于seo ·自动缓存自动更新,可设置缓存时间达到自动更新,css缓存 ·简繁体互转 ·代理IP、伪造IP、随机IP、伪造user-agent、伪造referer来路、自定义cookie,以便应对防采集措施 ·url地址加密转换,个性化url,让你的url地址与众不同 ·关键词内链功能 ·插件机制,内容灵活控制 ·还有更多功能等你发现…… ftp上传需使用二进制上传方式,方法请百度 data文件夹需要读写权限 首次使用程序请到后台进行相关设置,否则出现错位、空白等现象 默认后台:http://网站地址/@admin/index.php 默认账号: admin 默认密码: admin 程序使用环境 php5.2 - php5.5 vivi万能小偷程序 v4.0 更新日志: 1.增加采集开关,关闭时将停止采集仅使用缓存 2.增加替换支持首页内页区分 3.增加禁止手机版搜索引擎转码 4.增加目标站编码自动识别 5.增加支持首页使用目标站标题 6.优化替换算法 7.优化后台采集节点界面 8.强化后台插件管理 9.仅保留最近1万条蜘蛛记录,为提高性能
绕看漫画小偷程序,免费完全开源,新手可以学习用,2011.11.30更新全站程序为完全开源版,代码完全公开,适合初级学习;可以用于交流修改二次开发;无任何加密文件,可以任意修改了;本站会陆续更新所有程序为开源免费版,支持二次开发。 目标站是:raokan 更新速度还可以,主要是图片没经过防盗链,容易被采集。 广告比较少,界面不是太漂亮,很一般的那种。 他的漫画资源倒是不少,不过有个很大的缺点与那些专门的漫画站比,就是速度不好,为什么? 因为,他的站的图片是一个ip里面的,不像其他大站,图片分为好几个服务器,会根据客户ip不同自动调整服务器ip,力求找到最优的速度服务器. 这个站是我大学时候的东西了,有几年了。。 属于古董级的东西了。大家不嫌弃的话,就下载研究研究,很简单,也许你看了代码后也完全可以仿照着写出小偷程序了呢。 代码写法经过整合,完全适合新手参考,相同代码归类,一目了然。 下面说说本程序的修改方法: 本程序无后台,修改网站信息,找到config.asp这个文件,用记事本打开,可以看到下面的代码: 这些代码没行后面都有相应的注释,按照注释进行修改就可以了。 其他的文件一般不用修改 其他文件想修改的话,要用记事本打开相应的文件。 我举个例子就成了,比如 头部文件 head.asp ,用记事本打开,看到如下: 以上这些里面的网址啥的都是可以修改的,等等吧,自己看着办了,网址汉字都还是可以看懂的吧。。 说说广告问题: 广告都是js调用的,我这里也没仔细看过哪个是管的哪个广告,里面的js文件都可以用记事本打开看看,如果里面是广告网址的话,那么他就是广告文件了,记得js广告文件,必须代码是经过js转换后的。 Tags: 漫画小偷 4dzz小偷 asp小偷
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值