http://green168.51.net/music.rar
[简介]
1.根据设定的网址序列自动提出网页中的音乐地址,并保存为access数据库。
2.速度超快,每秒最高可提取音乐地址40首,根据音乐网站服务器响应的快慢提取速度会有所不同。
3.可提取mp3,rm,wmv,swf,mpga,mpg,wma,rmvb 等格式的影音文件。
4.自动分析影音文件名称,如有必要可根据设定进行二级页面提取。
5.适合建立局网内部的音乐搜索网站,提供asp搜索页面源代码。
6.程序配置文件设定全面详细,可根据实际情况进行不同组合设定。
7.可提取需要登陆才能试听下载的页面。
8.可预设定各个影音网站提取参数,自动记录提取过的歌曲id,方便及时更新歌曲数据库。
9.附带搜刮和胜利在线音乐提取样板,可直接提取这两个网站的音乐。
[系统要求]
1.操作系统:windows sever 2000(推荐),windows xp,
2.环境:Microsoft .Net Framework 1.1 ,安装iis
[文件介绍]
bot目录下:
music.asa:access数据库
music.exe:主程序
xcprof.dll:主程序
CF.ini:主配置文件
reg.txt:注册号(第一次运行自动生成)
save.txt:临时读取文件,用于分析页面代码
bot/inf目录下:
1.ini:第一个网站页面提取配置文件
2.ini:第二个网站页面提取配置文件
*.ini:第*个网站页面提取配置文件
bot/log目录下:
1.txt:第一网站的提取日志
*.txt:第*网站的提取日志
web目录下:
logomp3.GIF:网站logo
music.asp:搜索页面asp源码
[CF.ini:主配置文件设置]
iniid:1
本次提取的网站id,这里的id是指inf目录下的id号。
read:0
是否生成临时读取文件,1 :生成 0:不生成
reg:928637DEE181104936CC32D2545C7B3A
注册号,用来注册本程序
[网站页面提取配置文件设置]
这一步是关键,请耐心看完这一小节,否则很容易出现问题!!!!
为方便大家理解下面用1.ini文件举例说明:
先看一下文件内容:
站点名称:shikongyinyue
//////////////////////////////////////////////////
url:http://10.68.64.36/yy/play/play.asp?id=
url1:
start:248
stop:2456
st1: <br>
op1:<td@height=17@width=241
st2:\filename\@value=\
op2:<param@name=\invokeurls
n1:39
n2:77
n3:18
n4:41
weburl:0
st21:href
op21:artist
n5:6
n6:21
weblog:http://10.68.64.36/
weblog1:Action=index.php&logname=green168&logpass=8859277
/////////////////////////////////////////////////////////
下面一一说明:
url:http://10.68.64.36/yy/play/play.asp?id=
start:248
stop:2456
通过这三行告诉提取程序你要提取的页面地址,意思就是说从http://10.68.64.36/yy/play/play.asp?id=248这个页面开始一直提取到http://10.68.64.36/yy/play/play.asp?id=2456结束。一般音乐站点的播放或者下载歌曲的页面都包含有歌曲的名称和地址。
st1: <br>
op1:<td@height=17@width=241
页面中歌曲名称的开始和结束处的字符串,字符串可以任意选取,不过要尽量靠近歌曲的名称。一般情况下,对于一个新的站点,我们需要在cf.ini中,设置read:1,然后我们运行程序,就会在程序根目录下生成save.txt 的文件,我们在这里查找歌曲的名称,选取没有重复的一段字符串即可。如果不太明白可以对照上面的例子和我们提供给你的save.txt 对比一下就明白了。
st2:\filename\@value=\
op2:<param@name=\invokeurls
页面中歌曲地址的开始和结束处的字符串,选择方法同上。
n1:39
歌曲名称前截段字符数,这个数从st1的第一字符开始算起一直数到歌曲名称出现的前一个字符,换行算一个字符,汉字算一个字符。
n2:77
歌曲名称前截段字符数,这个数是从歌曲名称最后一个字的下一个字符算起一直数到op1开始的字符的字符个数加上n1就得到这个数。
n3:18
n4:41
和n1,n2一样,只不过针对的是歌曲的地址。
url1:
一般情况下这里是不用设置的,但是如果页面中歌曲的地址使用相对地址,那么我们可以在这里设置号地址前缀,是我们提取的地址加上这个前缀合并成完整的歌曲地址。如:我们提出的地址是mp3/1.mp3 ,这是相对地址,我们加上前缀http://10.67.33.129/,这样存入数据库的歌曲地址就是:http://10.67.33.129/mp3/1.mp3.
weburl:0
是否进行二级页面提取,设置成weburl:1 则进行二级页面提取。如果我们在第一次提取过程中并不能提取的歌曲的地址,而是提取到了一个类似song.asp?id=234的地址,那么我们就需要把这里设置成 1
st21:href
op21:artist
n5:6
n6:21
这四个项目设置方法和st2,op2,n3,n4相同,也是提取歌曲地址用的,如果weburl设置为0,那么这四项不起作用。
weblog:http://10.68.64.36/logingchsk.asp
weblog1:Action=index.php&logname=green168&logpass=8859277
这两项是针对部分音乐站点需要登陆以后才能打开试听和下载页面而增加的项目,weblog是登陆页面地址,weblog1是你注册过的用户名称和密码,注意“Action=”必须保留,姓名和密码之间是&"号,而不是"?"号。如果网站不需要登陆就可以打开,那么这里随便加上这个网站的某个页面地址即可。
[音乐地址提取]
1.设置cf.ini
2.设置相应的.ini
3.运行music.exe
4.运行完毕后,将music.asa 拷贝到iis虚拟目录中
5.运行网页搜索程序