气钉枪原理动画动态图:直接自动下载某个网页的html脚本

来源:百度文库 编辑:高考问答 时间:2024/04/28 07:15:22
我现在正在做网络蜘蛛这个毕业设计,现在调试了半天,还是没有调试出代码自动来下载某个页面的html脚本(不是我们通常看到的网页的形式,即要通过右键,查看源文件的方式看到的html脚本),不知哪位好心人能够给我一些指点,小弟很着急,谢谢啦^_^
忘了说了,我要用jsp实现程序
那用jtidy或是jdom来生成dom树么?我把它们的jar包路径放在classpath环境变量里了,但没有加载成,应该怎样做?比如我要下载sina的html脚本,能给一些代码提示么?很着急,谢谢啦

自动下载URL到文件可用URLDownloadToFile(),
MS VC++ 和 SDK 中都有它. 参数说明和CALLBACK 请查VC++ 里的说明.

HRESULT URLDownloadToFile(
LPUNKNOWN pCaller,
LPCWSTR szURL,
LPCTSTR szFileName,
DWORD dwReserved,
LPBINDSTATUSCALLBACK lpfnCB
);

URLDownloadToFile downloads bits from the Internet and saves them to a file. The client can choose to be notified of progress via a notification callback.

用dom哈
document.text就是全部的html文本
window.body.text是body范围内的html文本