Loading...
爬虫部分书接上回,我们讲到,要用elasticsearch来存储信息,那么我们首先就得安装elasticsearch。这里就不介绍了,默认已经装好elasticsearch,那我们就正式开始写爬虫了。1. Scrapy创建爬虫项目(baidunewsspider) C:\Users\LiTangMM\PycharmProjects>scrapy startproject baiduNe...
爬虫部分新闻链接爬取(2)书接上回,我们获取到了使用动态加载技术加载的新闻链接,但是,有些不是动态加载的新闻链接,我们还没有处理。我们将doc类型文档拷贝下来,放入HBuilder X编辑器中,然后打开内置浏览器,打开开发者工具。这里不直接使用chrome定位元素,因为chrome看到的html实际上不是我们这个请求获取到的代码。我们定位到了一个 div 它子元素 是一个 div 和5个无序...
爬虫部分首先,我们得爬取百度新闻的信息。爬虫分为两部分:获取新闻链接通过链接爬取新闻信息新闻链接爬取(1)1.获取新闻链接1.1 分析请求打开chrome浏览器,输入百度新闻链接,按F12打开开发者工具,依次点击Network->Doc,再刷新一次网页,效果如下:我们看到了所有返回doc的请求。接着,我们点击Preview选项卡:通过预览,我们可以看到这个请求热点要闻、热搜新闻词和百家...
1.两种集成测试1.1自顶向下测试特点:是从程序的初始模块开始测试。(1)该方法会在早期发现顶层的错误。(2)早期的程序框架可以进行演示(3)需要开发桩模块辅助测试。有些甚至需要多个桩模块辅助,加大了桩模块本来的错误影响。(4)测试完一个上层模块后,挑选哪个模块作为下一个测试模块,以及测试的顺序没有唯一的界定标准。优点:较早地验证了主要控制和判断点;按深度优先可以首先实现和验证一个完整的软件...
考点一:OSI七层参考模型OSI从逻辑上,把一个网络系统分为功能上相对独立的7个有序的子系统,它们由低到高分别是物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。(1)物理层(Physical,PH)传递信息需要利用一些物理传输媒体,如双绞线、同轴电缆、光纤等。物理层的任务就是为上层提供一个物理的连接,以及该物理连接表现出来的机械、电气、功能和过程特性,实现透明的比特流传输。在这一...