科百科
当前位置: 首页 范文大全

pythonscrapy爬虫教程(在windows下如何新建爬虫虚拟环境和进行scrapy安装)

时间:2023-08-03 作者: 小编 阅读量: 2 栏目名: 范文大全

Scrapy是Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。第一个piplist命令的时候尚未解压Twisted安装包,此时并没有Twisted库;第二个piplist命令是在Twisted安装包解压之后执行的,可以看到Twisted库已经在里边了。至此,Scrapy的安装已经顺利完成。

Scrapy是Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

1、关于虚拟环境的创建可以参考之前发布的两篇博文,在Windows下如何创建指定的虚拟环境和在Windows下如何创建虚拟环境(默认情况下)。下面在指定的文件夹下,直接先创建环境,在命令行输入环境创建命令“virtualenv --python=C:\Python34\python.exe scrapy_demo”,指定Python的版本和路径,以及虚拟环境的名字scrapy_demo,其中虚拟环境可以自己进行修改,这里命名为scrapy_demo。

2、尔后进入到scrapy_demo文件夹下,找到Scripts文件夹,输入activate.bat以激活虚拟环境,步骤如下图所示。之后可以看到scrapy_demo被括号括起来了,说明进入了环境,在命令行中输入python,可以看到直接弹出Python3的环境。

3、新建完虚拟环境之后,接下来就开始安装Scrapy,输入安装命令“pip install Scrapy”或者“pip install -i https://pypi.douban.com/simple/ Scrapy”,后面这个命令是通过豆瓣源镜像进行下载,速度会快很多,而且较为稳定,建议使用该方法进行安装,Python中的其他库也建议用该命令进行安装,十分的方便快捷。输入命令之后,等待Scrapy的安装,如下图所示。

4、可以看到Scrapy的安装速度非常快,因为我们使用了镜像进行下载。不过稍等片刻之后可能会碰到timeout的问题,这是由于Scrapy安装的过程中需要很多依赖包,导致下载过程中会遇到网络延时的问题,此时只需要重新输入安装命令进行安装即可。除了timeout的问题之外,可能还会碰到下图这个问题。

5、这个问题的出现是因为缺乏Twisted依赖包,此时通过“pip install twisted”可能有问题,这里给大家介绍一个非常实用的Python包网站,里边的Python包专门用于Windows下的安装的。在网页中找到Twisted安装包,然后选择本机Python对应版本和电脑系统位数的安装包,小编的电脑是64位的,而且Python版本是Python3.4,所以下载的包如下图红色框框所示。

6、下载完成之后,直接进入到下载的目录,由此进入命令行窗口,输入安装命令“pip install Twisted-18.7.0-cp34-cp34m-win_amd64.whl”,一般是可以安装上的,但是有时候会出现下面的错误提示“Twisted-18.7.0-cp34-cp34m-win_amd64.whl is not a supported wheel on this platform.”,表示该平台不支持这个安装包,如下图所示。

7、此时不用慌,在这里小编给大家介绍一个小技巧,专门用来应对这样的问题的。进入到Twisted-18.7.0-cp34-cp34m-win_amd64.whl安装包目录下,一般下载之后将其放到虚拟环境的site-packages文件夹下面,尔后将后缀.whl更改为.zip,有木有觉得很熟悉?对,它就是个压缩文件,现在将压缩包里边的内容全部解压到当前文件夹,如下图所示。

8、之后在虚拟环境下输入pip list命令查看安装包,可以看到Twisted安装包已经在里边了,如下图所示。第一个pip list命令的时候尚未解压Twisted安装包,此时并没有Twisted库;第二个pip list命令是在Twisted安装包解压之后执行的,可以看到Twisted库已经在里边了。

9、尔后我们再次输入Scrapy的安装命令,“pip install -i https://pypi.douban.com/simple/ Scrapy”,等待安装完成,此时可以看到没有任何的报错了。

10、最后通过pip list查看Scrapy是否安装成功,可以看到Scrapy已经在list之内了,如下图所示。

至此,Scrapy的安装已经顺利完成。文中记录的部分bug解决方法是很多小伙伴们都会遇到的问题,希望大家日后在安装Scrapy的时候有章可循。最后,祝大家安装Scrapy一切顺利~~

    推荐阅读
  • 伴手礼好物精选(好礼相伴伴手礼)

    此时,伴手礼已不只是着重于联系情感的一份随手小礼物,而是成为了更具仪式感和关怀感的东西。作为一家运营独到,经验丰富的伴手礼从业品牌,好礼相伴伴手礼一直秉持“锦上添花,常伴幸福”理念。好礼相伴伴手礼的认真负责,让人看到了伴手礼行业最初的初心——情深义重。相信只要坚持这样的发展理念,好礼相伴伴手礼会越来越好。

  • 乐事是哪个国家的 乐事是哪个国家的品牌

    乐事是美国的薯片品牌,作为一个全球品牌,从1938年开始,乐事就将它无法抗拒的美味和快乐的品牌精神传播于世界各地。首先立足于本土消费者需求,又结合了博大精深的中国美食文化,进而研发推出适合中国消费者的美味薯片。

  • 健身十八种锻炼方法(一周健身两分钟就能有效提升体能)

    理想很丰满,现实很骨感,普通人的运动减肥效果远没有“管住嘴”来得显著。综上所述,我认为一般人管住嘴与迈开腿的减肥效果是7:3,前者才是起主要决定作用的因素,两者结合、双管齐下是王道。如果说保持身体活性需要日积月累、年复一年的坚持才能慢慢见效,那么使心情愉悦起来对运动来说简直易如反掌、立竿见影。究其原因,至少有两点。

  • 为什么青蛙和蟾蜍长得像(你知道青蛙与蟾蜍的区别吗)

    晚上,窗外蛙声一片。让我迟迟不能入眠,猛然我想到一个问题?为什么我第一时间想到外面的是蛙鸣而不是蟾蜍呢?一.青蛙的历史称谓“田鸡”?

  • 私企红头文件字体字号要求(业务交流红头文件)

    私企红头文件字体字号要求一、“红头文件”如何取名?行政规范性文件,即老百姓常说的“红头文件”,该如何确定名称?简而言之,通报、报告、请示、批复、议案、函、纪要等属于内部性的公文,一般不具有对外的效力,不涉及行政管理相对人的权利义务,因此不能作为“红头文件”的名字使用。

  • 蕙苡仁的功效和作用 蕙苡仁的功效和作用图片

    3、美容养颜蕙苡仁还具有特别好的美容作用,因为它还有一定数量的维生素e和一些活性成分,人们再服用它以后能这样细腻肌肤会让人类皮肤变得爽滑细嫩,另外它含有的有效成分还能阻止人体内黑色素生成,它能淡化人类皮肤表面的色斑,并能改善肤色,经常食用能美白肌肤。

  • 明日之后莱文市卡顿怎么解决(怎么让明日之后莱文市不卡呢)

    跟着小编一起来看一看吧!明日之后莱文市卡顿怎么解决游戏设置里面的ASTC纹理功能取消打勾,然后模拟器的基础设置CPU调4核,内存调2048,完成以上设置之后重启模拟器重新进入游戏即可。莱文市是一个全新的地图,在里面主要有三个元素,分别是莱文的医院、莱文的发电厂和莱文的公园。在不同的组成部分中各自都有非常经典的场景,是一次比较大型的版本更新。进入莱文就要通过希望谷,根据玩家的推测必须要庄园等级到14级以上才可以进行。

  • 西和高速是哪到哪(西和高速的起点和终点是哪里)

    以下内容大家不妨参考一二希望能帮到您!西和高速是哪到哪西宁到和田。西和高速公路,中国国家高速公路网编号为G0612,起点在青海省西宁市,途经青海、新疆两省区,终点在新疆维吾尔自治区和田市。2005年1月13日,中华人民共和国交通部颁布《中国高速公路网规划》,并规定了国家高速公路的主干线、地区环线和支线的编号规则。

  • 龙虾怎么做好吃又简单(简单快手又下饭的蒜蓉小龙虾)

    做法简单又快,几分钟就能搞定一盘下酒菜By大兔子小尾巴用料小龙虾2斤蒜5头蚝油1勺生抽2勺盐2克姜片3片啤酒1罐桂皮2块香叶2片葱3片做法步骤1、直接买来冷冻的龙虾尾凉水泡化清洗一下。做菜好吃都有技巧,我的每道菜都有小妙招,大家搜索“豆果”可以直接查看我的菜谱!

  • 部编二年级语文上册字词专项习题(部编一二年级上全重点字词听写汇总)

    小学着重在基础学习,字词是其中的重中之重。听写是小学语文的一种重要学习方法,它有利于检测学生对生字词的掌握程度,是老师课堂上经常会做的事。下面为大家带来了一二年级上册重点词语听写,家长要多督促孩子哦。字词词语听写方式:1、家听前,建议让孩子先熟读听写内容;2、请家长读,孩子听写,每个词语匀速读两遍;3、平时可让孩子反复读这些词语。