题海
让大学四年没有难题
首页
搜题
登陆
题目详情
多选题
下列哪些是网络爬虫的分类
A.
通用爬虫
B.
深度爬虫
C.
聚焦爬虫
D.
广度爬虫
查看答案
学科:
数据采集
时间:
2025-06-16 08:08:20
相关题目
相关作业
题目1
多选题
下列选项中,属于 Python 开发网络爬虫优势的是( )
A. 语法简洁,容易上手
B. 开发效率高
C. 模块丰富
D. 运行速度快、性能强
题目2
多选题
网络爬虫的作用是什么?( )
A. 模拟用户浏览万维网行为
B. 自动提交用户信息给网站
C. 自动请求万维网并获取数据
D. 帮助用户隐藏真实 IP 地址
题目3
多选题
下列哪些是网络爬虫的分类
A. 通用爬虫
B. 深度爬虫
C. 聚焦爬虫
D. 广度爬虫
题目4
多选题
下列选项中,会将数据包修改后转发给服务器的是( )
A. 透明代理
B. 普通匿名代理
C. 高度匿名代理
题目5
多选题
下列选项中,关于 Scrapy 框架的描述正确的是( )
A. Scrapy 是一个纯使用Python语言开发的收费的网络爬虫框架
B. Scrapy 支持Shell工具,方便开发人员独立调试程序
C. Scrapy 自身不可以实现分布式爬虫
D. Scrapy-Splash 是基于Scrapy 框架开发的
题目6
单选题
下列选项中,表示 Robots 协议允许网络爬虫访问的是( )
A. User-agent
B. Disallow
C. Allow
D. Sitemap
题目7
单选题
下列选项中,用于定义 HTML 文档超链接的标签是( )
A. <html>
B. <p>
C. <title>
D. <a>
题目8
单选题
下列选项中,用于匹配任意非数字的是( )
A. \w
B. \d
C. \D
D. \W
题目9
单选题
下列选项中,用于在 Xpath 中从当前节点开始选取后代节点的是( )
A. /
B. //
C. @
D. #
题目10
单选题
下列选项中,用于处理 Responses 并从中提取 Items 封装数据的组件是( )
A. Scrapy Engine
B. Scheduler
C. Spiders
D. Item Pipeline
下载
题海APP
拍照搜题更快捷
海量题库
无搜索限制
快捷拍照搜题
扫描他!然后带走我~