题海
让大学四年没有难题
首页
搜题
登陆
题目详情
单选题
下列选项中,不属于结构化数据的是()
A.
JSON
B.
HTML
C.
CSV
D.
XML
查看答案
学科:
网络爬虫
时间:
2024-12-29 06:38:09
相关题目
相关作业
题目1
单选题
下列选项中,不能用于解析网页数据的是()
A. lxml
B. Beautiful Soup
C. JSONPath
D. Requests
题目2
单选题
关于抓取静态网页实现技术的说法,下列描述错误的是( )
A. 如果要抓取静态网页的数据,只需要获得网页的源代码即可
B. 通过urllib、urllib3和Requests等库抓取静态网页数据
C. Requests库只能发送网络请求不能获取网页源码
D. 抓取静态网页数据的整个过程是模仿用户通过浏览器访问网页的过程
题目3
单选题
下列选项中,关于网页数据格式的描述说法错误的是()
A. 如果网页返回的是结构化数据,那么无法使用Python进行提取
B. 对于非结构化数据的提取可以使用正则表达式、XPath、CSS选择器进行提取
C. 结构化数据是先有结构,再有数据
D. 非结构化数据是先有数据,再有结构
题目4
单选题
下列选项中,表示访问服务器images目录下的glass.png的是()
A. http://127.0.0:8000/static/goods/glass.jpg
B. http://127.0.0:8000/static/goods/glass.png
C. http://127.0.0:8000/images/glass.png
D. http://127.0.0:8000/glass.png
题目5
单选题
下列选项中,不属于结构化数据的是()
A. JSON
B. HTML
C. CSV
D. XML
题目6
单选题
下列选项中属于内置库的是()
A. Beautiful Soup
B. Scrapy
C. Requests
D. urllib
题目7
单选题
关于JSONPath的描述,说法错误的是()
A. JSONPath只适用于JSON文档
B. JSONPath提供了描述JSON文档层次结构的表达式
C. JSONPath提供的语法与XPath提供的语法相同
D. JSONPath可以看作定位目标对象位置的语言
题目8
单选题
下列选项中,关于Selenium的描述说法错误的是()
A. Selenium是一个开源的、便携式的自动化测试工具
B. Selenium可以模拟用户使用浏览器完成一些动作
C. Selenium最初的目的就是为了便于网络爬虫抓取动态网页数据
D. Selenium需要通过浏览器驱动程序WebDriver才能与所选浏览器进行交互
题目9
单选题
下列选项中,关于抓取动态网页的实现技术的描述错误的是()
A. Selenium可以模拟用户输入文本、选择下拉框、单击按钮、单击超链接等操作
B. Selenium不支持IE浏览器
C. PyAutoGUI可以控制鼠标和键盘自动与其他应用程序交互
D. Splash用于JavaScript渲染服务,是一个带有HTTP API的轻量级Web浏览器
题目10
单选题
关于XPath的描述,说法错误的是()
A. XPath基于XML或HTML的节点树定位目标节点所在的位置
B. XPath是一种用于确定XML文档中部分节点位置的语言
C. XPath匹配节点的方式与正则表达式匹配字符串的方式类似
D. XPath通过路径表达式可以快速地定位与选取XML或HTML文档中的一个节点或者一组节点集
下载
题海APP
拍照搜题更快捷
海量题库
无搜索限制
快捷拍照搜题
扫描他!然后带走我~