[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"$f6EADFJFqFhU7lbBaK_x9nz67pAgss4fTFQJxzs6LTaM":3},{"answer":4,"createTime":5,"id":6,"options":7,"origin":12,"question":19,"related":20,"source":30,"type":31},[],"2025-11-30 21:25:35",246119484,[8,9,10,11],"filter(func):筛选出满足函数func的元素,并返回一个新的数据集","count():返回数据集中的元素个数","map(func):将每个元素传递到函数func中,并将结果返回为一个新的数据集","take(n):返回数据集中的第n个元素",{"count":13,"courseId":14,"courseImg":15,"courseName":16,"workId":17,"workName":18},15,"f5b55b31fd526f7bfecf207ace7e96b5","https:\u002F\u002Ftihai-oss-cloud.itihey.com\u002Fimg\u002F9c1e48361b00f3ee2086f4e259ed792b.jpg","大数据处理技术","work_48507783","第五次作业-副本","下列关于常见的动作(Action)和转换(Transformation)操作的API解释错误的是",[21,32,41,50,53,62,71,80,89,99],{"answer":22,"createTime":5,"id":23,"options":24,"question":29,"source":30,"type":31},[],246119481,[25,26,27,28],"Lisp","Scala","Java","Python","Spark SQL目前暂时不支持下列哪种语言","v1",0,{"answer":33,"createTime":5,"id":34,"options":35,"question":40,"source":30,"type":31},[],246119482,[36,37,38,39],"map","count","filter","groupBy","RDD操作分为转换(Transformation)和动作(Action)两种类型,下列属于动作(Action)类型的操作的是",{"answer":42,"createTime":5,"id":43,"options":44,"question":49,"source":30,"type":31},[],246119483,[45,46,47,48],"在选择Spark Streaming和Storm时,对实时性要求高(比如要求毫秒级响应)的企业更倾向于选择流计算框架Storm","RDD采用惰性调用,遇到&quot;转换(Transformation)&quot;类型的操作时,只会记录RDD生成的轨迹,只有遇到&quot;动作(Action)&quot;类型的操作时才会触发真正的计算","RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换","Spark支持三种类型的部署方式:Standalone,Spark on Mesos,Spark on YARN","下列说法错误的是",{"answer":51,"createTime":5,"id":6,"options":52,"question":19,"source":30,"type":31},[],[8,9,10,11],{"answer":54,"createTime":5,"id":55,"options":56,"question":61,"source":30,"type":31},[],246119485,[57,58,59,60],"复杂的批量数据处理:MapReduce","基于历史数据的交互式查询:Impala","图结构数据的计算:Hive","基于实时数据流的数据处理:Storm","下列大数据处理类型与其对应的软件框架不匹配的是",{"answer":63,"createTime":5,"id":64,"options":65,"question":70,"source":30,"type":31},[],246119486,[66,67,68,69],"降低","升高","不变","不确定","流计算秉承一个基本理念,即数据的价值随着时间的流逝而______,如用户点击流",{"answer":72,"createTime":5,"id":73,"options":74,"question":79,"source":30,"type":31},[],246119487,[75,76,77,78],"Spout","Tuple","Bolt","Topology","Hadoop运行的是MapReduce任务,类似地,Storm运行的任务叫做",{"answer":81,"createTime":5,"id":82,"options":83,"question":88,"source":30,"type":31},[],246119488,[84,85,86,87],"Spark最初由美国加州伯克利大学(UCBerkeley)的AMP实验室于2009年开发","Spark在2014年打破了Hadoop保持的基准排序纪录","Spark用十分之一的计算资源,获得了比Hadoop快3倍的速度","Spark运行模式单一","下列关于Spark的描述,错误的是哪一项?( )",{"answer":90,"createTime":5,"id":91,"options":92,"question":97,"source":30,"type":98},[],246119489,[93,94,95,96],"Spark","Storm","Hadoop","Oracle","Apache软件基金会最重要的三大分布式计算系统开源项目包括",1,{"answer":100,"createTime":5,"id":101,"options":102,"question":107,"source":30,"type":98},[],246119490,[103,104,105,106],"通用性好","容易使用","运行速度快","运行模式多样","Spark的主要特点包括"]