大数据练习题答案 PDF 下载_Java知识分享网-免费Java资源下载

失效链接处理

大数据练习题答案 PDF 下载

本站整理下载：

链接：https://pan.baidu.com/s/1scmVdvsCLug49gRA6odSGA

提取码：2enj

相关截图：

主要内容：

一、选择题（20个,每题1分）

1. Hadoop作者（ C ）

A、Martin Fowler B、Kent Beck

C、Doug cutting D、Grace Hopper

2. Hadoop起始于以下哪个阶段？（ D ）

A、2004年，Nutch的开发者开发了NDFS。

B、2004年，Google发表了关于MapReduce的论文。

C、2003年，Google发布了GFS论文。

D、2002年，Apach项目的Nutch。

3. 在Centos7中,如果想要查看本机的主机名可以使用下面哪个命令? （ B ）

A、reboot（重启） B、hostname

C、pwd （查看当前工作路径） D、tail（查看文件最后1kb内容）

4. 关于大数据的价值密度描述正确的是以下哪个? （ A ）

A、大数据由于其数据量大,所以其价值密度低。

B、大数据由于其数据量大,所以其价值也大。

C、大数据的价值密度是指其数据类型多且复杂。

D、大数据由于其数据量大,所以其价值密度高。

5. Hadoop的三种安装模式不包括以下哪种? （ A ）

A、两分布式模式 B、完全分布式模式

C、伪分布模式 D、单机模式

6. 以下哪一项属于非结构化数据。（ C ）

A. 企业ERP数据 B. 财务系统数据

C. 视频监控数据 D. 日志数据

7. 下面哪个程序负责 HDFS 数据存储（ C ）

A. NameNode B.Jobtracker

C. Datanode D. secondaryNameNode

8. HDFS1.0 默认 Block Size大小是多少（ B ）

A. 32MB B. 64MB

C. 128MB D. 256MB

9. Hadoop-2.x集群中的HDFS的默认的副本块的个数是?（ A ）

A、3 B、2

C、1 D、4

10. 关于HDFS集群中的DataNode的描述不正确的是（ A ）

A、一个DataNode上存储的所有数据块可以有相同的

B、存储客户端上传的数据的数据块

C、DataNode之间可以互相通信

D、响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑

11. 关于SecondaryNameNode哪项是正确的（ A ）

A、它目的是帮助NameNode合并编辑日志,减少NameNode的负担和冷启动时的加载时间

B、它对内存没有要求（SecondaryNameNode也是在内存中合并的）

C、它是NameNode的热备（冷备）

D、SecondaryNameNode应与NameNode部署到一个节点（SecondaryNameNode通常与NameNode在不同的计算机上运行，因为它的内存需求与NameNode相同，这样可以减轻NameNode所在计算机的压力）

12. 一个gzip文件大小75MB，客户端设置Block大小为64MB，请问其占用几个Block？（ B ）

A、3 B、2

C、4 D、1

13.HDFS有一个gzip文件大小75MB，客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为（ D ）

A、一个map读取64MB，另外一个map读取11MB

B、128MB

C、64MB

D、75MB

14.HDFS有一个LZO（with index）文件大小75MB，客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为（ A ）

A、一个map读取64MB，另外一个map读取11MB

B、64MB

C、75MB

D、128MB

15.Client 端上传文件的时候下列哪项正确？（ B ）

A. 数据经过 NameNode 传递给 DataNode（不经过NameNode）

B. Client 端将文件切分为 Block，依次上传

C. Client 只上传数据到一台 DataNode，然后由 NameNode 负责 Block 复制工作（Client 向 NameNode 发起文件写入的请求。NameNode 根据文件大小和文件块配置情况，返回给 Client 它所管理部分 DataNode 的信息。Client 将文件划分为多个 Block，根据 DataNode 的地址信息，按顺序写入到每一个DataNode 块中。）

D. 以上都不正确

16. HDFS是基于流数据模式访问和处理超大文件的需求而开发的，具有高容错、高可靠性、高可扩展性、高吞吐率等特征，适合的读写任务是（ D ）

A. 一次写入，少次读

B. 多次写入，少次读

C. 多次写入，多次读

D. 一次写入，多次读

17. 配置机架感知的下面哪项正确（ D ）

A、MapReduce会根据机架获取离自己比较近的网络数据

B、写入数据的时候会写到不同机架的DataNode

C、如果一个机架出问题，不会影响数据读写

D、都正确

18. Hadoop1.0默认的调度器策略是哪个（ A ）

A. 先进先出调度器 B. 计算能力调度器

C. 公平调度器 D. 优先级调度器

19. 若不针对MapReduce编程模型中的key和value值进行特别设置，下列哪一项是MapReduce不适宜的运算。（ D ）

A. Max B. Min

C. Count D. Average

最新Java全栈就业实战课程(免费)

AI人工智能学习大礼包

IDEA永久激活

66套java实战课程无套路领取

锋哥开始收Java学员啦！

Python学习路线图

大数据练习题答案 PDF 下载