失效链接处理 |
大数据练习题答案 PDF 下载
本站整理下载:
相关截图:
主要内容:
一、选择题(20个,每题1分)
1. Hadoop作者 ( C )
A、Martin Fowler B、Kent Beck
C、Doug cutting D、Grace Hopper
2. Hadoop起始于以下哪个阶段? ( D )
A、2004年,Nutch的开发者开发了NDFS。
B、2004年,Google发表了关于MapReduce的论文。
C、2003年,Google发布了GFS论文。
D、2002年,Apach项目的Nutch。
3. 在Centos7中,如果想要查看本机的主机名可以使用下面哪个命令? ( B )
A、reboot(重启) B、hostname
C、pwd (查看当前工作路径) D、tail(查看文件最后1kb内容)
4. 关于大数据的价值密度描述正确的是以下哪个? ( A )
A、大数据由于其数据量大,所以其价值密度低。
B、大数据由于其数据量大,所以其价值也大。
C、大数据的价值密度是指其数据类型多且复杂。
D、大数据由于其数据量大,所以其价值密度高。
5. Hadoop的三种安装模式不包括以下哪种? ( A )
A、两分布式模式 B、完全分布式模式
C、伪分布模式 D、单机模式
6. 以下哪一项属于非结构化数据。 ( C )
A. 企业ERP数据 B. 财务系统数据
C. 视频监控数据 D. 日志数据
7. 下面哪个程序负责 HDFS 数据存储 ( C )
A. NameNode B.Jobtracker
C. Datanode D. secondaryNameNode
8. HDFS1.0 默认 Block Size大小是多少 ( B )
A. 32MB B. 64MB
C. 128MB D. 256MB
9. Hadoop-2.x集群中的HDFS的默认的副本块的个数是?( A )
A、3 B、2
C、1 D、4
10. 关于HDFS集群中的DataNode的描述不正确的是( A )
A、一个DataNode上存储的所有数据块可以有相同的
B、存储客户端上传的数据的数据块
C、DataNode之间可以互相通信
D、响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑
11. 关于SecondaryNameNode哪项是正确的( A )
A、它目的是帮助NameNode合并编辑日志,减少NameNode的负担和冷启动时的加载时间
B、它对内存没有要求(SecondaryNameNode也是在内存中合并的)
C、它是NameNode的热备(冷备)
D、SecondaryNameNode应与NameNode部署到一个节点(SecondaryNameNode通常与NameNode在不同的计算机上运行,因为它的内存需求与NameNode相同,这样可以减轻NameNode所在计算机的压力)
12. 一个gzip文件大小75MB,客户端设置Block大小为64MB,请问其占用几个Block?( B )
A、3 B、2
C、4 D、1
13.HDFS有一个gzip文件大小75MB,客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为 ( D )
A、一个map读取64MB,另外一个map读取11MB
B、128MB
C、64MB
D、75MB
14.HDFS有一个LZO(with index)文件大小75MB,客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时input split大小为 ( A )
A、一个map读取64MB,另外一个map读取11MB
B、64MB
C、75MB
D、128MB
15.Client 端上传文件的时候下列哪项正确? ( B )
A. 数据经过 NameNode 传递给 DataNode(不经过NameNode)
B. Client 端将文件切分为 Block,依次上传
C. Client 只上传数据到一台 DataNode,然后由 NameNode 负责 Block 复制工作(Client 向 NameNode 发起文件写入的请求。NameNode 根据文件大小和文件块配置情况,返回给 Client 它所管理部分 DataNode 的信息。Client 将文件划分为多个 Block,根据 DataNode 的地址信息,按顺序写入到每一个DataNode 块中。)
D. 以上都不正确
16. HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是 ( D )
A. 一次写入,少次读
B. 多次写入,少次读
C. 多次写入,多次读
D. 一次写入,多次读
17. 配置机架感知的下面哪项正确 ( D )
A、MapReduce会根据机架获取离自己比较近的网络数据
B、写入数据的时候会写到不同机架的DataNode
C、如果一个机架出问题,不会影响数据读写
D、都正确
18. Hadoop1.0默认的调度器策略是哪个 ( A )
A. 先进先出调度器 B. 计算能力调度器
C. 公平调度器 D. 优先级调度器
19. 若不针对MapReduce编程模型中的key和value值进行特别设置,下列哪一项是MapReduce不适宜的运算。 ( D )
A. Max B. Min
C. Count D. Average
|