失效链接处理 |
主流大数据处理技术及应用方案 PDF 下载
本站整理下载:
相关截图:
主要内容:
特点
多服务器、多节点的集群架构
大数据多任务的分布式处理
HDFS(Hadoop Distributed File System)——分布式文件系统、流式访问
MapReduce——曹冲称象,分而治之
可靠、高效、高扩展(Scale-out)、高容错、低成本
可处理多种格式数据源,非结构化、半结构化数据
开源
缺点
对SQL的支持有限
无法高效存储大量小文件
不支持多用户写入及任意修改文件
缺乏专业的支持服务
|