失效链接处理 |
HCIP-Big Data Developer V2.0 培训教材 PDF 下载
本站整理下载:
提取码:hqsy
相关截图:
主要内容:
三驾马车
大数据技术起源于Google在2004年前后发表的三篇论文,也就是我们经常听到的
“三驾马车”。 分布式文件系统GFS
大数据分布式计算框架MapReduce
分布式数据库系统BigTable
大数据主流技术 - 数据采集
使用Flume,可进行流式日志数据的收集。 使用Sqoop可以交互关系型数据库,进行导入导出数据。 使用爬虫技术,可在网上爬取海量网页数据。
|