失效链接处理 |
FastDFS 分布式文件系统 PDF 下载
本站整理下载:
相关截图:
主要内容:
文件系统概述
分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接
连接在本地节点上,而是通过计算机网络与节点相连。
计算机通过文件系统管理、存储数据,而信息爆炸时代中人们可以获取的数据成指数倍的
增长,单纯通过增加硬盘个数来扩展计算机文件系统的存储容量的方式,在容量大小、容
量增长速度、数据备份、数据安全等方面的表现都差强人意。分布式文件系统可以有效解
决数据的存储和管理难题:将固定于某个地点的某个文件系统,扩展到任意多个地点/多个
文件系统,众多的节点组成一个文件系统网络。每个节点可以分布在不同的地点,通过网
络进行节点间的通信和数据传输。人们在使用分布式文件系统时,无需关心数据是存储在
哪个节点上、或者是从哪个节点从获取的,只需要像使用本地文件系统一样管理和存储文
件系统中的数据。
文件系统最初设计时,仅仅是为局域网内的本地数据服务的。而分布式文件系统将服务范
围扩展到了整个网络。不仅改变了数据的存储和管理方式,也拥有了本地文件系统所无法
具备的数据备份、数据安全等优点。判断一个分布式文件系统是否优秀,取决于以下三个
因素:
数据的存储方式,例如有1000万个数据文件,可以在一个节点存储全部数据文件,在其他
N个节点上每个节点存储1000/N万个数据文件作为备份;或者平均分配到N个节点上存储,
每个节点上存储1000/N万个数据文件。无论采取何种存储方式,目的都是为了保证数据的
存储安全和方便获取。
数据的读取速率,包括响应用户读取数据文件的请求、定位数据文件所在的节点、读取实
际硬盘中数据文件的时间、不同节点间的数据传输时间以及一部分处理器的处理时间等。
各种因素决定了分布式文件系统的用户体验。即分布式文件系统中数据的读取速率不能与
本地文件系统中数据的读取速率相差太大,否则在本地文件系统中打开一个文件需要2秒,
而在分布式文件系统中各种因素的影响下用时超过10秒,就会严重影响用户的使用体验。
数据的安全机制,由于数据分散在各个节点中,必须要采取冗余、备份、镜像等方式保证
节点出现故障的情况下,能够进行数据的恢复,确保数据安全。
文件系统分类
块存储:MongoDB数据库中的GridFS、Hadoop中的HDFS,这些系统在存储文件的的时
候会尝试先将文件打碎存储(拆分成Data Block)。这样存储的优点可以存储超大型文
件,更加高效的利用磁盘资源。但是需要额外存储文件碎片的元数据信息。
在块存储中HDFS存储的块128MB,但是在MongoDB中默认Chunk 255 KB,虽然都
支持块存储但是应用场景有很大差异。HDFS使用于超大文本日志文件存储。但
是MongoDB适合存储超大的流媒体文件例如操大的音频和视频,可以实现流媒体
数据流的区间加载。
文件存储:GlusterFS、NFS、FastDFS等都是基于文件单位存储,这种存储并不会将文件
系统打碎。而是文件存储到系统中的某一台服务器中。这样存储的优点可以应对一些
小文件系统,系统维护简单,无需存储文件的元数据,系统设计和维护成本低。
FastDFS 介绍
特点FastDFS 是一款开源的轻量级分布式文件系统如下特点:
纯粹C语言实现,支持Linux、FreeBSD等unix系统。
类似GoogleFS/HDFS,但是不是通用的文件系统,只能通过专有的API访问,目前提供
了C、Java和PHPAPI 互联网量身定做,最求高性能,高扩展. FastDFS不仅仅可以存储文件,还可以存储文件的元数据信息(可选)。
架构
|