Administrator
Published on 2025-10-12 / 4 Visits
0
0

【云原生存储】什么是文件存储?从共享文件夹到企业级NAS的演进之路

一、开篇:共享文件夹,也是一种“云的原型”

你是否用过公司内部的共享文件夹?
部门资料放在一个“\192.168.1.100\project”,所有人都能访问。

这其实就是文件存储的雏形。

从最早的 Windows 文件共享(SMB)、Linux 的 NFS,到现代云端的 阿里云 NAS、华为云 SFS、AWS EFS
文件存储始终是最贴近人类直觉的数据组织方式:

“文件 + 文件夹”——可视化、结构清晰、天然多用户协作。


二、什么是文件存储(File Storage)

文件存储(File Storage) 是一种通过 层级目录结构(Folder Hierarchy) 管理文件的存储方式。
它将数据组织成“文件(File)”,通过标准协议(NFS/SMB)供多个主机同时访问。

🧩 简单理解:

文件存储 = 云端的共享文件系统。
不需要你关心底层磁盘块,只需像在本地打开文件夹一样去读写。

举个例子:

# 在Linux挂载NFS共享目录
mount -t nfs 192.168.1.10:/data /mnt/shared
# 或在Windows访问 \\192.168.1.10\share

只要网络通,多个用户可以同时访问、修改同一个文件。


为了克服块存储无法共享的问题,所以就有了文件存储。

文件存储也有软硬一体化的设备,用一台普通服务器/笔记本,只要安装上合适的操作系统与软件,就可以对外提供FTP与NFS服务。

优点

1、造价较低:只需要普通机器和普通网络即可满足需求,不需要专用的SAN网络;

2、方便文件共享。

缺点

1、读写速率低,传输速率慢:以太网,上传下载速度较慢,另外读写操作都分布到单台服务器,与磁阵的并行写相比性能差距较大。

典型设备

FTP、NFS服务器

应用场景

与偏向底层的块存储不同,文件存储上升到了应用层,一般指的是NAS。

一套网络存储设备,通过TCP/IP进行访问,协议为NFSv3/v4由于通过网络,且采用上层协议,因此开销大,延时肯定比块存储高,一般用于多个云服务器共享数据,如存放共享文件等。

主流技术

Microsoft;Windows Azure文件共享存储

Google:Google FileStorage(GFS)

Amazon:Elastic File Storage(EFS)

OpenStack:Swift

其他:CephFS、HDFS、NFS、CIFS、Samba、FTP

三、文件存储的三要素

  1. 文件系统(File System)

    • 负责文件命名、路径管理、权限控制(如EXT4、XFS、NTFS、ZFS)。

  2. 共享协议(Protocol)

    • NFS(Linux/Unix)或 SMB(Windows)提供远程访问能力。

  3. 存储后端(Backend Storage)

    • 物理磁盘阵列或分布式文件系统(如 CephFS、Lustre、GlusterFS)。

文件存储其实是“文件系统 + 网络访问层”的结合体,
它既保留了传统文件的灵活性,又拥有云端的扩展性。


四、文件存储 vs 块存储 vs 对象存储

对比项

文件存储

块存储

对象存储

数据单位

文件

数据块

对象(含元数据)

协议

NFS、SMB

iSCSI、FC、NVMe

RESTful/S3

可共享性

多主机并发访问

一对一挂载

通过URL访问

性能

中高(依赖协议)

较低

结构

层级目录

扁平块设备

扁平命名空间

应用场景

文件共享、项目协作

数据库、系统盘

海量非结构化数据

一句话总结:

文件存储是“办公室共享盘”,块存储是“服务器硬盘”,对象存储是“云端资料库”。


五、文件存储的核心特性

特性

描述

层级组织

目录树结构,用户熟悉的文件路径模式

多用户共享

多主机并发访问同一目录

权限管理

细粒度访问控制(POSIX ACL、LDAP、AD域)

协议兼容性

同时支持NFS/SMB/FTP等

高可用与冗余

后端分布式集群保障可靠性

可扩展性

支持自动扩容、横向扩展节点

快照与备份

支持定时快照、防误删恢复


六、典型架构解析:分布式文件系统

现代云文件存储多基于 分布式文件系统(Distributed File System) 构建,如:

  • CephFS:统一块、对象、文件三种接口;

  • Lustre:高性能计算(HPC)领域广泛使用;

  • GlusterFS:开源、灵活扩展;

  • JuiceFS:云原生兼容 S3 协议;

  • 华为 SFS Turbo / 阿里云 NAS / AWS EFS:商业化分布式方案。

架构逻辑可分为三层:

  1. Metadata Server (MDS):管理目录结构与权限;

  2. Object/Chunk Server:保存文件数据块;

  3. Client Cache:实现本地缓存、读写加速。

数据以块形式分布存储,却对用户呈现文件视图。


七、文件存储的典型应用场景

场景

描述

企业文件共享平台

替代传统NAS,实现跨部门协作

研发环境共享

多节点并行访问源代码、日志、编译文件

AI训练/大数据分析

多GPU/节点共享同一训练数据集

视频编辑/媒体制作

大文件并发读取与编辑

科研计算集群(HPC)

高带宽并行I/O访问

政企文件归档系统

支持多用户访问与权限审计


八、安全与合规特性

文件存储作为企业数据协作核心,安全设计不可或缺:

安全措施

说明

传输加密

NFS over TLS / SMB3 Encryption

访问控制

ACL、RBAC、LDAP/AD 集成

审计日志

记录文件访问、下载、修改操作

防误删与快照恢复

支持文件级回滚

多租户隔离

虚拟化或VPC隔离不同部门存储空间

合规标准

等保二级/三级、ISO27001、GDPR、国密SM系列算法

特别是在政务云、科研网、信创环境中,
国产方案如 华为云SFS Turbo阿里云NAS国密版 已实现全链路国密加密与分权管理。


九、主流文件存储产品对比

厂商

产品名

协议

主要优势

阿里云 NAS

NFS/SMB

稳定可靠,支持国密

政企协作、科研共享

华为云 SFS Turbo

NFS 3.0/4.0

高性能、低时延

AI 训练集群

腾讯云 CFS

NFS/SMB

成本低,支持跨可用区

开发协作

AWS EFS

NFSv4

全球部署广

SaaS、分布式应用

MinIO + JuiceFS

S3/NFS 混合

开源灵活,适合私有云

企业内部NAS替代


十、文件存储的技术趋势

  1. 混合协议访问(NFS + S3):统一文件与对象接口;

  2. 高性能分布式缓存:AI/大数据场景下的低延迟访问;

  3. Serverless NAS:无服务器自动扩缩;

  4. 统一命名空间:多云文件系统融合访问;

  5. AI文件索引:自动标签、语义检索、智能归档。

未来的文件存储不再只是“共享盘”,
而是融合 AI感知 + 对象接口 + 智能编排 的“数据协作平台”。


十一、结语:文件存储,是“协作的根底,云的温度”

块存储像肌肉,驱动性能;
对象存储像大脑,容纳无限;
而文件存储——像神经系统,连接人与数据、系统与团队。

它让复杂的数据协作,回归到最自然的“文件”交互方式,
成为企业数字化协同、AI训练与科研算力背后的默默支撑。

☁️ 在云的世界里,文件存储不只是保存数据,它保存的是“协作的记忆”。



Comment