Administrator
Published on 2025-10-11 / 3 Visits
0
0

【技术深潜】存储的世界:从本地到云端,从块到对象——一文看懂现代数据存储体系


📦 数据是数字世界的“石油”,而存储就是它的“油罐”。

本地存储、云存储、块存储、文件存储、对象存储、NAS、SAN、DAS、分布式存储……

它们之间到底有什么区别?又该如何选择?

本文带你从存储介质、访问方式、网络架构与场景应用四个维度,系统理解现代存储体系的全景。


一、存储的本质:数据的持久化与可访问性

存储系统的本质是把易失的计算结果(RAM)转化为持久的可访问数据(Disk/Cloud)

核心指标有三:

  • 性能(IOPS / 带宽 / 延迟)

  • 可靠性(冗余 / 容灾 / 副本 / 校验)

  • 可扩展性(容量 / 节点 / 并发)


二、存储的三维分类体系总览

分类维度

类型

代表技术

应用场景

按部署位置

本地存储 (Local)云存储 (Cloud)

SSD / HDD / Amazon S3 / 阿里云 OSS

终端设备、企业机房、云平台

按访问协议

块存储 (Block)文件存储 (File)对象存储 (Object)

iSCSI / NFS / S3 API

数据库、共享文件、归档

按网络架构

DAS、NAS、SAN、分布式存储、云原生存储

SATA / FC / NFS / Ceph / Lustre

各类企业网络环境

按温度层级

热存储、温存储、冷存储、归档存储

SSD / HDD / Tape / Glacier

高频访问、低频归档


三、按网络方式划分的存储架构

现代存储除了按“类型”区分(块 / 文件 / 对象),
还要按网络连接方式划分。网络结构直接影响性能、共享性与扩展性。


1️⃣ DAS(Direct Attached Storage)直接附加存储

原理:存储设备(如 SSD/HDD)直接挂载在服务器主板或控制器上。
无独立网络,只能被单一主机访问。

示意:

[Server]——[SATA/PCIe SSD]

特点:

  • 性能高(本地总线直连)

  • 不可共享(单主机独占)

  • 扩展性差

代表技术:

  • SATA / NVMe SSD

  • RAID 卡直连阵列

应用场景:

  • 单机数据库、日志缓存、本地临时数据区

  • 边缘计算 / 工控终端


2️⃣ NAS(Network Attached Storage)网络附加存储

原理
NAS 是通过 文件级协议(NFS / SMB) 提供共享访问的存储系统,
用户像访问网络盘一样访问文件。

示意:

[多台服务器] ↔ [NAS 存储设备](通过 TCP/IP 网络访问)

特点:

  • 文件级共享,目录结构清晰

  • 多主机可同时访问

  • 依赖网络带宽与延迟

  • 适合读多写少场景

代表技术:

  • NFS(Linux 环境)

  • SMB / CIFS(Windows 环境)

  • 阿里云 NAS、AWS EFS

应用场景:

  • Web 应用共享目录

  • AI / ML 数据集共享读取

  • 集群中间文件 / 日志文件存储


3️⃣ SAN(Storage Area Network)存储区域网络

原理
SAN 是通过 光纤通道(FC)或 iSCSI 协议
将存储阵列以块级形式映射给服务器使用。

示意:

[Server群] ↔ [光纤交换机 FC Switch] ↔ [SAN存储阵列]

特点:

  • 块级访问,性能高、延迟低

  • 通常用于关键业务系统

  • 管理复杂,成本高

代表技术:

  • Fibre Channel (FC)

  • iSCSI / FCoE

  • EMC VMAX、HPE 3PAR、华为 OceanStor

应用场景:

  • 核心数据库(Oracle、MySQL Cluster)

  • ERP、金融交易系统

  • 高可用虚拟化平台(VMware、KVM)


4️⃣ 分布式存储(Distributed Storage)

原理
通过软件定义存储(SDS)方式,将多节点的本地盘聚合成一个逻辑存储池。
实现横向扩展、高可用与自愈。

特点:

  • 软硬解耦,标准服务器即可部署

  • 自动冗余与副本修复

  • 同时支持块 / 文件 / 对象三种接口

代表技术:

  • Ceph(对象 + 块 + 文件)

  • GlusterFS(文件型)

  • Lustre(高性能文件系统)

  • MooseFS / HDFS(大数据分布式文件)

应用场景:

  • 云数据中心底座

  • AI/大数据训练平台

  • 视频监控归档 / 科研数据集存储


5️⃣ 云存储(Cloud Storage)

原理
通过互联网 API 访问的分布式存储服务,按需计费、自动扩容。
底层往往基于对象存储架构 + 全球多副本。

特点:

  • 弹性、可靠、低维护

  • 提供 SDK / REST API / Web 控制台

  • 接入门槛低,按量计费

代表技术:

  • Amazon S3

  • 阿里云 OSS

  • 华为 OBS / 腾讯 COS

  • MinIO(自建 S3 兼容云)

应用场景:

  • 云原生应用数据存储

  • 图片 / 视频 / 日志归档

  • 混合云 / 备份灾备


四、按访问类型划分(块 / 文件 / 对象)

存储类型

访问粒度

协议

优势

典型应用

块存储

数据块

iSCSI / FC / NVMe-oF

性能高

数据库、虚拟机

文件存储

文件

NFS / SMB

易用共享

共享目录、集群文件

对象存储

对象 (Key + Data + Metadata)

S3 / OSS API

扩展性强、低成本

静态资源、日志归档


关于性能容量等方面,对三种存储做直观对比。

块存储、文件存储、对象存储的层次关系

五、按性能与温度层次划分(热 / 温 / 冷 / 归档)

层级

访问频率

延迟

成本

代表介质

典型应用

热存储

高频

极低

NVMe / SSD

交易数据库、缓存

温存储

中等

SATA SSD / HDD

用户数据、AI 中间结果

冷存储

低频

对象低频层 / HDD

备份、归档

归档

极低

极高

极低

磁带库 / Glacier

法规档案、科研历史数据


六、各类存储典型架构总览

网络类型

存储类型

协议

优势

缺点

典型代表

DAS

SATA / NVMe

简单高效

不可共享

本地SSD/HDD

NAS

文件

NFS / SMB

文件共享

性能有限

Synology / QNAP / 云NAS

SAN

FC / iSCSI

高性能

成本高

EMC / HPE / 华为

分布式

文件/对象

Ceph / GlusterFS

可扩展

部署复杂

Ceph / Lustre

云存储

对象

S3 / OSS / COS

弹性、成本低

网络依赖

AWS / 阿里云 / 腾讯云


七、企业级典型部署模式举例

🏢 混合云企业存储架构:

本地DAS:高性能缓存
   ↓
NAS:文件共享
   ↓
SAN:数据库与虚拟机块设备
   ↓
分布式存储:AI/大数据中台
   ↓
云对象存储:归档与备份

👉 实现性能与成本的最优平衡。


八、总结:从“存”到“智存”

演进阶段

特点

技术代表

存储1.0

本地直连 (DAS)

SATA、RAID

存储2.0

网络共享 (NAS/SAN)

NFS、FC

存储3.0

分布式与虚拟化

Ceph、GlusterFS

存储4.0

云与智能分层

S3、OSS、OBS、ZNS、CXL

存储的演进,不只是容量扩展,更是“计算–存储–网络”一体化的演化。


九、结语:

在这个“数据爆炸、AI泛化、云原生横行”的时代,
谁理解了存储的层次,谁就掌握了数字世界的根基。

  • DAS 代表性能极限

  • NAS 代表协作共享

  • SAN 代表企业级可靠性

  • 分布式存储代表可扩展未来

  • 云存储代表弹性与智能

选择正确的存储架构,
是每一个架构师、科研机构和数字化转型团队的必修课。



Comment