快捷搜索:

使用 Parallel NFS 增强文件系统

经由过程 NFS(由办事器、客户机软件和两者之间的协议组成),一台谋略机就可以和同一收集中的其他谋略机共享物理文件系统。NFS 暗藏办事器的文件系统的实现和类型。对付在 NFS 客户机上运行的利用法度榜样,共享的文件系统看起来和本地存储一样。

图 1 演示了在包孕各类操作系统的收集中支配 NFS 的一样平常措施。这些操作系统包括支持 NFS 标准的 Linux®、Mac OS X 和 Windows®。(NFS 是 Internet Engineering Task Force 惟一支持的文件系统)。

图 1. 简单的 NFS 设置设置设备摆设摆设

在图 1 中,Linux 机械是 NFS 办事器;它共享或导出(用 NFS 的话讲)一个或多个物理附带文件系统。Mac OS X 和 Windows 机械是 NFS 客户机。它们分手应用或挂载 共享的文件系统。实际上,挂载 NFS 文件系统和挂载本地驱动分区的结果是一样的 — 在挂载时,利用法度榜样仅根据造访节制读写文件,而不留意持久化数据所需的技术。

对付经由过程 NFS 进行共享的文件系统,Read 和 Write 操作 — 由蓝色阴影表示 — 从客户机(这里是 Windows 机械)遍历到办事器。这个办事器终极履行获取或持久化数据的哀求或改动文件元数据的哀求,比如权限或着末的改动光阴。

NFS 的功能异常强大年夜,从广泛将它用作 Network Attached Storage (NAS) 就可以看出来。它可以在 Transmission Control Protocol (TCP) 和 User Datagram Protocol (UDP) 上运行,并且相对轻易治理。此外,NFS 的最新许可版本是 NFS version 4,它前进了安然性、增强了 Windows 和类 UNIX® 系统之间的互操作性,并且经由过程锁租赁(lock lease)供给更好的排他性。(NFSv4 于 2003 年头?年月次得到赞许)。NFS 的根基举措措施也不昂贵,由于它平日能在通俗的 Ethernet 硬件上很好地运行。NFS 能够办理大年夜部分的问题。

不过,NFS 处置惩罚高机能谋略(HPC)不停不敷抱负。高机能谋略涉及到的数据文件异常宏大年夜,并且 NFS 客户机的数量可能达到几千台。(想一想拥稀有千个谋略节点的谋略集群或网格)。在这里,NFS 是一个包袱,由于 NFS 办事器的局限性 — 比如带宽、存储容量和处置惩罚器速率 — 限定了总体谋略机能。NFS 在这里成了瓶颈。

或者,至少曩昔 是这样。

NFS 的下一个改动版是 version 4.1,包括一个扩展 Parallel NFS(pNFS),它将通俗 NFS 的上风和并行输入输出(I/O)的高传输率结合起来。应用 pNFS 时,客户机也像曩昔一样可以从办事器共享文件系统,但数据不颠末 NFS 办事器。相反,客户机系统将与数据存储系统直接连接,为大年夜型数据传输供给许多并行的高速数据路径。在简短的初始化和握手(handshaking)历程之后,pNFS 办事器开始退出 “舞台”,不再阻碍传输速度。

图 2 显示一个 pNFS 设置设置设备摆设摆设。顶部是谋略集群的节点,比如大年夜量便宜的、基于 Linux 的刀片办事器群。左边是 NFSv4.1 办事器。(为了方便评论争论,我们称之为 pNFS 办事器)。底部是一个大年夜型的并行文件系统。

图 2. pNFS 的观点组织布局

像 NFS 一样,pNFS 办事器也导出文件系统,并且保留和掩护数据仓库中描述每个文件的标准元数据。pNFS 客户机和 NFS 一样 — 在这里是集群中的一个节点 — 挂载办事器导出的文件系统。类似于 NFS,每个节点都将文件系统看作本地的物理附加文件系统。元数据的变动经由过程收集传回给 pNFS 办事器。然而,与 NFS 不合的是,pNFS 在 Read 或 Write 数据时是在节点和存储系统之间直接 操作的,如图 2 的底部所示。从数据事务中移除 pNFS 办事器为 pNFS 供给了显着的机能上风。

当客户机不再必要这个文件时,它将提交残剩的变动,并将结构副本返回给元数据办事器,然后关闭文件。

尤其必要留意的是,Read 操作是由一系列协议操作组成的:

客户机向 pNFS 办事器发送一个 LOOKUP+OPEN 哀求。办事器会返回一个文件句柄和状态信息。

客户机经由过程 LAYOUTGET 敕令哀求从办事器获取一个结构。办事器将返回所需的文件结构。

客户机向存储设备发出一个 READ 哀求,该哀求同时初始化多个 Read 操作。

当客户机完成读操作时,它以 LAYOUTRETURN 表示操作停止。

假如与客户机共享的结构由于分离活动而逾期,办事器将发出 CB_LAYOUTRECALL,注解该结构无效,必须清除和/或从新获取。

Write 操作类似于 Read 操作,不合的地方是客户机必须在 LAYOUTRETURN 将文件变动 “宣布” 到 pNFS 办事器之前发出 LAYOUTCOMMIT。

结构可以缓存到每个客户机,这进一步提升了机能。假如一个客户机不再应用时,它会自动放弃从办事器获取结构。办事器还能限定 Write 结构的字节范围,以避免配额限定或削减分配开销等等。

为了避免缓存过时,元数据办事器将收回不准确的结构。收回发生之后,每个关联的客户机必须竣事 I/O,并且必须从新获取结构或从通俗的 NFS 造访文件。在办事器考试测验治理文件(比如迁移或从新划分)之前必须履行收受接收历程。

位置是重点

如前所述,每个存储造访协议都定义一个结构类型,并且可以随意添加新的造访协讲和结构。为了使 pNFS 可以自力应用,pNFS 的供应商和钻研职员已经定义了 3 种存储技术:文件、块 和工具 存储:

文件存储 平日是由传统的 NFS 办事器实现的,比如由 Network Appliance 天生的办事器。存储群是由一组 NFS 办事器组成的,并且每个文件都超过所有办事器或办事器的子集,从而使客户性能够同时获取文件的各个部分。在这里,结构罗列持有文件片段的办事器、每个办事器上文件片段的大年夜小,以及每个片段的 NFS 文件句柄。

您可能还会对下面的文章感兴趣: