这三周 #20 数据丢了,你会遗憾吗?
生活不止投资炒股,今天不谈投资,聊聊这段时间我搞得事情 —— 数据备份。
什么数据不想丢失
早年喜欢收集资料,然后存起来备用。后来发现网络上通常都有永久的记忆,根本不需要我存在硬盘中。掌握好搜搜引擎技巧即可。现在 AI 大模型时代,甚至搜索技巧都不太需要了。
生活中数据会有很多,真正要备份的却并不多。对我来说,似乎只有拍摄的照片和视频是万万不想丢失的。

写了一个小脚本统计了一下,目前不想丢失的数据至少有这么多。群晖的索引和缩略图大概占用50G左右。
备份方案
相对比较安全的备份原则是「3-2-1」,即:3份数据、2种存储介质、1份在异地。
3份数据,也就是原是数据加上至少2份副本,放置误操作、硬件损坏等等
2种存储介质,比如固态硬盘、机械硬盘、云存储。每个介质寿命不同,使用环境不同。
1种异地,避免被 AOE(单场地整体被破坏)损毁
对于个人和家庭来说,也不需要特别复杂。以下的方式即可实现:
3份数据:1份在 NAS,1份在移动硬盘,1份在云存储
2种存储介质也满足了,硬盘和云存储(成熟的云存储厂商有灾备和冗余处理,可以视为不同介质了)
1异地,云存储即异地。
我的方案基于这个实现:
WD 的移动硬盘,机械,没啥原因,就是因为买不起大容量固态盘。数据备份会第一时间存储到移动盘。简单整理后复制到 NAS。
最后,通过 NAS 的不间断网络持续上传到云端。
云端服务我选择了 Backblaze,位置在美国,非常「异地」了。
上传软件其实挺难选的,群晖自带了 Hyper Backup,开源的有 Duplicati,原理都差不多,都是分块数据上传,然后提供版本管理。也就是说,云存储那边的数据不是原始的一张张照片,而是一块块的数据块。需要使用专用软件才能解开。甚至还可以使用加密,这样必须有密码和还原软件才可以解包数据。对于 AI 时代来说,这种方式对隐私的保护相对比较彻底。
一挪迈的思考
数据备份有很多误区。比如,很多 NAS 厂商吹嘘的 RAID 阵列,其实并不安全,该坏一样坏。如果整个备份策略完善,还不如直接单盘(也就是所谓 RAID 0)经济实惠。
Backblaze 的产品分两种,一个是 B2 存储桶,算是比较通用,对标(兼容)Amazon S3,按存储用量计费。另一个是 Personal Computer Backup,包月制,每个月9刀,无限容量备份,但这种方式类似于同步盘。理论上 Backblaze 不允许通过科技手段上传海量数据,但官方似乎也没有禁止或处罚这种用法。我个人没有使用这种方式。
成熟的云存储厂商支持你邮寄硬盘来做数据的上传和下载,如果身处美国等地,这类服务还是挺划算的。大量的数据上传下载,还得是靠飞机、卡车来运送来的更快
原创不易,如认为有价值,请不吝赞赏充电⚡️