# 📦 为何要按自然日归档?

众流的底层架构是以SAAS平台来做的,目前能深度支持计时计费、生鲜零售2大行业。

但随着平台的数据量增加,我们不得不选择和大型互联网公司类似的存储方式,即将每天产生的所有订单数据按天统计好再存入数据库,统计时使用这些统计好的数据,不再使用原始订单数据。

这是为什么❓ 下面我们尝试说下这个问题。 和技术无关,技术只是认知的实现手段

举个例子,某家店铺1号这天产生500个订单,每个订单包含5个商品。则系统中会产生2500条数据,用作标识1号所有商品的销售状况,那当我要查看其中某一个商品的数据时,系统会扫描2500条数据。

2500条数据其实真的很少,但一年以后立马变成912500条数据。如果是10家连锁店,那还得 ✖️ 10,即9125000。也就是说,1年以后这家店查询任何一个商品任何一个时间段的数据都会面临从912万条数据里面找结果的问题。

image-20220818131216743

# 那如果按日存档呢?

还是那个例子,1号产生的2500条数据会在凌晨被归档,每个商品存储1条,一年后是365条,10家店是3650条。对,你没有看错,1年以后的量几乎和未归档前的1天差不多。

image-20220818131407915

不单单是使用数据的效率变得更高了。另一方面,现代系统都是相互协作,相互依赖的。不大可能一切业务都由某家公司全部完成,大家通常都是聚焦在自己更擅长的领域,其他功能模块通过技术的方式和专业的产品进行打通联动。拿众流专注在经营管理领域来说,聚合支付,第三方外卖,企业内部OA这些我们都是通过和第三方专业的产品进行技术对接来实现。这里面大家都是用天来进行数据交互。

细心的你可能也想起来了,过往使用的国内其他大型互联网公司的产品(如微信、支付宝账单,各大电商平台等),她们是不是都是最多只能让你看以天为单位的数据?

这其实是数据到达一定量级后唯一的解决办法。

那是不是就完全不能看 < 天的数据呢?并非这样,我们仔细思考下, 我们真的需要看数据指标看到小时、分钟、秒吗? 其实可能只是一些特殊的地方才真正需要,比如众流提供了一些经营相关的数据图表或报表,这里面会展示一些时段的经营指标,如分析店铺的时段高峰这些,你应该用得上。

Tips:按日归档只是指标按日存储,订单原始数据仍然存储在云端,你随时可以在后台查询任何一单的所有明细。

上次更新: 8/18/2022, 2:29:32 PM