重新认识多渠道跨境出海的结构化数据和半结构化数据的应用
日期:2023-11-23 21:27:54   来源:云开平台/集团新闻

  2017年5月,全球影响力最大的时政杂志之一《经济学人》发表了题为《The world’s most valuable resource is no longer oil, but data》的文章。根据文章观点,数据已取代石油,成为当前世界上最有价值的资源。

  文章刊发后,其观点迅速引起各方热议:“2017年Q1,Alphabet、微软、苹果、Facebook和亚马逊总计实现净利润超过250亿美元,全美超过50%的线上开支都进了亚马逊的腰包;2016年,谷歌和Facebook几乎攫取了美国数字广告营收的全部增量。”

  从这个角度上看,文章观点无疑是正确的。而欧美国家也认为,自1969年开始,人类社会已正式步入信息时代。

  时至今日,即使一个人只是在走路,诸如微信运动之类的小程序都可以将数据记录下来并生成步数。此外,驾驶、考试等一系列日常场景也会生成相应的数据。

  2020年5月,国家发改委发布“数字化转型伙伴行动”倡议。倡议提出,要在更大范围、更深程度推行普惠性“上云、用数、赋智”服务,加快打造数字化企业,构建数字化产业链,培育数字化生态,形成数字化生态共同体,支撑经济高质量发展。

  由于数字化转型涉及的理论和技术相对晦涩,当前仍有不少卖家对数字化转型感到云里雾里,甚至认为多买入几款数据处理工具就算“实现”了数字化。

  针对卖家存在的这种误区,王泽耀表示,卖家不了解技术很正常,毕竟术业有专攻,但希望卖家在认识上不要本末倒置,“在AWS的业务推广中,我们大家都希望跟客户通过一些渠道产生最直接的接触,然后再从业务的场景去切入。”

  辩证唯物主义的观点认为,人对新事物的认识可分为两个阶段,即由感性认识飞跃至理性认识,再由理性认识飞跃到实践过程。

  也就是说,理性认识反映事物的一般特性和普遍本质,而感性认识是理性认识的基础和前提。在这一基础上,要想令更多卖家认识到数字化转型对跨境出海的重要性,先要让他们感受到数字化技术的实际功能和意义。

  以资金结算为例,传统跨境电子商务资金结算涉及多个中转银行以及国际清结算组织,手续多、耗时长,有一定的概率会对卖家资金正常流动造成一定延迟,假如通过数字化转型引入了区块链技术,就能有效解决卖家这一烦恼。

  利用区块链的两大特点,“去中心化”和“信息不可篡改”,恰好能够更好的降低跨境中转金融机构的影响,并在资金流转过程中以通证作为媒介,确保用户个人信息与产品信息真实有效,实现了信息可溯源与多方共享,因而大幅优化了资金流转的速度与效率。

  事实上,按照当前的行业趋势发展,在未来几年,数字化转型对卖家来说或许将不是一道选择题,而是必答题。

  国内快消时尚巨头SHEIN财报多个方面数据显示,2020年,其全年营收近100亿美元,连续八年实现超100%增长。

  根据其官网数据,SHEIN日均能出售80万件衣服,折算起来,一年销量近3亿件。如此庞大的销售数据,还能像以前一样只用基础的数据分析工具来处理吗?恐怕很难,显然,这已经涉及到大数据的领域。

  一般来说,大数据具有“5V”特点。Volume,体量大,通常以TB、PB为起始计量单位;Velocity,时效性高,即使几分钟前的资讯也能被用户查询;Value,挖掘出数据的实际价值;Veracity,准确度高,虚假或不准确的数据一律不采用;Variety,数据种类多样化,包括结构化、非结构化和半结构化数据。

  在大数据5个“V”当中,前面4V,对大部分卖家来说理解起来并不难,但Variety(数据种类)对不直接接触数字业务的卖家而言确实有些陌生。

  所谓的结构化数据,指的是固定格式及长度有限的数据,比方说,“性别:男”、“民族:汉”,都属于结构化数据;非结构化数据,可以与结构化数据反着理解,即没有固定格式及长度无限的数据,比如说,图片、音频、视频等;半结构化则是介于以上两者之间,即部分格式化和有限长度的数据及部分没有格式化和固定长度的数据。

  在实际应用中,得益于固定格式及有限长度的特点,利用结构化数据可以高效、实时地对业务信息进行查询,需要出示账户、交易明细时,也能实现大量请求,毫秒级响应。

  相较于结构化数据,半结构化数据在结构上具有自描述性、复杂性和动态性等性质。简单来说,半结构化数据的构成更为复杂、不确定,因而也具有更高的灵活性,比起结构化数据,能适应更广泛的应用场景。