大数据最核心的价值是什么?
日期:2024-03-06 17:58:21   来源:常见问题

  “很多人还没搞清楚什么是PC互联网,移动互联网来了,我们还没搞清楚移动互联的时候,大数据时代又来了。”

  空白处你会填上什么?欢迎各位讨论。但是目前可以预测的是,数据和内容作为互联网的核心,不论是传统行业还是新型行业,谁率先与互联网融合成功,能够从大数据的金矿中发现暗藏的规律,就能够抢占先机,成为技术改革的标志。

  •Mckinsey也列出了Open Data时代里七大行业潜在的经济价值,自上而下分别是教育,运输,消费品、电力、石油与天然气、医疗护理、消费金融。

  1.传统企业数据:包括 CRM systems的消费者数据,传统的ERP数据,库存数据及账目数据等。

  2.机器和传感器数据:包括呼叫记录,智能仪表,工业设施传感器,设备日志,交易数据等。

  3.社交数据:包括用户行为记录,反馈数据等。如Twitter,Facebook这样的社会化媒体平台。

  从理论上来看:所有产业都会从大数据的发展中受益。但由于数据缺乏以及从业人员本身的原因,第一、第二产业的发展速度相对于第三产业来说会迟缓一些。1985年,我国国家统计局明确地把我国产业划分为三大产业:

  2.工业(包括采掘业、制造业、自来水、电力、蒸汽、煤气)和建筑业定为第二产业。

  第三产业即除第一、第二产业以外的向全社会提供各种各样劳务的服务性行业,主要是服务业。其中第三产业可具体分为两大部门:一是流通部门;二是服务部门。再细分又可分为四个层次:

  1.第一层次,流通部门。包括交通运输行业、邮电通讯行业、物资供销和仓储行业。

  2.第二层次,为生产和生活服务的部门。包括金融业、商业饮食业、保险业、地质普查业、房地产业、公用事业、技术服务业和生活服务修理业务;

  3.第三层次,为提高科学文化水平和居民素质服务的部门。包括教育文化、广播电视事业、科学研究事业、卫生、体育和社会福利事业;

  4.第四层次,为社会公共需要服务的部门。包括国家机关、党政机关、社会团体、以及军队和警察公安司法机关等。我们大家可以看出,由于某些客观原因,相对于第一产业和第二产业来说,第三产业凭借自身的优势,大多汇聚了当前最海量的数据及大批的科研中坚力量。

  接下来让我们看一些典型例子,当前新形势下与三大产业紧密关联的大数据应用。

  •孟山都(Monsanto A Sustainable Agriculture Company),农业孟山都是一家美国的跨国农业生物技术公司,其生产的旗舰产品抗农达,即年年春(Roundup)是全球知名的嘉磷塞除草剂,长期占据市场第一个位置。

  孟山都首先发起“Green Data Revolution”运动,建立农业数据联盟(Open Ag Data Alliance)来统一数据标准,让农民不用懂“高科技”也能享受大数据的成果。典型的应用如农场设备制造商John Deere与DuPont Pioneer当前联合提供“决策服务(Decision Services)”,农民只需在驾驶室里拿出平板电脑,收集种子监视器传来的数据,然后将其上传给服务器,最终服务器返回化肥的配方到农场拖拉机上。

  The Climate Corporation为农民提供Total Weather Insurance (TWI)——涵盖全年各季节的天气保险项目,利用公司特有的数据采集与分析平台,每天从250万个采集点获取天气数据,并结合大量的天气模拟、海量的植物根部构造和土质分析等信息对意外天气风险做出综合判断,然后向农民提供农作物保险。该公司于2013年被孟山都收购。

  工业企业对数据的记录以往看来大致上可以分为两种方法:传统的纸笔和Excel电子表格记录。这些操作起来看似简单的数据管理方式为公司制作及质量监控埋下了巨大的隐患,也让数据挖掘无从谈起。

  随着信息化与工业化的融合发展,信息技术渗透到了工业公司产业链的各个环节。

  例如Sensor、RFID、Barcode、物联网等技术已在企业中得到初步应用,工业大数据也开始逐渐得到积累。

  德国汉德技术监督服务有限公司(简称TÜV)获得德国政府授权,负责安全检验工作。检验产品品种类型从采矿、电力系统开始,到能承受压力的容器、机动车辆、宇航工业、医疗产品等等,应有尽有。现在的德国汉德技术监督服务有限公司慢慢的变成了了许许多多产品的安全代号。

  TÜV当前从建筑绿色标准体系方面提出了对于大数据能源管理的探索,以微软新总部,蒂森克虏伯电梯总部为例,在整个项目实施中引入大数据能源管理,在建筑的设计规划阶段、施工阶段、运营阶段等多个阶段通过数据化的能源管理系统,实现建筑的低碳、绿色、智能。

  Wonderware作为系统软件涉及的专业企业,对于大数据的计算和运用是从比较“IT”的方面出发的。

  Wonderware 的实时数据管理软件可提供一个工厂所需要的从建立到报废的所有实时数据。目前已经退出移动版本,工程总监在手机上就能够随时随地监控设备的运行状况。

  Early Detection of Patient Deterioration等公司正在开发床垫监测传感器,自动监测和记录心脏速率、呼吸速率、运动和睡眠活动。该传感器收集的数据以无线方式被发送到智能手机和平板电脑进行进一步分析。

  《车来了》通过一系列分析公交车上GPS定位系统每天的位置和时间数据,结合时刻表预测出每一辆公交车的到站时间;

  实时交通数据采集商INRIX-Traffic的口号是(永不迟到!^^),通过记录每位用户在行驶过程中的实时数据例如行驶车速,所在位置等信息并进行数据汇总分析,而后计算出最佳线路,让用户能避开拥堵。

  于2013年被 eBay收购的Decide 是一家预测商品的价值并为广大购买的人提出购买时间建议的勇于探索商业模式的公司,通过抓取亚马逊、百思买、新蛋及全球各大网站上数以十亿计的数据来进行分析,最终整合在一个页面中方便消费者对比查看,还可以预测产品的价格趋势,帮助用户确定商品的最好购买时机。

  FICO 信用分计算的基本思想是:把借款人过去的信用历史资料与数据库中的全体借款人的信用习惯相比较,检查借款人的发展的新趋势跟经常违约、随意透支、甚至申请破产等各种陷入财务困境的借款人的发展的新趋势是否相似。FICO 已经为三分之二的世界 100 强银行提供服务,提高了客户忠诚度和盈利率、减少欺诈损失、管理信贷风险、满足监管与竞争要求并快速获取市场份额。

  美国T-mobiles采用Informatica - The Data Integration Company平台开展大数据工作,通过集成数据综合分析客户流失的原因,根据分析结果优化网络布局为客户提供了更好的体验,在一个季度内将流失率减半;韩国 SK telecom新成立一个企业SK Planet,通过大数据分析用户的使用行为,在用户做出决定之前推出符合用户兴趣的业务防止用户流失。

  英国BT - Broadband公司发布了新的安全数据分析服务Assure Analytics—BT news releases,帮企业收集、管理和评估大数据集,将这一些数据通过可视化的方式呈现给企业,帮企业改进决策。

  了解了大数据的典型应用,相信在每个人的心中,关于大数据的价值都有了自己的答案。

  2010年《Science》上刊登了一篇文章指出,虽然人们的出行的模式有很大不同,但我们大多数人同样是可以预测的。这在某种程度上预示着我们能够根据个体之前的行为轨迹预测他或者她未来行踪的可能性,即93%的人类行为可预测。

  而大数定理告诉我们,在试验不变的条件下,重复试验多次,随机事件的频率近似于它概率。“有规律的随机事件”在大量重复出现的条件下,往往呈现几乎必然的统计特性。

  举个例子,我们向上抛一枚硬币,硬币落下后哪一面朝上本来是偶然的,但当我们上抛硬币的次数足够多后,达到上万次甚至几十万几百万次以后,我们就会发现,硬币每一面向上的次数约占总次数的二分之一。偶然中包含着某种必然。

  随着计算机的解决能力的日益强大,你能获得的数据量越大,你能挖掘到的价值就越多。

  实验的不断反复、大数据的日渐积累让人类发现规律,预测未来不再是科幻电影里的读心术。