比特红人馆|Cloudera大中华区总经理徐晋:新基建背景下,如何利用数据实现价值提升?

作者:yu 来源:原创 2020-04-27

  2020年似乎对我们并不友好,在新冠肺炎疫情阴霾笼罩下,国内外经济活动均受到重大影响。

  为了对冲经济下行压力,推进产业转型升级。今年以来,中央相关会议多次提到“新基建”的重要性,各地方政府也纷纷出台相关政策,将加快新基建具体工作提上日程。

  相较于传统基础设施,新基建是以数字化为主要目标,强调利用科技的力量来推动产业发展。伴随着企业数字化转型的不断深入,数据将是企业最核心的资产之一。从数据获取更多的价值,并且快速指导业务决策也将成为越来越多企业的关键需求。

  近日,比特网邀请到了Cloudera大中华区总经理徐晋进行专访,针对后疫情时代的新机遇、Cloudera在“新基建”浪潮中所扮演的角色、企业在数字化转型过程中需要注意的问题,以及Cloudera发展规划等话题展开交流。

  

Cloudera大中华区总经理徐晋

  疫情之下,企业如何把握数字化转型的新机遇?

  疫情影响之下,餐饮、住宿、旅游、娱乐等线下实体受到较大冲击,甚至面临生存危机。但同时也意外催生出“数字化”风潮,远程办公、在线教育、在线医疗、生鲜电商等服务需求大幅增长,成为抵御疫情冲击的重要力量。

  徐晋表示:“新冠肺炎疫情的爆发,对与线下消费强关联的行业冲击强烈,但一定程度上促进了更多消费需求从线下转向线上。未来,在经济社会生活重塑的进程中,数字经济将发挥越来越重要的作用,企业的数字化进程也必将加速。”

  当然,企业向数字化转型不是一蹴而就的事情,在这一过程中还面临一些挑战。以金融行业为例,金融行业的数字化转型早已成为共识。在整个行业升级发展的过程中,数据分析在其中扮演着不可忽视的角色。

  首先,随着企业的成长与积淀,业务方面早已由从前的粗放型模式向着更加复杂的方向发展,形成大量的数据。如何实现对已有数据的管理成为了摆在金融企业面前的一大问题。此外,在使用数据过程中,对“度”的把握也值得关注。

  据徐晋介绍,“Cloudera新一代混合数据管理平台Cloudera Data Platform,可以帮助金融机构提高客户保留率和盈利能力,利用机器学习和预测分析增加收入;同时确保针对GDPR、CCAR等相关法律的合规性,减少欺诈和风险暴露;以数据为驱动为企业提供更加智能的分析信息,改善业务决策。”

  新基建将为以数据为驱动的企业带来不可估量的前景

  今年3月,中共中央政治局常务委员会召开会议,提出加快5G网络、数据中心等新型基础设施建设进度。目前,各方对新基建的新价值有着不同角度的解读。

  “新基建是指以5G、人工智能、工业互联网、物联网为代表的新型基础设施。在Cloudera看来,这几大主流技术趋势是相互联系、密不可分的。它们之间的共同特点都会需要一个符合安全性合规性的数据管理平台,不仅能高效管理海量的数据并能从大数据中产生洞察和业务价值,而这正是Cloudera多年来一直聚焦的领域,现在更包括从边缘、数据工程、数据仓库到机器学习的全生命周期数据的管理。新基建将为已做好准备的数据驱动的企业带来不可估量的前景。”徐晋说道。

  拥抱“Hadoop哲学”,持续为客户带来价值

  最近几年,有一些言论认为Hadoop已经过时。众所周知,在Hadoop生态系统中,规模最大、知名度最高的公司是Cloudera。那么,Cloudera如何看待这种观点呢?

  “首先大家对Hadoop的理解有广义和狭义之分,”徐晋强调,“Hadoop代表的是数据领域的开源社区,即使传统狭义的 Hadoop已经不复存在,但'Hadoop哲学'永存。作为领先的企业数据云公司,Cloudera从未停止拥抱新的主流技术,持续为客户带来价值。Cloudera Data Platform(CDP)的诞生便是其持续创新的最佳证明,它提供了拥有一致的安全及治理能力的数据平台,来帮助企业更好的对生命周期内的数据进行控制。重要的是,它依旧是100%基于'Hadoop哲学'。”

  在采访的最后,徐晋谈到了关于Cloudera的未来布局。徐晋表示,“Cloudera在借助AI和机器学习管理数据领域已经深耕多年。任何企业的数据战略都必须跨越边缘到云,数据管理必须自始至终。尽管市面上有很多企业数据管理产品,但是能够纵观全局、提供从边缘到到机器学习/AI的跨多云和混合云的一致性安全和治理和全套功能的产品却很少。Cloudera将借此机会定义下一代数据管理方式,并对新一代IT技术产生深远影响。”

  以下是采访全文:

  比特网:疫情之下,爆发出一些新的商业需求,催生出很多新的应用场景。您认为,疫情过后,哪些领域会持续加速发展?贵公司未来的战略、产品和行业布局会有哪些调整和变化?

  徐晋:新型冠状病毒肺炎疫情爆发,成了突袭中国经济的黑天鹅。此次疫情对与线下消费强关联的行业冲击强烈,但一定程度上促进了更多消费需求从线下转向线上。未来,在经济社会生活重塑的进程中,数字经济将发挥越来越重要的作用,企业的数字化进程也必将加速。Cloudera致力于帮助企业管理从边缘到云的所有数据,为其提供全生命周期管理,并提供一致的安全和治理服务。另外,借助AI和机器学习技术,实现跨多个云平台且安全合规的数据分析,帮助企业深入挖掘数据价值,有效改善业务决策。

  比特网:当前,“新基建”迅速成为各界所关注的焦点,很大程度上被当做对冲疫情影响的一个重要的政策措施,各界对于“新基建”的理解和解读有些差别,Cloudera对“新基建”是怎么看的?

  徐晋:新基建是指以5G、人工智能、工业互联网、物联网为代表的新型基础设施。在Cloudera看来,这几大主流技术趋势是相互联系、密不可分的。它们之间的共同特点都会需要一个符合安全性合规性的数据管理平台,不仅能高效管理海量的数据并能从大数据中产生洞察和业务价值,而这正是Cloudera多年来一直聚焦的领域,现在更包括从边缘、数据工程、数据仓库到机器学习的全生命周期数据的管理。新基建将为已做好准备的数据驱动的企业带来不可估量的前景。

  比特网:贵公司如何在新基建浪潮中,扮演什么角色?有哪些能力?

  徐晋:在大数据领域,Cloudera是当之无愧的佼佼者,也是全球数据管理市场的领导者。Cloudera认为,任何企业的数据战略都必须跨越边缘到云,数据管理必须自始至终。Cloudera Data Platform融合了Cloudera的传统AI驱动数据管理与Hortonworks端到端数据管理方式,是全球领先的企业数据云平台。它通过统一的平台界面,对企业数据进行整个生命周期管理,并提供一致的安全和治理服务;同时支持数据管理和机器学习在跨云环境中的应用,实现跨多个云平台且安全合规的数据分析。

  比特网:疫情之下,企业数字化转型成为大势所趋,而“新基建”的到来更是加速这一进程,我们知道Cloudera也一直致力帮助企业数字化转型,在实际落地的过程中,Cloudera认为企业在转型中会遇到那些问题?Cloudera给出的解决方案有哪些呢?

  徐晋:以金融行业为例,金融行业的数字化转型早已成为共识。在整个行业升级发展的过程中,数据分析在其中扮演着不可忽视的角色。Cloudera认为,企业在金融行业实现数字化转型中应该重点考虑对数据的安全管控和应用模式。

  1.企业数据管理与应用问题

  传统的金融企业对数据的管理与应用方面存在一定的问题。对金融企业而言,随着企业的成长与积淀,业务方面早已由从前的粗放型模式向着更加复杂的方向发展,形成大量的数据。金融企业该如何实现对已有数据的管理?相应的数据问题能否以开放的思维去解决?企业若想对外提供更好的金融服务,必然要联合上下游企业,此时又该如何进行数据管理?此外,一些银行目前在尝试API(应用程度接口)银行让自己更加开放,同时API的接口数据能够更好地对企业的内部数据进行保护。同时,企业又该如何合法合规地获取外部数据也是一个新的课题。

  事实上,无论是内部还是外部数据,企业最终的诉求应该是借助数据分析对目标客户进行准确“定义”。以前我们对一个人的定义方式其实很简单,但现在却不一定有效。以申请信用卡为例,目前大多数银行针对申请信用卡的数据风险模型相对老旧、死板,企业的风险部门可能会因为打你的固定电话没人接而拒绝向你发放信用卡。这样就会经常错失价值较高的客户。

  2.数据的隐私保护问题

  企业在使用数据过程中,对“度”的把握也值得关注。有时对客户数据的过度使用会导致过度营销,造成客户反感便得不偿失了。企业既要学会借助数据了解客户需求,也要考虑到客户的隐私保护问题。这一点在技术上目前已经可以实现,例如目前流行的“联邦学习算法”。从前做机器模型的部署,把所有的数据都收集到机器上进行分析,产生利用模型的同时也保存了客户的隐私数据。新的算法部署方式,可以让客户在同意隐私访问策略的基础上,在用户使用的终端使用和验证模型,从而避免客户对自己隐私数据泄露的担忧。

  Cloudera新一代混合数据管理平台Cloudera Data Platform,可以帮助金融机构提高客户保留率和盈利能力,利用机器学习和预测分析增加收入;同时确保针对GDPR、CCAR等相关法律的合规性,减少欺诈和风险暴露;以数据为驱动为企业提供更加智能的分析信息,改善业务决策。

  比特网:现在有一种说法认为:Hadoop已经过时。据了解,在Hadoop生态系统中,规模最大、知名度最高的公司是Cloudera。贵公司是如何看待Hadoop已经过时的观点?

  徐晋:首先大家对Hadoop的理解有广义和狭义之分,Hadoop的生态系统现在已经达到数十个开源项目,在过去高速发展的十年中有一点是不变的:Hadoop 代表的是数据领域的开源社区,即使传统狭义的 Hadoop 已经不复存在,但“Hadoop 哲学”永存。“Hadoop 哲学”始终遵循以下原则:

  1. 转向分解软件堆栈,将每一层(存储、计算平台、批处理/实时/SQL计算框架等)构建为可组合的乐高积木,而不是单一且不灵活的软件栈(例如以垂直方式整合的具有定制存储格式、解析器、执行引擎等的数据库。尤其是,通过建立开放的元数据、安全和管理平台来协调分解的堆栈,有助于实现这一点。

  2. 转向用于大型分布式系统的商业化硬件,而不再是专有/单片硬件+软件堆栈。

  3. 转向利用开放数据标准和开源技术,而不是专有的、供应商控制的技术。这不仅仅是开放标准——标准是实现,而不仅仅是“规范”。

  4. 转向灵活多变的技术生态系统(MRv1 -> YARN -> K8s, MapReduce -> Spark/Flink等),而不是对所有的整体堆栈一刀切,从而在每一层都能实现创新。

  作为领先的企业数据云公司,Cloudera 从未停止拥抱新的主流技术,持续为客户带来价值。Cloudera Data Platform(CDP)的诞生便是其持续创新的最佳证明,它提供了拥有一致的安全及治理能力的数据平台,来帮助企业更好的对生命周期内的数据进行控制。重要的是,它依旧是100%基于“ Hadoop 哲学”。

  技术永远是在“打破”与“被打破”中得以发展。最初, Hadoop 框架中最核心的设计就是 HDFS和MapReduce 。后来,MapReduce 逐渐被 Spark 取代,从前的“ Hadoop 发行版”如今所提供的软件包含了 Spark、HBase、Hive,Kafka、Flink、NiFi 等众多组件,早已超出了最初的批处理功能和基于磁盘的本地部署。

  所有这些都表明Hadoop这个名称已不再能够表示我们当今堆栈中的各项技术的真正作用,现在我们应该开始讨论的是数据湖、机器学习、运营数据管理等用例,将这些具体用例作为设计、开发、集成和运营计划的基础会更具说明性和实用性。或许我们可以通过拥抱“Hadoop哲学”来实现这一目标。

  比特网:2020年,Cloudera将在哪些方面发力?

  徐晋:Cloudera在借助AI和机器学习管理数据领域已经深耕多年。Cloudera认为,任何企业的数据战略都必须跨越边缘到云,数据管理必须自始至终。2019年1月Cloudera宣布与Hortonworks合并。这两家企业的强强联手,使Cloudera一跃成为全球数据管理市场的佼佼者。

  Cloudera的传统AI驱动数据管理与Hortonworks端到端数据管理方式相结合,创建了全球领先的下一代数据平台Cloudera Data Platform。Cloudera希望为企业提供一个本身即是多云且多功能的平台,用于管理企业数据云。通过统一的平台界面,对数据进行整个生命周期管理,并提供一致的安全和治理服务。

  公有云版本的Cloudera Data Platform,其中包括Cloudera Data Warehouse和Cloudera Machine Learning服务,目前已在AWS和Microsoft Azure上商用。除了将边缘和云中数据管理整合在现有解决方案中,Cloudera还将在年内提供CDP私有云功能。

  Cloudera面对的是一个260亿美元的巨大市场。未来三年内,市场规模预计将会翻倍至520亿美元,这无疑是一个巨大的发展机遇。尽管市面上有很多企业数据管理产品,但是能够纵观全局、提供从边缘到到机器学习/AI的跨多云和混合云的一致性安全和治理和全套功能的产品却很少。Cloudera将借此机会定义下一代数据管理方式,并对新一代IT技术产生深远影响。

发布
X
第三方账号登录
  • 微博认证登录
  • QQ账号登录
  • 微信账号登录