最近几年,首席数据官的出现变得更加清晰。最初,这个新的C级的管理角色在医疗、金融和政府组织中更为常见。最近,它已经进入了更多的商业公司。在麻省理工学院的CDOIQ大会第二天的活动中,theCUBE邀请到了Dave Vellante、Jeff Kelly和Paul Gillin畅谈了最近首席数据官的发展情况。
Vellante提出了一个想法,“首席信息官的角色实际上变成了首席运营官和首席技术官,首席数据官正在浮出水面,直接向首席运营官汇报。”
Gillin解释说这是正常的现象。“离开了数据的信息是什么?我们有一位首席信息官和一位首席数据官,数据等同于信息,我们为什么需要两个人来做同样的事情呢?”由于首席信息官更多地负责基础架构方面的工作,所以这个职位自然而然地出现了演变。
将数据治理放在哪里合适
Vellante表示,当绝大部分的公司都上马了大数据项目之后,在监督如何利用这些数据帮助企业治理方面就出现了缺口。Kelly承认“不同的部门往往会使用不同的数据和分析产品,”因为缺乏企业级的监督,“想要将其用于企业治理非常困难。”
随着企业的员工原来越多地使用免费的社会服务,他们需要了解使用它们的意义,以及数据流出去的影响。Kelly补充表示,问题仍然是“你如何符合道德规范、合法地使用这些信息?我不认为现在在这方面有大量的监督。绝大部分的组织将这些项目看成是孤立的,而不是将它们看成是治理工作中更广泛的视角。”
Gillin表示,最大的问题之一是“我们倾向于认为数据是结构化的。”在现实中,80%到90%的数据都不是结构化的。如何从大量的非结构化的信息中找出意义是治理工作面临的一大挑战。
Wikibon的分析师Kelly谈到了他在最近进行的大数据从业人员调查的时候发现了一些和首席数据官相关的事情。Kelly表示,问题之一就是找到让大数据分析项目产品化的最大障碍。他回忆说,“从非技术的角度来看,它混淆了隐私和合法性的问题。”他表示,“人们不理解自己的责任是什么,他们不想被牵涉进法律或者道德的问题之中。”
Vellante强调了这样的发现“说到缺乏某种类型的数据皇帝。”Vellante表示,“首席数据官的工作从根本上说不是拥有数据,而是关于拥有治理,如何处理数据以及和每个相关的人沟通。”
数据仓库目前的状态
在讨论到数据仓库目前的状态的时候,Vellante质疑说以目前的情况看,这种技术是否已经过于陈旧了。Kelly表示,“这些已经用了一、二十年的技术已经不能实现对它们的期望了,我认为我们都能够同意这一点。”他表示数据仓库采用了“一种相当不灵活的数据模型。”
Kelly继续表示,“区别在于理解内容和背景。”他说,“每个人都能够理解内容,但是这些内容在特定的背景有什么含义,这才是真正的挑战。”
Vellante强调说在Kelly的从业人员调查中,大部分参与调查的人都表示将资源从数据仓库转移到Hadoop之中,到今年年底,这一情况还会愈演愈烈。Kelly表示在这方面他的发现略有不同,大约有60%多一点的人将这种或者那种工作负载从传统的大型机或者数据仓库迁移到Hadoop。他解释说这里的工作负载通常是指变革、商业智能和报告等。
Gillin补充表示数据仓库在市场营销和客户关系等领域的影响最大,或者是在零售行业也取得了显著的回报。他表示,“在银行、医疗保健、制造业等行业我还没有看到数据仓库创造了巨大回报的例子。”
Kelly指出,“只要你是一个持续创新的组织,Hadoop就是可持续发展,”只要不断发展和添加新的资产。他表示,“Hadoop和大数据只是一个平台,是一个促进者。如果你持续不断地创新,不断寻找机会让你已有的数据提供新的价值,如果你能够建立起一种不断最大限度利用你的数据的文化,就会有可持续的增长。”
好文章,需要你的鼓励
Panzura在其Symphony数据管理平台中新增了访问控制列表分析和自动修复功能。该平台专门处理EB级非结构化数据集,具备扫描、分层、迁移和合规分析等功能。Panzura声称58%的企业受到权限扩散问题影响,74%的数据泄露涉及特权凭证滥用。新版本重点解决权限继承中断、过度授权访问和合规盲点等问题,提供完整的文件系统权限可视性和快速问题解决能力。
沙特TachyHealth团队开发的32亿参数医疗AI模型Gazal-R1,通过创新的双阶段训练方法在医疗推理任务上超越了12倍大的模型,在MedQA等测试中取得87.1%的优异成绩,展现了精巧训练策略胜过规模扩张的重要启示,为资源有限的医疗AI研究提供了新路径。
Arista Networks宣布收购博通旗下VeloCloud SD-WAN业务,交易金额约10亿美元。VeloCloud是SD-WAN领域先驱企业,拥有集成安全功能的云管理SD-WAN解决方案。此次收购填补了Arista在分支机构连接方面的空白,使其能够提供端到端网络解决方案。同时,前思科高管Todd Nightingale加入担任总裁兼首席运营官,将助力公司拓展更广泛的客户群体。
奥地利维也纳医科大学研究团队开发了RetFiner技术,通过让眼科AI模型同时学习OCT图像和医疗文字描述,显著提升了诊断准确率。该方法采用四种训练任务让AI模型建立图像与文字的深层联系,在三个主流眼科AI模型上实现了2-6个百分点的性能提升,为医学AI发展开辟了新方向。