扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共2页)
4.前沿与核心,数据科学家的施展平台
尽管这种做法完全是为了迎合消费者心理所打造的营销工具,但其意义仍然不容忽视。数据科学家有能力向用户展示数据与平台间的协作关系以及奇妙成果。他们也是技术会议上人们所期待的发言代表。
几乎每个人都可以接手Hadoop与NoSQL营销工作。我们很难对这类销售人员的技能水平进行衡量,也没必要继续纠结于容量、类型以及速度之类的陈词滥调。针对系统配置与整合的讨论虽然非常重要,但只能吸引到一小部分受众,只有以规模化方式进行推广才能引发广泛关注。
与其它Hadoop竞争对手相比,Cloudera所获得的关注以及带给听众的信息明显更多。虽然发生这种现象的原因多种多样,但其中最关键的因素在于Jeff Hammerbacher。不要在数据以及存储或处理数据的基础设施方面喋喋不休——告诉我你的方案能创建出哪些实际产品,我又能在其上进行哪些类型的分析工作。厂商至少需要证明自己有诚意将数据推向更广泛的应用领域,而不只是在为自己的产品销售寻找新的借口。
5.开源的重要性由大家自己决定
几乎每一家大数据新兴企业都依赖于开源软件。其中一部分直接借用自现成项目——例如Hadoop、Storm或者其它各类数据库——还有一些由企业自主开发。在多数情况下,企业会将两种方案相结合,例如为HBase添加新功能。这些项目之所以如此红火,根源在于活跃的技术社区。
我从没打算尝试发起一场开源运动,在我看来这是一项艰苦的工作。不过可以肯定的是,在Github上提交的代码确实有助于企业最终完成预期项目。Facebook与谷歌这样的业界巨头有实力把代码公开作为一种纯粹的激励机制,但作为新兴企业,大家应该不至于自大到认为自己的开发团队强大到无需技术社区的辅助。
开源的目标通常在于将开发某种代码的技术人员汇聚起来,从而实现项目改进。厂商需要以开放的形式利用群众的智慧改进技术,并解释为什么自己的项目能受到众多开发者的青睐。虽然这种策略与前面提到的吸引开发者有些相似,但免费增值路线有机会吸引更多用户体验产品,并一步步将自己的精力甚至资金投入到项目研发当中。
通过开源形式进行代码编写的新兴企业可谓数不胜数,但真正愿意分享项目并建立技术社区的公司则不多。在这方面,Neo Technology的Neo4j、Concurrent的Cascading、10gen的MongoDB以及Twitter等终端用户厂商推出的Storm与Mesos等算得上其中的佼佼者。这些企业创建了项目,并以此为核心打造技术社区,如今这一系列努力终于换来了丰厚的回报。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。