“CBA”战略再下一城 UCloud成功获得AI领域标杆客户

UCloud于2017年初提出了“CBA”(Cloud,Bigdata,AI)三位一体发展战略,其中人工智能(AI)随着云计算、大数据、深度学习等技术实现了快速发展。

UCloud于2017年初提出了“CBA”(Cloud,Bigdata,AI)三位一体发展战略,其中人工智能(AI)随着云计算、大数据、深度学习等技术实现了快速发展。在这一过程中,UCloud深挖AI领域标杆客户,运用强大技术实力和良好服务帮助客户解决痛点,成功与格灵深瞳建立起友好合作。

人工智能领军者——格灵深瞳

人工智能的五大核心技术包括计算机视觉、机器学习、自然语言处理、机器人和语音识别。格灵深瞳是一家同时具备计算机视觉、深度学习技术以及嵌入式硬件研发能力的人工智能公司,拥有全球领先的三维视觉感知技术,帮助计算机理解人的行为轨迹,也是第一家将人工智能应用于金融安防、智能交通等领域的公司。

经过多年技术积累和沉淀,格灵深瞳在金融安防、智能交通等行业累积大量了数据,通过深度学习技术,进一步将计算机视觉性能提高。接下来,格灵深瞳将开拓商场、超市等连锁企业,为他们提供智能视频监控解决方案,实现真正的商业化。

随着业务拓展,格灵深瞳很需要GPU做在线服务的计算支持,部署客户前端的智能摄像机会进行画面抓拍,同时把画面传回云端,由云端的GPU集群来进行计算,并且可以快速将返回的结果提供给用户。

AI实践者——UCloud

2016年,Alpha Go和人类围棋冠军的两轮对决刷新了大众对人工智能的认知,也让人工智能成为舆论焦点。今年7月20日,国务院颁布《新一代人工智能发展规划》,明确将人工智能作为未来国家重要的发展战略。

一直以来,UCloud都走在科技发展前沿。在人工智能兴起之初,公司便积极与国内领先的人工智能公司接触,共同探讨人工智能与云计算的结合点。因此,在与格灵深瞳接触中,UCloud深入挖掘客户痛点,运用强大技术实力和良好服务,成功拿下人工智能领域的标杆客户。

通过与客户一系列的接洽,UCloud总结出此类客户以往的IT架构,并拿出了针对AI客户的解决方案。

格灵深瞳等传统AI客户的IT架构以自建机房为主:

软件架构:

需要维护多套深度学习框架,如:Tensorflow、Caffe;

很难进行框架层面优化以实现最佳训练性能;

需要自己维护一套驱动仓库,不同GPU卡对应不同的显卡驱动;

训练数据种类繁多,数据量较大,管理起来较复杂,包括热数据备份和冷数据归档、存储容量扩展性、IOPS和带宽吞吐量等,都是复杂的工程性问题。

硬件资源:

需要自己购买机柜、X86服务器、GPU显卡、UPS电源、交换机、路由器,维护成本高;

需要维护一个X86服务器的备件库,保证GPU服务器的最高训练效率;

服务器、GPU卡属于固定资源,无法做到资源快速扩展,重新采购周期较长;

训练数据的周期性迭代,使得硬件资源使用率存在高低峰值。

资金投入:

硬件资源购买需一次性投入大量资金;

电费开销巨大,一般还需要涉及电路改造;

需要专业的硬件和操作系统运维工程师。

UCloud软硬件并行,提供完善的解决方案

硬件资源:

UCloud提供NVIDIA最新Tesla系列GPU卡P40。P40是NVIDIA推出的专门用于深度学习训练和推理的GPU卡,提供比CPU服务器快40倍的深度学习推理速度,采用NVIDIA最新的PascalTM架构和16纳米制造工艺,具有3840个流处理器,核心主频高达1303~1531MHz,24GB GPU显存;高达12 TFLOPS单精度浮点运算和47TFLOPS整数运算能力(INT8)让深度学习的速度飙升。

UCloud提供单机4卡P40物理机:

UCloud提供基于P40云主机:

格灵深瞳云端架构:

格灵深瞳原先自建的机房深度学习训练平台使用单机8卡(GTX 1080Ti)的GPU物理机。迁移到UCloud云上之后,选择UCloud的单机4卡(P40)GPU物理机+单机4卡(P40)GPU云主机,训练数据三副本存放在UCloud提供的3台万兆网络环境的SSD物理机上,最终实现资源层弹性伸缩和存储层可靠性。

软件架构(PaaS):

UCloud最近刚发布了AI-Train在线训练产品,解决包括代码管理、运行环境维护、GPU管理维护、数据管理等模型训练过程中的每个环节,提供一站式Paas解决方案。下一步,我们将了解格灵深瞳的软件架构,为其解决模型训练场景所带来的一系列工程性难题。

最后,通过使用UCloud的服务,帮助格灵深瞳解决硬件成本以及人力成本,大幅度降低了格灵深瞳的成本投入。

资金投入前后对比:

前:硬件资源购买需一次性投入大量资金。

后:UCloud所有产品都可以提供按需付费模式,不需要一次性付费,提高了客户资金的利用率。

前:电费开销巨大,一般还需要涉及电路改造。

后:UCloud所有GPU资源都不收取产品费用以外的任何费用。

前:需要专业硬件和操作系统运维工程师。

后:UCloud所有GPU产品有专业的团队运营维护,发生硬件故障后,可以快速从备件库更换新硬件,或者开启新的GPU资源,删除故障机器。

现在,格灵深瞳已经成为UCloud在人工智能领域的标杆客户。在摸索探寻人工智能的道路上,我们发现“中立性”是人工智能公司对云计算厂商重要评估标准之一。此次UCloud成功将人工智能技术与云计算服务结合,从中带来的经验和可复制性,将为UCloud进军人工智能领域打下坚实的基础。

来源:业界供稿

0赞

好文章,需要你的鼓励

2017

09/25

18:29

分享

点赞

邮件订阅
白皮书