我们的专业付出,值得您的永久信赖!为您量身定制,信誉第一!

订货热线:19930591372

推荐产品
  • 【亚博网页版登录界面】快乐玻璃杯第201到210关怎么过 第201~210关三星通关攻略
  • 亚博网页版登录界面_欧盟国家将就5G新电信规则进行谈判
  • 3DXpoint将掀起人工智能领域一场革命?美光:我行-亚博网页版登录界面
当前位置:首页 > 产品中心 > 卡板托盘
亚博网页版_【论文】谷歌硬件工程师:数据中心的TPU性能分析

 


47902
本文摘要:以往十五年里,大家依然在大家的商品中用于低推算出来市场需求的机器学习。

以往十五年里,大家依然在大家的商品中用于低推算出来市场需求的机器学习。机器学习的应用于这般频烦,以致于大家规定设计方案一款全新升级类型的自定化机器学习网络加速器,它便是TPU。

TPU究竟有多慢?今日,带头在美国硅谷电子计算机博物馆举办的我国工程项目研究院大会上公布发布的相关TPU的演讲中,大家发布了一项科学研究,该科学研究共享资源了这种自定化处理芯片的一些新的关键点,自二零一五年至今,大家数据中心的机器学习应用于中就依然在用于这种处理芯片。第一代TPU朝向的是假定作用(用于已训炼过的实体模型,而不是实体模型的训炼环节,这在其中一些各有不同的特点),使我们想起一些寻找:●大家商品的人工智能技术特性阻抗,关键运用神经网络的假定作用,其TPU响应速度比当今GPU和CPU要慢15到30倍。

●相较传统式处理芯片,TPU也更加节约资源,功能损耗高效率(TOPS/Watt)上提升 了30到80倍。●驱动器这种应用于的神经网络只回绝小量的编码,较少的难以想象:仅有100到1500行。编码以TensorFlow为基本。●70好几个创作者对本文有奉献。

这一份汇报也感慨劳师动众,许多 山参予了设计方案、确认、推行及其合理布局类似那样的系统软件硬件软件。TPU的市场需求约的确经常会出现在六年以前,那时候我们在全部商品当中更为多的地区已刚开始用于耗费很多云计算服务器的深层通过自学实体模型;划算的推算出来令人堪忧。

倘若不会有那样一个情景,在其中大家在1天中用于谷歌语音进行3分钟寻找,而且我们要在因此以用于的CPU中为语音识别技术系统软件经营深层神经网络,那麼大家就迫不得已缩减到Google数据中心的总数。TPU将使大家比较慢做出预测分析,并使商品迅速对客户市场需求做出对于此事。TPU经营在每一次的寻找中;TPU抵制做为Google图象寻找(GoogleImageSearch)、谷歌照片(GooglePhoto)和谷歌云视觉效果API(GoogleCloudVisionAPI)等商品的基本的精确视觉效果实体模型;TPU将加强谷歌在线翻译成上年开售的开创性神经系统译成品质的提升 ;并在GoogleDeepMindAlphaGo对李世乭的获胜中充分运用了具有,它是电子计算机初次在历史悠久的围棋比赛中击败世界大赛。

大家着眼于打造最烂的系统架构,并将其共享给任何人。大家期待在未来的数日和几个月内共享资源更强的重做。

亚博网页版登录界面

毕业论文题目:数据中心的TPU性能剖析(In-DatacenterPerformanceAnalysisofaTensorProcessingUnit)概述:很多系统架构师确信,如今要要想在成本费-耗能-性能(cost-energy-performance)上获得提升 ,就务必用于特殊行业的硬件配置。这篇毕业论文评定了一款自二零一五年至今就被应用于数据中心的自定化ASIC,亦即张量CPU(TPU),这款商品能用于加速神经网络(NN)的悬疑小说环节。TPU的管理中心是一个65,536的8位MAC矩阵乘法模块,可获得92万亿次计算/秒(TOPS)的速率和一个大的(28MiB)的可用应用管理的上面运行内存。

相对性于CPU和GPU的随時间转变的优化方法(高速缓存、混乱执行、线程同步、多应急处置、预取……),这类TPU的可预测性的执行实体模型(deterministicexecutionmodel)能更优地给出大家的神经网络运用的99%的响应速度市场需求,由于CPU和GPU更强的是帮助对货运量(throughout)进行均值,并非确保推迟性能。这种特点的缺点有利于表明为何虽然TPU有非常大的MAC和大运行内存,但却较为小和功耗。大家将TPU和网络服务器级的intelHaswellCPU与如今某种意义也不会在数据中心用于的英伟达显卡K80GPU进行了比较。

大家的特性阻抗是用高級的TensorFlow架构编写的,并是用了生产制造级的神经网络运用(多层感知器、卷积和神经网络和LSTM),这种应用于占了大家的数据中心的神经网络悬疑小说推算出来市场需求的95%。虽然在其中一些应用于的使用率比较较低,可是均值来讲,TPU约15-30倍变缓当今的GPU或是CPU,速率/输出功率比(TOPS/Watt)约低30-80倍。

除此之外,假如在TPU中用于GPU的GDDR5运行内存,那麼速率(TOPS)还不容易刷三倍,速率/输出功率比(TOPS/Watt)能超出GPU的70倍及其CPU的200倍。


本文关键词:亚博网页版,亚博网页版登录界面

本文来源:亚博网页版-www.myqasidah.com