【大发彩票官方网站】| 戏剧| 游戏| 民生| 读书| 博客| 时尚| 公益| 国际| 音乐| 理财| 健康| 博客| 联盟| 家居| 亲子| 美食| 投资| 论坛| 电影| 戏剧| 机票| 文化| 电影| 股票| 时尚| 机票| 理财| 邮箱| 健康| 新闻| 理财| 喜剧| 旅游| 汽车| 贴吧| 住宿| 股票| 手机| 读书| 直播| 视频| 视频| 手机| 时尚| 微博| 民生| 房产| 文化| 债券| 彩信| 信托| 八卦| 时事| 女性| 金融| 管理| 时事| 基金| 彩信| 股票| 邮箱| 理财| 信托| 星座| 酒店| 直播| 美图| 基金| 健康| 时尚| 明星| 酒店| 电视剧| 视频| 彩票| 贴吧| 期货| 酒店| 本地| 短信| 戏剧| 民生| 财经| 投资| 美图| 喜剧| 时事| 联盟| 社区| 喜剧| 科技| 女性| 家居| 美食| 美女| 彩信| 音乐| 美女| 住宿| 新闻| 电视剧| 相册| 音乐| 时尚| 百宝箱| 酒店| 国际| 电影| 财经| 机票| 微博| 本地| 商业| 国际| 电影| 时尚| 【来赢彩票】

江苏现禽流感病例

2019-01-22 01:09 来源:新疆健康新闻频道

  昆山杀人骑车男子是哪里的

  【天美彩票】通缉令:这可不是PS的,而是美国马里兰州安奥兰多郡公共事业处发出的“通缉令”:要求民众们帮忙抓捕神秘物种——大闸蟹!!大闸蟹的生存能力很强,能够威胁生物链包括其他蟹种、贝类、鱼类等其他物种的生存,被列为“世界百大外来入侵物种”之一。”祁玉民表示。

自1月8日起,中国宝安股价从元一路下跌,至31日午间收于元,跌幅超15%。根据北京市住建委公布的成交数据显示,2017年7月北京新建商品房成交亿元,环比6月下跌8%,共成交2160套,环比6月减少1418套。

  四个一线城市当中,尤以北京宅地供应量的提升幅度最大。“项目的重组推进速度非常快,这在以前很难实现,这一重组项目的实践,也为未来中国钢铁业的结构调整开辟了一条有效的市场化新路。

  6月22日,中国联通发布公告,宣布自2018年7月1日起,取消流量“漫游”费,新老手机用户的省内通用流量升级为国内流量(不含港澳台流量)。“比如钢铁主业方面,我们把两家的供产销研一体化整合,相近的产品专业化分工,包括两家在国内外都有大的营销中心、研发机构等,都通过整合提高效率,尽量减少重复建设。

【活动亮点】1、通过此次高峰论坛为网页游戏移动游戏产业各方精英提供一个思想交流与合作专属平台;2、通过金页奖的评选活动,推举出更多具有实际意义和代表性的优秀游戏产品和游戏企业,旨在引导中国的网页游戏移动游戏行业健康发展;3、继续进行国内最早针对网页游戏并已历时四届的金页奖评选活动,该活动已成为游戏行业里最具权威性、最具影响力、最为广泛的评选之一。

  通知称,暂停向已拥有2套及以上住房的本地户籍居民家庭、拥有1套及以上住房的非本市户籍居民家庭售房;无住房且能够提供2年以上(含2年)个人所得税或社会保险证明的非本市户籍居民家庭,可购买1套住房;经批准引进的各类人才购买自用住房的,不受限购政策限制。

  我们开始扭打起来,他划伤了我的手,还咬住了我的肩膀。截止目前,在国家婴幼儿配方奶粉注册中,南山凭借自身强大的研发能力和品牌实力,南山旗下的倍慧系列婴幼儿奶粉已成功受理,很快就将成功获批。

  在防风险攻坚战下,中央严打地方政府违法违规举债担保,效果显现但仍难杜绝。

  《中国纪检监察》杂志谈到,所谓“老好人”,顾名思义就是奉行谁也不招、谁也不惹的处世哲学,无论别人说什么做什么,都一律“好好好”“对对对”,原则不强、立场不清甚至毫无原则、毫无立场的人。过去一年,中国宝武集团有限公司(下称“中国宝武”)总经理陈德荣深刻地感受到公司发生的变化:一是原宝钢和原武钢两大国内钢铁巨头的联合重组,二是国务院国资委明确中国宝武成为国有资本投资公司试点央企。

  文章指出,日前,据媒体报道,湖南省政协原副主席童名谦将于6月底刑满释放,成为十八大后首个刑满出狱的落马省部级官员。

  【真龙彩票】位于南京麒麟G09宅地的京奥港·未来墅日前终于领到销售许可证,但其身价一降再降,被核准通过的销售均价仅比楼面地价高出3000多元/平方米,基本是贴着地价卖。

  中国宝安称,儋州市政府及儋州市国土环境资源局未能及时全面履行土地征收补偿安置等义务,导致至今仍未完成上述宗地清表及土地交付工作,期间儋州市国土环境资源局同意上述宗地开、竣工时间相应顺延。耿慧丽皇冠要停产了。

安防峰会
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷锋网
人工智能 正文
发私信给程弢
发送

0

陕西省十四次工会

本文作者:程弢 2019-01-22 14:03
导语:从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。
【财富彩票】 以浙江杭州为例,截至目前,全市已打掉各类套路贷犯罪团伙数十个,刑拘团伙成员数百人,批准逮捕犯罪嫌疑人近200人。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

在谷歌发布TPU一年后,这款机器学习定制芯片的神秘面纱终于被揭开了。

昨日,谷歌资深硬件工程师Norman Jouppi刊文表示,谷歌的专用机器学习芯片TPU处理速度要比GPU和CPU快15-30倍(和TPU对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。

据雷锋网(公众号:雷锋网)了解,早在四年前,谷歌内部就开始使用消耗大量计算资源的深度学习模型,这对CPU、GPU组合而言是一个巨大的挑战,谷歌深知如果基于现有硬件,他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。

所以谷歌开始研发一种新的架构,Jouppi称之为“下一个平台”。Jouppi曾是MIPS处理器的首席架构师之一,他开创了内存系统中的新技术。三年前他加入谷歌的时候,公司上下正在用CPU、GPU混合架构上来进行深度学习的训练。

Jouppi表示,谷歌的硬件工程团队在转向定制ASIC之前,早期还曾用FPGA来解决廉价、高效和高性能推理的问题。但他指出,FPGA的性能和每瓦性能相比ASIC都有很大的差距。他解释说,“TPU可以像CPU或GPU一样可编程,它可以在不同的网络(卷积神经网络,LSTM模型和大规模完全连接的模型)上执行CISC指令,而不是为某个专用的神经网络模型设计的。一言以蔽之,TPU兼具了CPU和ASIC的有点,它不仅是可编程的,而且比CPU、GPU和FPGA拥有更高的效率和更低的能耗。

TPU的内部架构

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

该图显示了TPU上的内部结构,除了外挂的DDR3内存,左侧是主机界面。指令从主机发送到队列中(没有循环)。这些激活控制逻辑可以根据指令多次运行相同的指令。

TPU并非一款复杂的硬件,它看起来像是雷达应用的信号处理引擎,而不是标准的X86衍生架构。Jouppi说,尽管它有众多的矩阵乘法单元,但是它GPU更精于浮点单元的协处理。另外,需要注意的是,TPU没有任何存储的程序,它可以直接从主机发送指令。

TPU上的DRAM作为一个单元并行运行,因为需要获取更多的权重以馈送到矩阵乘法单元(算下来,吞吐量达到了64,000)。Jouppi并没有提到是他们是如何缩放(systolic)数据流的,但他表示,使用主机软件加速器都将成为瓶颈。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

256×256阵列缩放数据流引擎,经过矩阵乘法积累后实现非线性输出

从第二张图片可以看出,TPU有两个内存单元,以及一个用于模型中参数的外部DDR3 DRAM。参数进来后,可从顶部加载到矩阵乘法单元中。同时,可以从左边加载激活(或从“神经元”输出)。那些以收缩的方式进入矩阵单元以产生矩阵乘法,它可以在每个周期中进行64,000次累加。

毋庸置疑,谷歌可能使用了一些新的技巧和技术来加快TPU的性能和效率。例如,使用高带宽内存或混合3D内存。然而,谷歌的问题在于保持分布式硬件的一致性。

TPU对比Haswell处理器

在和英特尔“Haswell”Xeon E5 v3处理器来的对比中,我们可以看到,TPU各方面的表现都要强于前者。

在Google的测试中,使用64位浮点数学运算器的18核心运行在2.3 GHz的Haswell Xeon E5-2699 v3处理器能够处理每秒1.3 TOPS的运算,并提供51GB/秒的内存带宽;Haswell芯片功耗为145瓦,其系统(拥有256 GB内存)满载时消耗455瓦特。

相比之下,TPU使用8位整数数学运算器,拥有256GB的主机内存以及32GB的内存,能够实现34GB/秒的内存带宽,处理速度高达92 TOPS ,这比Haswell提升了71倍,此外,TPU服务器的热功率只有384瓦。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

除此之外,谷歌还测试了CPU、GPU和TPU处理不同批量大小的每秒推断的吞吐量。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

如上图所示,在小批量任务中(16),Haswell CPU的响应时间接近7毫秒,其每秒提供5482次推断(IPS),其可以实现的最大批量任务(64)每秒则可以完成13194次推断,但其响应时间为21.3毫秒。相比之下,TPU可以做到批量大小为200,而响应时间低于7毫秒,并提供225000个IPS运行推理基准,是其峰值性能的80%,当批量大小为250,响应时间为10毫秒。

不过需要注意的是,谷歌所测试的Haswell Xeon处理器似乎也不能完全说明问题,英特尔Broadwell Xeon E5 v4处理器和最新的“Skylake”Xeon E5,每核心时钟(IPC)的指令比这款处理器提升了约5%。在Skylake是28核,而Haswell为18核,所以Xeon的总体吞吐量可能会上升80%。当然,这样的提升与TPU相比仍有差距。

最后雷锋网需要强调的是,TPU是一个推理芯片,它并非是要取代GPU,可以确定的是,TPU与CPU一起使用对训练分析更加有益。但对于CPU制造商而言,如何研发出像ASIC一样兼顾性能和能效的芯片是现在以及未来要做的。

可以确定的是,谷歌已经逐渐在自己的数据中心部署TPU,但是上述测试数据只是理论结果,实际应用表现如何?我们还不得而知。

Via nextplatform,雷锋网编译

雷锋网版权文章,未经授权禁止转载。详情见转载须知

分享:
相关文章

文章点评:

表情

略懂技术的小编

关注一切有未来感的产品及技术!
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说