设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 创业者 手机 数据
当前位置: 首页 > 服务器 > 系统 > 正文

IDF2012:AVX2指令集优化CPU运算更给力

发布时间:2017-01-02 09:49 所属栏目:52 来源:吴晓伟
导读:AVX2指令集还增加了矢量化操作。什么是矢量化操作呢?举个简单的例子就能说明。例如寄存器中现在存放的全是RGB数据,而我们现在需要把所有的“R”数据提取出来进行进一步操作,比如使之变得更红。通过矢量化操作我们就能把其中全部的“R”抽取出来。这就是矢量

  【资讯】由英特尔主办的全球IT界高水平的技术论坛活动——2012英特尔信息技术峰会(Intel Developer Forum, IDF),将于4月11至12日在北京国家会议中心举行。本届IDF以“未来在我‘芯’”为主题,前瞻IT产业的发展与计算体验的变革,共迎个性化计算时代的到来。

英特尔AVX2指令集优化CPU运算更给力

  早在2011年的6月份,英特尔的高级工程师Mark Buxton就在官方论坛中宣布,下一代架构处理器Haswell将会支持新的指令集“AVX2”。他同时还公布了一份完整的Haswell指令集规范文档,其中就介绍了新的AVX2。根据这份文档的介绍,AVX2是由现在Sandy Bridge架构上的第一代AVX指令集扩展增强而来的,为绝大多数128位SIMD整数指令带来了256位数值处理能力,同时继续遵循AVX的编程模式。

英特尔AVX2指令集优化CPU运算更给力

  本课程介绍了英特尔高级矢量扩展指令集 2(英特尔 AVX2)。英特尔 AVX2 是一种全新的指令集,将整数 SIMD 从 128 位扩展到 256 位,可显著提升整数计算密集型应用的性能。

英特尔AVX2指令集优化CPU运算更给力

  从上图我们可以清晰地看到英特尔的发展战略。其中Tick-Tock就是为人们所熟知的工艺年-架构年的“滴答”战略。即Tick年更新制造工艺,如22nm的Ivy Bridge,Tock年在制造工艺不变的情况下更新微架构,如22nm的Haswell。而AVX2就是Haswell中才具有的。

英特尔AVX2指令集优化CPU运算更给力

  AVX 1.0指令集现在已经在SNB平台上推出了,它较之前的SSE4指令集有了显著地提升。2倍的浮点运算能力,更新到256位浮点矢量,这都是它的优势。

英特尔AVX2指令集优化CPU运算更给力

  英特尔AVX2指令集同AVX一样使用相同的256位YMM寄存器。它从128位整数矢量扩展到了256位,完全在SSE4上升级而来,当然也较AVX多了数十条新的指令。不但如此,AVX2还增加了256位操作指令,其全256位跨通道的数据排列操作也是一项重要的革新。说道跨通道数据排列操作这里有必要解释一下。在之前的指令集中,256位被分为高128位和低128位通道。高通道的数据只能从高通道中得到,同理,低通道的数据也只能从低通道中读取。而现在的跨通道数据排列操作允许高通道从低通道中得到数据,也允许低通道从高通道中得到数据,也就是高低通道之间的高强被推倒了。

  AVX2指令集增加了乘加融合指令。例如计算(a*b)+c来说,之前的指令会计算a*b之后进行舍入操作,再把得到的结果与c相加,然后再舍入一次。而有了现在的FMA,计算a*b之后不会进行舍入,直接把得到的结果与c相加之后再进行舍入操作,这样就提高了计算和精度。

  AVX2指令集还增加了矢量化操作。什么是矢量化操作呢?举个简单的例子就能说明。例如寄存器中现在存放的全是RGB数据,而我们现在需要把所有的“R”数据提取出来进行进一步操作,比如使之变得更红。通过矢量化操作我们就能把其中全部的“R”抽取出来。这就是矢量化操作。

(编辑:ASP站长网)

    网友评论
    推荐文章
      热点阅读