IDF2012:AVX2指令集优化CPU运算更给力

发布时间：2017-01-02 09:49 所属栏目：52 来源：吴晓伟

导读：AVX2指令集还增加了矢量化操作。什么是矢量化操作呢?举个简单的例子就能说明。例如寄存器中现在存放的全是RGB数据，而我们现在需要把所有的“R”数据提取出来进行进一步操作，比如使之变得更红。通过矢量化操作我们就能把其中全部的“R”抽取出来。这就是矢量

　　【资讯】由英特尔主办的全球IT界高水平的技术论坛活动——2012英特尔信息技术峰会(Intel Developer Forum, IDF)，将于4月11至12日在北京国家会议中心举行。本届IDF以“未来在我‘芯’”为主题，前瞻IT产业的发展与计算体验的变革，共迎个性化计算时代的到来。

英特尔AVX2指令集优化CPU运算更给力

　　早在2011年的6月份，英特尔的高级工程师Mark Buxton就在官方论坛中宣布，下一代架构处理器Haswell将会支持新的指令集“AVX2”。他同时还公布了一份完整的Haswell指令集规范文档，其中就介绍了新的AVX2。根据这份文档的介绍，AVX2是由现在Sandy Bridge架构上的第一代AVX指令集扩展增强而来的，为绝大多数128位SIMD整数指令带来了256位数值处理能力，同时继续遵循AVX的编程模式。

英特尔AVX2指令集优化CPU运算更给力

　　本课程介绍了英特尔高级矢量扩展指令集 2(英特尔 AVX2)。英特尔 AVX2 是一种全新的指令集，将整数 SIMD 从 128 位扩展到 256 位，可显著提升整数计算密集型应用的性能。

英特尔AVX2指令集优化CPU运算更给力

　　从上图我们可以清晰地看到英特尔的发展战略。其中Tick-Tock就是为人们所熟知的工艺年-架构年的“滴答”战略。即Tick年更新制造工艺，如22nm的Ivy Bridge，Tock年在制造工艺不变的情况下更新微架构，如22nm的Haswell。而AVX2就是Haswell中才具有的。

英特尔AVX2指令集优化CPU运算更给力

　　AVX 1.0指令集现在已经在SNB平台上推出了，它较之前的SSE4指令集有了显著地提升。2倍的浮点运算能力，更新到256位浮点矢量，这都是它的优势。

英特尔AVX2指令集优化CPU运算更给力

　　英特尔AVX2指令集同AVX一样使用相同的256位YMM寄存器。它从128位整数矢量扩展到了256位，完全在SSE4上升级而来，当然也较AVX多了数十条新的指令。不但如此，AVX2还增加了256位操作指令，其全256位跨通道的数据排列操作也是一项重要的革新。说道跨通道数据排列操作这里有必要解释一下。在之前的指令集中，256位被分为高128位和低128位通道。高通道的数据只能从高通道中得到，同理，低通道的数据也只能从低通道中读取。而现在的跨通道数据排列操作允许高通道从低通道中得到数据，也允许低通道从高通道中得到数据，也就是高低通道之间的高强被推倒了。

　　AVX2指令集增加了乘加融合指令。例如计算(a*b)+c来说，之前的指令会计算a*b之后进行舍入操作，再把得到的结果与c相加，然后再舍入一次。而有了现在的FMA，计算a*b之后不会进行舍入，直接把得到的结果与c相加之后再进行舍入操作，这样就提高了计算和精度。

　　AVX2指令集还增加了矢量化操作。什么是矢量化操作呢?举个简单的例子就能说明。例如寄存器中现在存放的全是RGB数据，而我们现在需要把所有的“R”数据提取出来进行进一步操作，比如使之变得更红。通过矢量化操作我们就能把其中全部的“R”抽取出来。这就是矢量化操作。

（编辑：ASP站长网）