AI、游戏与通用计算: 国产GPU的市场定位

电子发烧友网报道（文/周凯扬）从去年国产GPU开始陆续冒尖后，今年各大厂商的动作明显更大了一些，新品频繁面世。但从这些新品的规格和技术来看，其实每家公司对于自己GPU产品的定位都是不同的，我们就选几家国产GPU厂商来分析一下他们的产品定位以及未来技术趋势。

摩尔线程摩尔线程确实收获了不少。不仅如此，MTTS80也是业内首个PCIe5.0的显卡，支持双向128GB/s的传输带宽。更重要的是，哪怕标榜的是游戏显卡，MTTS80依然支持3D图形渲染、智能多媒体、物理仿真及科学计算和AI计算加速的全功能应用。

MTTS3000/摩尔线程除了MTTS80以外，春晓这一芯片也为摩尔线程带来了面向服务器GPU市场的新产品，MTTS3000。单从芯片规格上来看，MTTS3000与MTTS80都用的是完整的MT-春晓芯片，都内置了4096个MUSA流处理单元，但前者将主频提高到了1.9GHz，FP32也因此提升到了15.2TFLOPS。为了让MTTS3000更适用于服务器市场，摩尔线程也将其显存提升至了32GB，并增加了对虚拟化的支持，可对GPU弹性切分。MTTS3000也从MTTS80的主动散热改为了被动散热。到了AI上，摩尔线程的MUSA架构和软件栈为MTTS3000提供了训推一体的支持。除了训练支持TensorFlow、PyTorch、飞桨等常见框架外，摩尔线程还在推理上打造了自研AI推理引擎TensorX，甚至推出了兼容CUDA源码的方案。可以看出，摩尔线程不仅已经在游戏GPU市场有了进展，同样想在服务器市场实现突破，甚至是通过兼容CUDA来吸引更多的客户，这与GPU巨头英伟达的战略相似。但兼容或对标CUDA的方法也被AMD、英特尔等国际大厂推进，如果考虑到开发投入和难度，或许在软件生态上走合作之路会更适合。

芯动科技在使用GPU这类产品的过程中，支持不同的图形与计算API对于开发者来说尤为重要。而芯动科技的风华GPU在这API上的支持尤为亮眼，目前已经完美支持到OpenGL4.3、OpenGLES3.2、Vulkan1.2和OpenCL3.0，这为风华GPU的开发生态奠定了基础。虽然其产品性能本身已经足够亮眼，但风华GPU最大的优势在于芯动自研高性能接口IP。这些接口IP包括高带宽内存（GDDR6x、HBM3）、高速SerDes（PCIe5.0、CXL2.0）和高清多媒体（HDMI2.1、eDP1.4），同时这些IP也实现了对先进工艺的覆盖。芯动科技近期还推出了跨工艺、跨封装的Chiplet互联解决方案InnolinkChiplet，同时兼容UCIeChiplet。对于高性能GPU来说，核心IP决定了性能上限，而这些接口IP决定了GPU能发挥出多少实力，以及在未来的服务器市场是否能脱颖而出。目前看来，风华2号定位为低功耗GPU产品，适用于智能座舱等应用；风华1号面向服务器市场，尤其是云游戏、云手机等场景。两款一年以内发布的产品都还未使用PCIe5.0等新接口技术。据悉，芯动科技已经基本完成研发风华3号，该产品支持光线追踪技术，面向服务器/数据中心市场，但或许侧重在云游戏等商用场景上。相信在未来的发布中将看到更强大的性能表现。

壁仞科技壁仞科技的BR100系列通用GPU芯片在性能上达到了极高水准。与摩尔线程和芯动科技不同，BR100更适合于AI和科学计算这样的高性能计算场景，所以并没有去做DirectX和Vulkan这样的图形API支持。单个BR100由16个流处理簇构成，每个都采用了16个执行单元的设计，每个执行单元包含16个流处理核心（V-core）和一个向量引擎（T-Core）。V-Core作为SIMT处理器，支持到FP32、FP16、INT32、INT16，用于通用计算。T-Core在SPC级别的2.5DGEMM架构下，可以极大加速常见的AI运算，如MMA矩阵乘加和卷积等。壁仞科技的BIRENSUPA不仅支持PyTorch等主流框架，还有自研的推理加速引擎。从应用定位来看，壁仞科技主要发力于多媒体、自动驾驶和推荐系统等重AI的场景。壁仞科技是唯一推出了OAM模组的厂商之一，与浪潮合作推出了“海玄”OAM服务器，实现了8PFLLOPS的峰值算力。尽管壁仞科技最近遇到了一些困难，但这也表明了他们的发展方向正确。如果能克服困境，无疑在服务器市场上将大有作为。

来源：今日头条作者：核芯产业观察

本文来自用户投稿，不代表币大大立场，如若转载，请注明出处：https://czxurui.com/zx/36715.html