近日,金山云基于Tesla T4的GPU云服务器正式对外商用,这也是继去年国内首家商用Tesla V100之后,金山云在GPU云服务器领域再一次拔得头筹,代表金山云在新技术应用上始终处于行业领先水平。
作为全面升级的新一代GPU云服务器,T4采用了最新的Turing架构,单卡提供8.1 TFLOPS的单精浮点计算能力和65 TFLOPS的混合精度(FP16/FP32)矩阵计算能力。Tesla T4相比于上一代产品Tesla P4,其整体性能有了较大的提升,在给定场景下,T4的推理性能提升超过350%。
震撼的多精度推理性能为AI全面加速
Tesla T4基于Turing架构,提供了更加强大的训练和推理能力,在原有对FP32和FP16支持的基础上,Turing架构中的Tensor Core新增了对INT8和INT4的支持,并探索性地推出了INT1精度模式。通过对多种精度模式的支持,T4能够有效缩短在线预测和离线训练时长。根据Nvidia公布的测试数据,在语言推理的场景中(NLP: GNMT Model),T4相对于P4,其性能提升超过350%。
Tesla T4使用TU104核心,搭载136亿个晶体管,共40个SM(stream multiprocessor),每个SM单元中有64个CUDA Core和8个混合精度的矩阵运算单元Tensor Core,共2560个CUDA core和320个Tensor core,提供8.1 TFLOPS的单精度性能和65 TFLOPS的混合精度(FP16/FP32)性能。此外,T4中还集成了Turing架构首次引入的RT Core,可实现高效的光线追踪(Ray Tracing)功能,在图形图像渲染方面有着广泛的应用。目前,金山云基于T4的GPU加速计算服务已全面商用,为诸多客户提供着高性能的计算支撑。
优异的机器学习能力让技术更智能
T4针对深度学习应用场景,进行了全方位的优化。首先,T4卡配备了320个Tensor Core。Tensor Core作为专门用于执行张量/矩阵运算的计算单元,能够为训练和推理场景中的矩阵运算提供极大的加速,被广泛用于各种深度学习的场景中。Turing Tensor Core相对于先前的Volta版,强化了推理的功能,支持了INT8和INT4两种精度模式,算力分别高达130TOPS和260TOPS。其次,T4继承了Volta架构中首次引入的Multi-Process Service(MPS)功能,优化了对batch较小时推理的性能,减少启动延迟,从而能够支持更多的并发请求。
及时响应是提升用户参与度的关键,随着模型准确性和复杂性的提高,快速交付正确答案所需的计算能力也在呈指数级提升。T4拥有先进的实时推理性能,在会话式人工智能、推荐系统和可视化搜索等场景的处理上,可提供低延时、高吞吐量的计算能力,进而实时满足更多的处理请求。T4通过优异的机器学习推理能力让技术应用更为智能。除了深度学习外,T4在视频转码和虚拟桌面等诸多场景中都能够发挥重要的作用。
作为中国领先的云计算服务提供商,金山云始终致力于通过最前沿的技术、最高效的产品为客户提供更加安全、稳定、便捷的云服务。目前基于T4的 GPU云服务器已经开放商用,卓越的深度学习推理性能,让用户能够更加快速、高效地构建AI业务,运行大规模模型推理应用。同时,基于Tesla T4的实例具备易扩展和高性价比的特性,能够为用户节省大量计算成本,有效提升AI产品迭代的速度,提高企业AI竞争力。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 网信办严打网络侵害未成年人行为,守护成长新篇章
- 豆包大模型升级引爆股市,字节紧急警示:小心为上
- 小米YU7无伪装实车首次曝光引热议,小红书封号事件冲上热搜,科技圈又掀波澜?
- 警惕讨好型人格:赚钱路上,人格魅力并非一切
- 小米SUV坠崖一家四口奇迹生还,车主回应:别夸大其词
- 金融AI大模型新突破:奇富科技AI产品小奇引领行业,重塑金融未来
- 谷歌携手Apptronik,AI+机器人引领未来:商业化人形机器人新纪元
- AI盛宴即将上演!李想回归,理想汽车12月25日揭秘未来驾驶新篇章
- 特斯拉Model Y劲敌来袭!明年登陆英国市场的未来乐道L60引爆期待
- 火山引擎总裁回应豆包大模型定价:如何确保合理毛利,揭秘行业内幕
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。