AI闯进设计圈腾讯混元大模型最新技术进展披露

人阅读

2024-05-11 17:16:00

来源：TechWeb.com.cn
相关关键词

5月11日消息，数字时代，人工智能技术的快速发展正在为各行各业带来翻天覆地的变革。在设计领域，AI的应用日益广泛，不仅赋予了专业人士更多创造力，更为普通人提供了表达创意的机会。

5月10日，腾讯混元产品负责人陈妍披露了混元大模型在设计领域的一些应用，以及在腾讯业务场景下的最新技术进展。

据陈妍介绍，在AI设计领域，除了文生文这一最基础的能力，腾讯还在进行文生图、文生视频、文生3D的多模态探索。

文生图方面，腾讯混元大模型和国外不一样的地方在于本土化，特别是在很多应用场景上面，用SDI、MDI等。欧美对中国很深度的历史文化的元素理解上是欠缺的，不管是广告还是游戏，让他们做一个古代元素是没有办法很好表现的，相较之下，混元大模型有比较突出的能力。

去年10月，腾讯混元大模型全新升级，正式对外开放 “文生图” 功能。官方公告称，升级后的腾讯混元中文效果整体超过 GPT-3.5，代码能力大幅提升 20%，达到业界领先水平。

陈妍指出，目前文生图已经深度应用在B端和C端，比如创意广告、人像风格化等。陈妍透露，下周腾讯将在北京举办发布会，宣布文生图能力开源。

文生视频方面，2月Sora的发布，给了业内很大震撼。陈妍表示，根据算法路径重新看我们文生视频的能力，时空扩散和解码不一样，可以把视频拉的很长，之前能够做到4秒，这个月我们可以做多16秒，整个过程非常不容易。

除了文生视频，腾讯混元大模型现在还可以做图生视频、视频生视频，具体落地上，可以把实拍图片变成卡通、脸土风或者其他风格，可以局部做替换，还有骨骼驱动视频等。

文生3D方面，现在还没有很广泛的应用，但腾讯已经提前做了一些研究。陈妍认为，文生3D跟生视频、生图比较不一样的点是它生成出来的模型可以再编辑，就是导到3D的编辑工具里面重新做调整。“现在我们也想尝试3D人物的应用，手伴这些东西还是蛮火的。”

最新数据显示，腾讯混元大模型目前已扩展至万亿级参数规模，自上线起即突出其实用性标签，腾讯内部已经有超过400个业务和场景接入混元大模型进行测试，部分已经发布。

陈妍向TechWeb等表示，“目前，大模型国内能力评测中，混元在第一梯队。中文领域能够赶上GPT的水平了，希望对中国的大模型技术越来越有信心。”

据悉，为了激发公众对科技和设计的兴趣，借助AI工具探索人工智能与人类创造力结合的新可能性，腾讯研究院联合清华大学建筑学院、中央广播电视总台央广网联合发起了腾讯未来城市AI创意设计大赛。5月10日，大赛征集活动已经正式启动。

此次大赛征集活动以腾讯深圳前海总部园区科创街区为主题，大赛面向对建筑设计、城市规划、艺术创作、科幻、人工智能感兴趣的公众，征集具有丰富想象力与创新性的城市建成环境场景设计、装置与小品设计、平面视觉设计。

“这应该算是一个实验。”腾讯集团副总裁、腾讯研究院总顾问杨健说到，我们选择在一个特定场景里面，把人工智能的一些新的技术，新的工具拿来，把城市规划、城市设计的专业人士以及对人工智能有兴趣的爱好者召集起来，让大家去了解怎么用这些技术提高规划设计的效率，也希望在这个过程中，能够进一步把腾讯混元大模型具备的能力和理念更好的落地。

作为新一轮科技革命和产业变革的重要驱动力量，人工智能技术发展正在按下“快进键”，给人们带来了无限想象的空间。国际建筑师协会副主席、清华大学建筑学院院长、教授张利表示，AI带给所有的学科和行业的挑战是众所周知的，在我国高质量城市更新的今天，数据与计算技术以及潜在的规划新范式涌现，建筑行业正站在新的历史起点上。虽然我们还远不能肯定AI带来怎样的具体改变，但我们拥抱AI带来的全新可能性，更期待这次竞赛，通过AI能够连接不同的人群，共同为高质量的城市更新贡献智慧。（周小白）

（免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。）