腾讯近日在微信公众号“腾讯云”上宣布了一项重要进展:其自主研发的腾讯混元文生视频大模型已正式面世。该模型不仅支持中英文双语输入,还能处理多种视频尺寸及清晰度,为用户提供了极大的灵活性。
为了展示该模型的强大功能,腾讯团队利用它生成了一段小视频。这段视频的提示词非常简单:“两只小猫在打闹,写实风格。”生成的视频效果逼真,两只小猫的动作和神态栩栩如生,仿佛就在眼前。
目前,腾讯元宝App已经开放了该功能的试用申请。企业用户也可以通过腾讯云接入,并有机会参与API内测。这意味着,越来越多的用户将有机会亲身体验到这一前沿技术的魅力。
腾讯还决定将这一视频生成大模型开源。据相关资料介绍,这可能是目前全球最大的视频开源模型,其参数量高达130亿。这一举措无疑将推动视频生成技术的发展,为更多开发者提供学习和创新的机会。
腾讯云方面发布的一项评测结果显示,该视频生成模型在多个维度上表现优异。特别是在文本视频一致性、运动质量和画面质量方面,它展现出了出色的性能。在人物、人造场所等复杂场景下,该模型同样能够生成高质量的视频内容。