文章浏览阅读933次,点赞30次,收藏28次。智谱AI公布了一项激动人心的技术创新:他们决定将他们开发的视频生成模型CogVideoX的源代码对外公开。这个模型目前能够处理的提示词数量上限为226个token,这意味着它可以理解和响应较长的文本输入。生成的视频长度可以达到6秒钟,以每秒8帧的速度播放,分辨率则为720像素乘以480像素。虽然这只是一个初步的版本,但智谱AI已经透露,他们正在开发性能更优越、参数量更大的后续版本。CogVideoX的核心优势在于其采用了先进的3D变分自编码器技术。
原文作者(或网站):CSDN
标签:[智谱AI, CogVideoX-2b——视频生成模型的得力工具]
原文网址:https://blog.csdn.net/Skrrapper/article/details/142416268