“一句话生成视频”AI 爆火
由清华和智源研究院出品的模型 CogVideo,“一脉相承”于文本-图像生成模型 CogView2,这个系列的 AI 模型只支持中文输入,输出的4秒视频帧数在32张左右。该模型一共有90亿参数,基于预训练文本-图像模型 CogView2 打造,一共分为两个模块。第一部分先基于CogView2,通过文本生成几帧图像,这时候合成视频的帧率还很低;第二部分则会基于双向注意力模型对生成的几帧图像进行插帧,来生成帧率更高的完整视频。
“一句话生成视频”AI 爆火“一句话生成视频”AI 爆火
由清华和智源研究院出品的模型 CogVideo,“一脉相承”于文本-图像生成模型 CogView2,这个系列的 AI 模型只支持中文输入,输出的4秒视频帧数在32张左右。该模型一共有90亿参数,基于预训练文本-图像模型 CogView2 打造,一共分为两个模块。第一部分先基于CogView2,通过文本生成几帧图像,这时候合成视频的帧率还很低;第二部分则会基于双向注意力模型对生成的几帧图像进行插帧,来生成帧率更高的完整视频。
Meta AI团队大换血据悉,Meta的人工智能部门FAIR将重组,该实验室将整合到Reality Labs中。至此, FAIR不再代表Facebook AI Research,而是Fundamental AI Research(基础AI研究)。 |
客服微信