文本

科技

继谷歌和Meta后,阿里达摩院上线文本生成视频大模型

1
封面新闻记者 吴雨佳 欧阳宏宇 这波AIGC(利用人工智能技术来生成内容)的热潮,已经开卷视频了。近日,阿里达摩院低调地在魔搭社区(ModelScope)放出了“文本生成视频大模型”。 据了解。目前文本生成视频大模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这3个子网络组成,整体模型参数约17亿。支持英文输入。扩散模型采用Une...
赞 (0)阅读(301)