阿里达摩院上线“文本生成视频大模型”
据《都市快报》消息,阿里达摩院昨日在魔搭社区(ModelScope)放出了“文本生成视频大模型”。根据官方介绍,目前这个模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成,整体模型参数约 17 亿。支持英文输入。扩散模型采用 Unet3D 结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。
此前 2 月消息,阿里版聊天机器人 ChatGPT 正在研发中,目前处于内测阶段。

Web3.0行业快讯更多 »
- 领英:93% 的印度中小企业同意 ChatGPT 可以帮助营销
- 温州新闻网副总编辑黄作敏:内容行业很可能出现“全栈式内容创意人才”
- 三星电子:晶圆代工部门将继续推进高密度内存集成技术开发以支持 AIGC 产品
- 温州AIGC产业联盟成立,助力温州打造GPT时代的中国数字经济高地
- 中信出版:加速推动 AI 技术在出版流程的应用
- 无界AI首席研究员刘秋杉:AIGC已具备大范围赋能产业设计的可行性
- AI 概念股午后掀跌停潮
- 德勤基于英伟达 omniverse 及 AI 堆栈为其 Quartz AI 推出两项新服务
- 美参议院情报委员会主席敦促人工智能公司 CEO 采取措施应对风险
- 英伟达发布开源工具 NeMo Guardrails,旨在提高 AI 聊天机器人的性能和安全性