阿里达摩院上线“文本生成视频大模型”
星空财经消息,据《都市快报》消息,阿里达摩院昨日在魔搭社区(ModelScope)放出了“文本生成视频大模型”。根据官方介绍,目前这个模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成,整体模型参数约 17 亿。支持英文输入。扩散模型采用 Unet3D 结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。
此前 2 月消息,阿里版聊天机器人 ChatGPT 正在研发中,目前处于内测阶段。
Web3.0行业快讯更多 »
- Fairmint CEO:代币化证券和链上股权或将重塑资本市场
- Coinbase CEO 就“广告被英国电视台禁播”发声:加密货币的潜力被忽视
- 香港金管局总裁余伟文:香港在数字资产领域的增长势头将会持续
- 摩根大通 CEO:相信稳定币和区块链,不相信比特币本身,重点在于满足客户需求
- 证券时报:中行、渣打等发钞行有望率先获批香港稳定币牌照
- 美 SEC 主席:将制定框架以允许加密证券和非加密证券并行交易
- 美 SEC 启动 Project Crypto 计划,推动证券规则现代化并推进市场转向链上
- Tether发布Q2 财报:季度净利润49 亿美元
- 德勤调查:99% 十亿美元级企业 CFO 拟长期将加密货币用于业务场景
- 数字银行 Revolut 考虑收购美国银行以获得牌照
