阿里达摩院上线“文本生成视频大模型”
据《都市快报》消息,阿里达摩院昨日在魔搭社区(ModelScope)放出了“文本生成视频大模型”。根据官方介绍,目前这个模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成,整体模型参数约 17 亿。支持英文输入。扩散模型采用 Unet3D 结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。
此前 2 月消息,阿里版聊天机器人 ChatGPT 正在研发中,目前处于内测阶段。
Web3.0行业快讯更多 »
- BNB Chain Q1 报告:BSC 上日均 DEX 交易额增长 193%
- 尼日利亚央行否认要求冻结加密交易所用户银行账户
- 币安已开放 BounceBit(BB)Megadrop,申购 BNB 定期产品或完成 Web3 任务即可参与
- Aligned Layer 完成 2000 万美元 A 轮融资,Hack VC 领投
- a16z Crypto CTO:Memecoin 改变了公众、监管机构等对加密货币的看法
- Merlin Chain:现可使用Unicross或Merlin其他NFT市场交易Ordinals NFT
- IRISnet 3.0 升级拟于 5 月中旬进行
- 加密矿企 Argo 去年开采 1760 枚比特币,实现 5060 万美元收入
- Linea Bridge现已接入OKX Web3钱包
- OKX Jumpstart 上线 MSN (Meson Network)