分析测试百科网

搜索

喜欢作者

微信支付微信支付
×

对标Sora,快手发布文生视频大模型“可灵”

2024.6.13

近日,国内头部短视频平台“快手”发布了首个“Sora级”的文生视频大模型“可灵”,并宣布面向用户开放。

据快手方面介绍,可灵大模型为快手AI团队自研,采用与Sora相似的技术路线,并结合多项自研技术,能够生成大幅度的合理运动、能够模拟物理世界特性、具备强大的概念组合能力和想象力,效果对标Sora。其生成的视频分辨率达1080p,时长最高可达2分钟(帧率30fps),且支持自由的宽高比。目前,用户可在快手旗下的快影App申请使用可灵大模型进行文生视频的创作。

666a9276e4b03b5da6d10970.png

利用“可灵”生成的大熊猫弹吉他视频截图。

“细节很棒,效果都不错,(与Sora)旗鼓相当。”新加坡南洋理工大学数字媒体技术硕士“桔仔”(化名)在多次对比测试之后评价称,可灵的可用度“还是蛮高的”。

目前,可灵在海外AI圈也备受追捧,甚至有网友手把手教如何注册快手并申请试用可灵。有海外博主在拿到邀测资格试用后,评价其“从效果上看,称之为 Sora 级应该不夸张”。

公开信息显示,快手已在AI领域展开全面布局,AI大模型在快手有丰富的应用场景,能与快手内容生态和商业生态有机融合。2024年,快手先后发布1750亿参数规模的通用大语言模型“快意”和文生图大模型产品“可图”。在视频生成上,快手也曾与多个高校或科研机构联手,陆续发布可控运动的视频生成算法Direct-a-Video、多模态生成算法Video-LaVIT、图生视频算法I2V-Adapter、多模态美学评价模型UNIAA等关键技术,为可灵大模型积累了深厚的技术沉淀。

快手相关负责人表示,作为短视频领域头部玩家,快手在短视频技术方面有多年的深入积累,其视频生成大模型也有天然、广泛的应用场景。据透露,快手相关图生视频功能也将在近期开放。


 


中国科学报
仪器推荐
文章推荐