暖风文章网 手机版
您的位置: 首页 > 实时讯息 >

AI生成视频用文字难以描述需求,如何破?

0次浏览     发布时间:2025-04-15 19:49:00    

中新经纬4月15日电 (常涛)用户在用AI工具生成图片尤其是视频时,普遍会遇到用文字难以描述的情况。

快手高级副总裁、社区科学线负责人盖坤15日在北京表示,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性以及用户复杂创意的精确传达上仍有“很多挑战”。

“大家应该很自然地会感受到文字在表达影像信息时,是不完备的。我们需要有新的方式,能让人真正精准地表达出心中所想。”盖坤说。

当日,快手发布可灵AI全新2.0模型,包括可灵2.0视频生成模型及可图2.0图像生成模型。其中,在本次2.0模型的迭代中,可灵AI发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,直接高效地传达给AI。

盖坤介绍,MVL由TXT(Pure Text,语义骨架)和MMW(Multi-modal-document as a Word,多模态描述子)组成,能从视频生成设定的基础方向以及精细控制这两个层面,精准实现AI创作者们的创意表达。

基于MVL理念,可灵AI推出多模态编辑功能。“用户可以在可灵AI的平台上体验多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入,生成符合自己想法的创意视频。”盖坤介绍,MMW将不只局限于图片和视频,也可以引入其他模态的信息,例如声音、运动轨迹等,让用户实现更加丰富的表达。

快手副总裁、可灵AI负责人张迪介绍,当前,图生视频约占到可灵AI视频创作量的85%,图片质量也对视频的生成效果产生重要作用。

据快手方面介绍,截至目前,可灵AI全球用户规模已突破2200万,累计生成1.68亿个视频及3.44亿张图片素材。自2024年6月上线至今的10个月时间里,可灵AI已累计完成超20次迭代,月活用户数量增长25倍。

(更多报道线索,请联系本文作者常涛:changtao@chinanews.com.cn)(中新经纬APP)

中新经纬版权所有,未经书面授权,任何单位及个人不得转载、摘编或以其他方式使用。

责任编辑:魏薇 李中元

相关文章
AI生成视频用文字难以描述需求,如何破? 中新经纬4月15日电 (常涛)用户在用AI工具生成图片尤其是视频时,普遍会遇到用文字难以描述的情况。快手高级副总裁、社区科学线负责人盖坤15日在北京表示,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性以及用户复杂创意的精确传达上仍有“很多挑战”。
2025-04-15 19:49:00
欧线集运跌超6% 【欧线集运跌超6%】国内期货主力合约涨跌不一,燃油涨超2%,焦炭、低硫燃油、原油、烧碱涨超1%。跌幅方面,欧线集运跌超6%,多晶硅、合成橡胶跌超2%。(中新经纬APP)
2025-04-15 12:09:00
测评博主的“无广,真心话”,是真心话吗? 测评到一半,博主开始推销产品了 商测一体套路调查“只要氯化钠在成分表里的排名越靠前,它的去油能力就越强……”“就选这款,××牌的海盐洗发膏!”这是某视频网站一则播放量高达六百万、标题带有“医学博士”“脱发、头屑的原罪”等字眼的洗发膏测评视频内容。视频一开始,博主以科普的态度表明多家洗发水的“去屑防脱
2025-04-12 19:14:00
壹点漫评|“网上纪念馆”乱象:需建立缅怀数字净土,而非“消费局” 齐鲁晚报·齐鲁壹点评论员 孔雨童 绘画 徐进清明刚过,央广网曝光了一批针对逝者的网上纪念馆乱象:一些平台上传逝者信息不需要审核,一些平台设置“香火排行榜”诱导祭扫者充值打榜……最严重的,有在世女孩被创建祭奠纪念馆,其照片等个人信息被公开传播长达六年,事后起诉却因上传者未实名认证,维权困难。当下,网上
2025-04-11 14:45:00
尚福林:人工智能的算法“黑箱”、数据污染、模型缺陷等潜在风险问题不容忽视 北京商报讯(记者 刘四红)4月10日,以“人工智能与金融未来”为主题的国民财富发展研究合作平台2025春季峰会正式召开。中国财富管理50人论坛理事长、原银监会主席、证监会原主席尚福林出席并发表主旨演讲。尚福林指出,要关注人工智能提升效率与加剧风险的双重效应,当前,我国人工智能发展的总体态势良好,正处
2025-04-10 16:52:00