视频大模型 快手美图殊途同归-凯发k8国际娱乐官网入口

 视频大模型 快手美图殊途同归-凯发k8国际娱乐官网入口
当前位置:凯发k8国际娱乐官网入口-凯发k8官网下载客户端中心>> 产业经济>> 电商•商业>>正文内容

视频大模型 快手美图殊途同归

2024年06月14日 来源:北京商报

有图像视频业务傍身的互联网企业,加速奔向大模型。近日,快手正式上线视频大模型“可灵”并开始邀测,用户输入一段文字即可生成视频。美图宣布将在7月底上线新品moki,该产品基于美图奇想大模型的视频生成能力,可帮助用户生成ai短片。不论是做视频还是做短片,都是通过大模型辅助用户创作,契合自己的主营业务。目前,获得内测资格的用户可以免费使用可灵,其他ai功能以限时免费、限次免费等方式向用户开放。美图相关人士并未透露komi的变现计划,但付费会员、单次付费等变现模式已是美图成熟的商业模式。

北京商报

不约而同

“今天你‘可灵’了吗?”6月12日晚间,快手通过官方公众号向用户“安利”自家的视频生成大模型“可灵”。为了证明实力,快手不光拿出一条由快手可灵生成的一分钟预告片,还放出一系列首批获得测试资格的创作者生成的视频,如一朵花绽放的过程、复活成语故事《对牛弹琴》等。

打开快手的视频剪辑app快影,进入凯发k8官网下载客户端中心主页的“ai玩法”,再点击“ai生成视频”模块填写问卷,即可以申请免费的内测资格。根据内测网友提供的信息,用户可以输入一段200字以内的文字描述,自行选择超现实主义、极简等风格,再等待约3分钟,就能看到由可灵生成的一段5秒视频。

来自快手的最新数据显示,截至目前,在快影app上申请文生视频内测资格的人数已超6万,图生视频功能将于近期上线。

同样瞄准视频大模型出手的还有美图。“目前市场上的ai视频产品倾向于提供文生视频等能力,我们认为只有深度理解创作者的需求,提炼有共性的视频场景,才能打造辅助内容创作的工具。”美图创始人吴欣鸿谈到moki时说,“moki聚焦于ai短片创作,专注于动画短片、网文短剧、故事绘本和mv等视频场景。”

具体的工作流程是:在脚本、视觉风格、角色等前期设定完成后,ai自动生成分镜图并转为视频素材,通过智能剪辑、ai配乐、ai音效、自动字幕等功能串联素材并实现成片。moki的上述能力即基于美图奇想大模型。

热度升温

除了快手、美图,近日视频生成的网红应用pika、联合清华大学发布视频大模型vidu的生数科技,也为视频大模型赛道添了一把柴。

pika不久前通过凯发k8官网下载客户端中心官网宣布,pika已完成总额8000万美元的b轮融资,由spark capital领投,greycroft、lightspeed venture partners以及jared leto参投。pika团队表示,这一轮融资将加快公司构建最佳视频模型的进程,同时帮助公司聘用优秀的人才。

成立于2023年4月,爆火于2023年11月,早在sora出世前,pika就依靠ai生成和编辑3d动画、动漫等多种风格的视频,成为网红应用。

生数科技仅比pika早成立一个月,主要业务集中在图像、3d、视频等原生多模态大模型的研发。2024年4月,生数科技联合清华大学发布的视频大模型vidu,支持一键生成16秒、分辨率1080p的高清视频内容。

6月初,生数科技宣布,已完成数亿元pre-a轮融资,由百度、北京市人工智能产业投资基金领投,此前这家创业公司还获得了来自蚂蚁集团、智谱ai等的投资。生数科技称,将在本轮融资完成后坚持其原生通用多模态技术路线,持续迭代优化自研大模型,并加速产品开发与市场拓展。

“近期视频大模型活跃,说明大模型最早形成的一些技术壁垒在被打破。”文渊智库创始人王超告诉北京商报记者,“我认为能超过gpt-4的中国大模型可能在年中就会出现。中国的算力、能源和人才,支持着中国大模型持续追赶。”

谈及视频大模型的门槛,中经传媒智库专家张书乐向北京商报记者表示,“视频生成不是将一堆ai绘画连在一起变成动画片,除了考虑形象一致、符合描述、光影分割、分镜表现等,还要具有对剧情的理解能力、再创造能力,这些都需要对视频结构、内容解析等多个垂直领域进行深度学习,难度高于聊天、绘画或棋类等靠主要数据堆积和用户纠错完成的功能”。

跟着业务走

2022年底openai的chatgpt让国内科技巨头在生成式大模型赛道扎堆,且大多瞄准对话式互动形式,2024年openai又推出文生视频模型sora。和一拥而上的大语言模型竞争相比,在视频大模型领域比拼的主角更多是图像视频类互联网公司。

站在技术的角度,王超认为,“这两种大模型虽然都是agi(通用人工智能),但技术路线不同,openai两个都做,但不是每个企业都有这样的能力”。

在视频大模型赛道,“快手和美图的最大优势在于用户积累、算法和数据处理等方面的经验”,深度科技研究院院长张孝荣表示。

张书乐的看法是,“快手、美图拥有可以让人工智能深度学习的‘学习资料’,且可以规避一定的凯发k8国际娱乐官网入口的版权问题。这两家企业在视频领域的内容积累、垂直细分的标签标注,能让大模型更好地‘检索’知识”。

不过第三方观察者也提醒,做视频大模型的难度比大语言模型更高,前景还不明确,“这是没多少国内大模型创业公司进入视频大模型赛道的原因,连巨头都没那么积极”,王超说。“视频大模型的变现比大语言模型困难。”张孝荣补充。

快手和美图正通过各种手段吸引更多用户使用ai,并寻找ai变现的路径。以快影的ai创作功能为例,快影向用户提供ai舞王、ai小说转漫画、ai变装、ai头像壁纸等十几种服务,其中ai舞王提供免费5次的使用机会、ai变装限时免费、ai小说转漫画是vip会员的权益。

美图相关人士并未向北京商报记者透露moki可能的变现模式,但吴欣鸿在介绍美图新品时多次提到产品的商业化数据,在他看来,“如果ai帮用户创收,用户是很愿意为能创造价值的ai产品付费的”。

责任编辑:郑伊丹
相关推荐

近日,快手正式上线视频大模型“可灵”并开始邀测,用户输入一段文字即可生成视频。美图宣布将在7月底上线新品moki,该产品基于美图奇想大模型的视频生成能力,可帮助用户生成ai短片。不论是...[详细]

近日,商务部等9部门发布《关于拓展跨境电商出口推进海外仓建设的意见》(以下简称《意见》)。《意见》指出,跨境电商是以科技创新为驱动,积极运用新技术、适应新趋势、培育新动能的外贸新...[详细]

自牌占比达九成,平价超市奥乐齐掌握零售商成长“超级引擎”

从全球零售演进趋势来看,“高购商”人群对于质价比的追求推动了零售折扣化模式的快速发展。在此之下,零售价格竞争愈演愈烈,发展自有品牌正逐渐成为当下企业寻求破局的重要策略之一。日前...[详细]

返回顶部
网站地图