剪映亲爹竟怀上AI剪映宝宝🫃

2026-01-16|骡子马|14 个实体|11 条关系

「Flova其实是画布软件」 测了一堆AI视频生成工具后,骡子马发现了个真东西——Flova。 经过他的一番测试,结论是没达到剪映的高度,但至少方向是对的,而且证明OiiOii和 Medeo都在瞎弄。 我后来发现,我的朋友@朱亦辉早早在小登群里吹捧过Flova,可惜当时没人搭理他,他 的评价是,「一句话生成产品领域的sota」和「最简单的最实在的邀请码机制」。 朱亦辉一定要我夸他才是真正的AI产品经理,其他PM都在瞎弄🤓 与之对应的,某位不愿透露姓名的群友对OiiOii和Medeo的评价则是,「狸谱的视频版秽 土转生」和「这么快做商业化和付费墙是怕用户发现不好用么?」 高下立判。 但我问了一圈,没人知道Flova是谁做的。 于是我加了他们的用户群,里面工作人员的企业认证是船岛。哎我去,这不就郭列的公 司。 给大伙科普一下郭列是谁。 他是脸萌和Faceu创始人,之前是IDG 90后基金的被投之一,出道就和孙割坐一桌。 2018年脸萌科技3亿美元被字节收购了,脸萌团队后来干出了剪映和醒图。 郭列离开字节后做了船岛游戏,去年初船岛一款游戏宣布项目暂停,看来郭列是换了新方 向。Flova也小几亿美金估值了。 那么我们可以夸张点说,郭列相当于剪映亲爹。开服玩家出手,OiiOii和Medeo只能往后 排。 你爹来咯! 下面请欣赏骡子马的测试环节: 快过年了,作为一名精神山东人,最大的痛点就是回家上桌吃饭的时候,各种传统礼仪总 是被抛在脑后。 因此,我发明了「鱼头自动追踪器」,能够实时精准识别酒桌上主陪的位置,并将鱼头冲 着主陪。 其实类似的创意小视频最近在各个平台早就泛滥成灾,一般都使用Sora2一键生成的。但 这么伟大的产品,必须得搭配一个高科技高质感的企业级宣传片。 于是我写了一段提示词如下: 「现在我要给这个发明做一个苹果手机质感的高科技宣传广告片。要求所含要素有:产品 运用最新AI大模型技术,已获得专利和诺贝尔奖, 出示370开头身份证或孔姓证明可享受 50%优惠价格。」 并把它发给了Flova,一个集成了多模态AI能力的视频生成工具。 用完之后体验还真不错。

首先来颅内模拟一下,如果不用Flova,想弄这么一个多镜头多要素的鱼头追踪器广告, 我们需要做什么? 我得先打开Claude或者ChatGPT,让他根据我这个创意写个脚本; 然后打开Nano Banana生成多个角度的产品渲染图,存到一个名为「鱼头追踪器-产品图」 的文件夹里; 再用Midjourney生成画面首尾帧,为了不跟上面的产品图混淆,得另存到一个名为「鱼 头追踪器-首尾帧」的文件夹里,还得好好命名; 紧接着打开Veo或是Sora,把上面这些七七八八的混在一起生成视频; 如果生成的视频没有人声还得单独配个音,然后发现口型没对上直接崩溃了; 最后还得手动把这些素材剪辑到一起。 一套下来,办了10个AI工具的会员开了20个网页,文件夹也整成八室一厅了,记忆力稍 微差点都忘了自己干到哪步了。 Flova首先解决的就是这个问题。它把这些AI工具和素材都整理到一起了。 拼好AI。 图片、视频、音乐、人声,国产的进口的大模型基本都包圆了,写提示词的时候可以自己 指定模型使用。 00:54 00:54

当然并不是每个人都有了解各种大模型孰优孰劣的义务。 所以如果你把需求发给Flova,它也会帮你做决策。 比如片子里有一个镜头需要说山东话,我用Veo3.1和Sora2生成都屡屡失败。 跟Flova说了之后,发现是外来菩萨念不明白本地经,把传统方言的发扬光大当成地域歧 视和文化挪用了。 懂事的它直接一键更换成国产AI,实现我的鲁味梦想。 虽然经后续调查发现,它最后给我生成的其实是河南话,但经后续更多调查发现,河南老 乡对鱼头文化亦有贡献,所以它这波在大气层。 有人要指出了,说了这么多,这Flova不就是个多模态大模型二道贩子吗?不就音视频领 域的OpenRouter吗? 别的AI视频工具不也整合多个大模型吗?Flova不就是模型多点也要吹?没吃过好的?

但我犹记先前很多AI视频剪辑工具都声称,产品有个全局导演,用户能够言出法随。 结果真用了就发现,这些AI视频剪辑工具的素材和片段,那叫一个各自为政分庭抗礼群龙 无首,也不听全局导演的也不听我的,想通过打几个字让片子把自己改了比登天还难。 不禁惊呼,AI视频是需要管的。 那Flova在管理AI视频这一块,做的还是相对较好的。不仅狠狠管起来了,还把各种大模 型狠狠连接在一起了,强制ai🥵 比如我一开始脚本里设计的是,这个鱼头自动追踪器荣获诺贝尔和平奖,做到一半突然想 起来,和平奖不是要被委内瑞拉那姐们献给特朗普了吗,我们就不抢了。 于是我就和Flova说,把旁白音频里的「诺贝尔和平奖」改成「诺贝尔物理学奖」。 结果它并不只是简单地把字改了,而是自己独立思考了一下,把相关的脚本和镜头也都给 改了。根本没用我单独指点。 就凭这个主观能动性,已经超越职场里100个装傻充愣的神人同事了。 可以看出,它真的在理解,或者至少是尝试理解整个视频的内容和逻辑。 说实话这真不难,但之前测的几个AI视频产品好像就没往这方面努力,我也不知道是为 啥。 比神人同事更优质的一点是Flova很尊重我。 在每一步开始前,Flova都会给出几种不同的工作流分支路线,也会把每个选择的优缺点 列出来,让我像玩旮旯game一样做AI视频。 举个例子,我后来紧跟国际局势热点,为第三世界人民发声,想做一个美式喜剧风格的讽 刺特朗普的动画。

角色形象和剧本生成完之后,Flova把选择权交给我,让我决定是先「将静态画面转化为 动画视频」,还是先「生成角色的配音对白」。 其实这很重要,因为我一开始选的是「将静态画面转化为动画视频」,结果口型就对不 上,把动画片拍成纪录片了。 还好Flova不存在之前某工具「你不能回到过去再踏进另一条河流」一样的问题,能随时 回溯开启新分支。 我改成先「生成角色的配音对白」之后,由于视频是跟着先生成的语音走,口型问题就解 决了。 而且当我想自己写提示词自己选模型自己控制流程的时候,也可以随时介入亲自下手。 模型、首尾帧、提示词都能精细化控制。 不给人工智能糊弄活人骗token的可乘之机。 还有一点,以往很多AI视频工具,都只能一个素材一个素材修改,用户坐在电脑前面盯着 屏幕就纯等啊,让这个AI和自己玩熬鹰战术。

Flova弄了个引用功能,让我可以真正地像一个甲方一样发号施令,一口气发过去10086 个需求,直接静候就完事了。 最后生成的视频效果还是不错的,咸鱼头一天晚上看完之后,第二天办美签都没过,什么 含金量。(美国人我xxx——咸鱼🤬) 说了这么多好话,还是得讲一下,Flova也并不完善,甚至有很多我觉得不能简单用bug来 归纳的问题。 01:37 01:37

比如在文生图——图生视频这个环节,两个模型还是没有心连心,经常你干你的我干我 的。 生图模型想的是一定要把所有脚本里提到的元素都展示出来,但其实视频模型需要的首尾 帧并不是这样。 有非常强的生殖隔离。 甚至Nano Banana会生成很多这种分屏视频,但视频模型根本不知道这大香蕉想干什么, 最后做出来一坨。 再比如,Flova目前是内嵌了两个音乐模型,Suno和Mureka的。 但现在兄弟俩在工具内部的定位,好像就是个生成bgm的。生成的带歌词的曲子就没法 用。 因为Flova里没有模型能对上歌曲的口型。

所以至少现阶段,当我想用Flova生成一个《大东北是我的家乡》的春晚live MV的时候, 只能悻悻然。 再再比如,时间轴也只能做简单的编辑和调节,而且角色音频不跟画面走,操作几次就全 乱了套了。 好在可以导出fcpx文件和pr文件,让我曲线救国二次加工。 00:30 00:30

最后,我得承认Flova本质上就是一个壳子。 它没有花里胡哨的Agent拟人角色扮演节目,也没看起来丰富多彩的封装提示词环节。 它干的事其实很简单:集成很多大模型,然后把它们连接到一起。 和其他视频Agent最大的区别是,Flova其实是一个画布软件。它把画布那些复杂的节点、 连线做了更好的交互,让用户只需要说话就能解决问题,实现自然语言剪辑。 其实也没啥难的。 但我想的是,这不就是我们需要的吗?至少这就是我需要的。 暴论一下,我甚至觉得这就是AI时代剪辑软件的正确发展方向:把剪辑这个行为AI化。 毕竟我寻思,都AI时代了,各路AI产品经理对剪辑的想象,多少还是带点「农民说皇上用 金锄头」的意味。 在他们心里,传统的剪辑就是把素材拼到一起,好无趣好无聊。AI剪辑就是在传统剪辑的 基础上加入AI技能,比如用AI生成视频,或者用说话的方式代替鼠标拖拽,好好玩要爆了 🤥 咱就是说,骗投资人可以,别把自己骗了。这就是你们对AI的完全理解? 我宣布AI时代的剪辑需要重新被定义。 就像工作之前要开会,做菜之前要腌肉一样,AI生成视频之前就要把剪辑当个事办。 别等到视频生成出来再剪辑,而是要在大模型启动的那一刻,就在文生文、文生音频、文 生图、图生视频之间建立传递信息的道路,让它们彼此理解,互相影响,建立并解决需 求,让剪辑悄悄发生。 毕竟想致富,先修路。 当然,Flova目前还是有很多问题,也远远称不上一个成熟的软件。 咸鱼最近也在狂用Flova,还发出了质问:这玩意是比之前测的那几个好些,但也没好到 夸张啊,生成的胖猫和秦始皇也就那样,没法克隆胖猫声音,甚至还遇到了导出失败问

题。 我不否认这点。 可能不完美,但大方向正确,我还是愿叫他一声AI剪映雏形,怀胎两三个月的那种👶 最后来欣赏一下我用Flova精心制作的《怪奇物语》真·大结局。 (本文封面由ChatGPT 生成,纯人工写作) 00:27 00:27