如果心流2.0支持视频生成模型,你想拿他做什么?

rt,如果心流2.0支持视频生成模型,你想拿他做什么?

将知识点生成视频,养成知识博主?

用它写脚本、做动画、拍短剧?

或者用它做创意视频,玩梗、整活、搞艺术?

来点想法和需求,我们正在调教 :smiling_face_with_horns:


:egg: 彩蛋:心流知识库视频生成功能即将接入 :red_question_mark: 模型 :detective:

2 个赞

做成虚拟龙王,三年之期已到,我会将失去的知识全都学回来 :smirking_face:(歪嘴)

1 个赞

小朋友才做选择题,哈哈哈,不能都要么

1 个赞

把产品手册丢给它,让它起个playwright cli打开产品页面,开始自动操作录屏,之后生成带讲解的产品介绍视频,支持让客户从众多讲解员中选择他喜欢的,比如罗永浩,王自如,星巴克服务员,雷军,金凡,白永祥,李楠,余承东,宋大腿……

1 个赞

这个有需求

将知识点生成视频,养成知识博主?

1 个赞

感觉b站上刷到的知识区up主、吐槽区up主,都可以在知识库里写好稿子,一键生成视频了~

让模型给他找相匹配的画面即可,反正主要是观点的输出。

2 个赞

给我的文章、产品生成配套视频

1 个赞

当然是做我的医学学习视频呀?现实里说说得了,网上谁不想急头白脸地用IFLOW2生成学习视频,我再也不想看比新华字典还厚的教科书了ŏ̥ㅁŏ̥

1 个赞

必然是做产品页的宣传视频

1 个赞

哈哈 我全都要. 主要还是会考虑生成流程,知识方面的生成会多吧. 视频这块一直接触的少,没什么太多想法啊.

1 个赞

能把知识点完整体现出来的视频 比如 借十法 用视频生动的展现出来

1 个赞

春节期间试过用iflow cli 调用slidev skills将文章生成ppt,然后调用remotion-best-practices skills和edge-tts skills分别生产视频和配音,如果有更好的视频生成模型,那么就可以从创意或者文章直接到PPT风格的带讲解的视频了

另外,傅盛的3万的那个白板手写风格PPT很喜欢,试过用iflow cli来生成,就是没有好用的视频模型最后只能放弃,现在有了视频模型,那么白板手写风格的PPT也就有了

1 个赞

当然是给两个视频生成一个衔接的转场视频了。

理论上用首尾帧就能生成,应该会很好玩。

1 个赞

我觉得:
知识类视频 > 动画/短句 > 艺术
因为ai在创作这一块确实还有点欠缺。输出的很多都是数据集里面的,或者很浓的ai味。
而且就现在的画质而言,很难跑出特别精致的视频。
除非恰好抓住了某个热点/梗 而引起的爆火。

但如果写一个skill,让它把一个知识点转化成 视频提示词+配文,这是比较容易跑通的。
作为实验 我只需要一小段话就可以让d老师生成提示词
再稍微优化一下提示词约束,优化一下流程,应该就能跑个雏形出来了。
如果是艺术创作,它当然也会这样输出提示词,但我总觉得缺乏新意。
但知识讲解不需要新意,只需要跟着提示词,一点一点生成就好,重点在于清晰、易于理解,也许这就是优势。

1 个赞

1、目标:做短视频

痛点:写文案、找素材、剪视频、配音加字幕,一整套流程下来,一条视频可能就要耗掉半天时间,更别说想做批量内容、做副业变现了,光是重复劳动就已经让人疲惫不堪

需求:需要一个基于 AI 的自动化短视频生成工具,最大的特点不是“生成视频”,而是“自动完成整个视频生产流程”。

竞品参考: GitHub - harry0703/MoneyPrinterTurbo: 利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI LLM. · GitHub

2、目标:在长视频中做画面穿插

痛点:纯讲解的长视频太干了,需要穿插一些有趣的画面,要么找素材库、要么自己画,效率很低,而且随便从网上扒的通用素材总觉得差点意思

需求:纯讲解的长视频需要穿插一些有趣的画面,画面需要跟自己有关,比如:根据我的照片生成卡通形象,AI能提取出我的特征生成了一张统一的卡通角色参考图,再用这张图作为视觉锚点,并同步生成三个视频场景。

3、目标:品牌宣传广告

痛点:自己规划分镜,自己选模型,自己合成
需求:只想做愉悦的环节:构思创意、审片、做最终决定。我不需要知道哪个模型擅长什么,希望AI会根据我描述的场景自己判断用哪个。

4、目标:做数字人视频

需求:希望能有通义万相团队做的功能:阿里巴巴于2025年8月26日正式开源了Wan2.2-S2V作为阿里云推出的升级版视频生成模型,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致的电影级数字人视频。该模型单次生成的视频时长可达分钟级。

痛点:目前在线版万相 | 领先的AI视频与图像生成模型只能生成18秒视频,排队需要几个小时,github上的文件又太大

开源版只是兜底方案,更希望能拿下通义的这些:wanx2.1-vace-plus、wan2.7-videoedit、wan2.7-t2v、wan2.7-i2v、wan2.7-r2v 作为底层基础设施。

GitHub: https://github.com/Wan-Video/Wan2.1

HuggingFace:https://huggingface.co/Wan-AI

ModelScope: https://modelscope.cn/organization/Wan-AI

博客: https://wanxai.com/

推理与LoRA训练支持:https://github.com/modelscope/DiffSynth-Studio/tree/main/examples/wanvideo

之前看过开源版的宣传片,这个宣传片就已经非常震撼了。

竞品参考:

https://github.com/GuijiAI/HeyGem.ai(分辨率达3840×2160)

5、目标:视频翻译 && 支持自定义音色

痛点:一些收藏的视频,语音是英文的。
需求:希望能够提供准确且流畅的翻译结果,无论是日常对话还是专业领域术语,都能轻松应对。
希望支持自定义音色克隆,可以根据视频风格选择最合适的配音。

视频翻译:

支持自定义音色:

竞品参考: https://github.com/krillinai/KrillinAI

6、目标:做微短剧

痛点:做短剧需要有更高分辨率的支持 及 专业级效果。
需求:支持 文本到视频、图像到视频、参考风格视频生成、更高分辨率+插值

竞品参考: https://github.com/lllyasviel/FramePack

7、目标:从图像到视频

需求:需要能根据照片生成短视频,让照片开口说话
竞品参考: DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance

8、目标:做音乐MV
痛点:需要把繁琐的室外工作转为室内绿幕即可生成MV视频背景
需求:最终目标要达到这种效果:

https://mp.weixin.qq.com/s/nYduNBVp2F5ee6bUmwCr5Q

1 个赞