图生视频提示词生成器

AI CHINESE PROMPT

简繁 EN

About this tool

从一张图出发，构建图生视频的运动与运镜提示词

免费图生视频提示词生成器：按首帧、想要的运动、运镜与幅度拼装提示词，适配即梦/可灵/海螺。浏览器本地运行。

RT-AI-065 · AI Tools

从一张静态图出发，用一个简单的表单拼出干净、结构化的图生视频提示词——首帧画面、想要的主体动作、镜头运镜、运动幅度、时长与一致性一应俱全，随后连同你的图，直接复制到即梦、可灵或海螺中使用。全部在你的浏览器本地拼接，不向服务器发送任何内容，也不会调用任何模型。

提示：本工具只负责拼接文本。请自行把结果连同你的首帧图复制到即梦 / 可灵 / 海螺等工具中——不会调用任何模型，也不会向任何地方发送内容。

你的图生视频提示词

本图生视频提示词生成器的工作原理

先描述首帧画面

在第一格简要描述你那张静态图里有什么：主体是谁、所处场景、光线与构图。这一行让视频模型「看懂」起点，与你上传的首帧对齐，是后续运动的基础。注意只需点到为止，重点留给「想要的变化」。

写「想要的变化 / 运动」而非重述静态画面

图生视频的关键是描述动作与变化，而不是再描述一遍画面。填入主体的动作（如「缓缓转头微笑」「头发被风轻轻吹动」）以及画面里应当发生的变化。模型已经看到了图，你要告诉它的是「让它怎么动起来」。

设定运镜、幅度与时长

指定镜头运动 / 运镜（推、拉、摇、移、环绕或固定机位）、运动幅度与速度（轻微、适中、明显），以及视频时长。幅度宜适中——动作过大、过快容易让主体崩坏或扭曲，这是图生视频最常见的翻车点。

复制到即梦 / 可灵 / 海螺

点击「复制」，把拼好的提示词连同你的首帧图一起，粘贴到即梦、可灵、海螺等视频生成工具的图生视频入口即可。全部在浏览器本地拼接，不上传你的文字，也不调用任何模型。

本图生视频提示词生成器的工作原理

描述「想要的运动」，而非模型已经看见的画面

图生视频是一门和「写静图提示词」截然不同的手艺。你已经有了一张满意的图，任务是让它动起来，同时不破坏它原本的好。最关键的思维转变在于：模型已经能看到你的首帧，所以再详细地重述一遍静态构图，多半是白费力气。模型看不到的是「未来」——主体该如何运动、镜头往哪里走、动多快、哪些要保持不变。本工具替你保留这套结构：先用一句话点明画面里有什么，然后把字数花在真正要紧之处——想要的主体动作、镜头运镜、运动幅度、时长、一致性要求，以及一小段要避免的瑕疵清单。拼出来的，正是一位有经验的动态师会手写的提示词，只是几秒就能完成，并且在即梦、可灵、海螺之间通用。

最有价值的一条指令，永远是「想要的运动」。「缓缓转头，对镜头微笑，发丝在微风中轻轻飘动」一句话就告诉模型究竟要让什么动起来，远比一整段情绪形容词来得可靠。运动之后是镜头：推近、拉远、摇移、环绕，或固定机位。明确写出运镜，远比交给运气可控；固定机位配合轻微的主体动作，是最稳妥的起点之一。时长则决定节奏——多数短片只有数秒，一个清晰动作通常胜过同时编排三个。把每一格都写得具体：与其说「要有动感」，不如说「轻微、自然的呼吸感；人脸与手部保持稳定」。

「图生视频里，模型已经拿到了画面。你的提示词不是描述，而是一组「该怎么动」的导演指令。」

适度的幅度与稳定的运镜，才是保住主体不崩坏的关键

默默帮你保住最多素材的，是运动幅度这一格。图生视频模型对剧烈动作很敏感，幅度一旦推得太高，人脸会拉伸、手会多出手指、物体会扭曲。把幅度控制得适中，并把较大的幅度留给天然就在动的元素（风、水、烟雾），是规避最常见翻车的最省力办法。再配上一小段负面提示（「变形、扭曲、闪烁、多余肢体」）和一条清晰的一致性要求（「保持角色的脸、服装与首帧的光线」），主体就更可能在整段视频里始终是它自己。这些都不会削弱模型，只会把它聚焦到一个能干净渲染出来的运动上。

由于输出是结构化纯文本，同一段提示词在各家中文视频模型间通用，同样的原则也适用于其他图生视频工具。面向中文模型时就用中文书写——结构本身与语言无关。又因为整个工具在本地运行，你可以放心反复打磨：改一句运动描述、再次复制、重新生成、对比效果——而你输入的文字始终不会离开浏览器，也不会调用任何模型。把第一段成片当作草稿：主体漂移就把幅度调低；太死板就单独提一个具体动作；镜头与主体打架，就锁住镜头、让主体独自运动。两三轮这样有纪律的调整，往往能把崩坏、抖动的初版变成干净可信的画面，而你最后还留下了一段整洁、可复用的提示词。

关于图生视频提示词的 10 个要点

图生视频（图生视频 / image-to-video）从一张静态图出发生成动态视频，提示词的核心是描述「想要的变化与运动」，而不是再描述一遍画面。

模型已经看到了你上传的首帧，因此过度重述静态构图意义不大；把字数花在动作、运镜与变化上回报更高。

运动幅度宜适中：动作过大、过快是图生视频最常见的崩坏来源，容易让人脸、手部或物体结构扭曲变形。

镜头运镜（推、拉、摇、移、环绕、固定机位）是一条独立的描述维度，明确写出来比让模型自由发挥更可控。

一句清楚的主体动作（如「缓缓转头」「眨眼微笑」）通常比一长串模糊的形容词更有效。

指定时长有助于模型分配动作节奏；多数图生视频以数秒短片为主，动作不宜塞得太满。

风格 / 一致性要求（保持首帧的画风、光线、角色外观）能减少主体在运动中「变脸」或漂移。

同一套结构化思路在即梦、可灵、海螺等主流中文视频模型上都适用，因为提示词本质是结构化纯文本。

负面提示（不要出现的元素或瑕疵，如变形、闪烁、多余肢体）有助于规避常见的图生视频翻车。

本工具完全在你的浏览器本地拼接提示词——你的图片与文字都不会上传，不调用任何模型，也不会被保存。

常见问题

不会。本工具只是把你填写的字段按固定模板拼接成一段结构化的图生视频提示词，全程在你的浏览器本地完成，不调用即梦、可灵、海螺或任何视频模型，也不联网。生成的提示词需要你自己连同首帧图复制到所选工具里使用。
最大的区别是：图生视频里模型已经看到了你的首帧图，所以你不需要再描述一遍静态画面，而应把重点放在「想要的变化与运动」上——主体动作、镜头运镜、运动幅度与一致性。文生视频则要从零描述整个场景。
最常见的原因是运动幅度过大、过快。图生视频对剧烈动作很敏感，幅度一大就容易让人脸、手部或物体结构扭曲。建议把动作写得克制、适中，并在负面提示里加入「变形、扭曲、多余肢体」等。
即梦、可灵、海螺等主流中文视频模型都适用；其他支持图生视频的工具同样可用。因为输出是结构化纯文本，与具体厂商无关，你可以粘贴到对应工具的图生视频输入框中。
不必。留空的字段会被自动省略。最少填好「想要的主体动作」就能得到可用的提示词；再补上运镜、运动幅度与一致性要求，结果会更可控、更稳定。
用常见的镜头语言即可，例如推近（推）、拉远（拉）、左右摇、平移、环绕，或固定机位。明确写出运镜，比让模型自由发挥更可控；不确定时，固定机位加轻微主体动作往往最稳。
本工具不接触你的图片，也不上传任何文字——所有拼接都用纯 JavaScript 在你的浏览器本地完成。你的图片只会在你自己把提示词和图一起提交给所选视频工具时，才由那个工具处理。
多数情况下「适中」最稳。轻微幅度适合人像、产品等需要保持一致性的画面；明显幅度适合风、水、烟雾等天然就在动的元素。动作越大越容易崩坏，宁可偏保守再迭代。
可以，但建议循序渐进。先让主体或镜头其中之一动起来，确认稳定后再叠加另一项。一次同时给出大幅运镜与大幅主体动作，最容易出现画面崩坏。
完全免费，无需注册或登录，也没有使用次数限制。它在你的浏览器中运行，不收集任何数据。

图生视频提示词生成器

本图生视频提示词生成器的工作原理

先描述首帧画面

写「想要的变化 / 运动」而非重述静态画面

设定运镜、幅度与时长

复制到即梦 / 可灵 / 海螺

本图生视频提示词生成器的工作原理

描述「想要的运动」，而非模型已经看见的画面

适度的幅度与稳定的运镜，才是保住主体不崩坏的关键

关于图生视频提示词的 10 个要点

常见问题

Related News

75 more free tools

图生视频提示词生成器