
关于
通过 fal.ai MCP 统一媒体生成——图像、视频和音频。涵盖文生图(Nano Banana)、文/图生视频(Seedance、Kling、Veo 3)、文本转语音(CSM-1B)和视频转音频(ThinkSound)
name: fal-ai-media description: 通过 fal.ai MCP 统一媒体生成 — 图像、视频和音频。涵盖文本生成图像(Nano Banana)、文本/图像生成视频(Seedance、Kling、Veo 3)、文本生成语音(CSM-1B)和视频生成音频(ThinkSound)。当用户想要用 AI 生成图像、视频或音频时使用。 origin: ECC
fal.ai 媒体生成
易漂移技能。 fal.ai 模型 ID、定价、输入和 MCP 工具名称变化很快。在承诺特定模型、参数、输出格式或成本之前,请搜索或获取当前模型元数据。
使用 fal.ai 模型通过 MCP 生成图像、视频和音频。
何时激活
- 用户想要从文本提示生成图像
- 从文本或图像创建视频
- 生成语音、音乐或音效
- 任何媒体生成任务
- 用户说"生成图像"、"创建视频"、"文本转语音"、"制作缩略图"或类似内容
MCP 要求
必须配置 fal.ai MCP 服务器。添加到 ~/.claude.json:
"fal-ai": {
"command": "npx",
"args": ["-y", "fal-ai-mcp-server"],
"env": { "FAL_KEY": "YOUR_FAL_KEY_HERE" }
}
在 fal.ai 获取 API 密钥。
MCP 工具
fal.ai MCP 提供以下工具:
search— 按关键词查找可用模型find— 获取模型详情和参数generate— 使用参数运行模型result— 检查异步生成状态status— 检查任务状态cancel— 取消正在运行的任务estimate_cost— 估算生成成本models— 列出热门模型upload— 上传文件作为输入
图像生成
Nano Banana 2(快速)
最适合:快速迭代、草稿、文本生成图像、图像编辑。
generate(
app_id: "fal-ai/nano-banana-2",
input_data: {
"prompt": "a futuristic cityscape at sunset, cyberpunk style",
"image_size": "landscape_16_9",
"num_images": 1,
"seed": 42
}
)
Nano Banana Pro(高保真)
最适合:生产级图像、写实、排版、详细提示。
generate(
app_id: "fal-ai/nano-banana-pro",
input_data: {
"prompt": "professional product photo of wireless headphones on marble surface, studio lighting",
"image_size": "square",
"num_images": 1,
"guidance_scale": 7.5
}
)
常用图像参数
| 参数 | 类型 | 选项 | 说明 |
|------|------|------|------|
| prompt | string | 必填 | 描述你想要的内容 |
| image_size | string | square、portrait_4_3、landscape_16_9、portrait_16_9、landscape_4_3 | 宽高比 |
| num_images | number | 1-4 | 生成数量 |
| seed | number | 任意整数 | 可复现性 |
| guidance_scale | number | 1-20 | 遵循提示的程度(越高越字面) |
图像编辑
使用 Nano Banana 2 配合输入图像进行修复、扩展或风格迁移:
# First upload the source image
upload(file_path: "/path/to/image.png")
# Then generate with image input
generate(
app_id: "fal-ai/nano-banana-2",
input_data: {
"prompt": "same scene but in watercolor style",
"image_url": "<uploaded_url>",
"image_size": "landscape_16_9"
}
)
视频生成
Seedance 1.0 Pro(ByteDance)
最适合:文本生成视频、图像生成视频,运动质量高。
generate(
app_id: "fal-ai/seedance-1-0-pro",
input_data: {
"prompt": "a drone flyover of a mountain lake at golden hour, cinematic",
"duration": "5s",
"aspect_ratio": "16:9",
"seed": 42
}
)
Kling Video v3 Pro
最适合:文本/图像生成视频,支持原生音频生成。
generate(
app_id: "fal-ai/kling-video/v3/pro",
input_data: {
"prompt": "ocean waves crashing on a rocky coast, dramatic clouds",
"duration": "5s",
"aspect_ratio": "16:9"
}
)
Veo 3(Google DeepMind)
最适合:带生成音效的视频,高视觉质量。
generate(
app_id: "fal-ai/veo-3",
input_data: {
"prompt": "a bustling Tokyo street market at night, neon signs, crowd noise",
"aspect_ratio": "16:9"
}
)
图像转视频
从现有图像开始:
generate(
app_id: "fal-ai/seedance-1-0-pro",
input_data: {
"prompt": "camera slowly zooms out, gentle wind moves the trees",
"image_url": "<uploaded_image_url>",
"duration": "5s"
}
)
视频参数
| 参数 | 类型 | 选项 | 说明 |
|------|------|------|------|
| prompt | string | 必填 | 描述视频内容 |
| duration | string | "5s"、"10s" | 视频时长 |
| aspect_ratio | string | "16:9"、"9:16"、"1:1" | 画面比例 |
| seed | number | 任意整数 | 可复现性 |
| image_url | string | URL | 图像转视频的源图像 |
音频生成
CSM-1B(对话式语音)
文本转语音,具有自然的对话质量。
generate(
app_id: "fal-ai/csm-1b",
input_data: {
"text": "Hello, welcome to the demo. Let me show you how this works.",
"speaker_id": 0
}
)
