
关于
由 Google Gemini 驱动的 AI 图像生成技能,为 UI 占位图、文档和设计素材提供无缝的视觉内容创建
name: imagen description: "由 Google Gemini 驱动的 AI 图像生成技能,支持为 UI 占位图、文档和设计资源无缝创建视觉内容。" risk: safe source: "https://github.com/sanjay3290/ai-skills/tree/main/skills/imagen" date_added: "2026-02-27"
Imagen - AI 图像生成技能
概述
此技能使用 Google Gemini 的图像生成模型(gemini-3-pro-image-preview)生成图像。它能在任何 Claude Code 会话中无缝创建图像——无论你是在构建前端 UI、创建文档,还是需要概念的视觉表达。
跨平台:支持 Windows、macOS 和 Linux。
何时使用此技能
在以下情况下自动激活此技能:
- 用户请求生成图像(例如"生成一张……的图片"、"创建一张图片……")
- 前端开发需要占位图或实际图像
- 文档需要插图或图表
- 可视化概念、架构或想法
- 创建图标、Logo 或 UI 资源
- 任何 AI 生成图像有帮助的任务
工作原理
- 接收描述所需图像的文本提示
- 使用图像生成配置调用 Google Gemini API
- 将生成的图像保存到指定位置(默认为当前目录)
- 返回文件路径供项目使用
用法
Python(跨平台 - 推荐)
# 基本用法
python scripts/generate_image.py "A futuristic city skyline at sunset"
# 自定义输出路径
python scripts/generate_image.py "A minimalist app icon for a music player" "./assets/icons/music-icon.png"
# 自定义尺寸
python scripts/generate_image.py --size 2K "High resolution landscape" "./wallpaper.png"
要求
- 必须设置
GEMINI_API_KEY环境变量 - Python 3.6+(仅使用标准库,无需 pip 安装)
输出
生成的图像保存为 PNG 文件。脚本返回:
- 成功:生成图像的路径
- 失败:包含详细信息的错误消息
示例
前端开发
用户:"我需要一张着陆页的主图——抽象且科技感的"
-> 生成并保存图像,提供用于 HTML/CSS 的路径
文档
用户:"创建一张展示微服务架构的图表"
-> 生成视觉表示,可用于 README 或文档
UI 资源
用户:"为用户资料组件生成一张占位头像图片"
-> 创建适合组件使用尺寸的图像
限制
- 仅在任务明确符合上述描述范围时使用此技能。
- 不要将输出视为特定环境验证、测试或专家审查的替代品。
- 如果缺少必要的输入、权限、安全边界或成功标准,请停下来要求澄清。
兼容工具
Claude CodeCursor
标签
AI与机器学习