AI IDEs generate images, audio, music, etc. natively

Feature request for product/service

Cursor IDE

Describe the request

  1. 一句话概括 / One-Sentence Summary
    中文:希望 AI IDE 直接支持生成图片、音频、音乐等素材,能灵活调用不同模型,不用靠插件拼凑。
    English: Let AI IDEs generate images, audio, music, etc. natively—and switch models freely—without relying on scattered plugins/skills.
  2. 需求描述 / Request Description
    中文:
    :white_check_mark: 在 IDE 里输入文字,就能直接生成图片、语音、背景音乐等素材,自动存入项目文件夹;
    :white_check_mark: 后台可自由切换不同模型(如文生图、文生语音、音乐生成),不用手动装插件;
    :white_check_mark: 生成结果能自动被代码引用,比如<img src="./assets/xxx.png"> 或 playAudio(‘xxx.mp3’);
    :white_check_mark: 减少跳转、复制、重命名等重复操作,让创作和开发一气呵成。
    English:
    :white_check_mark: Type a prompt in the IDE → get images, voice, or music → auto-saved to your project;
    :white_check_mark: Swap models behind the scenes (text-to-image, TTS, music gen) — no plugin installs needed;
    :white_check_mark: Generated assets auto-link in code, e.g., <img src="./assets/xxx.png"> or playAudio(‘xxx.mp3’);
    :white_check_mark: Cut down on copy-paste, tab-switching, and manual file management — keep the flow seamless.
1 Like

嘿,感谢你提出的功能需求。其实从 Cursor 2.4 版本起就已经支持图像生成功能了!该功能采用 Gemini 3 Pro 图像预览技术,详情见

十分感谢,图片生成用起来不错, 一开始入口没找到,也没看到相关配置, 如果可以配置自己的apikey和相应的能力,agent能调用会方便许多。
希望平台把基础的能力集成完善, 这样使用起来更加稳定便捷,让创造者专注于创作内容,不用重复制造harness/skills/mcp等基础工具。