AI IDEs generate images, audio, music, etc. natively

papaw · April 20, 2026, 3:02am

Cursor IDE

一句话概括 / One-Sentence Summary
中文：希望 AI IDE 直接支持生成图片、音频、音乐等素材，能灵活调用不同模型，不用靠插件拼凑。
English: Let AI IDEs generate images, audio, music, etc. natively—and switch models freely—without relying on scattered plugins/skills.
需求描述 / Request Description
中文：
在 IDE 里输入文字，就能直接生成图片、语音、背景音乐等素材，自动存入项目文件夹；
后台可自由切换不同模型（如文生图、文生语音、音乐生成），不用手动装插件；
生成结果能自动被代码引用，比如<img src="./assets/xxx.png"> 或 playAudio(‘xxx.mp3’)；
减少跳转、复制、重命名等重复操作，让创作和开发一气呵成。
English:
Type a prompt in the IDE → get images, voice, or music → auto-saved to your project;
Swap models behind the scenes (text-to-image, TTS, music gen) — no plugin installs needed;
Generated assets auto-link in code, e.g., <img src="./assets/xxx.png"> or playAudio(‘xxx.mp3’);
Cut down on copy-paste, tab-switching, and manual file management — keep the flow seamless.

Tom_Coustols · April 20, 2026, 3:21am

嘿，感谢你提出的功能需求。其实从 Cursor 2.4 版本起就已经支持图像生成功能了！该功能采用 Gemini 3 Pro 图像预览技术，详情见

papaw · April 20, 2026, 3:58am

十分感谢，图片生成用起来不错，一开始入口没找到，也没看到相关配置, 如果可以配置自己的apikey和相应的能力，agent能调用会方便许多。
希望平台把基础的能力集成完善，这样使用起来更加稳定便捷，让创造者专注于创作内容，不用重复制造harness/skills/mcp等基础工具。

Topic		Replies	Views
Feature request: Add video generation support Feature Requests image-gen	0	194	March 4, 2026
Dalle-3 Image Generation Support Feature Requests	5	3431	April 1, 2025
Cursor 2.4: Image Generation Release Discussions	27	4888	March 10, 2026
Feature Suggestion: Cursor AI Integration with Image Generation Models (DALL-E, Stable Diffusion) Feature Requests	0	783	March 14, 2025
Feature Request: Enable Direct Image Generation via GPT-4o in Cursor Feature Requests	1	153	July 3, 2025