腾讯混元发布AI绘画框架24维度训练让AI听懂人话
AI绘画总“画不对”,让创作者一再崩溃。
如今,腾讯混元团队开源的PromptEnhancer框架,为这一难题提供了解决方案。
无需修改任何预训练T2I模型的权重,仅通过 “思维链(CoT)提示重写” 这一简单思路,就能让AI绘画的文本-图像对齐精度大幅提升。
在抽象关系理解、数值约束等复杂场景中,准确率甚至能提升17%以上。
同时,为了助力研究人员进一步深入探索提示优化技术,腾讯混元团队同步开源了一个全新的高质量人类偏好基准测试数据集。
该数据集围绕复杂场景构建,包含大量标注数据,不仅为PromptEnhancer的训练与评估提供了有力支撑,更为相关研究领域提供了重要参考。