字节跳动旗下的智能AI助手豆包宣布其文生图能力已全面升级,现支持用户通过一键操作生成带有指定文本的图片。用户只需在生图提示词中明确文本要求,例如输入“一张包含‘科技前沿’字样的图片”,系统即可迅速生成满足需求的图片。目前,这一创新功能已在豆包App中开启测试,同时,即梦平台也已启动小范围测试。
据“虎嗅”今日发布的消息,豆包大模型团队的相关负责人透露,豆包的文生图模型通过整合LLM(大型语言模型)和DIT(深度图像转换)构架,显著提升了其原生中文数据的学习能力。在此基础上,豆包还专门针对汉字生成能力进行了优化,从而大幅提高了图片的生成效果。据悉,豆包的网页版及电脑版也将在不久的将来上线这一强大功能。
此外,豆包在本月初还推出了图片理解功能,为用户带来了更加丰富的使用体验。现在,用户在豆包App及豆包PC版中可以看到新增的照片及相机按钮,只需上传图片,系统即可识别并解析图片中的内容和基本特征。豆包的“图片理解”功能不仅能够识别图片中的元素,还能帮助用户解答关于图片中景点位置或影视角色出处等具体问题。