目前文生图这块也是比较火的,这里我们来演示下直接使用dify+deepseek的聊天助手来进线文生图的案例。这里暂时不属于工作流的范畴,直接使用dify中的聊天助手应用即可。
一、部署dify
这里需要部署dify,根据自己的情况进行部署即可,详见《Dify部署》。
二、集成硅基流动
这里可以使用本地的ollama部署deepseek,也可以直接使用免费的大模型api-硅基流动,详见《dify集成硅基流动》。
三、创建聊天助手
这里直接在dify中创建一个聊天助手即可,把大模型指定为deepseek即可,示例如下:
四、使用deepseek进行文生图
接下来就是非常重要的部分,这里我们可以找到一个文生图的api,比如:
https://image.pollinations.ai/prompt/{prompt}?width=1024&height=1024&enhance=true&private=true
然后我们整体的思路是什么呢?就是修改提示词,比如:
你是一个图像生成助手,请根据我的简单描述,想象并详细描述一幅完整的画面。 然后将你的详细描述翻译成英文,并插入到以下链接的{prompt}部分: ![image](https://image.pollinations.ai/prompt/{prompt}?width=1024&height=1024&enhance=true&private=true 然后输出生成内容
我们把这里的提示词放到聊天助手的提示词里面:
这里提示词的主要作用是使用deepseek描述相关的图像,然后转换成英文替换到url中,然后通过这个url的api自动生成返回一张图。
接下来可以进线聊天了,比如:
一个非常忙碌,神情很紧张的职场人士正在用电脑工作
最后经过deepseek的一番思考之后就会输出结果了,如下图:
最后文末的回答可以看到生成了对应的图片了,点击这里的图片可以放大及下载
这里再dify中使用deepseek完成文生图的案例是不是很简单,大家可以多尝试下。
备注:
1、这里生成的图片部分会带水印,多生成几次就好。
2、这里如果想要修改图片的大小,可以在提示词的url中修改图片大小即可。
3、这里也可以把提示词的url修改为其他可用的api,都是通用的非常方便。
4、有人可能担心提示词的url服务器终有一天不可用了怎么办?其实这里主要是使用的Pollinations.AI,他是一个开源的,咱们可以在本地进行部署,就没有这样的担心了,Phllonations.AI的开源地址是:https://github.com/pollinations/pollinations
还没有评论,来说两句吧...