准确,详细的提示单词将图像反向传播到文本(Accurate and detailed cue word backpropagation of images to text)

molmo 7b-d基于qwen2–7b,并使用openai夹子作为视觉骨架。

测试时结果非常好。

,所以我也写了一个节点,使人们还可以轻松地在comfyui。依赖项,环境问题。

由于您无法安装它,让我们变得更好一p>更多内容收录在⬇️

https://xiaobot.net/p/gotocomfyui

https://pan.quark.cn/s/882aea39f59c </pan.quark.cn/8829f59c

节点

https://github.com/cy-chenyue/comfyui-molmo

video

https://youtu.be/clpa3wwkekw4

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部