把文字从图片上删除,原理是非常简单的,就是先 OCR,找到文字的坐标,然后再生成一个 mask,把文字罩住就可以,今天看到一个开源项目,叫做 GitHub – iuliaturc/detextify: Remove text from AI-generated images ,他的做法是用 Stable Diffusion 这样的模型去生成图,然后用这个图去罩住那块文字。
效果
问题
对中文的图片支持不好,要调用第三方 OCR 来处理中文,最多能删除 5 个 textbox(字块)。
想法
基于这种思路,把各个 AI 的能力整合到一起,就可以实现一些复杂的能力,如可以实现图片到图片的翻译。