描述: restaurant menu card
描述:cheesecake store
描述:Advertisement of limited offer in McDonald's
![]() |
1
czfy 356 天前 ![]() “需要用几个简单的词描述一下图片里的内容”
举个例子,最后要描述成什么样 |
![]() |
2
h272377502 356 天前 ![]() gpt4 不是提供了 api 了吗,minigpt4 和 gpt4 差距很大
|
![]() |
4
Egfly OP @h272377502 gpt4 api 有调用频率限制吗
|
5
dobelee 356 天前 ![]() 看你的例子可不“简单”。图二需要通过 cake 等字眼结合分析才能得到是餐厅,图三需要识别麦当劳的 logo 才能得出是麦当劳的广告。一般给照片内容识别打标签的 AI 没训练到这程度吧,还是得上 chatgpt 或者 gemini 。
|
7
jZEdn7k4 356 天前 via iPhone ![]() 你这个任务叫 image captioning ,github 用这个关键词搜一下,不少开源代码和模型的,当然质量比不上 gpt 也不会太差
|
![]() |
8
Puteulanus 356 天前 ![]() 我之前用过 IBM Watson Visual Recognition ,不知道现在还活着没
国内的用过腾讯的万象优图 https://cloud.tencent.com/document/product/460/39082 |
9
loi1noG2463cVpXu 356 天前 via Android ![]() 人工,增加工作机会,造福社会
|
![]() |
10
vivisidea 356 天前 ![]() |