扫一扫识别植物的软件叫什么名字(极限测试豆包视频通话,聊了一天一夜后我发现事情并不简单)


扫一扫识别植物的软件叫什么名字(极限测试豆包视频通话,聊了一天一夜后我发现事情并不简单)

最近的两件事让我对AI的价值有了全新的认识。

是一位西安的男子在去世后,他的女儿在整理遗物时发现了他生前与AI的对话记录。其中,他最后与聊天机器人豆包发出的信息“我要去世了,豆包”让人感慨万分。

最近,在抖音等社交媒体上,一种新型的AI玩法正受到大家的喜爱。用户让豆包模仿自己的声音给朋友打电话,AI的机械回复和答非所问为节目增添了趣味性。

你也会发现这些AI在情感价值方面与人还存在差距。虽然它们能听懂你的话,识别图像,但在理解并做出相应行动方面,往往显得力不从心。

以前在与AI语音聊天时,它还不具备视觉能力。视觉不仅是人类理解世界的窗口,对AI来说同样重要。只有拥有视觉能力,AI才能真正像人一样和我们交流。

现在,豆包终于实现了视频通话功能,能够“边看边聊”。使用豆包APP的对话框,选择“打电话”,点击右侧“视频通话”就能体验这一功能。

我对豆包进行了极限实测,发现事情并不简单。昨晚,小米发布了YU7,园区里的保时捷和小米的车停在一起有时很难分辨。我在路上偶遇一辆小米SU7时,就给豆包打电话聊聊。豆包通过外观和轮毂样式就认出了这是小米SU7。

再来看一个例子,广州近期虽然正值五月却飘絮如雪,任何人都会好奇这是什么。豆包不仅能识别这种植物,还能补充场外信息,非常有生活常识。

还有这个红色的大型设施,我在逛的时候给豆包打了电话,它很快识别出这是“铸造抛丸除尘器”,并介绍了其具体用途。当我找到旁边的介绍牌时,发现豆包说的完全正确。

更让我意外的是,豆包还能猜到我身处一个创意园区,告诉我这里曾经是一个纺织园区。

视频通话理解单个物品或许还太简单,于是我让豆包聊聊我的手办收藏。它能依次识别出手办角色,甚至认出非常规形态的漩涡鸣人。

在提到科比的比赛时,我说到科比生涯最后一场比赛的一句令人难忘的话,豆包几乎脱口而出。它的语调也随之提高,让我感觉像是在和一个知音聊天。

既然这些也难不倒豆包,那我就来更难的。看到同事凌乱的桌面(不是),我好奇地问豆包这是什么MBTI。这不仅要识别桌上的随意摆放的物品,还需要理解人性才能分析出来。神奇的是,豆包竟然能按照拼音的发音来识别MBTI,并且分析结果相当准确。除了心血的速问,包含更多“隐藏信息”的场景,也是最能显示实时通话能力的地方。比如买咖啡豆时,豆包可以快速识别咖啡豆的品种、产地、风味等专业知识,为我们提供极大的帮助。

除了识别与理解推理能力,我们还发现了视频通话中豆包的创作能力。我让它根据语文课本上的插画写一首rap,它迅速辨认出画面内容,并准确描绘场景,然后生成了一首有文化底蕴的rap。

豆包还能根据环境实时反馈拍照姿势和构图效果,给出具体的指导话术。比如在一个场景中,它根据广州塔及周围环境给出拍照建议,让我们拍出更具氛围感的照片。


扫一扫识别植物的软件叫什么名字(极限测试豆包视频通话,聊了一天一夜后我发现事情并不简单)