现在,微软似乎要抢先一步,在BingChat上发布图像识别功能。在上个月的Bing更新日志中,微软提到会为使用GPT-4模型的BingChat添加多模态支持。
那么,BingChat的图像识别功能到底怎么样呢?首先,对于梗图功能来说,BingChat可以精确识别并回答网络用户上传的关于机器学习或者汽车上烫衣服的梗图中的内容和笑点,基本上可以说是理解了梗图的意义。其次,在识别准确度方面的评测中,BingChat对于一张包含了很多《任天堂大乱斗》游戏角色的图片进行识别后,成功辨认出了其中7个角色,但还有5个未能辨认出来。总的来说,在二次元问题上,BingChat仍然有进一步提升的空间。此外,在根据手绘图编程方面,BingChat基本上可以根据用户手画的“试题”搭出网页的雏形。
在大型语言模型的升级过程中,经过视觉识别的学习之后,BingChat将具备更多的功能,为人类使用带来更大的便利。曾经无法用语言表达的内容现在可以通过图片解决。而具备图像识别功能的人工智能在教育、医疗等领域也能发挥更大的作用和价值。例如,在教育领域,BingChat可以担任老师的角色,帮助学生解答复杂的数理化问题,从而解决教育资源不均衡的问题。在医疗领域,用户还可以使用它进行基础的医疗诊断,从而节约就医所需的金钱和时间。因此,人工智能在社会生活中的价值将得到最大化的实现。
BingChat所带来的未来功能无疑令人兴奋。然而,在将图像识别功能完全对公众开放之前,微软还需要进行大量的限制和调试,以确保公众不会因为错误的回答而面临安全问题。这是一个任重道远的过程。
本站所有软件信息均由用户上传发布,版权归原著所有。如有侵权/违规内容,敬请来信告知邮箱:764327034@qq.com,我们将及时撤销! 转载请注明出处:https://czxurui.com/zx/28816.html
发表回复
评论列表(0条)