今年3月,谷歌发布了一种叫做PaLM-E的多模态具身视觉语言模型,它能够理解图像、生成语言,并且能够执行各种复杂的机器人指令,而且无需重新训练,具有很好的迁移能力。
政策方面也开始关注具身人工智能。北京市日前发布的《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》提出了探索具身智能、通用智能体和类脑智能等通用人工智能新路径的措施。
具身智能是指智能体通过与环境交互后,通过自身学习产生对客观世界的理解和改造能力。要实现具身智能离不开多个学科的交叉互助,包括机器人学、深度学习、强化学习、机器视觉、计算机图形学、自然语言和认知科学。
具身智能最早可以追溯到1950年,不过在之后的几十年中没有取得显著进展,大多数机器人仍然依赖人类的手写指令和代码。谷歌的PaLM-E模型引起了业界的关注,因为它无需预处理场景,并且能对周围环境变化作出相应反应。
实现通用人工智能是行业的愿景之一,但其中一些概念很难被测量或验证。因此具身智能可能是迈向通用智能的一个很好起点,因为它是可测量、可解释和可验证的。
本站所有软件信息均由用户上传发布,版权归原著所有。如有侵权/违规内容,敬请来信告知邮箱:764327034@qq.com,我们将及时撤销! 转载请注明出处:https://czxurui.com/zx/97463.html
发表回复
评论列表(0条)