在科技飞速发展的当下,人工智能与机器人领域的每一次突破都备受瞩目。2025 年 6 月 24 日,谷歌 DeepMind 发布的 Gemini Robotics On - Device,宛如一颗投入平静湖面的巨石,激起千层浪,为机器人领域带来了全新的变革与无限可能。
Gemini Robotics On - Device 最大的亮点之一便是其离线运行能力。在以往,许多机器人依赖活跃的互联网连接才能执行复杂任务,这不仅限制了其使用场景,在网络不佳或无网络的环境中更是举步维艰。而如今,这款离线 AI 模型打破了这一束缚,让机器人在诸如偏远地区、信号屏蔽区域等网络连接受限甚至为零的地方,也能稳定且高效地工作。例如在一些野外探险、灾难救援场景中,机器人可以凭借此模型,在没有网络的情况下,自主完成搜索、救援物资搬运等任务,大大提升了救援效率与行动的可行性。
为了适应机器人设备的运行环境,Gemini Robotics On - Device 在设计上进行了深度优化,以实现高效低耗。它仅需 “最少的计算资源”,就能在机器人硬件上流畅运行。这对于资源有限的机器人设备而言,意义重大。它意味着机器人无需配备过于庞大、昂贵的计算硬件,便能运行复杂的 AI 模型,降低了机器人的制造成本与能耗,使更多企业和开发者能够负担得起更智能的机器人研发与应用。
自然语言交互一直是智能机器人追求的重要目标,Gemini Robotics On - Device 在这方面表现出色。它如同一位精通多种语言的翻译官,能够理解人类的自然语言提示,支持自然语言命令。使用者只需通过简单的语言指令,就能实现对机器人运动的直观、免提控制。想象一下,在工业生产线上,工人只需说出 “将零件 A 搬运到工位 B”,机器人便能迅速理解并执行任务,极大地提升了生产流程的便捷性与效率,减少了传统操作方式中复杂的编程与操作流程。
从任务执行能力来看,Gemini Robotics On - Device 展现出了令人惊叹的高灵活性与强泛化性。它能控制机器人完成高难度的灵巧任务,如折叠衣服、拉开拉链等。这些看似简单的日常动作,对于机器人而言,需要极高的动作精度与对物体的感知能力。而且,该模型最初针对 Aloha 机器人进行训练,却展现出了极强的适应性,已成功适配双臂 Franka FR3 机器人和 Apollo 人形机器人。在 Franka FR3 机器人上,它能遵循通用指令,处理以前未见过的物体和场景,如完成工业皮带组装;在 Apollo 机器人上,它能以通用方式操作不同的未知物体,这充分体现了其强大的泛化能力,即能够举一反三,在不同的机器人形态与任务场景中灵活应用,而不是局限于特定的任务与设备。
在性能方面,Gemini Robotics On - Device 相较于其他设备端模型优势明显。在完成复杂的多步骤指令和具有挑战性的分布外任务时,它的表现更为出色,甚至其性能接近基于云的模型。这一成绩的取得,无疑让其在设备端 AI 模型领域脱颖而出,为机器人在本地实现更高级、复杂的任务提供了有力支持。
对于开发者而言,谷歌还贴心地提供了软件开发工具包(SDK),方便他们试用 Gemini Robotics On - Device 模型。这一举措不仅降低了开发者进入该领域的门槛,也为更多创新应用的诞生提供了可能。相信在不久的将来,随着开发者们的不断探索与创新,基于 Gemini Robotics On - Device 模型的各种新奇、实用的机器人应用将如雨后春笋般涌现,为人们的生活、生产带来更多便利与惊喜,推动机器人领域迈向一个全新的发展阶段。

4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有