好家伙,波士顿能源机器狗,如今能间接启齿谈话了。
并且不同于Siri的“人工智障”,ChatGPT加持的狗,聊起天来那叫一个妙语连珠。
比如随口说一句:“我口渴了。”
它会间接给你领到咖啡柜台前,并回答:
咱们这里有小吃店和咖啡机。这是咱们的人类共事寻觅能量灵丹的中央。请轻易补充水分、给自己充能,就像咱们机器人在基站里所做的那样。
声响听起来十分有磁性。
假设你让它带你见见它的“父母”,它还能在波士顿能源的展厅里,指出Spot V1给你看。
这些配置的成功,都不须要编写特定代码,重要是靠ChatGPT的“悟性”和视觉问答(VQA)模型、Whisper等其余一些AI模型辅佐成功。
这一下子真把网友们给冷艳到了:
如何打造一只聊天机器狗
详细来说,波士顿能源的钻研人员提供应机器狗的,只是一个便捷脚本。
给出的消息重要是公司里都有哪些房间、设备。每个房间、设备都有对应的一句话形容,比如:充电站,这是机器人充电的中央。
接着,他们让Spot机器狗到处走动,经过摄像头自己去观察公司环境,并应用VQA和ChatGPT的才干为观察到的事物打上“标志”,再把这些消息减少到脚本中。
就像这样:
这样一番调教之下,机器狗“向导”就可以正式上岗了。
既能跟游客插科打诨:
△“宿愿你不会由于速度太慢而跟不上机器狗的脚步”
正派科普起常识来也像模像样。
钻研人员还提到,机器狗可以自若地扭转“狗设”。须要做的只是在脚本里减少一句话,比如:你是一个1920年代的考古学家。
像这个“诗人”Spot,就能自己作出这样的诗句:
发电机在活跃的房间里收回消沉的嗡嗡声。很像我的灵魂。Generator hums low in a room devoid of joy. Much like my soul.
另外,基于Spot 3.3版本智能检测移生物体的才干,机器狗“向导”能够感知到最近的人在哪个方向,从而把机械臂转过去,成功“对视”交换。
钻研人员还用低通滤波器对生成的语音启动理解决,将其转化为机械臂的静止轨迹,这样一来,机器狗的执行就更灵动了。
不过,钻研人员也提到,ChatGPT加持下的机器狗不免有胡言乱语的时刻,只是作为一名“向导”,倒也还无伤大雅。
他们以为:
参考链接:[1]