傅盛ai让机器有了人类的感知全链条ai技术赋能物联网

Kate 0 2023-11-18

11月8日,猎豹移动董事长兼 ceo 傅盛出席第五届世界互联网大会“:连接无处不在”论坛,并发表题为《真开放・全链条ai技术赋能物联网》的主题演讲。

傅盛:ai让机器有了人类的感知 全链条ai技术赋能物联网

傅盛表示,即便是在今天的生产线上,也很难解决设备智能化的问题,而ai让机器第一次拥有了人类的感知能力,也让物联网终端更聪明。这是一个巨大的分水岭,使得aiot的概念开始出现。在行业和自身的变革背景下,猎豹移动携旗下人工智能公司猎户星空,研发了包括、视觉识别、室内导航平台等在内的行业唯一全链条ai技术。

他说到,“我们未来不会单做一款硬件,我们致力于打造ai赋能的云端,跟开发者一起做更多的物联网设备。”

以下是演讲全文:

首先,我花一点时间介绍一下猎豹移动。猎豹移动是一家经历过三次跨越的公司,2010年由我自己创办的可牛影像和金山安全合并而成。

当时我们经历的第一波是pc杀毒软件免费化,实现了第一次的增长。

第二波在移动互联网的时候,我们碰到了强大的对手,决定出海。我们是第一家大规模的把用户做到海外的中国公司。今天,猎豹移动大概有5亿多的月度活跃用户,其中80%来自于海外,完全走出了一条不一样的曲线,我们内部叫做“天外飞仙”。所以我们现在依然是google工具排行榜的第一,我们游戏的下载次数在全球接近20亿次。

第三波是在2014年上市以后。我当时就意识到,整个移动互联网的风口将尽,我们需要寻找下一个机会。我们在硅谷、以色列都投资了基金,由此看到了人工智能的机会。

ai让机器拥有感知能力 全力以赴打造全链条ai技术

我对人工智能有一些自己的理解和思考,我们讲了很久的物联网、智能硬件,其实在ai或者人工智能出现之前,所有的智能硬件都是伪智能硬件。那个时候的智能硬件本质上是联网硬件,你要掏出手机进行操作。大概在三五年前,各种智能硬件的行业都起来了,但是很快这个行业又衰落了。

我甚至想要把机器人行业划分成两个分水岭。在ai出现之前的机器人本质上都是自动化机器,没有人的属性。我们看产线上那么多漂亮的机械手,其实都是通过非常原始的编程和自动化的设备进行生产的。即便今天在生产线上,也很难解决智能化的问题。

但ai出现以后,第一次让机器有了人类的感知能力,我们以前的摄像头看到的都是0101等一串数字,但今天摄像头看到的是人脸;以前看到的语音是波形,我们现在看到的语音是文字。

机器开始有了人类的感知能力,使得aiot的概念开始出现,看到这个机会以后,我们就去做了行业唯一的全链条ai技术。包括语音识别、视觉识别、导航、机械臂、麦克风阵列等,为什么要做呢?

这是从内外两个方面思考的。

第一个,猎豹移动在以前做的太快了。我们就做一个小工具,居然就上市了。后来等到google发政策不让我们做工具,手机厂商都开始自己做工具的时候,我们的日子就变得很艰难。所以我当时就想,拥有自己的底层技术很关键。

第二个,因为ai行业还处于早期。很多技术都不完善,或者没有形成产业分工。但很多开发者,拿一块板子,拿一个所谓的开放平台,就想实现很好的语音识别效果,其实是非常难的。以智能音箱为例,换一个外壳罩上去,算法就得调整,因为混响不一样。就像,在你的耳朵上加一个耳塞,听力就可能大幅度下降,和你的大脑聪不聪明没关系。所以整个人工智能产业的链条都非常新,又没有足够的分工。

第三个,我意识到,ai其实并不算是一个不可逾越的黑科技。很多人都说,bat才能做ai,或者人家的积累更好一点。但是今天看来,开源代码会远远丰富于任何一个时代。很多大洋彼岸的论文出现之后,中国的工程师就很快把它实现了。所以,好处就在于,ai大大降低了技术壁垒。而且ai使得以前很多公司的积累变得无效,大家处在同一起跑线上。我们认为,这是一个弯道超车的好机会。

所以,我们当时就下定决心,把所以技术全都干了一遍,全力以赴打造全链条 ai 技术。全干一遍的好处就是,我们能够自主调整很多细节。

语音交互实现了命令的自然化 可能颠覆手机的中心地位

我认为真正有智能的第一个硬件品类,应该是智能音箱,我一直在想,语音识别是什么东西?今天有人谈“语义理解能力超过人”。只要看到这种标题,基本上都是骗子。

为什么这么说?在语义的理解上,ai离人有巨大的差距。因为语言是人类超级牛的发明,你能够把你对世界的理解,压缩成一串很短的文字输入给对方,对方听完以后,能把这个图像、事件还原出来,这是个相当牛的能力,人类之间的交流是带有巨大的信息压缩和背景知识的。

所以,今天机器完全做不到。ai想在阅读理解上超过人类,那是在一个很有限的短文章里,没有实际意义。

真正的语音操作是什么?我认为它的本质是实现了命令的自然化。乔布斯有一句话说,每一次交互操作的演进都是一次革命。苹果有幸抓住了两次革命,第一个是抓住了键盘和鼠标,第二个是抓住了触摸屏。

今天的手机不是因为它有多么智能,而是因为它有强大的处理能力,你可以非常方便地touch。所以手机立刻取代了以前的pc、电视,成为了你的中心位置。

但语音使得手机的中心位置有可能被颠覆掉,你想象一下,语音是什么?比如,你想看《延禧攻略》,以往你需要从口袋里掏一个东西,解锁、搜索,未来可以用语音就直接唤醒:我想看《延禧攻略》。

我甚至认为,虽然手机还是个非常关键性的设备,但下一代设备都可以变得去手机化。

两年前,我们是业内第二款做智能音箱的厂商。我们(联合喜马拉雅)做了一款小雅音箱,当时很多人就问我,智能音箱有多智能呢?我回答:你不要考虑它有多智能,你只要考虑它是个摇控器,能够非常简单地点歌、了解天气,设置闹钟。我们买来了对手的产品,我们发现点歌根本点不准,只有50%的准确率。为什么?不是语音识别的问题,而是内容上的问题。比如说今天抖音出了个神曲叫《我们一起学猫叫》,你的曲库里得有这首歌。有的时候用户说叫“学猫叫”,有的说喵喵喵,有多种的说法。这不是一个智能的活儿,这是个产品的活儿。

所以我们就把音乐的点播率和内容的点播率,这一件事儿做好了。当时,我觉得智能音箱的核心不是它有多智能,而是一种新的交互模式。这种新的交互模式本质上就是一个摇控器,它把极其复杂难用的摇控器给改掉了,这个进步是非常巨大的。

iphone刚出来的时候,大家说这个没有全键盘、没有硬键盘怎么用,输入内容太慢了。但就是因为它方便,你可以容忍它非常多不够快速的地方。

我们赋能了很多物联网的中枢,我坚定的认为,语音是下一代操作系统的界面,它一定可以使得物联网的很多设备变得智能。可以跟你直接交互,不需要通过手机app的方式,它自己就被赋能了。我们跟很多厂商合作了很多款音箱,因为我们觉得打音箱上的战役可能打不过,但是合作是有机会的。

人工智能不会颠覆人只要一点突破就会带来变革

我们还做了一款能移动的售卖机——零售机器人豹小贩,它会主动问你是否需要商品,用户扫描二维码就可以购买。看到人多的地方它就会过去,因为它有人脸识别技术。以前,售卖机只能放在一个地方,如今,自动售卖机的售卖效率,大概是传统的三到五倍,用互联网的定律看,当多一个链接,互联网就损失了50%以上的流量。而在线下零售端,当你从原有的位置走出来,让用户看到有一点点改进,效率的改变是巨大的。

在机械臂方面,我专门去发那科看过他们的生产线。我个人觉得,在精密制造上和日本、德国企业去比拼,是没有机会的。因为他们是三十年的积累,可以用机械臂生产机械臂。但是他们面临一个问题:整个产线投产周期非常长,他要改变一个产品的时候,整条产线都要变,成本非常高。

我一直在想,ai 出现之后,可能不需要精密的机械臂,来做生产。我想到我奶奶的手,哆哆嗦嗦的,但她仍然能够织毛衣,还可以穿针引线。核心不是因为她的肌肉能够多么精确地控制,而是因为她能用眼睛做最后一点点调整。

受此启发,我们在机械臂上加上了摄像头,使得它去抓杯子的时候,杯子怎么样放都可以抓得到,这样可以降低对机械臂精度的要求。

做机械臂的机床,如果从日本买,大概需要 2000 万的投资,六个月之后拿货,我们现在正在尝试用韩国产的机床为我们做谐波减速器,未来可能用国产的机床。虽然精度降低了一点点,由于由于有视觉技术,所以它最后肯定能完成动作。

因为机械臂最大的成本就来自于谐波减速器,我们正在做的机械臂,未来可以降到市场价格的三分之一。当机械臂的价格降低,可能会产生新的、比工业市场大十倍的市场,市场增大十倍之后,成本又会进一步降低。在 ai 赋能之后,机械臂是有可能实现跨越式增长的。

在接待服务方面,如果大家有兴趣的话,可以去猎豹移动参观一下。我们的前台已经是机器人接待了,我们是一家没有前台的公司,只有机器人。你来的时候,我在oa上提一个申请,然后你会收到一条数字码,机器人就会过来。你跟它说“我来面试”或者开会,把数字码输上,它给你拍张照,在我们的闸机上刷一下脸,你就可以进入公司,它也会带你去会议室。

今天讲人工智能,很多人太强调所谓颠覆人的智能,这条路我还没有看到颠覆人的地方。但核心是有可能实现一点点突破,比如说它能够把原来的0101这种信号,对应成真正的人脸和语音的字节的时候,其实我觉得这个机会就已经非常非常巨大了。它会让很多设备具备人的感知能力,在一个非常垂直的领域,完成一点点工作。这一点点工作,可能会带来巨大的变革。

我们最近刚跟一个酒店签约,我们的音箱进酒店了。以后你到房间以后,你就直接可以说,开灯。你可以跟音箱说:“给我来支牙刷”,酒店系统就会收到,服务员很快就会把牙刷送过来。这样的话,通过人工智能技术可以让物联网的设备变得更聪明,而且真正可以使得照明、空调等设备变得互联互通,非常好用。

我希望机器人也好,音箱也好,都能跟各行各业合作,我们的本质不是想做一个硬件,我们的本质还是想做一个ai赋能的云端操作系统,跟开发者一起做更多的物联网设备。谢谢大家!

(原标题:傅盛:ai让机器有了人类的感知 全链条ai技术赋能物联网)

动作捕捉系统

虚拟动作捕捉技术

虚拟教学

上一篇: 乐视网证监会决定对公司和贾跃亭立案调查
下一篇: 2020年中国机器人企业家峰会在山东青岛召开
猜你喜欢