今天,百度AI开发者大会在北京举行,有超过4000人参加了本次开发者大会,这是百度有史以来规格最高的一次人工智能大会。在上午的演讲中,百度创始人李彦宏、总裁兼COO陆奇、度秘事业部总经理景鲲、以及英特尔副总裁Amir Khosrowshahi分别做了演讲。下午还将有6个分论坛,话题分别为:AI技术与平台、自动驾驶、语音交互、大数据、云计算、Web生态。
在今天上午刚刚结束的演讲中,百度公布了有关DuerOS语音交互平台、Apollo自动驾驶平台、以及百度大脑+智能云的几项重磅新进展。其中包括:全资收购西雅图创企KITT AI,打造DuerOS唤醒词训练,并且提供DuerOS的软/硬件开发者套件与一体化解决方案;宣布开放Apollo自动驾驶平台1.0,并且介绍了Apollo生态的50个初始合作伙伴;最后还有百度大脑+智能云与英伟达、英特尔的深度合作,以及举行AI Star开发者扶持计划”、第13届百度之星大赛、并且推出DuerOS基金与Apollo基金,推进生态链发展。
智东西作为特邀媒体亲自来到现场,为你带来最完善的全程实录与亮点提炼,文章结尾还有大会PPT下载~
一、陆奇开场:All in AI
上午的演讲以百度总裁兼COO陆奇开场,一身淡蓝色Polo衫+深蓝牛仔裤陆奇看上去依旧很瘦。
他首先介绍了对AI的理解。本次人工智能革命的本质是知识的革命,是快速获取知识的能力;AI同时也是新一代的计算平台,通过芯片+传感器+智能云落地到医疗、教育、金融、家居等,将会为各个行业带来巨大的机遇。此外,AI还是中国历史性的机遇,人才储备、技术积累、资金、市场、政策,我国正在推动
从百度来说,陆奇再次强调,“百度是一间AI公司”、我们要“All in AI”、百度在技术、人才(2000+AI研发人员),数据(万亿级搜索数据+百亿级搜索数据)都有着深厚的积累。
DuerOS和自动驾驶汽车则是陆奇专门点出的两个AI落点,其他的业务都放进了“等”里。而百度的AI生态战略, 也由端上的DuerOS+apollo平台、中间层的百度大脑、以及最终云端的智能云组成。
二、DuerOS平台:为设备赋予语音交互能力
第二个上台的是度秘事业部总经理景鲲,由他来介绍DuerOS平台。
DuerOS的核心理念是“唤醒万物”:让设备听懂用户说话、懂得用户需求。
景鲲介绍,每一次人机交互的变革都在推动时代变革,从鼠标、键盘的PC时代,发展到触屏的移动时代,最如今到以语音对话的AI时代。因此,他将DuerOS定位为人工智能时代的安卓系统,
目前国外市场在这方面已经进入了白热化竞争,苹果、亚马逊、微软等巨头都在纷纷发力。而国内市场中智能语音的渗透率也在急剧提升。
而唤醒万物的三个基本要素是:听清、听懂、满足——可以理解为语音识别、语意理解、以及响应。
1)听清:目前近场语音识别技术已经有了不错的发展,而除了近场语音识别之外,百度也在研发与远场语音相关的技术:如麦克风阵列、回声消除、波束成形等。
2)听懂:从语意理解来说,数据+计算是两大基础。
首先,数据是语意理解的基础,而百度这些年积累的数据量自然无须多讲。其次,深度学习、增强学习、自然语言处理、多轮对话、搜索技术等等都是百度持续发力的语意理解的相关技术。
接着,景鲲扔出了有关DuerOS的第一个重要消息——全资收购西雅图创企KITT AI,这是一间同时获得Alexa(亚马逊)、AI2(微软)投资的公司,其名下的Snowboy平台可以快速训练唤醒词,至今已经积累了一万两千名开发者用户,打造了全美最大的唤醒词社区,也被成为了Alexa推荐的第三方应用。
唤醒词很好理解,就像“Hey Siri”、“叮咚叮咚”等,可以理解为语音交互的“开关”。在会上,KITT AI联合创始人兼CTO陈果果也展示了如何使用Snowboy平台快速训练唤醒词。首先新建一个唤醒词,接着念三遍这个唤醒词,最后测试一遍,这个唤醒词就训练完成了。从此,你的设备就有了一个专属于你自己的、定制化的唤醒词。
有关DuerOS的第二个消息则是——提供软/硬件开发者套件,让用户搭建自己的对话设备:个人版(树莓派、科胜讯)+轻量版(只有约1元人民币大小,RDA、Realtek)+标准版(MTK、全志、Intel、高通等)+参考设计(开放的电路板设计、麦克风阵列设计等),大家今天就可以登陆官网申请。
除了开发者套件之外,面对厂商,DuerOS也推出了一个简便的解决方案,只需要更改几行代码,不到几分钟就能让一个原本搭载了Alexa的设备,改造成一个兼容DuerOS的设备,工程师在现场也展示了这个功能。
景鲲最后强调,DuerOS的定位是人工智能时代的开放平台,欢迎更多的个人与企业加入到DuerOS这个开放平台的生态当中。