百度大脑震撼发布 会27种语言 人脸识别率达99.7%
9月1日消息 百度2016年世界大会今日举行,百度创始人李彦宏在会上发表了以“人工智能”为主题的演讲。李彦宏表示,互联网的发展已经不能靠人口红利来驱动了,互联网的下一幕是人工智能。并强调称,人工智能对于百度来说就是核心,就是大脑。
对于“百度大脑”这个概念,李彦宏分别从三个方面、四个能力进行了详细的解释。其中,三个方面包括:算法(神经网络、参数和样本训练)和计算能力(服务器和GPU集群),以及大数据(网页资料、搜索数据、图像视频数据和定位数据)。四个能力,则分别为语音识别、图像识别、自然语言处理以及用户画像能力。
据了解,百度大脑的语音识别准确率已经达到了97%,基本可以替代电话销售的工作,提高工作效率。同时,它还具备语音合成功能,可以模拟任何一个你喜欢的人的说话方式。此前,百度就曾利用这项技术,还原张国荣声音,实现与粉丝的“隔空对话”。
而百度大脑的图像识别能力也非常突出,其人脸识别准确率已经高达99.7%。同时,其图像智能识别技术在百度地图、百度无人驾驶等领域都发挥着重要作用。
值得注意的是,百度大脑还会27种语言,直接翻译毫无压力。其自然语处理能力主要是应用在度秘上。在奥运会期间,百度还搞了个机器人解说大赛,度秘通过对人的语言的理解,实现了对篮球比赛的解说。
用户画像上,百度通过其描绘的61.5万个标签来制定个性化画像,从而达到千人千面的额个性化阅读体验,2个月内阅读量提高了10倍。
李彦宏认为人工智能是移动互联网的下一幕,并且人工智能将是百度核心中的核心,具体来说,人工智能对百度意味着百度大脑。
目前,百度大脑主要包含三个方面,即算法(神经网络、参数和样本训练)和计算能力(服务器和GPU集群),以及大数据(网页资料、搜索数据、图像视频数据和定位数据)等。
这位百度创始人称,百度大脑将围绕以上三个方面,从四个能力展开应用。包括:自然语言的处理、语音识别、图像识别处理以及用户画像等能力。
具体落地应用方面,目前百度语音识别准确率达97%,已经可以用于客服和销售方面,帮助这些语音相关的行业实现提高。语音合成方面,则可以做到原音复现,李彦宏现场以张国荣声音合成举例,合成了张国荣的国语声音,李彦宏还称,目前可以通过50句话的录制,让每一个人都能拥有属于自己的声音模型。
图像识别方面则主要用于四个方面,首先是人脸识别,通过捕捉人脸关键点,形成人脸表情网,实现人脸的准确识别;其次是被应用于百度地图等方面,百度地图与图像智能识别技术的结合,可以让数据无限逼近现实世界;此外,最关键的使用在于百度无人驾驶,利用计算机视觉,可以加快无人车的研发。最后,图像识别还将应用于AR领域,可以提高广告主的营销效果。
自然语言处理方面,主要应用是度秘。核心是通过机器人对于人的语言的理解,用人的语言来实现人机交互。李彦宏称,在最近的奥运会比赛中,度秘实现了对于篮球比赛的解说。实际上,除了运动解说,百度还将度秘应用在了肯德基点餐等方面,目前已在上海开设了概念店。除了语言理解,百度还在机器翻译方面应用了自然语言处理方面,目前可以直接翻译27种语言。
用户画像方面,主要分为通用个性化画像和垂直行业画像两个方面。李彦宏以百度资讯的推荐阅读量举例,使用了个性化画像后,2个月内阅读量提高了10倍,千人千面的个性化阅读体验可以不断被加强。此外,百度还用到了票务销售中,可以精准判断目标用户群体实现销售转换,比如前段时间的《魔兽世界》,就有和百度在用户画像方面展开合作。
最后,李彦宏称百度大脑会将以上四个方面的能力不断结合,也会全部开放共享,实现各个领域的“因智而能”。李彦宏最后强调:人工智能将会让人重新想象中国的经济发展和未来。