注册
百度大脑 3.0:让机器听清、看清、理解真实的世界

时间:2018-10-26

“百度大脑”是 2016 年李彦宏在百度世界大会上正式对外发布的超大规模神经网络,经过多年的技术升级和研发投入,目前已经成为百度在人工智能领域的“集大成者”。



百度的人工智能布局:18 年的积累与投入


要谈百度的人工智能布局就要追溯到它成立之初。18 年前,百度作为搜索公司诞生。当时的搜索引擎还是一个基于统计学的技术,但随着互联网的快速发展,在千奇百怪的用户需求和海量数据处理要求下,搜索引擎变得越来越依赖人工智能和机器学习技术。


2010 年百度开始全面布局包括语音识别、自然语言处理、机器学习、知识图谱、视觉语义等在内的人工智能技术。并在两年后着手深度学习技术的研发,将其用在百度图像、语音等具体应用中。


鉴于深度学习技术在实际应用中的惊艳表现,2013 年百度正式成立了深度学习研究院 IDL(数据分析及图像化应用和编程语言)诸多知名专家纷纷加入,为其人工智能技术的完善和提升不断加持。除了在国内,在美国硅谷离苹果公司不远的地方也设有百度深度学习实验室。基于此,百度在全球率先将深度学习技术应用于大规模线上搜索引擎,还基于深度神经网络上线了机器翻译系统。


经过长达 16 年一步步的技术积累和投入,“百度大脑”在 2016 年正式在百度世界大会上推出。如今,它已经拥有万亿级的参数、千亿样本、千亿特征训练,甚至能模拟人脑的工作机制。从基础层、感知层到认知层和平台层,不仅能够对内提供完整的人工智能技术支持,同时,百度还在去年 7 月宣布对外开放了包括语音识别、理解与交互技术、人脸识别等核心 AI 能力。



百度大脑基础架构


两年来,从 1.0 版本的基础能力搭建到 2.0 形成了完整的技术体系,首次开放 60多项 AI 核心能力,再到此次 3.0 版本的发布,百度大脑的能力仍在不断提升。具体来说,百度大脑 3.0 的发布包含了技术升级、开放升级两大层面。

技术层面    百度大脑 3.0 在业界首次提出“多模态深度语义理解”,并形成从芯片到深度学习框架、平台、生态的 AI 全栈技术布局;

开放层面    百度 AI 开放平台持续升级,是最完整、最前沿、最开放、最具活力的 AI 技术平台。



百度大脑 3.0:聚焦“多模态深度语义理解”


百度大脑 3.0 的核心是“多模态深度语义理解”,具体是指对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。

换言之,就是要能让机器听清、看清,从而深入理解语义背后的含义,深度理解真实世界,更好地支撑各种应用。而其中,百度地图语音助手就是语音语义一体化和自然语言处理技术结合最典型的应用场景之一。


如今百度高噪声环境 Hand-free 语音识别准确率已提升了 10 个百分点,语音语义一体化技术使得远场语音识别准确率提升了 10 个百分点;在语音合成方面,WaveNet+拼接的情感语音合成技术,使得流畅度和自然度也大幅提升。


还有百度的对话理解技术也已积累多年,而百度大脑3.0 版本中通过研发最新的深层注意力匹配模型,相比已知的最好结果又提升了4.1%在阅读理解技术上,百度大脑已经阅读了千亿量级的文章,相当于 6 万个中国国家图书馆的藏书,并由此积累了亿级实体、千亿事实的知识。


更有趣的是,借助视觉的语义化技术,百度大脑曾还被应用在世界杯的视频解析场景中。一段世界杯球赛视频,视频中,百度大脑可以通过识别视频中的裁判、球、球门、球场线等,捕捉射门、进球、角球、换人等画面,完成机器人解说、精彩片段集锦剪辑、以及数据统计分析等等。


知识是机器理解世界的重要基础,在多元语义知识方面,百度也构建了包含数亿实体、数千亿级事实的庞大知识图谱。除了基础的由实体、属性、关系构成的实体图谱,还针对不同的应用场景和知识形态,构建了关注点图谱、事件图谱、多媒体图谱、行业知识图谱等多种图谱。所有这些,都构成了百度大脑的基础。



PaddlePaddle3.0:各个版本和平台全面优化


必须强调的是,在百度大脑 3.0“多模态深度语义理解”技术突破的背后,深度学习平台 PaddlePaddle 发挥了重要作用。



PaddlePaddle3.0 核心框架对服务器版本以及移动端版本进行了全面优化,可以灵活适用于更广泛的开发需求;

AutoDL    能更高效自动地搜索神经网络结构,开发者无需特殊硬件设备就可以快速得到高质量模型;

EasyDL     可以满足零算法基础训练业务定制模型,通过可视化的操作使得使用者无需懂深度学习也可以快速上手;

AI studio  具有云端集成、简单易用、运行高效和资源免费的特点,是集成“数据、算法、算力”的 PaddlePaddle 实训平台,可以一站满足使用者学习、技术进阶、学术研究需求。


此外,AI 芯片“昆仑”也将与 PaddlePaddle 深度学习框架深度结合,从而推动 AI行业生态的快速发展。


据了解,从去年 11 月份百度世界大会到现在,仅仅过了半年多的时间,百度 AI平台上语音能力调用次数增长了94%,视觉能力的日调用量增长了 416%,自然语言处理的日调用次数增长了 180%,此外,视觉中的人脸识别技术,调用次数更是涨了近 8 倍。


而在这个过程中,百度正在扮演的是一个“授人以渔”的角色。它不仅正在通过AI 开放平台让每个人平等地使用 AI 技术,与此同时还集众开发者之力持续为百度大脑的迭代和升级赋能。除此之外,借助百度 AI 生态伙伴“燎原计划”、AI 加速器等方式,百度也在不断打造和布局自己的生态系统,从而为开发者释放更多价值,为产业升级带来了更多想象力。


众所周知,“百度大脑3.0”是所有AI+的运算和决策中枢,百度推出的智能小程序也将会把百度大脑3.0的AI能力全面开放给开发者。开发者可以借助“百度大脑3.0”的的云端数据、算法、算力,测试和跑通自身商业模型、获取用户。

同时,为了让智能小程序精准获取到对应行业的更多潜在用户,百度实现全域流量开放化。对于开发者而言,百度智能小程序AI与流量的扶持,不仅意味着更低的开发成本,也意味着更高的获客效率。





当前,腾讯、阿里、百度、今日头条等互联网巨头都已纷纷入局小程序。你的企业还要等待吗?微商通为首批智能小程序开发服务商,从PC端走向移动端拥有十几年互联网营销开发经验,专业为企业提供技术支持,目前已有多项成功案例!想要抓住互联网时代的趋势,想要企业获取更多流量及用户,赶快咨询我们加入百度小程序吧!

联系电话:4000-173-178  

官方链接:http://www.mywst.com


官方微信

售前客服

扫一扫添加售前咨询

(工作日:9:00-18:00)

在线客服

客服电话0755-23578923