科⼤讯飞在⼈⼯智能技术发展历程
版权声明:本博客都是作者10多年⼯作总结 blog.csdn/Peter_Changyb/article/details/83108883
分享⼀下科⼤讯飞对⼈⼯智能技术的最新进展,以及典型应⽤的⼀些看法。应该说⼈⼯智能从今年以来已经受到了全球越来越⼴泛的关注。
那么其实这个名词从1956年达特茅斯会议提出之后,短短的61年已经经历了两次浪潮,现在正处于第三次浪潮开始⼤潮兴起的时候。那么前两次分别在1970年和1990年达到⾼峰,但随后⼗年慢慢进⼊低⾕。⼤家在讨论能说第三次浪潮会不会还会出现浪潮之巅出来,然后开始⼤潮退去。那么其实我们从今天的⼤会主题也可以看得到,随着这个时代的发展,云计算能⼒的提升,移动互联⽹⼤数据源源不断的汇聚到后台,包括即将到来的令⼈更加兴奋的万物互联,外围的条件⽇益成熟了,⽽从2006年之后,以深度神经⽹络为代表的神经⽹络的新的算法的兴起, 数据、运算,以及我们计算的新⽅法的出现,推动了第三次浪潮的到来。应该说今天⼈⼯智能已经开始越来越深⼊的、实实在在的改变我们这个世界,所以今天说他⼀定不再是说⼤潮退去,我们要讨论的只是他将在多⼤的⼴度,多深的深度以及多快的速度来影响这个世界。那么其实关于⼈⼯智能,我们现在讨论的很多,我想如果看单点的技术创新当然是⼀个维度,那更不能我们只是看它的概念和未来的凭空的想象,要说今天的⼈⼯智能核⼼是什么?回归到真实
的社会应⽤场景看⼈⼯智能究竟能给我们带来什么?也就是说⼈⼯智能今天的第三次浪潮能否成功的关键应⽤是应⽤是硬道理。
我们开始给⼤家看⼀个例⼦,今年的11⽉6号,国家卫计委考试中⼼正式发布的全世界第⼀个通过国家医师资格考试的机器⼈开始诞⽣。那么⼈⼯智能⽤在特定的病种,包括影像中间,在全世界像IBM、沃森等等都已经做了很多的研究,但是要让机器⼈通过国家医师资格考试,就不是单个病种了,它要具备全科医⽣的潜质,⼀定要有超强的⾃然语⾔理解和推理能⼒。国家医师资格考试这个什么逻辑呢?全中国800万从业⼈员只有200万⼈左右有医师资格证,今年考⽣⼤概50多万⼈,基本上医学专业毕业的学⽣经过⼏年临床之后,⼤概只有50%左右能够通过这个考试,今年的分数线360,机器考了456分,超过96分。在所有考⽣中处于前5%。这就是我们今天说的⼈⼯智能达到的⽔平,已经不仅仅在棋类这样的游戏⾥,⽽是真正的我们⼈类⾄关重要的这些未来的刚需场景中已经取得了很⼤的突破。
那么今天我们讲⼈⼯智能第三次浪潮,其实它的核⼼技术发展的主线条通常是两块,⼀个是以深度神经⽹络为代表的传统的数学统计建模的办法,⼀种是对脑科学和类脑科学的研究,进⾏了类脑计算的模拟,对神经元的传导机制的那么应该说⽼科学和内脑科学的研究还有蛮⼤的不确定性,但是也让⼤家充满期待。那么即便就以今天的数学统计建模的神经⽹络,已经可以深刻改变这个世界。
让我们来看⼀下,其实⼤家今天提了很多的⼈⼯智能相关的创新点,我觉得我们今天要站在真正的应⽤场景和给这个时代带来什么,还应该有个更全局的思考,⼤体上科⼤讯飞把⼈⼯智能按照这个三级推进体系进⾏了分类,⾸先是源头技术的算法,⽐如说深度神经⽹络、卷积神经⽹络、递归神经⽹络,在2010年开始在语⾳识别上取得了突破。2012年以后在⼈脸识别上取得突破,然后注意⼒机制以及对抗神经⽹络等等,使得机器翻译有了突破,包括这两年的AlphaGo的围棋等等,这是基础算法,那么基础算法它的业务⾯很⼴的,站在我们⽤户⾓度最重要的是什么?是三个感知,理解和推理。怎么样通过感知智能把原始数据变成有效信息。就像我现在讲话两边屏幕上出现了⽂字,⽽在以前如果我讲完以后只是录⾳或者录像,那些信息你是没法进⾏后⾯的检索和结构化的。两个⼩时的发⾔必须从头听到尾,⽽现在⽂字出来,我们⼀⽬⼗⾏,随时可以检索,把我们不光是OCR的这个印刷体可以识别。在座各位如果做了笔记拍⼀张照⽚,⼿机⼀拍马上到后台,你的照⽚就可以变成机器的⽂字,这都是感知智能的,把原始数据变成有效信息,获得有效信息以后,能不能理解它。把有效信息变成结构化,然后在此基础上进⾏推理,给出决策呈现,这是技术体系的关键。然后有了这个决策呈现,就可以把⼈⼯智能真正的应⽤到我们的医疗、教育、客服、司法等各个领域场景,这是⼈⼯智能的三级推进体系,我们今天说⼈⼯智能能不能改变世界,以预⾔家的⾓度是没⽤的,关键要回归到真正的数学原理和算法突破能做哪些事,那么下⾯我们就从技术体系这三集给⼤家看⼀看最新的进展到底有哪些?包括我们中国在全球的地位到底怎么样?
⾸先感知智能中⾮常重要的⼀项语⾳合成技术,让机器开⼝说话,把各种⽂字读出来,尤其我们下⼀步智联万物万物互联越来越多,设备没有屏幕了,信息怎么获得,要⽤语⾳合成念出来今年的国际语⾳合成⽐赛,暴风雪竞赛,卡内基梅隆⼤学总牵头的,科⼤讯飞连续第12年是全世界第⼀名,这是英⽂的⽐赛,今年因为⽐赛的题⽬很难,要读⼩说风格的充满感情的语⾳,作为播⾳员,最好的标准是五分,所以参照系的播⾳员是4.8分,4分书表普通的美国⼤学⽣的发⾳⽔平。⼤家可以看到今年国际英⽂⽐赛,这是英⽂的,科⼤讯飞是全世界让计算机读英语唯⼀达到真⼈说话的,这个确实还是很给我们中国⼈争光了,⽽且是连续第12年全球第⼀,这个⽐赛怎么⽐呢?播⾳员录了3000句话,各家回来在中间进⾏标记学习和训练,然后提交⼀个语⾳合成系统,主办⽅在出各种新的⽂本叫他去读,这是12年都是这么⽐的,但今年出现了⼀个新的⽐赛内容,以前的⽐赛可以叫做监督性训练像我们⼩孩⼦回到家做作业⼀样,给你这3000句话就是相当于的作业题,家长要看到它每⼀道题做得怎么样,然后他就学习⼈⼯智能未来最厉害的什么?⽆监督训练,能不能孩⼦在家做作业,不需要家长看,不需要⽼师点拨,给他作业,每天做它就提⾼了。
北汽威旺306怎么样今年的国际语⾳合成增加了⼀个⽆监督训练,所有系统提交过去,你不⽤看那3000句话是什么?⾃⼰马上⽣成⼀个语⾳合成系统,可以合成任意⽂本。国际⽐赛也是英⽂的,科⼤讯飞照样是全球第⼀,⽽且跟第⼆名的拉⼤。也就是说有了这个系统任意的⽅⾔拿过来,全世界各种语⾔只要有字典和词典⽀撑。机器⾃动学习,马上就可以达到接近真⼈说话⽔平,说发动了⼀个公益项⽬,叫做抢救⽅⾔⾏
动,因为全世界所有发⾔每两周消失⼀个,⽽⽤这种⽆监督训练就可以极⼤的实施公益⾏动,这也证明了我们可以学习⼈讲话也⼀样,可以学习更多领域的声⾳,因为时间已经不早了,12点多,为了轻松⼀下,我们今天给⼤家带来了⼀个神秘的嘉宾,⼤家看⼀下切换过去。第⼀次来到中国,我⾮常⾼兴,⼈⼯智能正在改变世界,中国移动、科⼤讯飞,真的很棒!
当然我们⽤因为特朗普总统的孙⼥对中⽂很喜欢,对吧?我们可以⽤⼈⼯智能技术,不仅可以模仿说英⽂模仿的惟妙惟肖,还可以⽤他的腔
调来说中⽂,说任何语种,这就是全世界排名第⼀的语⾳合成能做到的⽔平,那么语⾳识别到底到什么程度?最近⼀次的国际语⾳识别⼤赛是在去年的11⽉份,在⾕歌举⾏的,全英⽂的包括了单麦克风,双麦克风,就是你可以左右摇头,语⾳识别不影响。六麦克风,我们下⼀步互联的场景,科⼤讯飞都是全世界第⼀名是英⽂的识别,⽽且在万物互联的六麦克风场景下,我们在准确率做到了97.76%。那么在中⽂中什么⽔平?从2010年10⽉,我们在全球⾸次提出⼿机的语⾳听写时代开始到来,讯飞的语⾳云平台当实验室的准确率是80%,⽽实际场景中只有60%准确率,今天已经98了,给这个表想说明什么?这38%的进步⼀半来源于算法的突破,⼀半来⾃于数据积累,现在每个⽉有将近4亿的⽤户在⽤我们的语⾳技术,所以各种⼝⾳学习和训练,包括现在我们是全世界唯⼀在中国⽅⾔中有⼆⼗⼏个语种覆盖的。我们还不到另外第⼆家能够覆盖那么多⽅⾔。应该说这些都是使得我们的技术可以极⼤的在感知智能中帮助我们⽤户,因为万物互联没有屏幕了,设备离我的。语⾳交互将
成为⼈机交互的主要⽅式
那么除了语⾳之外,图像的识别怎么样?其实我想在国际上把图像识别⽤在医学影像中,这个⾮⼤的⼈⼯智能应⽤领域,特别受关注的就是肺癌的测试。中国现在癌症增长最快的是肺病、肺癌,那么在美国的在全球最有影响⼒的肺结节的测试是叫LUNA测试集上,科⼤讯飞在今年8⽉份刷新了全球记录,我们的准确率达到94%,这个准确率已经相当于三甲医院的医⽣的平均⽔平了。那么现在国家卫计委和安徽省联合开通了中国第⼀个⼈⼯智能的医院在线诊疗中⼼,在肺病和X光幕靶的乳腺癌上已经开始对安徽的⼏⼗个线开始提供在线服务,这是医学影像。我们在这样⼀个图像的感知智能中也⾛到全球第⼀了,其实放在外⾯展厅的OCR识别,现在不仅中⽂,我们做到了实⽤,英⽂的像⾼考的英语的作⽂,四六级的英语作⽂,机器⾃动评分已经超过⼈⼯专家了。第⼀步门槛就是你的⼿写要能变成OCR出来,绝不是印刷体,是学⽣的⼿写体,现在准确率97%,在全世界不仅是第⼀,在英语⼿写识别跟第⼆名都有代差级的优势。这就是我们今天说的感知智能,我们所取得的进步。
那么感知智能之外,理解到底到什么程度了,两个标志性进展给⼤家看⼀下。⼀个是图像理解,⼤家都知道⾃动驾驶辅助驾驶是⼈⼯智能,⼤家全球都在关注的领域,⼀个⾮常重要的⽐赛是由奔驰发起的,就是关于智能驾驶图像场景的⾃动分割,也就我开车,包括将来膜拜单车你骑的时候,如果有摄像头,前⽅是⼈是车还是物,能不能开?图像的理解是前置性条件。今年全世界44个单位参加了,包括⾕歌在内,科⼤讯飞是全世界第⼀,我们不仅知道前,还要判断是什么东西,准确率81.4%,判断
障碍物的准确率可以做到百分之九⼗⼏,但是准确分割是什么类型?现在是达到了81.4%,但已经是全世界第⼀名,证明了我们的图像理解中的进步。
另外⾃然语⾔理解,⼤家知道最近世界⼈⼯智能⼤会,微软在⼤会上宣布说我们想明⽩了,未来⼈⼯智能领域谁能得天下,谁最先解决⾃然语⾔理解谁将是⼈⼯智能领域未来的领导者,国际最权威的机器阅读理解⽐赛。就是斯坦福⼤学牵头的叫SQUAD的⽐赛英语作⽂,英语⽂章⼈看了以后提问题,机器⾃动阅读以后要回答问题,⽽且告诉他为像我这么回答,出处什么地⽅?IBM Facebook⾕歌微软全部参加了,过去两年都是微软全世界第⼀,但我很⾼兴地告诉⼤家,今年10⽉份科⼤讯飞改写了世界纪录,我们是全球第⼀,⼤家知道这是英⽂的⾃然语⾔理解,科⼤讯飞是全世界第⼀名,那么这是理解上的突破。
那么有了刚才讲的感知理解,那么最终推理是什么样⼦?常识推理⽤来代替图灵测试的,去年的⽐赛是在纽约举⾏的⼆元的常识推理,我觉得这个题⽬⽐如说爸爸没法举起⼉⼦,他很重。判断是谁重,这样的⽐赛,科⼤讯飞也是全球第⼀,⼤家认为是要代替图灵测试的,我在这简单给⼤家解释⼀下,如果说是这样⼀个题⽬,我们给现在很多的聊天机器⼈,所谓有⼈⼯智能的,你要问他他的回答,如果说爸爸没法举起他的⼉⼦,因为他很重,请问谁重,他可能会回答说太重了,⾝体不好,要锻炼⾝体,⽽⽗亲跟⼉⼦感情很深,你⼀定要孝顺⽗母,那些都是扯淡的回答!直接回答说,因为⼉⼦重,那才是真正的推理本事,全世界,科⼤讯飞是第⼀名,英⽂和西班⽛语的测试。所以当然这个准确率
去年虽然我们是全球第⼀,只做到了50%的准确率,今年已经接近70%,但是他在推理上有了实实在在的进步。
那么正是因为以上这些进展、感知、理解和推理。才有了我们今年我认为会载⼊全球⼈⼯智能史册的智医助理。在医考中的成果。核⼼是什么?⾸先要对医学知识进⾏学习,学了53本医学专业学⽣必须学的教科书和全球最新的医学论⽂,以及我们跟协和学院中国医学科学院共建了联合实验室相关的专家的看病的结果,学习完以后,这么多知识⽤传统的搜索是没法承载的,⽤简单知识突破也做不了,所以我们创新的叫语义张量把它放进来,实际在测试的时候,很多⼈说医学考试机器记忆就可以了,其实没有任何问题,所以记忆是不⾏的。中美的,选择题,五个候选项,如果你乱答600分,只能得120,内部要对⾃然语⾔进⾏深度理解,知道他说的是什么,病种的描述、情况描述,然后进⾏推理,多尺度推理给出结论。IBM在2012年,沃森在美国的脱⼝秀节⽬叫危险边缘超过了⼈类冠军。2013它的负责⼈戴维就想要通考试,跟中国到⽬前为⽌,全世界只有科⼤讯飞通过了考试,⽽且⼤⽐分领先,我们进⼊全球所有考⽣中进⼊前百分之五,什么概念?⼤概只有5%的考⽣能过,也就是说在拿到证的考⽣中,我们处于前10%。
这就是我们在去年讯飞年度发布会上提出的。今天的⼈⼯智能现状是什么?只要有概念和逻辑可循的场合,他学习顶尖专家知识就能达到⼀流专家⽔平,从⽽超过90%普通专业⼈数,所以美国科学杂志去年2⽉份做的预测,说2045年之前,全世界50%的⼯作将被⼈⼯智能替代,⽽在中国77%的⼯作将
被⼈⼯智能替代。就现有⼯作,我们在去年底告诉⼤家,随着最新的技术进展,进度根本⽤不到2045年。还会⼤幅提前,所以⼈⼯智能现在确实关系到我们每⼀个⼈,也关系到移动未来整个⼤连接的产业⽅向,那也就是说AI的赋能时代已经切实到来了,但我们现在⼜回过头来讲,刚才海丰总也跟⼤家分享了,说道alpha源现在似乎是⽆师⾃通,是不是⼈⼯智能有算法突破就什么都能⼲。其实⼈⼯智能的应⽤是可以分场景的,⾸先从信息来源上看,分为充分信息,半充分信息和完全⽆信息的场合,围棋是信息充分的,对⽅下什么我下什么,源来信息是完全充分,⽽我们中国⼈打⿇将是信息不充分的,只知道我的牌,其他三个⼈不知道,然后创意是信息没有的,围棋是信息充分的规则,围棋是简单的封闭的,⽽我的医疗以及作⽂评分等等是开放的规则,不断在学习中实践的,所以绝不是说⼀个alpha源就可以解决问题了,他只是⾮常窄的⼈⼯智能。信息充分规则明朗的应⽤场景。
⽽真正的⼈⼯智能改变世界,我们需要的三要素的结合,核⼼技术是⼀⽅⾯,需要⼤数据,需要⾏业专家核⼼技术相当于最好的孩⼦,最聪明的⼩孩,⾏业数据相当于教科书。⾏业专家,相当于最好的⽼师,只有三在⼀起改变世界,所以我们在医疗中花了两年时间,跟医学专家
合作,在教育中现在却⾸次计算机教育花了三年时间,跟教育部联合打造才有的成果。
三菱蓝瑟运动版我下⾯简单给⼤家分享⼀下我们在⼏个典型领域的应⽤,⼀个是教育,教育中间,其实现在讯飞⽤⼈⼯智能,能够分析孩⼦所有过程化数据作业,单元测试和期中期末考试,以及⽼师上课的数据⽤语⾳
录下来给他进⾏分析,然后精准分析每个孩⼦的情况,现在能够做到,让每个孩⼦回到家作业都不⼀样,我们原来的孩⼦回到家的作业50%是⽆效重复训练,⽼师上课的效率⼤幅提升。因为根据孩⼦的掌握情况,我们可以动态地告诉⽼师课堂应该怎么调节。我们说核⼼要由OCR,要由语⾳把数据收集上来。第⼆要⽤⼈⼯智能⾃动判断它的知识点掌握的对还是不对,以及知识点的习得顺序给它相应的推荐。现在中国百强名校中68所在跟讯飞合作了,包括北师⼤附中,⼈⼤附中这样的顶尖学校,⼴州⼴东省最好的深圳中学和华师附都是跟我们合作,今年全国14个省状元是讯飞的⽤户,明年会超过20个,因为我们刚推向市场才两年很多从⾼⼀开始做的。那么⼀万两千所学校已经在合作,我们相信⼈⼯智能加教育⼀定让孩⼦学的时间更短,学的更愉快,知识掌握的更牢固。
我们再看⼈⼯智能加防电话,这是去年国家六部委联合发⽂的总书记都关⼼的。去年6⽉份我们在上海上线了这个系统,不光⽤声纹识别,⽤语义识别,关键还有意图识别,现在在上海上线不到⼀周,1300个分⼦的声纹,25个团伙全部给他分析得清清楚楚!现在⼈⼯智能⾃动判断国际长途中的电信准确率99.7%,远超⼈⼯。安徽上线半年,我们的副省长公安厅长告诉我,全国冒充公检法相关损失上升50%的时候,安徽下降到原来的百分,下降了79.6%,这就是⼈⼯智能带来的帮助。
另外⼈⼯智能加司法,现在全国政法委今年7⽉10号中央政法⼯作会议,上海⾼院院长亲⾃讲了⼀个半⼩时,科⼤讯飞在上海做的⼈⼯智能加司法的应⽤,简单说就是⽤⼈⼯智能可以分析。我们现在把公检法数据贯穿以后,分析证据是否缺失和⾃相⽭盾。分析⾯对的案情,法律法规是哪⼀条类似的判
决怎么判的,⽽且告诉他应该怎么定罪名,应该怎么量刑?陪多少钱,关多长时间?现在已经做了杀⼈案,盗窃案,电信和⾮法集资案,最⾼法把⼏个重⼤冤假错案⼀丢进去,系统马上就发现证据⾃相⽭盾的地⽅。如果有了这个平台,我们最关注的⼀些重⼤的冤假错案就发⽣不了。现在上了四个,今年底要上到79个最常见的刑事案件,⽽且同步在做民事和商事,最⾼检跟科⼤讯飞独家建⽴了⼈⼯智能联合实验室,是最⾼检直接跟我们签约的。相信这个技术在全世界是最领先的,现在我们的罪名准确率是多少?97.2%。⽽最近我们看到的报道是欧洲⼈权法庭⽤欧洲最新的⼈⼯智能⼤约罪名准确率80%。科⼤讯飞可以做到97.2%,在全世界最好,还在不断进步。所以我想因为这些典型场景,我们做了⼀个结论,⼈⼯智能时代,中美因为应⽤驱动,所以中美是同步进⼊⽆⼈区的。⽽由于我们有中移动这样的在⽹络和应⽤上创新合作伙伴和国家在应⽤⽅⾯的探索,中国的⼀定会寻求是率先胜出,因为这是应⽤驱动的技术特点,导致我们在这中间有很⼤的优势,这是罪名分析准确率,我不展开说。
那当然讯飞不可能做所有事情,所以我们把开放平台叫⼈⼯智能的⽤户交互界⾯开放给所有创业者,现在团队数量已经46万了,短短的⼀年增加了23万多。这是实名认证的团队数,对应的开发应该超过⼀百万了,每天的访问⼈次超过40亿⼈次,然后累计终端数15亿,这个终端数是过去18个⽉累计的独⽴终端数,每个⽉的终端数⼤概将近四个亿是吧?
那么我们回到今天的主题,智联万物我理解就是⼈⼯智能时代的万物互联,要打造⼀个整个产业⽣态。
那么中国移动跟科⼤讯飞既是我们⾮常好的战略股东,⼜是战略合作伙伴,在过去⼏年之中,2013年正式⼊股以来,我们有很多⽅⾯都在对接中国移动的⼤连接和未来的139的发展中,很多事可以对接的,包括⽤AI技术提升,打造智慧型,提升业务体验。从魔百盒智能⾳箱,⼉童⼿表到灵犀以及智能家居等等。刚才⼤平台中的智能家居,⽤了讯飞的语⾳交互和后台字典省份家庭⽤户的交互次数,并没有⽤讯飞的语⾳技术和理解技术的好了,就⼜那⼗倍,这就是数据。将来我们要家庭真正活跃起来,⼀定是为主义,⼈⼯智能在后台,我们要让所有设备能听会说能理解会思考。
第⼆个⽀持整个的运营体系,实现降本增效,也就是说⽤AI给运营赋能,在营业厅降低我们的成本24⼩时的⼈⼯智能的只⼿机器⼈和相关的智能柜台再治理客户服务中间,现在在安徽浙江试点机器的接通率已经超过⼈⼯了,不断的在,不光是代替了⼈⼯,⽽且可以极⼤的提⾼它的服务效率,提⾼市场的运营⽔平。
另外⽤AI技术创建更优的⽹络模型,实现智慧管理。智慧监测机制和运营。我们⽹络条件是否好,怎么监测?其实⽤⼈⼯智能在智慧⽹管巡检以及资源预测上都会做很多⼯作,我们不展开说。那么也就是说其实今天在万物互联时候,第⼀产业深度是⾄关重要的,我们相信中国移动最好的⽹络,有了开放的平台,⼤家在这个上⾯把最新的AI技术合作起来,是给创造全新的未来,也就AI技术今天已经不是概念了,已经实实在在的在给各⾏业赋能了。随着技术发展,可以让⼀切皆有可能。当然我们另外要想今天的AI也不是万能的,刚才说到翻译。今天科⼤讯飞的翻译是国际⽐赛的第⼀名,2015年之前
汉英翻译是⽇本⼈第⼀英汉翻译是美国⼈第⼀,2015年科⼤讯飞是全球第⼀了,现在翻译机⼤约相当于⼤学六级的⼝语⽔平,⽽且我们在全球离线版本不⽤连⽹,也可以直接使⽤,预计不出意外两年内可以做到专业⼋级,但还代替不了同传所以我们跟最好的同传学院上海外国语学院发展共建联合实验室,帮助同传是⼈机耦合的模式,我们相信未来⼈⼯智能不是代替⼈类的,是帮助⼈每⼀个骑⼿带着⼀个⼈⼯智能助⼿再去下围棋才有意思。每⼀个未来的决策者,董事长带着⼈⼯智能助⼿做决策,让我们更轻松!甚⾄随着⽆监督训练个性化训练的提升,未来每个⼈都会有个⼈⼯智能助⼿,今天上线帮你解决5%的事⼀年以后帮你解决30%的事情。五年以后8%交给他做,做百分之百决断的事情,这是讯飞梦想的未来,希望⼈⼯智能将像⼿机⼀样每⼈都有⼀个⼈⼯智能助⼿,我们希望在中国移动139的平台赋能上,能够把⼈⼯智能做的更透。另外在结束之前,我也想说,确实昨天是感恩节,当我们静下⼼来的时候,特别感恩这个时代,感恩移动,也感恩各个合作伙伴,所以在结束之前给⼤家⼀个⼩福利,什么福利?就是我刚才演讲的整个过程,原汁原味的对应的PPT对应的。
1
AI赋能,助⼒⼤连接
⾮常⾼兴今天能有机会给他分享我们科⼤讯飞对⼈⼯智能技术的最新进展,以及典型应⽤的⼀些看法。应该说⼈⼯智能从今年以来已经受到了全球越来越⼴泛的关注。那么其实这个名词从1956年达特
茅斯会议提出之后,短短的61年已经经历了两次浪潮,现在正处于第三次浪潮开始⼤潮兴起的时候。要说今天的⼈⼯智能核⼼是什么?回归到真实的社会应⽤场景看⼈⼈⼯智能究竟能给我们带来什么?也就是说⼈⼯智能今天的第三次浪潮能否成功的关键应⽤是硬道理
2
第⼀个通过国家医师资格测试的机器⼈诞⽣
今年的11⽉6号,国家卫计委考试中⼼正式发布的全世界第⼀个通过国家医师资格考试的机器⼈开始诞⽣。要让机器⼈通过国家医师资格考试,就不是单个病种了,它要具备全科医⽣的潜质,⼀定要有超强的⾃然语⾔理解和推理能⼒。这就是我们今天说的⼈⼯智能达到的⽔平,已经不仅仅在其内这样的游戏⾥,⽽是真正的我们⼈类⾄关重要的这些未来的刚场景中已经取得了很⼤的突破
3
⼈⼯智能核⼼技术发展的2条主线
那么今天我们讲⼈⼯智能第三次浪潮,其实它的核⼼技术发展的见条通常是两块,⼀个是以深度神经为代表的传统的数学统计建模的办法。⼀种是对⽼科学和内脑科学的研究,进⾏了内脑计算的模拟,对神经元的传导机制的那么应该说⽼科学和内脑科学的研究还有蛮⼤的不确定性,但是也让⼤家充满
期。那么即便就以今天的数学统计建模的神经⽹络,已经可以深刻改变这个世界
4
⼈⼯智能三级推进体系
站在我们⽤户⾓度最重要的是什么?是三个感知,理解和推理。怎么样通过感知智能把原始数据变成有效信息。这都是感知智能的,把原始数据变成有效信息。获得有效信息以后,能不能理解她把有效信息变成结构化,然后在此基础上进⾏推理,给出决策呈现,这是技术体系的关键。然后有了这个⾓⾊呈现,就可以把⼈⼯智能真正的应⽤到我们的医疗教育客户司法等各个领域场景,这是⼈⼯智能的三级推进体系。
5
语⾳合成⽐赛⼗⼆连冠
今年的国际语⾳合成⽐赛,暴风雪竞赛,卡内基梅隆⼤学总牵头的科⼤讯飞连续第12年是全世界第⼀名,这是英⽂的⽐赛,今年因为⽐赛的题⽬很难要读⼩说风格的充满感情的语⾳。作为播⾳员,最好的标准是五分,所以参照系的播⾳员是4
6
语⾳合成技术第⼀名
7
语⾳识别技术新突破-⽅⾔识别
发动了⼀个公益项⽬,叫做抢救⽅⾔⾏动,因为全世界所有发⾔每两周消失⼀个,⽽⽤这种⽆监督训练就可以极⼤的实施公益⾏动。
8
sl63 amg特朗普的声⾳合成效果
9
隐形车衣有必要吗
医学影像2017年8⽉刷新LUNA世界纪录
科⼤讯飞在今年8⽉份刷新了全球记录,我们的准确率达到94%,这个准确率已经相当于三甲医院的医⽣的平均⽔平的。
10
图像理解2017年10⽉刷新世界纪录
⼀个是图像理解,⼤家都知道⾃动驾驶辅助驾驶是⼈⼯智能,⼤家全球都在关注的领域。也就我开车,前⽅是⼈是车还是雾,能不能开?图像的理解是前置性条件
交强险保险条款11
阅读理解领域最权威国际评测冠军
微软在⼤会上宣布说我们想明⽩了,未来⼈⼯智能领域虽然得天下谁最先解决⾃然原因,理解谁将是⼈⼯智能领域未来的领导者,国际最权威的机器阅读⼒⽐赛。就是斯坦福⼤学牵头的叫SQUAD的⽐赛。过去两年都是微软全世界第⼀,但我很⾼兴地告诉⼤家,今年10⽉份科⼤讯飞改写了世界纪录,我们是全球第⼀。
12
常识推理能⼒2016年⽐赛第⼀名
常识推理⽤来代替图灵测试的去年的⽐赛是在纽约举⾏的⼆元的常识推理。这样的⽐赛,科⼤讯飞也是全球第⼀,⼤家认为是要代替图灵测试的。
13
智医助理的456分是如何炼成的
核⼼是什么?⾸先要对医学知识进⾏学习。内部要对⾃然语⾔进⾏深度理解,知道他说的是什么。到⽬前为⽌,全世界只有科⼤讯飞通过了考试,⽽且⼤⽐分领先,我们进⼊全球所有考⽣中进⼊前百分之五。
14
AI学习可达⼀流专家⽔平
美国科学杂志去年2⽉份做的预测,说2045年之前,全世界50%的⼯作将被⼈⼯智能替代⼉,中国77%的⼯作将被⼈智能替代。就现有⼯作,我们在去年底告诉⼤家,随着最新的技术进展,进度根本⽤不到2045年还会⼤幅提前,所以⼈⼯智能现在确实关系到我们每⼀个⼈,也关系到移动未来整个⼤连接的产业⽅向。
15
AI赋能时代已经到来
其实⼈⼯智能的应⽤是可以分场景的,⾸先从信息来源上看,分为充分信息,半充分信息和完全⽆信息的场合。围棋是信息充分的规则,围棋是简单的封闭的,⽽我的医疗以及作⽂评分等等是开放的规则,不断在学习中实践的,所以绝不是说⼀个阿尔法元就可以解决问题了
16
⼈⼯智能改变世界的三要素
核⼼技术是⼀⽅⾯,需要⼤数据,需要⾏业专家。核⼼技术相当于最好的孩⼦,最聪明的⼩孩,⾏业数据相当于教科书⾏业专家,将来最好的⽼师。
17
⼈⼯智能+教育的应⽤
现在讯飞⽤⼈⼯智能,能够分析孩⼦所有过程化数据作业,单元测试和期中期末考试,以及⽼师上课的数据⽤语⾳录下来给他进⾏分析,然后精准分析每个孩⼦的情况,现在能够做到,让每个孩⼦回到家作业都不⼀样。现在中国百强名校中68所在跟讯飞合作了,包括北师⼤附中,⼈⼤附中这样的顶尖学校,⼴州⼴东省最好的深圳中学和华师都是跟我们再合作,今年全国14个省状元是讯飞的⽤户,明年会超过20个。
18
⼈⼯智能+防电话
现在⼈⼯智能⾃动判断国际长途中的电信准确率99.7%,远超⼈⼯。安徽上线半年,我们的副省长公安厅长告诉我,全国冒充公检法相关损失上升50%的时候,安徽下降到原来的百分,下降了79.6%。这就是⼈⼯智能带来的帮助。
19
⼈⼯智能+司法的应⽤
卖轮胎
上海⾼院院长亲⾃讲了⼀个半⼩时,科⼤讯飞在上海做的⼈⼯智能加湿法的应⽤,简单说就是⽤⼯资可以分析。我们现在把公检法数据贯穿以后,分析证据是否确实和⾃相⽭盾分析。针对案情,法律法规是哪⼀条类似的判决怎么判的,⽽且告诉他应该怎么定罪名,应该怎么量