内幕 沃森

(不是)基本知识:Watson的工作方式

多年来,IBM AI的基础技术已经有了长足的发展

沃森埃德港伊本
IBM

就像IBM所说的那样,如何使计算机通过感官,学习和经验来理解世界?首先,是无数的数据。

为了为Watson建立与Jeopardy合作的知识体系,研究人员将 2亿页 内容,包括结构化和非结构化,包括字典和百科全书。当被问到问题时,Watson最初使用100多种算法对其进行分析,以识别任何名称,日期,地理位置或其他实体。它还检查短语结构和问题的语法,以更好地确定所要询问的内容。总之,它使用数百万条逻辑规则来确定最佳答案。

如今,沃森经常被应用于新领域,这意味着学习新材料。研究人员首先将Word文档,PDF和网页加载到Watson中以建立其知识。然后添加问题和答案对以对Watson进行主题培训。为了回答问题,Watson搜索了数百万个文档,以找到数以千计的可能答案。在此过程中,它收集证据并使用评分算法对每个项目的质量进行评分。根据该评分,它会对所有可能的答案进行排名,并提供最佳答案。以下视频更详细地说明了该过程。

随着时间的流逝,沃森将从其经验中学到东西。随着新信息的发布,它也会自动更新。在螺母和螺栓方面,沃森 用途 IBM公司的DeepQA软件以及各种其他专有和开源技术。它的原始形式包括Hadoop和Apache UIMA(非结构化信息管理体系结构)软件,以及90个Power 750计算机集群,总共装有2880个处理器内核。

今天,Watson是通过云交付的,但是随着竞争的加剧,IBM对基本细节保持沉默。

IBM公司 沃森副总裁兼首席技术官Rob High说:“我们的DeepQA推理和其他基础认知技能利用了深度学习技术,专有算法,开源内核和框架,这些硬件和框架利用了针对那些工作负载进行了优化的硬件技术。” 

版权© 2016 IDG通讯,Inc.