ITPub博客

首页 > Linux操作系统 > Linux操作系统 > [原]读书会第1期DeepQA框架&Siri架构会场笔记(含PPT下载)

[原]读书会第1期DeepQA框架&Siri架构会场笔记(含PPT下载)

原创 Linux操作系统 作者:July___ 时间:2012-02-14 14:26:14 0 删除 编辑

   读书会·北京第1期DeepQA&Siri架构会场笔记(含PPT下载)


前言

    读书会以"革新学术,砥厉品行,共同探讨,相互学习”为宗旨,不限主题,不限形式,重在创造一种良好的学术气氛,和营造一种轻松的讨论氛围。昨日已于清华园顺利举办第一期,希望日后持续举办下去。下面,极为简略的说下昨日下午读书会的举办情况。

    (不了解读书会的朋友请先参看我的上一篇文章:http://blog.csdn.net/v_july_v/article/details/7237351

    首先非常感谢所有昨日于清华FIT楼参与读书会的朋友。大家的热情出乎我的意料(据签到人员名单统计,到会人数为160+,第2期及以后将控制人数,加大场地),现场氛围也非常好,虽然有将近一半的朋友因为没有座位而站完全场,但丝毫没有混乱的感觉。总体说来,还算不错。图为本人现场主持(谢谢@姐_夫提供的照片):


    OK,闲话少说,下面咱们来分别看看昨日读书会第1个主题:张栋的DeepQA,以及第2个主题:张俊林的Siri(本人主讲的第3个主题因时间不够现场取消,文末含两个主题的PPT下载地址)。

张栋之DeepQA基本框架

    在此之前,我必须说明下,到底什么是DeepQA,可能有很多朋友如我一样,去听昨日的讲座讨论之前,是不知DeepQA为何物。其实,DeepQA很简单,Deep是深度的意思,QA即Q(question)& A(answer),一问一答,综合起来,便叫深度问答系统。

    相信很快思维敏捷的朋友就会说到,一问一答?这不跟搜索引擎一个理么。

    搜索引擎的形式是,你向他查询什么问题,它便根据他的查询结果给出答案(当然,至于答案令不令你满意,或者你是否能找到合适的答案则又是另外一回事了)。如下图所示(张栋博士的PPT主要就是根据下面三张图而展开的):

    How Search Engine Solve Q&A?

    而这个DeepQA呢,有点像现实当中的技术支持/客服系统,而本身其自动语音服务就能解决相当一部分问题,不过DeepQA的目标决不仅仅是回答一些特定的简单问题,而是利用运算能力,融合信息检索、自然语言处理、知识表示及推理、机器学习、人机交互等相关技术,对现有数据加以分析来找出最佳答案。

    那么How DeepQASolve Q&A?如下图所示:

    原PPT的这段文字有点问题,我更正如下:DeepQA = Massively Parallel Probabilistic Evidence-Based Architecture Generates and scores many hypotheses using a combination of 1000’s of Natural Language Processing, Information Retrieval, Machine Learning and Reasoning Algorithms,These gather, evaluate, weigh and balance different types。

    大致意思是:深度问答系统, 建立了一套基于概率化证据的大规模并行架构,它综合利用数千种自然语言处理、信息检索、机器学习和推理算法,分析生成出多种假设,然后从中收集、评估、权衡各类证据,最终给出最佳答案。如下图所示:

    对于上面这张DeepQA的架构图,看下我上一篇文章中的由天蓝提琴所提供的汉化版,便一目了然了,如下:


    由于张栋更多的是侧重与现场各位讨论的形式进行,所以,核心细节并未涉及到太多(希望以后的读书会讲座能再讲得深入点)。

    后续会后读书会群内的朋友cyqcyq提出了一系列问题:1、什么是evidence?什么是hypotheses?2、基于什么算法能把 施者|动作|受者 作为一个 evidence 或者 一个 hypotheses?3、靠什么算法把众多 施者|动作|受者 组合中靠谱的筛出来?4、谁来判断  施者|动作|受者 是 evidence?5、如果有人工干预怎么把这个判断量减少到最小?..

    关于Watson的答题过程可以参看来自上图作者天蓝提琴的此篇文章:http://www.guokr.com/watson/article/6643/其摘要如下:“看到watson在Jeopardy!预赛中的惊人表现,你是否好奇于watson是怎样看懂题目并得出答案的呢?难道watson真的能和人类一样思考问题?现在果壳网就以他回答的第一个问题为例,给大家解说一下watson看到问题并给出答案的全过程...”。

张俊林之Siri基本架构

    张俊林先生的PPT有43页,基本属于巨细,娓娓道来,主要讲了Siri的整体架构,其输入系统,以及从文本到意图和从意图到服务的主题,最后讲了下输出系统,以及Siri向何处去的等等问题。

    当然,涉及到更多的如语义分析的技术细节及其原理,讲座依然也未有涉及。他的PPT主要依据以下几幅图展开(抽取我感兴趣的部分):

PPT下载

    昨日读书会第一期,第1个主题张栋的DeepQA PPT下载:;第2个主题张俊林的Siri基本架构 PPT下载:。updated:原来的微盘下载链接全部失效,正确的打包统一PPT下载地址为http://download.csdn.net/detail/v_july_v/4061067。02.13.17:20分。

    参会的其中一位朋友左其盛所写的文章:在清华校园内的听的一场关于机器学习的演讲的一些笔记。欢迎参会的其它朋友继续分享现场笔记或照片,我一一贴下,已让更多的朋友了解。

后记

    由于昨日时间不允许,所以我现场取消了原计划自己制定的第3个主题:基础算法的学习。同时,对机器人感兴趣的可以在新浪微博上关注@小猴机器人。最后感谢所有参与读书会的朋友,感谢两位主讲的张大儒,感谢提供场地的清华天雷同学,感谢报名参加志愿者工作的朋友,感谢图灵教育的杨老师。

    下面是陈吉锆提供的现场照片,十分感谢(按出场先后顺序排序):

    更多请关注本人微博@周磊July,咱们下期再见(欢迎听众报名,主讲分享人报名,特别是最近出了新书的朋友,欢迎提供部分免费100+场地)。有任何问题,随时联系我,周磊July、二零一二年二月十三日。

作者:v_JULY_v 发表于2012-2-13 14:48:24 原文链接
阅读:1335 评论:4 查看评论


Link URL: http://blog.csdn.net/v_july_v/article/details/7254769

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/25835657/viewspace-716232/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论

注册时间:2011-05-17

  • 博文量
    14
  • 访问量
    40159