ITPub博客

首页 > IT职业 > IT生活 > 无限的学习时间能否制服有限状态的延时反馈系统?

无限的学习时间能否制服有限状态的延时反馈系统?

原创 IT生活 作者:CHOSiN 时间:2007-01-13 19:55:59 0 删除 编辑

太拗口了,我不知道技术术语,只好自己杜撰。先澄清我自己的几个定义:

延时反馈系统:手碰到了火,会感觉痛,然后我们就会触发反射,把手收回。如果反射弧很长,感觉痛可能与碰到火被灼伤这两个事件间隔了很长时间,也就是我们经常说的恐龙的感觉。这样的系统我定义为延时反馈系统。

有限状态:碰到火,感觉到痛,手的动作,这些都是状态或者描述。例如向前伸,碰到火,感觉痛,做向前伸的相反动作,缩回手,痛感消失。这里面至少有两个位置状态——前、后,两个感觉状态——痛、不痛,两个动作状态——向前、向后。相同类型的状态直接通过某种关系关联,例如位置状态是排他的,在前就不能在后,但还可以相互转化,在后可以通过其它状态的改变(动作状态由向后缩,变为向前伸)而变得再前。

无限的学习:如果反射弧并没有建立,我们还不知道如果痛就要做疼痛之前进行动作的相反动作,那么就要去学习,通过改变各种可控制的状态,去察看那种状态控制可以实现我们的要求。可能向前伸,感觉痛,开始会继续向前伸,依然痛(假设你的手烧不坏!),再伸,还是痛,偶而向后缩,哦,好了,不痛了,那我们就学会了,再痛就向后缩。但这并不全面,如果后面也有火呢?或者伸得太长了,仅仅缩一点,还是痛呢?这就需要很复杂,很长时间的学习,甚至无限时间的学习。

能否通过无限时间的学习(当然有足够的知识库存放学习的结果),最终学会处理有限状态的系统呢?我想这是当然的,我不知道如何证明,但一定可以证明,我相信这一点,只要通过遍历所有可能状态,做个统计和相关分析就行了,最后再进行验证。

且慢,刚进入正题,如果系统是延时反馈的?就是发出动作之后,此动作的结果过许久才能得到感觉?结果会如何?我相信这也没问题,只要我做一点动作,然后等,直到反馈结果就好了。这样延时反馈也和即时反馈没什么区别。

好,这是个好开始,那么我们再进一步,如果系统要求实时性,就是不允许你等待很久,如果你不做任何动作,系统就崩溃,那怎么办?

似乎也有办法,只要游戏能重新开始。以我们用一只手指托起一根木棍来说,如果你发现木棍要倒,就要有动作去前后移动手指,否则系统就崩溃了,木棍掉到地下。如果你不能及时看到木棍倒的方向,似乎没有办法,但总归你能看到结果,如果游戏可以再开始,你就可以先假设木棍是往那个方向倒,然后你就做移动,尽管你不能及时看到结果,但最终还是能看到,于是一次一次,你就学会了,前提是每次木棍会重演刚才的过程,只要有相同的边界条件。

那么再加码,如果这是个混沌的系统,每次都不可能完全重现刚才的过程,又当如何?你可能会说,这太难了,刚看到木棍托到手指上,它其实已经掉到了地上,这怎么玩?确实,但如果我们把木棍加长,长到要倒下也需要几分钟的时间,而看到木棍状态虽然不是实时,也只要几秒钟,这样就有足够充裕的时间去控制手指,防止不可恢复的木棍轰然倒塌。

这个游戏就好玩了,什么样的算法,或者是学习方法能够让计算机控制的手指游刃有余?这可能是一个非常好玩的游戏。。。

有时间的时侯,我再想一想。

[@more@]

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/7570639/viewspace-890194/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 自我实现
下一篇: 量子与连续
请登录后发表评论 登录
全部评论

注册时间:2008-01-01

  • 博文量
    134
  • 访问量
    6742854