ITPub博客

首页 > Linux操作系统 > Linux操作系统 > 个性化技术综述

个性化技术综述

原创 Linux操作系统 作者:xyzlotus 时间:2009-06-09 21:30:59 0 删除 编辑

个性化技术综述

摘要:本文简述了个性化服务的概况,并总结了用户描述(User profile)、数据挖掘与推荐技术。最后,介绍了个性化技术的应用。

关键词:个性化 定制 数据挖掘

1、      个性化服务简介

随着互联网的飞速发展,World Wide Web已经深入到社会生活的各个方面,Web蕴涵着具有巨大潜在价值知识的分布式信息空间。Internet给人们带来极大便利和丰富的信息资源的同时,也产生了一些亟待解决的问题,即“信息过载”和“信息迷失”。

有效解决这些问题的办法,就是利用新技术提高用户获取信息的能力,使信息服务更加符合用户自己的需要,概括地说,就是建立面向用户的个性化服务机制。

个性化信息服务是网络信息服务发展的重要方向,已经引起国内外许多专家学者的研究兴趣。何谓个性化信息服务?在一些文献里,又将个性化信息服务称之为个性化服务、个性化定制服务、个性化信息搜索服务、个性化信息推荐服务等等。本人认为,人性化服务,就是根据用户的兴趣、偏好、行为,来向用户提供满足其个性化需求的一种服务。个性化服务针对不同的用户,采取不同的服务策略和方式。使用个性化与定制技术,可以实现这种服务。

个性化是指通过收集、存储和分析网站浏览者的信息,从而以用户喜欢的形式和布局发送合适的信息。个性化通过在网站和浏览者之间建立一对一的关系来提升用户的满意度和忠诚度,同时提供基于用户个人需求的产品和服务来增加销售量。个性化的目标是预测消费者的需求从而更好的服务消费者,通过提供定制的服务和产品建立长期的关系,从而促使消费者的后续访问。

定制描述的是用户所能控制的界面属性,用户必须根据自身的选择和需求设置网站提供的产品和服务,这种系统是被动,只有通过用户的手动设置才能实现。相比之下,个性化是基于先前用户的历史记录或相似用户的描述自动实现的,它不需要用户的参与。定制又可以分为内容定制、检索定制和界面定制等。

目前使用最多的是通过个性化技术,来达到为用户提供个性化服务的目的。

2、      获取用户描述

个性化需要关于用户喜好、需求、目的和期望等信息。用于描述特定用户的信息的收集过程称为用户描述。用户描述的主要组成部分是:行为和事实。事实部分包括人口统计学和事务的信息,例如:年龄、收入、受教育水平、喜欢的品牌等等。行为部分包括消费者在线活动的信息等。

用户描述的数据的收集可以是隐式(implicit )的或显式(Explicit )的。显式的收集需要用户的主动参与,因此用户可以控制描述的信息。显式的描述可以采取不同的形式,如用户在注册时填写的表格、调查问卷等,这种方法的优点是让消费者直接告诉网站他们需要什么以及怎样满足他们的需求。隐式的描述不需要用户的输入而是在后台完成,通常隐式的描述意味着追踪和监测用户的行为,从而确定用户浏览和购买的类型,这对于用户是透明的,在许多情况下并没有经过用户的许可。

获取用户描述的方法可以通过WEB使用挖掘来获取。网络用户访问记录的挖掘主要是从Web的访问记录中抽取具有意义的模式。Web中的每个服务器都保留了用户的访问日志(Web access log)等记录,保存了有关用户访问和交互的信息。分析这些数据可以用来了解用户的需求行为,为用户提供个性化的服务。目前Web使用记录挖掘技术和工具可以分为两大类:访问模式的追踪和个性化的使用记录的追踪。一般的访问模式追踪通过分析使用记录来了解用户的访问模式和倾向,以改进站点的组织结构;而个性化的使用记录追踪则倾向于分析个别用户的偏好,其目的是根据不同用户的访问模式,为用户提供个性化的定制服务。

用户访问挖掘针对用户对Web的访问记录,利用路径分析、分类聚类、关联规则和序列模式的发现等方法进行分析,寻找其中蕴涵的用户知识和模式。Web访问信息挖掘的数据对象主要是日志数据。当用户访问Web服务器时,服务器方将会产生三种类型的日志文件:Server logsError logsCookie logs,记录用户的访问情况。

另外在文献中提出在客户端使用Agent来收集用户信息。Letizia是另一种用于客户端个性化的代理软件。它通过观察用户的行为来得到模型,这个用户模型由代表用户兴趣的加权的关键字序列构成。Letizia在用户登陆网站之前浏览网站,然后推荐用户可能感兴趣的链接。

3、      为用户进行推荐

在得到用户描述这后,需要对用户描述的信息进行分析,来了解用户的兴趣和偏好。然后使用推荐技术为用户作出推荐。目前比较流行的个性化技术有基于规则的过滤、协同过滤、基于内容的过滤,这些技术主要用于预测消费者的兴趣从而做出推荐。

目前实现个性化推荐的主要技术有:

1.基于内容推荐(Content-based Filtering)

根据U的评分生成项目的分类器。推荐结果直观,容易解释;不需要领域知识。

2.协同过滤推荐(Collaborative Filtering)

识别u的邻居用户;根据其生成i的预测评分。新异兴趣发现、不需要领域知识;随着时间推移性能提高;推荐个性化、自动化程度高;处理复杂的非结构化对象。

3.基于人口统计信息推荐

识别u的相似用户根据其生成i的预测评分。新异兴趣发现;没有新用户问题;不要领域知识。

4.基于免疫原理的推荐

通过训练得到抗体;由抗体产生推荐。推荐准确率较高,自适应性强。

5.基于数据挖掘的推荐

对用户U的历史行为进行数据挖掘并产生推荐。具有准确率高,自适应性,个性化程度高;自动化推荐;不需要领域知识;可面向非注册用户推荐。

4、      个性化技术的应用

1)、自适应站点

一般的网站主要是为满足普通用户的需求而设计的,而自适应性网站为个人或团体用户提供了更合适更定制的内容,从而能够有效地与用户进行交流。自适应性网站通过学习访问者的访问模式半自动化地提高自身的组织和表达能力,自动地创建新的网页、删除或增加链接等等。自适应性网站可以分为个人性的和团体性的,个人性的自适应性网站由大量的单个用户描述所构成,而团体性的自适应性网站的目的是一组用户,它只需要少量的用于每一组的用户描述。

Perkowitz Etzion提出了索引页合成算法,这个算法能够自动的生成帮助用户浏览网站的索引网页。每个索引网页由一系列已存在且包含用户兴趣的主题的但不能连接的链接构成。为了在网站中收集相关的网页,网页收集算法采用了聚类挖掘的方法,这个算法通过获得网站服务器访问日志文件,计算网页间同现的频率来构造相似矩阵,然后将这个相似矩阵转换成相似曲线图,从而找出最大圈,每个最大圈代表了一系列趋于被同时访问的网页。

Corin R.AndersonPedro Domingos Daniel S.Weld提出了为无线移动用户提供个性化定制和自适应导航并研究了捷径寻找问题。

2)、推荐系统

目前,推荐系统已经在B-to-C电子商务网站中得到应用。推荐系统可以为用户推荐商品,同时为消费者提供帮助购买决策的信息。推荐系统为用户提供了面对大量商品信息时如何选择产品的解决方案。一些电子商务网站为用户提供了无数的产品,因此客户作出选择是非常困难并且乏味的。

推荐系统对电子商务的贡献主要有三点:第一,帮助提高交叉销售;第二,促使偶然的访问者转变成购买者;第三,帮助建改善客户的忠诚度和客户回头率。

目前存在着许多个性化推荐系统,它们提出了各种思路以实现个性化服务.个性化服务系统根据其所采用的推荐技术可以分为两种:基于规则的系统和信息过滤系统.信息过滤系统又可分为基于内容过滤的系统和协作过滤系统.

基于规则的系统如:IBM WebSphere,BroadVision,它们允许系统管理员根据用户的静态特征和动态属性来制定规则,一个规则本质上是一个If-Then 语句,规则决定了在不同的情况下如何提供不同的服务.基于规则的系统其优点是简单、直接,缺点是规则质量很难保证,而且不能动态更新,此外,随着规则的数量增多,系统将变得越来越难以管理.

基于内容过滤的系统如:Personal WebWatcher, Letizia,它们利用资源与用户兴趣的相似性来过滤信息.基于内容过滤的系统其优点是简单、有效,缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源.

协作过滤系统如:WebWatcher,它们利用用户之间的相似性来过滤信息.基于协作过滤系统的优点是能为用户发现新的感兴趣的信息,缺点是存在两个很难解决的问题,一个是稀疏性,亦即在系统使用初期,由于系统资源还未获得足够多的评价,系统很难利用这些评价来发现相似的用户.另一个是可扩展性,亦即随着系统用户和资源的增多,系统的性能会越来越低.

3)、自适应网店

自适应性Web商店是自适应性网站的一种特殊类型,它通过使用消费者的偏好来提出最适合消费者需求的项目。

Lilliana Ardissono Anna Goyr在文献中提出了SETASETA是一种用于创建自适应性Web商店的工具,它主要采用用户模型,根据消费者的喜好分组,每一组用户使用一个称为模版的描述,每个模版用以预测这组消费者的喜好、产品的选择等等,但是SETA必须依赖用户的注册。

5、      总结与展望

个性化服务技术是目前非常流行的一种技术,本文分析了各种具有代表性的个性化服务系统,并在此基础上详细描述了建立个性化服务的关键技术.面对日益增长的Web 信息,要满足不同背景、不同目的和不同时期的查询请求,必须针对不同用户提供不同的服务才能真正解决这个问题.

目前已经存在很多个性化服务系统,不过大部分都只是研究原型,也有一些系统已经推向了市场.随着电子商务的不断发展,个性化服务显得越来越重要,它能将电子商务网站的浏览者转变为购买者、提高电子商务网站的交叉销售能力、提高客户对电子商务网站的忠诚度.尽管已经存在许多个性化服务系统,但个性化服务技术仍有很多值得研究和探讨的领域,归纳起来有以下几个方向:

1)、在个性化推荐系统中使用智能代理Agent.智能代理是一种能够完成委托任务并可以快速浏览互联网,寻找我们所要的信息的计算机系统。智能代理具有自治性,社会性,反应性,主动性和推理能力。它能模仿人的行为执行一定的任务,不需要或很少需要用户的干预和指导。智能代理技术通过跟踪用户在信息空间中的活动,自动捕捉用户的兴趣爱好,能代表用户工作,引导、代替用户访问信息资源。该技术解决了传统搜索引擎的不足,可以根据用户的个人偏好和反馈自动检索,自主运行,及时获取用户信息,提高信息检索和推送的准确率。总之,智能代理技术的使用将大大提高Web信息检索的自主性、灵活性和精确性。

2)、多种推荐技术相结合。无论是基于内容的过滤系统还是协作过滤系统,它们都有不同的缺点。基于内容过滤的技术是通过比较资源与用户描述文件来推荐资源。它的关键问题是相似度计算。如果用户的描述文件没有正确描述用户的兴趣和行为,那么该方法推荐的数据可能和用户真正的兴趣根本不相关。从而难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源。协作过滤技术应用比较普遍,它的核心问题是为当前用户寻找K个最相似的邻居来预测当前用户的兴趣。该方法在实践过程中遇到两个很难解决的问题,一个是稀疏性,另一个是可扩展性。随着系统用户和资源的增多,该方法性能会越来越低。基于web使用挖掘的个性化推荐通过Web使用挖掘,对用户访问网站的行为模式和用户描述文件进行捕获分析和建模,这些发现的模式可以用来了解访问者的行为习惯、爱好,进而优化网站的组织结构,根据不同的用户为其提供动态的个性化推荐。Web使用挖掘提供的灵活性可以帮助提高以上讨论的几种方法的性能,也可以修正他们的缺点。特别的,web使用挖掘技术,如关联规则挖掘、序列模式挖掘等,它们在离线模式下对用户事务进行处理来实现模式发现,从而在处理点击流和电子商务数据时,可以提高协作过滤系统的扩展性。如果能将不同推荐技术相结合,就能弥补各自的缺点。在满足覆盖率的同时,能提高系统推荐的准确率

3)、为无线用户提供个性化定制。随着无线用户网络的发展,越来越多的用户通过手机等无线设备访问站点。由于移动设备屏幕较小,带宽有限,如何有效的为移动用户定制页面也是一个研究的方向。已有的成果一是对网页的内容进行定制,消去图片,动画等,二是为目的页面添加“捷径”,这样就可以避免延迟。

4)、推荐系统的安全性问题。安全与隐私保护是个性化信息服务中非常重要的内容。安全包括用户使用管理和系统安全管理。首先,隐私保护需要制定完善的隐私保护政策,提供隐私政策公示,提供设定用户隐私公开程度的工具,运用保证隐私不外泄的保护技术。其次,也要注意提供的个性化服务真正符合用户需要,不能强行向用户推送用户不需要的信息。另外,必须利用安全认证技术、数据加密存贮与传输技术、网络安全技术保证个性化服务系统的稳定性、安全性和抗攻击性,否则就可能弄巧成拙。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/12443821/viewspace-605686/,如需转载,请注明出处,否则将追究法律责任。

下一篇: 自适应网站综述
请登录后发表评论 登录
全部评论

注册时间:2007-12-17

  • 博文量
    41
  • 访问量
    78162