自适应网站综述
摘要:传统的网站是为满足一般用户的需求来设计的,自适应网站,可以为单个用户或者一组用户定制内容和接口,从而提供一种有效的交互方式。
关键词:自适应网站 个性化 定制
一、自适应网站简介
自适应网站根据不同的用户来定制内容和接口,通过学习用户的访问模式,可以半自动的提高网站的组织和展示形式。同时,自适应网站可以自动的创建一些页面,删除或者增加一些链接,高亮显示或者重新组织链接,对页面内容重新格式化等。
自适应可以分为基于内容和基于访问两类。基于内容的适应根据页面的内容来展示和组织页面。基于访问的适应根据用户与网站的交互,来跟踪用户的活动,获取用户导航模式,从而为其个性化页面内容和布局。
二、自适应网站技术
1、索引页合成问题。
在文献[1]中,Perkowitz和Etzioni提出了自适应网站中索引页合成问题,并使用PageGather算法来解决。
索引页是一个包含一组特定主题页链接的页面。索引页合成问题,就是给定一个站点和用户访问日志,来创建包含一组没有链接但相互相关的页面链接的页面。在索引页合成问题中需要考虑如下几个要素:索引页的内容、超链接如果排序、超链接的标签、页的标题、是否适合将该索引页加到站点等。在该文中,仅对索引页的内容和页的标题这两个问题做深入研究。
PageGather算法的思想是,计算不同页面同时出现的频度并创建相似矩阵,其次根据矩阵创建对应的图,再使用图算法来抽取簇。可以使用两种图算法:找所有的连通分支(connected components)或者找图里边的所有最大团(maximal cliques)。把得到的簇,按簇中所有成对页面出现频度的平均值评分并且排序,管理员可以选取前N个评分较高的簇。由于在产生簇的时候,不同的簇之间会有重叠,所以可以采取不同的办法来消除重叠部分,如约简和合并。然后,该算法将产生的候选簇展示给管理员,由管理员来决定选择哪一个簇或者移除哪些不必要的链接。最后,用目标页的标题作为链接的标签,按照字母顺序来排序,产生一个新的页面。管理可以将产生的索引页加在站点的某一位置。
该算法也存在一些有待改进的地方。首先,链接的排序问题。想提升用户的访问体验,就应该让用户在短时间内找到自己所感兴趣的东西,而一般用户点击的次序是从页面顶站到底端的。仅用字母顺序,很有可能出现这一种情况:用户点击的前面几个索引页里边的链接不是自己感兴趣的,从而放弃浏览该站点。可以考虑结合使用页面的点击率或者用户的访问模式,从而对链接进行评分,按照评分的高低次序来排序。还可以考虑使用收益值,来反馈该索引页链接的有用性,从而对索引页进行更新。第二,该算法最终产生的索引页需要让管理员从产生的候选簇中来选取,一定程序上带有主观性,并且系统也依赖于人工。如何让系统自动创建索引页,并加到相应的地方,也有待于改进。在这里,簇的选择可以考虑结合用户的访问模式来自动选取,然后在放置索引页的地方将原始页面内容替换掉。
2、为移动用户定制个性化站点。
在文献[2]中,Anderson,Domingos和Weld提出了为移动用户提供个性化站点,并描述了一个框架,提出了很多针对无线用户个性化网站的方法。并在文献[3]中,就自适应导航中的“捷径”问题,做了详细的研究。在文献[4]中,进一步对“捷径”问题中的预测页面模型做了补充,提出了关系马尔克夫模型。
在文献[2]中,作者提出了一个数学模型,描述了个性化推荐的的若干问题,包括输入和输出特征。然后,推荐器在站点状态空间进行搜索,直至没有更好的状态出现或者计算资源耗尽为止。站点状态空间是一系列状态的集合,最初的状态就是原始示经过修改更新的站点。此后的状态可能是通过一些自适应函数转变过的,这包括创建页面,删除页面,增加页面之间的链接等。每一个当前状态都通过一些期望效用值来衡量。
个性化推荐的输入就是:站点W,用户集V,当前用户v和请求的URL u及评估函数F,输出为使得F值最大的请求页U的定制版本。站点的每一个状态,可以是一组页面和链接的直接图。在评估个性化站点的质量时,作者使用了期望效用值。期望效用值包括内部期望效用和外部期望效用。内部期望效用用于衡量页面的内容与用户目标信息的吻合程度,外部期望效用通过为用户的导航动作(即滚动屏幕和点击链接)赋予不同的权值来递归计算。关于页面的转换操作,作者提出了三种:内容消除,左右子树交换,增加“捷径”。
文献[3]中,作者提出了为无线用户请求的每一个页面自动地增加“捷径”。所谓“捷径”是连接两个没有链接在一起的页面,从而可以便得用户更快的到达目的页面,减少浏览时间。在该文中,作者采用MinPath算法来寻找捷径。算法的输入是:当前用户V,用户trail前缀,“捷径”的最大数目m,输出是前m个最好的“捷径”集合。MinPath算法的核心思想是:通过遍历站点链接结构形成的直接图来建立trail后缀。从用户最后请求的页面pi开始,用函数ExpectedSavings计算其后面每一个链接的概率,递归地遍历图,直到浏览某个页面的概率低于一个阈值或者超过深度边界。然后对产生的结果进行比较,根据期望节省值排序,返回前m个“捷径”。
在MinPath算法中,有两个关键问题:一是期望节省这个度量值的选取,二是页面预测模型。在该文中,一个“捷径”通过期望节省来度量它为用户所节省的链接数目和浏览所花费的努力,期望节省值是捷径的每一条路径所节省的链接数目与该路径概率乘积之和。
由于要递归的遍历站点链接形成的图,所以需要计算用户请求每一个面的概率。在该文中,作者提出了四个预测模型,分别是:无条件模型、贝叶斯模型、马尔克夫模型和马尔克夫/位置模型。
关于MinPath算法,可以考虑使用序列模式来构建用户trail后缀。在一定程度上可以减少运算量,同时避免出现一些无用的或者不符合用户兴趣的“捷径”。另外,期望节省这个度量值有待改进,仅使用路径访问的概率并不能准确充度量。
文献[4]中,作者提出了改进的关系马尔克夫模型。上文的中马尔克模型,其状态集就是站点链接图中的页面集,其转移矩阵即是对应的每一对页面之间的转移概率。而关系马尔克夫模型的状态集是一个层层包含的关系,可以是一个主题,一组页面等。在该模型中,采用一个五元组来分别描述域,关系,页面集等。这个模型能够有效处理稀疏数据,降低系统的运算量,增加推荐的准确率。
3、自适应网店
文献[5]中,提出了一个SETA模型。SETA是一个框架(prototype),通过它可以辅助创建自适应网上商店。在该框架中,运用了用户建模和个性化技术。
SETA以基于模板的方法建立最初的用户模型,利用动态建模技术,对用户的交互行为进行跟踪,不断更新用户模型。然后根据用户模型的信息,如领域知识、兴趣、接 受能力等,从长度、语法、图形展示等方面,为用户定制商品的描述;SETA同时为商品的接受方(beneficiary)建立模型,并利用基于内容(content-based)的技术,为他们推荐最适合的商品。SEAT根据商品与用户偏好的匹配程度进行推荐。在个性化时,不仅考虑到为用户定制商品描述信息,同时也对页面布局(如背景颜色、字体大小等)进行个性化。
在该文中,进一步可以完善的地方有:对页面结构的定制,个性化广告选择、通过用户的隐式反馈来更新等。
三、总结与展望
综上所述,自适应网站就是为了让不同的用户得到不同的访问体验,从而提升网站的服务质量。大休来看,有二大方向:一是为一般个人PC用户进行个性化定制,第二个方向就是为无线用户提供自适应网站。这两者侧重点有所不同。
为一般个人PC用户进行个性化定制站点,主要是根据用户的访问模式,来个性化定制用户所感兴趣的东西,便于用户浏览的同时,能迅速的找到目标信息。所以可以使用诸如索引页合成,删除或者增加某些页面,增加或者移除一些链接,替换一些页面等,同时可以对页面的布局,结构,图片,广告等进行个性化定制。
而为无线用户定制自适应网站,就需要考虑移动设备的带宽和屏幕。如何在有限的空间和有限的传输速度下,为用户个性化页面,是重中之重。在为无线用户个性化定制时,已有的成果是采用内容消除(如消除图片,广告,动画,框架等),交换页面模块,增加“捷径”等方法来实现的。
同时,在自适应网站实现过程中,都用到了建模和数据挖掘技术。选择合适的挖掘算法,对结果也是有重要影响的。
可以大胆设想一下,能否实现这种自适应网站,根据用户的带宽或者用户接入网络的方式,来实现对不同用户群进行个性化定制。
参考文献:
[1] Mike Perkowits,Oren Etzioni. Towards adaptive Web sites:Conceptual framework and case study
[2]Corin R.Anderson,Pedro Domingos,Daniel S.Weld. Personalizing Web Sites for Mobile Users
[3]Corin R.Anderson,Pedro Domingos,Daniel S.Weld. Adaptive Web Navigation for Wireless Devices
[4] Corin R.Anderson,Pedro Domingos,Daniel S.Weld. Relational Markov Models and their Application to Adaptive Web Navigation
[5]Liliana Ardissono,Anna Goy. Tailing the Interaction with Users in Web Stores
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/12443821/viewspace-605688/,如需转载,请注明出处,否则将追究法律责任。