打印

[分享] 图片搜索的收纳柜--微软亚洲研究院

图片搜索的收纳柜--微软亚洲研究院



2007-09-20 10:32:41

标签:微软亚洲研究院 互联网搜索 创新工程中心 搜索技术 最新成果 图片搜索
如何从一堆乱糟糟的图片搜索结果中理出头绪?聚类的图片搜索会带来不同的体验。

 《互联网周刊》 记者 李洋


  现在市场上的图片搜索引擎多少有点懒人衣橱的味道。当你用关键词搜索图片时,常常会因为关键词本身的简单或模糊,导致搜索结果杂乱无章。面对搜索引擎给出的几千条结果而不耐烦地翻下去的时候,你的心情肯定就像临出门前,要在一个不整齐的衣橱里翻找今天要穿的衣服一样糟糕。

  有专业人士做过一项调查,对比搜索图片经验丰富和经验有限的两组人,结果发现了一个共同的规律:当他们进行图片搜索时,往往不会主动去改变关键词,而是在结果中不断后翻,直至找到满意的目标为止。不要怪他们懒惰,这种举动是因为,在搜索一幅图片时,很多人并不知道该怎样定义关键字,而列得太多又往往适得其反。

(在"IGroup"搜索中输入"Tiger"后,会自动生成很多与"Tiger"关键词相关的图片夹,其中包括高尔夫球星"Tiger Woods"的图片夹)


  新的技术能够带来什么改变吗?来自微软亚洲研究院的一对搭档,推出了一个名为“IGroup”(Image Group)的图片搜索聚类方向的研究项目,已经可以很好地解决用户上述的烦恼。

  喜欢K歌、热爱音乐的研究员景风,和穿着时尚、富有亲和力的用户体验设计师王烁,绝对是微软亚洲研究院里的两个个性分子,前者负责该项目的具体算法和技术实现,后者则从用户体验的角度设计整个交互流程与界面。他们的IGroup和他们本人一样,都有点突破传统思路、另辟蹊径的味道。目前,IGroup中的某些关键技术已申请了专利(http://igroup.msra.cn )。

  IGroup可以架构在某个基础搜索引擎之上。它把用户获得的搜索界面分为了两个区域,左侧是与关键字相关的短语聚类和小型缩略图,右侧则是图片搜索结果的展示区。这有点像是带有分类格子的衣橱,而所有的分类都是系统自动完成的。比如,当你搜索“Tiger”(老虎)一词时,左侧的聚类会显示出与之相关的几条短语,除了将其细分为“孟加拉虎”、“印度虎”、“西伯利亚虎”等类别外,还会出现类似“Tiger Woods”(“老虎”伍兹,一位著名的高尔夫运动员)的分类,甚至还有苹果曾经发布的代号为“老虎”的操作系统。用户可以先在左侧根据分类词条和小型缩略图进行初选,而后再在与之相关的右侧展示区中详细浏览。

  在右侧的浏览区,初始结果有多种显示排列方式。其一是从左侧导航区的每个分类中抽取几幅具有代表性的图片而形成的聚类缩略图;其二是自动显示某一较大的图片聚类。

  这种结合了语义的归纳视图能够显著提高图片搜索的效率,且能够带给用户额外的提示。比如,当你搜索“pentagon”(五角形)时,IGroup会在导航区列出美国五角大楼和五角形(pentagon shape)等不同聚类短语供用户选择,这样用户便可以在下一次的查询中,直接输入曾经点击过的某个词条作为关键字,由此获得更精准的搜索结果。

  事实上,关于图片的搜索聚类并不是一个新鲜话题。传统的做法是,对每张图片抽取一个特征(文本的或者图像的),然后进行聚类。但这一方式显然在效率和速度上处于劣势。IGroup选择了一个巧妙的做法,先根据用户的图片搜索关键字,再在搜索引擎中进行文本搜索,抽取出前几百个结果中反复出现的高频短语作为二次图片搜索的关键词(大约在20个以内),而对于一些无法分类的词则存放在一个名为“Other”(其他)的类别中,这样一来既覆盖了所有搜索结果,又在不影响速度的情况下提高了查询的效率。

  在算法实现上,如何定义和获得准确的聚类,如何消除各类中的冗余图片等,都是IGroup研究的难点。景风和王烁也在尝试进一步优化这一项目。在未来,他们可能采取类似Digg.com的机制,根据用户的搜索和点击情况,对聚类和缩略图进行排序;也可能会将目前的聚类分为多个层级,让用户可以有进一步细化的选择。

  方式多种多样,但可以预见的结果是,未来的图片搜索将会变得越来越聪明、越来越方便。

  若想体验Image Group技术,请访问:http://igroup.msra.cn

[ 本帖最后由 kenknigh 于 2007-10-17 17:20 编辑 ]
附件: 您所在的用户组无法下载或查看附件
是日已过,命亦随减。如少水鱼,斯有何乐? 大众当勤精进,如救头燃。但念无常,慎勿放逸

                      

TOP

看看是什么啊

TOP


看了半天不知道说的什么 我太菜了!

TOP

LZ 什么意思啊

不明白

图片也没了啊 ?

TOP