QQ:站内信联系

您的位置:主页 > 百事娱乐资讯 >

百事娱乐资讯

联系我们

电话:400-123-4567

Email: admin@baidu.com

传真:+86-123-4567

手机:13888888888

再次改变一切微博搜索来了

发布时间:2023-12-27 16:23人气:79

  近年来,对中文互联网生态改变最大的,莫过于微博。它赋予了普通人前所未有的话语权,每天有数千万人登录微博产生动作,23万个企业、19000个相关政府单位开设了微博账号,使人与人之间的关系变得更近。但随着微博的发展,一些先天缺陷也在制约着微博发展的环境,微博的应用形态亟需升级。

  现在的微博有着种种问题:各种段子、语录横行,让人们在首页上看不到有价值的信息;名人微博受到过度关注,明星打个喷嚏都上千转发,普通人的微博被淹没掉;碎片化严重,用户在信息的海洋里却找不到有价值的信息。

  目前新浪微博每天产生1.2亿条信息,而目前主流中文搜索引擎的网页数据库也仅仅在300--500亿,也就是说,新浪微博一年的数据量,就相当于中文互联网从开始到现在产生的有价值网页的数据总量。但是在如此海量的信息里,由于缺乏有效的搜索手段,人们很难找到对自己有用的微博。

  微博遇到的问题,跟1998年互联网搜索遇到的问题一样,都表现为信息的过度泛滥,人们检索信息的成本太高。在Google之前,人们利用信息的方式是类似hao123一样的分类网址列表,尽管也有全文搜索,但因为搜索引擎没分析网页之间的关系,使得搜索质量很差;而Google开始利用pagerank技术来分析网页关系之后,搜索质量有了很大提高。

  以传统网页搜索为例,仅需要分析网页与网页之间的关系即可,每天十亿个网页的排序,计算一下很简单。微博搜索不仅需要考虑微博的文字内容,还需要考虑微博作者是什么身份,医生说到的治病方法就要比普通人给予更多权重;考虑微博用户之间的关系,如果你发一个治病微博,好几个医生赞同了,那也要给更多权重;微博之间的相互引用、微博被网页引用等等,都需要列入考虑因素;搜索者跟发布者之间的关系也要考虑,你搜一条微博,好友的微博也需要排在前面。如此复杂的关系,是传统搜索引擎的基础架构无法承载的。

  无论传统搜索引擎还是微博搜索,其搜索质量都严重依赖于内容源。目前的微博内容还处于快速成长期,优质内容相对不足。比如相对有价值的商品购买后的评价微博、本地社区的相关微博、跟职业身份相关的专业知识微博比例较低。

  但这个问题跟微博搜索的成长是一个硬币的正反面:因为微博搜索不给力,专业有价值的微博没什么人看到,微博作者发微博的信心丧失,进入恶性循环;微博搜索更给力之后,用户要想看到优质内容,不必要依赖“某些大号”,打破大账号对用户的单向信息流动,

  通过搜索给予优质内容曝光机会,从而建立“内容发布--搜索--互动”信息正向循环。

  现在主流的微博平台均处于半封闭状态,尤其是核心的用户关系一般不会开放给第三方搜索,这将严重影响到微博搜索质量的进一步提高。普通的网页搜索是10亿人去搜索一个词,看到同样的结果;微博搜索则是你搜索一个词,朋友的微博、朋友转发的微博在前面,每个人都有不同的结果。如果搜索引擎不知道用户之间的关系,则这个理想的搜索状态就很难做到。

  搜索将大大加速微博用户之间信息流动,让用户寻找到更可信、更精准的信息,从而改变整个微博生态系统。

  以前的微博曝光严重依赖关注者,20万粉丝关注的微博账户就比2万粉丝的账户有价值,由此带来了刷假粉丝、频繁发微博刷屏、剽窃别人的微博内容发布等一系列不良现象。有了微博搜索之后,搜索带来的流量会大大超过自然关注者的流量。尤其对于知识性、趣味性的有用内容,用户搜索到的几率大大增加。这种生态的改变,会促使微博用户少发段子,多谈知识;靠转贴段子为生的大号被逐渐淘汰,代之而起的是拥有内容创造能力的媒体账号。

  普通网页内容有许多问题,例如更新时间长、不及时、无法核实真伪。微博内容不同,基本是鲜活的、实时的、有用的信息。例如搜索“天通苑停电”,马上能看到实名认证的天通苑用户相关微博,而网页搜索没有任何有用结果。而且,搜到的微博内容可以看到发布者的职业、年龄、过去发过的微博等,对于网民确认微博内容的真伪有着很大的参考意义。

  有了搜索之后,任何一个微博账号曾经说过的话、发表的观点、评论等都将成为个人信用的一部分,这个信用体系的建立,将对于求职、招聘、商业合作、媒体影响力、公司品牌建设等多个领域产生巨大的影响。例如前不久的双11事件中,有的网店虚假卖货、货不对板等,如果用户能在微博上搜索到奸商过去的劣迹,就会对这些店主敬而远之,让商家永远无法利用信息不对称欺诈顾客。

推荐资讯