数据采集

knowlesys web data mining

垂直搜索引擎的特点

垂直搜索引擎的数据来源于哪里?其一来源于所处行业的相关站点,比如:找酒店、旅游信息的搜索引擎.qunar 的数据来源于:乐思knowlesys)全世界的搜集等。   

其二 来源于自身平台。可能很多人认为来源于自身平台的搜索只能称为站内搜索,不应该定义成垂直搜索。我不同意这种观点。事实当某一平台上的信息达到足够量大的时候,比如 eBaytaobao上的商品数量达上百万种你能说他的搜索不是垂直搜索吗?况且垂直搜索本身就是从这些行业站点提取出数据的。

比如:找餐馆的搜索引擎 Gudumami.的数据全部来源于它的加盟商户所发布的信息,再由信息采集软件进行搜集整理。当然,eBaytaobaoAlibaba也属于垂直搜索引擎,从用户使用的行为过程来看也是先有搜索动作而后才会有交易,不过更多时候人们愿意 称他们为b2bc2c交易平台。   

跟通用搜索引擎相比,垂直搜索引擎有哪些数据特性?垂直搜索引擎的数据倾向于结构化和格式化。比如在某个购物类的垂直搜索引擎上输入“mp3”就会出 现,该产品的相关属性如:内存、尺寸、大小、电池型号、价格、生产厂家等相关技术属性,有的还提供比价服务。在某餐饮搜索引擎的高级搜索针对一家餐馆的搜 索属性设置多达300个选项,把你想到和没想到都列出来了,这就把搜索服务专业化、细致化、个性化了。

posted on 2008-07-31 15:48 clark 阅读(422) 评论(0)  编辑 收藏 引用

只有注册用户登录后才能发表评论。