搜索结果为: lucene

  Compass是建立在Lucene基础之上的一款开放源码的JAVA搜索引擎框架。关于Compass的介绍在此我不多讲了,更多了解请直接参考http://www.opensymphony.com/compass
    很多看了Compass的人多少对Compass的配置文件都有点云里雾里的感觉(我最开始也如此:P)。由于Compass有很多地方都借鉴 更多相关的内容 »
comments 讨论   addto 把此链接加入于...  recommend 与朋友分享   report 已已沉

In the I.T. world, we always start learning something in the same way, whether it is a language or a framework, the first thing we see is that Hello, World example. Compass is no different. In this tutorial we are going to do something very simple with the Compass framework. First of all we are going to configure Compass and our domain objects, we will see what an index is, and finally 更多相关的内容 »
comments 讨论   addto 把此链接加入于...  recommend 与朋友分享   report 已已沉

There might be times when you would like to integrate Apache Nutch crawling with a single Apache Solr index server - for example when your collection size is limited to amount of documents that can be served by single Solr instance, or you like to do your updates on "live" index. By using Solr as your indexing server might even ease up your maintenance burden quite a bit - you would get rid of 更多相关的内容 »
comments 讨论   addto 把此链接加入于...  recommend 与朋友分享   report 已已沉
Solr 是一种可供企业使用的、基于 Lucene 的搜索服务器,它支持层面搜索、命中醒目显示和多种输出格式。在这篇分两部分的文章中,Lucene Java™ 的提交人 Grant Ingersoll 将介绍 Solr 并向您展示如何轻松地将其表现优异的全文本搜索功能加入到 Web 应用程序中。

一旦用户需要某 种信息,就可以立即搜索到这些信息,这种要求再也不是可有可无的了。随着 Google 和类似的复杂搜索引擎的出现,用户希望得到高质量的搜索结果,帮助他们快速、轻易地找到所需的信息。经理对您的在线购物站点同样抱有很高的期望,要求它能 够提供一个可伸缩、高度可用且易于维护的搜索解决方案,并且安装这个解决方案不应太昂贵。对于您而言,只是希望事业进步,让老板和客户满意,以及保持头脑 清醒。

使用 Apache Solr 可以满足所有的这些要求,它是一种开放源码的、基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 更多相关的内容 »
comments 讨论   addto 把此链接加入于...  recommend 与朋友分享   report 已已沉

在本部分中,Lucene Java™ 的提交人 Grant Ingersoll 通过对用于企业的特性(包括管理界面、高级配置选项)以及与性能相关的特性(比如缓存、复制和日志记录)的探究,完成了对 Solr 的介绍。

在本系列的 第 1 部分, 我为您介绍了 Apache Solr,一种基于 HTTP 的开源搜索服务器,它可以很容易地与多种 Web 应用程序集成。我展示了 Solr 最基本的功能,包括索引、搜索和浏览,介绍了 Solr 模式并解释了它在配置 Solr 功能方面的作用。在本部分中,我将通过列举 Solr 作为大型生产环境中理想的解决方案时所具备的特性来完成对 Solr 的介绍。涵盖的主题包括管理、缓存、复制和可扩展性。

请参阅 第 1 更多相关的内容 »
comments 讨论   addto 把此链接加入于...  recommend 与朋友分享   report 已已沉

请参阅 第 1">submit '使用 Apache Solr 实现更加灵巧的搜索,第 2 部分: 用于企业的 Solr' to digg   submit '使用 Apache Solr 实现更加灵巧的搜索,第 2 部分: 用于企业的 Solr' to reddit   submit '使用 Apache Solr 实现更加灵巧的搜索,第 2 部分: 用于企业的 Solr' to Pligg   submit '使用 Apache Solr 实现更加灵巧的搜索,第 2 部分: 用于企业的 Solr' to yahoo   |   书签  

在本文中的HBase术语:
基于列:column-oriented
行:row
列组:column families
列:column
单元:cell

理解HBase(一个开源的Google的BigTable实际应用)最大的困难是HBase的数据结构概念究竟是什么?首先HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库.另一个不同的是HBase基于列的而不是基于行的模式.

Google's BigTable论文清楚地解释了什么是BigTable:
Bigtable是一个疏松的分布式的持久的多维排序的map,这个map被行键,列键,和时间戳索引.每一个值都是连续的byte数组.(A Bigtable is a sparse, distributed, persistent multidimensional sorted map. The map 更多相关的内容 »
comments 讨论   addto 把此链接加入于...  recommend 与朋友分享   report 已已沉

Web Indexing又稱為Internet? Indexing故名思義是一套索引機制,就好像是一本書的索引目錄,可以根據關鍵字來查詢網頁資源,應用領域不限於internet,可延申到 Intranet或Desktop Indexing,這樣的技術正是在實作搜尋引擎的索引資料庫,只要把常用的關鍵字搜集整理出來,然後再按照關鍵字去對映網頁地址,以及點閱率排名,再把 這些對映結果存放在可以快速搜尋的分散式資料庫中,就可以處理整個全球資訊網的網站索引;關於關鍵字的索引及對映工作,可以使用Map Reduce去做分散式批次處理比對工作,以全球資訊網的資訊量來說都是terabyte的容量起算,所以使用Map Reduce來做定期規律的分散式批次運算較合適,然後再將結果存放到Bigtable/Hypertable/HBase這一類的分散式數據資料庫裡提 供查詢程式讀取,這就成了搜尋引擎的索引資料庫。 更多相关的内容 »
comments 讨论   addto 把此链接加入于...  recommend 与朋友分享   report 已已沉

To scale up from 500,000 volumes of full-text  to 5 million, we decided to use Solr’s distributed search feature which allows us to split up an index into a number of separate indexes (called “shards”).  Solr's distributed search feature allows the indexes to be searched in parallel and then the results aggregated so performance is better than having a very large si 更多相关的内容 »
comments 116 意见/ 评语   addto 把此链接加入于...  recommend 与朋友分享   report 已已沉