讨论
把此链接加入于...
与朋友分享
已已沉
In the I.T. world, we always start learning something in the same way, whether it is a language or a framework, the first thing we see is that Hello, World example. Compass is no different. In this tutorial we are going to do something very simple with the Compass framework. First of all we are going to configure Compass and our domain objects, we will see what an index is, and finally
更多相关的内容 »
讨论
把此链接加入于...
与朋友分享
已已沉
讨论
把此链接加入于...
与朋友分享
已已沉
一旦用户需要某 种信息,就可以立即搜索到这些信息,这种要求再也不是可有可无的了。随着 Google 和类似的复杂搜索引擎的出现,用户希望得到高质量的搜索结果,帮助他们快速、轻易地找到所需的信息。经理对您的在线购物站点同样抱有很高的期望,要求它能 够提供一个可伸缩、高度可用且易于维护的搜索解决方案,并且安装这个解决方案不应太昂贵。对于您而言,只是希望事业进步,让老板和客户满意,以及保持头脑 清醒。
使用 Apache Solr 可以满足所有的这些要求,它是一种开放源码的、基于 Lucene Java 的搜索服务器,易于加入到 Web 应用程序中。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括
更多相关的内容 »
讨论
把此链接加入于...
与朋友分享
已已沉
在本系列的 第 1 部分, 我为您介绍了 Apache Solr,一种基于 HTTP 的开源搜索服务器,它可以很容易地与多种 Web 应用程序集成。我展示了 Solr 最基本的功能,包括索引、搜索和浏览,介绍了 Solr 模式并解释了它在配置 Solr 功能方面的作用。在本部分中,我将通过列举 Solr 作为大型生产环境中理想的解决方案时所具备的特性来完成对 Solr 的介绍。涵盖的主题包括管理、缓存、复制和可扩展性。
讨论
把此链接加入于...
与朋友分享
已已沉
在本文中的HBase术语:
基于列:column-oriented
行:row
列组:column families
列:column
单元:cell
理解HBase(一个开源的Google的BigTable实际应用)最大的困难是HBase的数据结构概念究竟是什么?首先HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库.另一个不同的是HBase基于列的而不是基于行的模式.
Google's BigTable论文清楚地解释了什么是BigTable:
Bigtable是一个疏松的分布式的持久的多维排序的map,这个map被行键,列键,和时间戳索引.每一个值都是连续的byte数组.(A Bigtable is a sparse, distributed, persistent multidimensional sorted map. The map
更多相关的内容 »
讨论
把此链接加入于...
与朋友分享
已已沉
Web Indexing又稱為Internet? Indexing故名思義是一套索引機制,就好像是一本書的索引目錄,可以根據關鍵字來查詢網頁資源,應用領域不限於internet,可延申到 Intranet或Desktop Indexing,這樣的技術正是在實作搜尋引擎的索引資料庫,只要把常用的關鍵字搜集整理出來,然後再按照關鍵字去對映網頁地址,以及點閱率排名,再把 這些對映結果存放在可以快速搜尋的分散式資料庫中,就可以處理整個全球資訊網的網站索引;關於關鍵字的索引及對映工作,可以使用Map Reduce去做分散式批次處理比對工作,以全球資訊網的資訊量來說都是terabyte的容量起算,所以使用Map Reduce來做定期規律的分散式批次運算較合適,然後再將結果存放到Bigtable/Hypertable/HBase這一類的分散式數據資料庫裡提 供查詢程式讀取,這就成了搜尋引擎的索引資料庫。
更多相关的内容 »
讨论
把此链接加入于...
与朋友分享
已已沉
To scale up from 500,000 volumes of full-text to 5 million, we decided to use Solr’s distributed search feature which allows us to split up an index into a number of separate indexes (called “shards”). Solr's distributed search feature allows the indexes to be searched in parallel and then the results aggregated so performance is better than having a very large si
更多相关的内容 »
116 意见/ 评语
把此链接加入于...
与朋友分享
已已沉
« 上一页1 下一页 »