搜索结果为: bi

本文只对几种流行的开源数据挖掘平台进行了检视,比如Weka和R等。如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directory上查看。为了评测这些软件,我们用了UCI Machine Learning Repository上的心脏病诊断数据集。

R

R (http://www.r-project.org) 是用于统计分析和图形化的计算机语言及分析工具,为了保证性能,其核心计算模块是用C、C++和Fortran编写的。同时为了便于使用,它提供了一种脚 本语言,即R语言。R语言和贝尔实验室开发的S语言类似。R支持一系列分析技术,包括统计检验、预测建模、数据可视化等等。在 CRAN(http://cran.r-project.org) 上可以找到众多开源的扩展包。
R软件的首选界面是命令行界面,通过编写脚本来调用分析功能。如果缺乏编程技能,也可使用图形界面,比如使用R Commander(http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/)或Ra 更多相关的内容 »
comments 讨论   addto 把此链接加入于...  recommend 与朋友分享   report 已已沉

一、数据挖掘工具

  在数据挖掘技术日益发展的同时,许多数据挖掘的商业软件工具也逐渐问世。数据挖掘工具主要有两类:特定领域的数据挖掘工具和通用的数据挖掘工具。
  特定领域的数据挖掘工具针对某个特定领域的问题提供解决方案。在设计算法的时候,充分考虑到数据、需求的特殊性,并作了优化。对任何领域,都可以开发特定的数据挖掘工具。例如,IBM 公司的Advanced Scout 系统针对NBA 的数据,帮助教练优化战术组合;加州理工学院喷气推进实验室与天文科学家合作开发的SKICAT 系统,帮助天文学家发现遥远的类星体;芬兰赫尔辛基大学计算机科学系开发的TASA,帮助预测网络通信中的警报。

  特定领域的数据挖掘工具针对性比较强,只能用于一种应用;也正因为针对性强,往往采用特殊的算法,可以处理特殊的数据,实现特殊的目的,发现的知识可靠度也比较高。

  通用的数据挖掘工具不区分具体数据的含义,采用通用的挖掘算法,处理常见的数据类型,一般提供六种模式。例如,IBM 公司Almaden 研究中心开发的QUEST 系统,SG 更多相关的内容 »
comments 讨论   addto 把此链接加入于...  recommend 与朋友分享   report 已已沉
我是一名软件开发人员,目前的主要经验是商业信息管理系统的架构设计和开发。最早了解到的BI实例,是2000年和惠普(HP)某家经销商经理的一次聊天 中。当时,该经理极力向我推荐HP美国总部销售管理系统的一个功能,当然,中国本土的经销商也可以通过网络来使用该系统。该系统要求经销商在每销售一台 HP的打印机后,必须把客户的信息、联系方式及购机日期录入到系统中去。当然,一开始的劳动是有回报的。一段时间后,销售系统会主动提醒该经销商,您该联 系一下之前购机的客户某某,询问其是否需要购买相应的打印耗材。经销商按系统提示主动和客户联系时,大部分客户非常惊讶,因为他们之前购买打印耗材差不多 正要用完,正准备再次购买。于是,第二笔交易很快就达成了,经销商扩大了销售额,客户也对经销商的适时服务非常满意。

  我在大学期间参加过数学建 模方面的专业培训,知道该功能是运用了数理统计,数据分析等方面的知识建立了一个预测模型,然后通过该模型来处理实际商业客户数据,预测客户的需求,从而 发掘出潜在的商机。我对此非常感兴趣,开始留意这方面的资料。当时这方面的新闻,报道都不多,不过,我在有限的几篇报道中都发现一个 更多相关的内容 »
comments 讨论   addto 把此链接加入于...  recommend 与朋友分享   report 已已沉