本文只对几种流行的开源数据挖掘平台进行了检视,比如Weka和R等。如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directory上查看。为了评测这些软件,我们用了UCI Machine Learning Repository上的心脏病诊断数据集。
R
R (http://www.r-project.org) 是用于统计分析和图形化的计算机语言及分析工具,为了保证性能,其核心计算模块是用C、C++和Fortran编写的。同时为了便于使用,它提供了一种脚 本语言,即R语言。R语言和贝尔实验室开发的S语言类似。R支持一系列分析技术,包括统计检验、预测建模、数据可视化等等。在 CRAN(http://cran.r-project.org) 上可以找到众多开源的扩展包。
R软件的首选界面是命令行界面,通过编写脚本来调用分析功能。如果缺乏编程技能,也可使用图形界面,比如使用R Commander(http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/)或Ra
更多相关的内容 »
讨论
把此链接加入于...
与朋友分享
已已沉
讨论
把此链接加入于...
与朋友分享
已已沉
我在大学期间参加过数学建 模方面的专业培训,知道该功能是运用了数理统计,数据分析等方面的知识建立了一个预测模型,然后通过该模型来处理实际商业客户数据,预测客户的需求,从而 发掘出潜在的商机。我对此非常感兴趣,开始留意这方面的资料。当时这方面的新闻,报道都不多,不过,我在有限的几篇报道中都发现一个
更多相关的内容 »
讨论
把此链接加入于...
与朋友分享
已已沉
« 上一页1 下一页 »