① weka&数据挖掘:Weka里面有很多的算法,但是Weka并没有给出算法如何实现的,有没有相关的论文可以看看啊!
我觉得直接看源码比较容易理解,WEKA是开源的
如果你要信息增益的话看这个:
http://www.360doc.com/content/09/1010/11/79028_7055867.shtml
② 使用weka可以分析数据库资料,然后是不是把分析的资料进行输出,这样就算数据挖掘
按照分析需求,使用weka中原有的算法对数据进行处理,得到分析结果。结果可以是文字描述,也可以是可视化图形等等。
③ 数据挖掘WEKA工具怎样来用来进行文本分类有800多个测试文本,求大神给出具体的步骤和通俗易懂的
第一步,你要有中文的数据集;
第二步,数据集要准备成weka能处理的结构,这很好做到,你把数据集压缩了就行了,因为它要求的格式是,一个类别的文件放一个文件夹下。但是还有一个问题,你的机器往往没那么多内存去处理这个数据集,那么你可以选几个类别出来,在每个类别中放几十个文档来做就可以了。
第三步,分词。
第四步,使用weka wiki中的例子将数据集转换成arff格式。
weka是一种机器学习算法的集合,它可以用于分类,预测等。由于weka支持的数据格式是arff或csv的格式,因此在进行weka实验的时候必须进行数据的预处理。一般,我们可以在EXCEL里面导入TXT,然后另存为.CSV格式的文件(这个格式WEKA也是可以识别的),然后打开WEKA,–》TOOL–》 arffviewer中打开刚才的.CSV文件,另存为.arff就OK了!
④ Weka研究有什么用途
weka是数据挖掘的平台之一,weka中集成了很多算法,主要用于数据挖掘方面,例如人脸识别,文本识别以及基因工程等等。算法不同,效果不同,这就要仔细研究了。
⑤ weka进行数据挖掘分类
分类得出的决策树只显示了一部
⑥ 关于weka数据挖掘预处理的问题
有监督,就是结果已经知道,在这个结果下去预测模型
无监督结果不知道,比如聚类算法,利用数据本身的结构情况来判断分类
⑦ weka数据挖掘遇到问题
找到eclipse 的快捷方式,右键,属性,
在把启动
eclipse.exe
命令改成
eclipse.exe --vmargs -Xss256m -Xmx512m
⑧ 关于数据挖掘软件《weka》关联规则挖掘功能
先把各个属性的取值都是0的那些给去掉,剩下的就是取值为1了吧。
⑨ 为什么有了SAS,WEKA等功能强大的数据分析挖掘软件,还需要R,PYTHON
1.R是用于统计分析和图形化的计算机语言及分析工具;
2.Weka可能是名气最大的开源机器学习和数据挖掘软件,但用起来并不方便,界面也简单了点;
3.Tanagra 是使用图形界面的数据挖掘软件;
4.RapidMiner现在流行的势头在上升,但它的操作方式和商用软件差别较大,不支持分析流程图的方式,当包含的运算符比较多的时候就不容易查看了;
5.KNIME和Orange看起来都不错,Orange界面看上去很清爽,但我发现它不支持中 文。推荐KNIME,同时安装Weka和R扩展包。
对于普通用户可以选 用界面友好易于使用的软件,对于希望从事算法开发的用户则可以根据软件开发工具不同(Java、R、C++、Python等)来选择相应的软件。
⑩ 用weka进行数据挖掘,其中使用到了Id3和J48,为什么结果会很不一样
不同算法的结果当然会不一样
J48是简单算法,按照树枝分类法来分析数据。假如a=3,b=4,在j48做training的时候就会记录:x<=3为a,x>3为b
可能你的数据不适合j48这种算法
个人推荐在function中的svm算法,很灵活