㈠ uci数据库的例子
下面以UCI中IRIS为例介绍一下数据集:
ucidatairis中有三个文件:
Index
iris.data
iris.names
index为文件夹目录,列出了本文件夹里的所有文件,如iris中index的内容如下:
Index of iris
18 Mar 1996 105 Index
08 Mar 1993 4551 iris.data
30 May 1989 2604 iris.names
iris.data为iris数据文件,内容如下:
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
……
7.0,3.2,4.7,1.4,Iris-versicolor
6.9,3.1,4.9,1.5,Iris-versicolor
……
6.3,3.3,6.0,2.5,Iris-virginica
6.4,3.2,4.5,1.5,Iris-versicolor
5.8,2.7,5.1,1.9,Iris-virginica
7.1,3.0,5.9,2.1,Iris-virginica
……
如上,属性直接以逗号隔开,中间没有空格(5.1,3.5,1.4,0.2,),最后一列为本行属性对应的值,即决策属性Iris-setosa
。
iris.names介绍了irir数据的一些相关信息,如数据标题、数据来源、以前使用情况、最近信息、实例数目、实例的属性等,如下所示部分:
……
7. Attribute Information:
1. sepal length in cm
2. sepal width in cm
3. petal length in cm
4. petal width in cm
5. class:
-- Iris Setosa
-- Iris Versicolour
-- Iris Virginica
……
9. Class Distribution: 33.3% for each of 3 classes.
本数据的使用实例请参考其他论文,或本站后面的内容。
下面以wine数据为例导入matlab并利用前面提到的libsvm做测试
>> uiimport('wine.data')
导入数据,workspace处出现wine数组178*14
将标签和数据属性提取,并保存到matlab平台下的数据
>> wine_label = wine(:,1);
>> wine_data = wine(:,2:end);
>> save winedat.mat
(下次使用的时候可以直接>> load winedat)
svm训练模型得到wine模型
>> modelw = svmtrain(wine_data,wine_label);
.*
optimization finished, #iter = 239
nu = 0.892184
obj = -61.125695, rho = 0.131965
nSV = 130, nBSV = 53
.*
optimization finished, #iter = 193
nu = 0.882853
obj = -50.421538, rho = -0.166754
nSV = 107, nBSV = 42
.*
optimization finished, #iter = 214
nu = 0.800233
obj = -53.411663, rho = -0.286931
nSV = 119, nBSV = 44
Total nSV = 178
分类结果
>> [plabelw, accuracyw] = svmpredict(wine_label,wine_data,modelw);
Accuracy = 100% (178/178) (classification)

㈡ 从UCI上下载的数据集(.data文件)用记事本打开怎么不换行
那个黑色小方块是网页脚本所用的格式,跟word里的回车换行符箭头是一样的,只不过txt不支持htm里的部分格式,所以记事本就找了个方块来代替它无法显示的那个换行符。
㈢ matlab怎么引用uci数据集
将UCI数据集下载到本地后,如果是压缩包,解压,若是txt文本,则可以用load函数
如果是xls文件,可以用xlsread函数
㈣ UCI数据集怎么用
uci 数据集 的说明 告诉了读者 数据的属性和类别,用户可以用自己的数据挖掘方法去将 uci数据集的分类,将结果与数据说明的结果对比。说明自己算法的正确性
㈤ 什么是UCI标准数据集
UCI数据库是加州大学欧文分校(University of CaliforniaIrvine)提出的用于机器学习的数据库,这个数据库目前共有187个数据集,其数目还在不断增加,UCI数据集是一个常用的标准测试数据集。
http://archive.ics.uci.e/ml/
㈥ 数据集的处理方法
数据集是美国加州大学欧文分校提出的一种适合模式识别和机器学习方向的开源数据集,很多学者选择使用UCI上的数据集来验证自己所提算法的正确性。博文写作时已拥有488个数据集,数据集还在不断扩充中,这些数据集主要分为二值分类问题、多分类问题以及回归拟合问题。UCI数据集提供了各个数据集的上主要属性,可以根据自己提出的各类算法在其数据集上做实验结果论证,证明自己所提算法的合理性。
包括了数据集页面入口、最新数据集、经典数据集及数据集的最近消息等。数据集页面入口提供了进入官网查看全部数据集的链接,为了方便用户查找在“最新数据集”和“经典数据集”区域整理了最新收录以及引用最多的几个数据集。如果只是简单测试下代码,直接点击页面上提供的数据集链接下载几个数据集就可以了,如果还需要更多数据集那就进入数据集页面入口,该页面发布有全部的数据集。
㈦ UCI数据集怎么用
uci
数据集
的说明
告诉了读者
数据的属性和类别,用户可以用自己的数据挖掘方法去将
uci数据集的分类,将结果与数据说明的结果对比。说明自己算法的正确性
㈧ 如何用UCI中标准库里的数据集做回归,如何去取自变量和因变量
最后一列是因变量,其余是自变量做回归就行
㈨ UCI中分类数据集可用来算法验证吗
uci 数据集 的说明 告诉了读者 数据的属性和类别,
用户可以用自己的数据挖掘方法去将 uci数据集的分类,将结果与数据说明的结果对比。说明自己算法的正确性