数据分析和统计
面向列的数据集
数据被保存在一个称为count.dat的文件中.
11 11 9
7 13 11
14 17 20
11 13 9
43 51 69
38 46 76
61 132 186
75 135 180
38 88 115
28 36 55
12 12 14
18 27 30
18 19 29
17 15 18
19 36 48
32 47 10
42 65 92
57 66 151
44 55 90
114 145 257
35 58 68
11 12 15
13 9 15
10 9 7
下面,我们调入此文件,并看看文件的一些参数
load count.dat
[n,p] = size(count)
n =
24
p =
3
创建一个时间轴后,我们可以把图画出来:
t = 1:n;
set(0,'defaultaxeslinestyleorder’,’-|--|-.’)
set(0,'defaultaxescolororder’,[0 0 0])
plot(t,count), legend('Location 1','Location 2','Location 3',0)
xlabel('Time'), ylabel('Vehicle Count'), grid on
足以证明,以上是对3个对象的24次观测.
基本数据分析函数
(一定注意是面向列的)
继续用上面的数据,其每列最大值.均值.及偏差分别为:
mx = max(count)
mu = mean(count)
sigma = std(count)
mx =
114 145 257
mu =
32.0000 46.5417 65.5833
sigma =
25.3703 41.4057 68.0281
重载函数,还可以定位出最大.最小值的位置
[mx,indx] = min(count)
mx =
7 9 7
indx =
2 23 24
试试看,你能看懂下面的命令是干什么的吗?
[n,p] = size(count)
e = ones(n,1)
x = count – e*mu
点这看看答案!
下面这句命令则找出了整个矩阵的最小值:
min(count(:))
ans =
7
协方差及相关系数
下面,我们来看看第一列的方差:
cov(count(:,1))
ans =
643.6522
corrcoef()用于计算相关系数,如:
corrcoef(count)
ans =
1.0000 0.9331 0.9599
0.9331 1.0000 0.9553
0.9599 0.9553 1.00