日立F-4700FL数据分析实验报告

该实验报告详述了利用日立F-4700FL荧光分光光度计对4种溶液进行三维光谱扫描的数据分析过程。通过预处理数据,进行平行因子建模,最终识别出组分c1对应化合物D,组分c2对应化合物L。

实验设定

  • 日立F-4700FL为荧光分光光度计,可输出三维光谱扫描结果到计算机。
  • D和L为两种化合物。

对4种不同的溶液进行三维光谱扫描,得到的光谱文件如下。

溶质光谱文件
K.txt
DD.txt
LL.txt
D+LH.txt

光谱文件(txt)的内容格式如下。

Sample: ...
File name: ...
Run date: ...
Operator: ...
Comment: ...

Instrument
...

Instrument parameters
Measurement type:	3-D scan
Data mode:	Fluorescence
EX  Start WL: ...
EX  End WL: ...
EX Sampling interval: ...
EM  Start WL: ...
EM  End WL: ...
EM Sampling interval: ...
...

...

Data points
...(有负值)

预处理

  • 从txt的Data points部分提取数据点矩阵,保存为csv(处理细节:制表位替换为,→第一行开头添加,)→D.csv,L.csv,H.csv
  • 使用Excel的公式功能进行空白扣除→D-K.csv,L-K.csv,H-K.csv
  • 打开Matlab,执行以下命令→D-K_corr.csv,L-K_corr.csv,H-K_corr.csv
% 组装数据集
[X,Emmat,Exmat,filelist]=readineems(1,'csv','A1..AZ352',[1 1],0,0);
Ex=Exmat(1,:);Em=Emmat(:,1);
ds=assembledataset(X,Ex,Em,'AU','filelist',filelist,[]);

% 去除散射
eemreview(ds)
eemreview(smootheem(ds,[10 10],[],[0 12],[ ],[0 0 0 0],[],3382,0))
ds2=smootheem(ds,[10 10],[],[0 12],[ ],[0 0 0 0],[],3382,0);

% 导出数据
Xout=ds2; 
foldername='correctedEEMs'; %the folder must exist
for i=1:Xout.nSample
    filename=deblank(char(Xout.filelist{i}));
    filename=filename(1:end-4); 
    eem_i=squeeze(Xout.X(i,:,:)); 
    eem_i=[[NaN; Xout.Em] [Xout.Ex'; eem_i]]; 
    csvwrite([foldername '\' filename '_corr.csv'],eem_i) 
end

平行因子建模

% 组装数据集(确保目录中只含有一个*_corr.csv)
[X,Emmat,Exmat,filelist]=readineems(1,'csv','A1..AZ352',[1 1],0,0);
Ex=Exmat(1,:);Em=Emmat(:,1);
ds=assembledataset(X,Ex,Em,'AU','filelist',filelist,[]);
% 平行因子分析得到特征向量:
H_best=randinitanal(ds,2); % 此时保存工作区为*_best.mat

变量*_best说明:*_best.Modelx为组分数x对应的模型。D和L的组分数为1,H的组分数为2,因此有效模型为D_best.Model1,L_best.Model1,H_best.Model2

光谱drEEM dataset文件
H-K_corr.csvH_best.mat
D-K_corr.csvD_best.mat
L-K_corr.csvL_best.mat

组分识别

使用余弦相似度作为特征向量相似度的度量指标。假设某个组分的特征向量有多个纯化合物的特征向量与之匹配,则分别计算组分特征向量与纯化合物特征向量的相似度,取相似度最大的纯化合物为组分的预测结果。

% 余弦相似度函数
function [cs]=CS(A,B,j):
    n = size(A,1)
    up = 0
    down1 = 0 
    down2 = 0 
    for i=1:n
        Ai = A(i:j)
        Bi = B(i:j)
        up = up + Ai*Bi
        down1 = down1 + Ai*Ai
        down2 = down2 + Bi*Bi
    end
    down1 = sqrt(down1)
    down2 = sqrt(down2)
    cs = up/down1/down2
load('H_best.mat');
load('D_best.mat');
load('L_best.mat');
% 下面进行em之间的比较
ans = H_best.Model2(2);
em = ans{1};
c1em = em(:,1);
c2em = em(:,2);
ans = D_best.Model1(2);
em = ans{1};
cdem = em(:,1);
ans = L_best.Model1(2);
em = ans{1};
clem = em(:,1);
CS(c1em,cdem)=0.9985
CS(c1em,clem)=0.5694
CS(c2em,cdem)=0.3553
CS(c2em,clem)=0.8983
% 下面进行ex之间的比较
ans = H_best.Model2(3);
ex = ans{1};
c1ex = ex(:,1);
c2ex = ex(:,2);
ans = D_best.Model1(3);
ex = ans{1};
cdex = ex(:,1);
ans = L_best.Model1(3);
ex = ans{1};
clex = ex(:,1);
CS(c1ex,cdex)=0.9595
CS(c1ex,clex)=0.8420
CS(c2ex,cdex)=0.3704
CS(c2ex,clex)=0.6127
组分组分特征向量纯化合物特征向量相似度
c1c1emcdem0.9985
c1emclem0.5694
c1excdex0.9595
c1exclex0.8420
c2c2emcdem0.3553
c2emclem0.8983
c2excdex0.3704
c2exclex0.6127

从上表得出结论:组分c1为化合物D,组分c2为化合物L。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值