数据拟合平滑样条问题

本文对比了R和Python中平滑样条函数的使用,重点介绍了R中的smooth.spline()函数在基因组测序数据校正中的应用,并讨论了Python中对应函数的差异。

R里面有平滑样条函数,一条命令就好了smooth.spline()

比如我们做基因组测序数据时需要将dosage对GC进行校正,那么

在R中做GC校正就相当简单:

d <- read.table(flex, colClasses = c("numeric", rep("NULL",4), "numeric", "numeric"))#其中设定为numeric的三列为纯数字染色体号、覆盖度、和该bin中的GC含量

select_data$depth_cor <- select_data$depth_scale -  smoother(select_data$depth_scale, select_data$GC)

得到的就是校正之后的depth,

重点来关注smoother函数

smoother <- function(depth, gc){
    ord = order(gc)
    reord = (1 : length(gc))[order(ord)]
    result = smooth.spline(depth[ord])
    print(result)
    return(result$y[reord])
}

其中depth=f(gc)的拟合只用smooth.spline就可以实现。

但是到了python中却很难找到对应的函数,仅仅名字相近的interpolate 函数是

from scipy.interpolate import UnivariateSpline as spline 

这个函数,但是其实和R做的还是不同,python相对更加粗一些吧,TM scipy里面那么多细分的函数谁能搞清楚,这点远不如R一个平滑样条用的方便

详细可执行代码参考:https://download.csdn.net/download/abcba101/11941821

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

尖端科技---产学研

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值