Overview 在CKSAAP(Compositon of k-spaced Amino Acid Pairs)方法中,利用在蛋白质序列片断中k个间隔距离的残基对(residue pairs)在该序列中的组成比例,建立数学模型,提取出特征向量,从而达到预测泛素(Ubiquitin)的目的。 残基(residue)和泛素(Ubiquitin)信息详见维基百科:残基和泛素,这里就不赘述了。 ...阅读全文>>
您正在查看: 标签 feature extraction 下的文章
蛋白质序列处理—总体步骤
蛋白质序列处理程序之前得到的数据源太乱,这些天整理并重新摆放了一下,每一步的输入文件夹后缀都有一个-in,处理程序文件夹后缀为-run,输出文件夹后缀为-out,这样条理清晰了很多,今日记录,以方便日后查阅使用。 数据处理部分共分5步: 下载并分类(set class) 多步CD-hit 正负样本1:1平衡(Dataset balance) 特征计算(feature calculation...阅读全文>>
蛋白质序列特征向量计算—数据处理第(4)步
该步骤为数据处理的第(4)步,共包含6小步。 其中前三步: 1. AAC,Amino acid composition(AminoAcidC.py) 2. SEQ,Sequence(Seq.py) 3. eft3,amino acids combination properties(involving kmp algorithm)(Eft3.py) 这前三步用到feature_calc.s...阅读全文>>
最新回复
PSSM(一)-什么是PSSM R11; Ayanokouji Monki的博客: [...]1.构建PSSM的步骤[...]
一条生物狗: 超感谢,有学到东西。找到这儿是为了读博憋文章在学PTM...
Google: Check beneath, are some com...
wendao: 赞!
Mars: 在版本么有问题的情况下,安装mmlspark等包后,引...
vimtutor: 不错的原创网站,纯粹、简洁,加油~
要你比我更快乐: 做的很棒,请继续加油!
Chris: 算是个人选择吧,其实自己觉得怎么方便怎么来,没影响...
essayforme: Thank you! Loads of knowledge!
kangbrilliant: 请问为什么要去除header呢?
归档
May 2020April 2020March 2020October 2019September 2019August 2019July 2019October 2018April 2018March 2018October 2017April 2017March 2017December 2016September 2016July 2016June 2016May 2016April 2016March 2016February 2016January 2016December 2015November 2015October 2015September 2015August 2015June 2015January 2015December 2014