您正在查看: 标签 linux 下的文章

python分离正负样本

Overview 机器学习算法在项目中应用的时候,有时候会用到分离fasta格式的正负样本。于是就写了一个python脚本,效果不错,记录一下。 1. separatePosNeg.py #! /usr/bin/env python # -*- coding: utf-8 -*- # vim:fenc=utf-8 import fileinput i...阅读全文>>

生物信息中常用的Linux命令(二)

Overview 做项目时出现过某些蛋白质序列出现O或者X等情况,导致计算出的PSSM矩阵也有问题。今天又遇到这种情况,在比对文件的时候,用到了两条文件操作的linux命令,记录一下。其他更多的内容参考之前Chris写的另一篇文章生物信息中常用的Linux命令。 1. 按顺序合并文件 普通的合并文件可以直接用一个cat命令,而按顺序合并多个文件必须遍历这些文件,逐个合并。命令如下: for...阅读全文>>

生物信息中常用的Linux命令

Overview 一直想把常用的命令搜集起来,以便平时用到的时候查阅,可惜一直没抽出来时间专门整理下。最近在做序列的特征提取和多个特征文件合并时,频繁使用到了一些命令,干脆一并整理到这里,以后边用边添加整理新的命令。 这里的linux命令主要在MAC 10.9.5和Ubuntu 14.04下测试,涉及到平台差异性的时候,会尽量指出来,没有区分的话就表示两种平台下都可以使用。如果仍有没涉及到...阅读全文>>

蛋白质序列特征提取方法之——PSSM

Overview 我在之前写的一篇博客中谈到整理那些混乱的数据源,发现有pssm fts文件夹中的子文件夹和文件并不清楚来龙去脉,这个问题困扰了我一段时间。最近在研究PSSM算法时,与Chris交流了一下,恍然大悟:这个文件夹中的t3pssm,t4pssm,t6pssm三个子文件夹中的形如t6_12.pssm的文件族,是由t3,t4,t6这三个文件夹中的形如t6_12.fasta的文件族经...阅读全文>>

Ubuntu 12.04下R的安装

Overview 很久以前,安装R以及R的程序库时,遇到了一些问题,当时做了笔记,现在整理一下。 1.安装R 直接在ubuntu 12.04上安装的R版本是2.14.2,安装ggplot2总是失败。需要在软件源里添加第三方软件源 命令如下: sudo sh -c "echo deb http://mirror.bjtu.edu.cn/cran/bin/linux/ubunt...阅读全文>>

DISOPRED的安装和使用

Overview DISOPRED是一个蛋白质内部非结构区域的预测软件,使用DISOPRED,我们可以很方便地得到一个蛋白质序列的非结构区域信息,能够为蛋白质特征分析提供更多的信息。 1.DISOPRED的下载 去http://bioinfadmin.cs.ucl.ac.uk/downloads/DISOPRED/这里就可以下载各个版本的DISOPRED,这里我们下载最新版本的DISOPR...阅读全文>>

命令行下为常用的命令取别名

Overview 很多时候由于在命令行会经常使用到很长的命令或者进一个很长的目录,可能需要为常用的命令取一个别名。通常有两种别名的方式,一种是不带参数的别名,一种是可以自带参数的别名。 两种方式都是通过修改shell的配置文件实现,该配置目录在home目录下,默认是隐藏文件,在home目录使用ls -a就可以看到。如果使用bsh,则文件名为.bshrc文件,如果使用zsh,则文件名为.zsh...阅读全文>>

Maven中实现自动部署到Tomcat

Overview 以下纪录了实现Maven自动部署的步骤。 修改本地Tomcat端口 为了保持本地环境跟服务器环境一致,方便部署,首先需要修改本地tomcat的默认端口号,将8080改为8888:修改tomcat目录中/conf/server.xml中的Connector的port属性。 <Connector port="8888" protocol=&qu...阅读全文>>

服务器开发环境搭建

基本LAMP环境的搭建 不论使用的服务器是托管的PC服务器/工作站,还是购买的VPS/云主机服务,选好系统版本后,对Web开发首先需要搭建起最常用的LAMP架构,在这主要记录我们使用过的命令和碰到的问题。比较详细的搭建手册可以见这里 L:即Linux的发行版,此处基于的是Ubuntu 14.04 LTS; A:即Apache,安装:apt-get install apache2,并开启伪静...阅读全文>>