把多个文件中的180条蛋白序列ID替换为物种编号

sh/bash/dash/ksh/zsh等Shell脚本
回复
yhzii
帖子: 13
注册时间: 2021-08-23 21:23
系统: ubuntu20.4.2

把多个文件中的180条蛋白序列ID替换为物种编号

#1

帖子 yhzii » 2021-10-21 15:21

请问大家,
我有100个蛋白序列文件,每个蛋白序列文件中包含约180条蛋白序列,需要把每条序列ID替换为对应的物种编号;序列ID和物种编号的对应关系在另一个矩阵文件(matrix.txt)中存储,矩阵中的列名即为物种编号,每个单元格是序列ID,一个物种中包含很多条序列。请问代码应当如何编写?
我尝试了for循环里使用sed awk但都很难做到。 :Cry
希望大佬们帮我指点一下。拜托啦

附件是待替换的蛋白序列文件和物种编号矩阵。
附件
proteins_seqID_PF00466-Ribosomal_L10.HMM1.txt
(53.36 KiB) 已下载 94 次
matrix.txt
(15.05 KiB) 已下载 100 次
头像
lilydjwg
论坛版主
帖子: 4250
注册时间: 2009-04-11 23:46
系统: Arch Linux
联系:

Re: 把多个文件中的180条蛋白序列ID替换为物种编号

#2

帖子 lilydjwg » 2021-10-21 16:23

要是我就用 Python 写了,有这个提问的时间,我的 Python 脚本都写好了……
shell 脚本不擅长比较精细的处理。
yhzii
帖子: 13
注册时间: 2021-08-23 21:23
系统: ubuntu20.4.2

Re: 把多个文件中的180条蛋白序列ID替换为物种编号

#3

帖子 yhzii » 2021-10-21 18:19

lilydjwg 写了: 2021-10-21 16:23 要是我就用 Python 写了,有这个提问的时间,我的 Python 脚本都写好了……
shell 脚本不擅长比较精细的处理。
能大概说明一下python的步骤吗?比如用到什么插件,分成几步?因为python我不太会
头像
lilydjwg
论坛版主
帖子: 4250
注册时间: 2009-04-11 23:46
系统: Arch Linux
联系:

Re: 把多个文件中的180条蛋白序列ID替换为物种编号

#4

帖子 lilydjwg » 2021-10-21 19:15

yhzii 写了: 2021-10-21 18:19
lilydjwg 写了: 2021-10-21 16:23 要是我就用 Python 写了,有这个提问的时间,我的 Python 脚本都写好了……
shell 脚本不擅长比较精细的处理。
能大概说明一下python的步骤吗?比如用到什么插件,分成几步?因为python我不太会
你会什么语言就用什么语言呀。(都不会的话建议学一下 Python)
用不上什么插件啥的。

把替换表读进来。
把数据读进来。
查表替换。
输出结果。
完。
yhzii
帖子: 13
注册时间: 2021-08-23 21:23
系统: ubuntu20.4.2

Re: 把多个文件中的180条蛋白序列ID替换为物种编号

#5

帖子 yhzii » 2021-10-21 20:24

lilydjwg 写了: 2021-10-21 19:15
yhzii 写了: 2021-10-21 18:19
lilydjwg 写了: 2021-10-21 16:23 要是我就用 Python 写了,有这个提问的时间,我的 Python 脚本都写好了……
shell 脚本不擅长比较精细的处理。
能大概说明一下python的步骤吗?比如用到什么插件,分成几步?因为python我不太会
你会什么语言就用什么语言呀。(都不会的话建议学一下 Python)
用不上什么插件啥的。

把替换表读进来。
把数据读进来。
查表替换。
输出结果。
完。
好的,我去试试。多谢了
yhzii
帖子: 13
注册时间: 2021-08-23 21:23
系统: ubuntu20.4.2

Re: 把多个文件中的180条蛋白序列ID替换为物种编号

#6

帖子 yhzii » 2021-10-25 19:45

yhzii 写了: 2021-10-21 20:24
lilydjwg 写了: 2021-10-21 19:15
yhzii 写了: 2021-10-21 18:19
lilydjwg 写了: 2021-10-21 16:23 要是我就用 Python 写了,有这个提问的时间,我的 Python 脚本都写好了……
shell 脚本不擅长比较精细的处理。
能大概说明一下python的步骤吗?比如用到什么插件,分成几步?因为python我不太会