把多个文件中的180条蛋白序列ID替换为物种编号

yhzii · #1

请问大家，
我有100个蛋白序列文件，每个蛋白序列文件中包含约180条蛋白序列，需要把每条序列ID替换为对应的物种编号；序列ID和物种编号的对应关系在另一个矩阵文件（matrix.txt）中存储，矩阵中的列名即为物种编号，每个单元格是序列ID，一个物种中包含很多条序列。请问代码应当如何编写？
我尝试了for循环里使用sed awk但都很难做到。

希望大佬们帮我指点一下。拜托啦

附件是待替换的蛋白序列文件和物种编号矩阵。

lilydjwg · #2

要是我就用 Python 写了，有这个提问的时间，我的 Python 脚本都写好了……
shell 脚本不擅长比较精细的处理。

yhzii · #3

lilydjwg 写了： ↑2021-10-21 16:23 要是我就用 Python 写了，有这个提问的时间，我的 Python 脚本都写好了……
shell 脚本不擅长比较精细的处理。

能大概说明一下python的步骤吗？比如用到什么插件，分成几步？因为python我不太会

lilydjwg · #4

yhzii 写了： ↑2021-10-21 18:19
lilydjwg 写了： ↑2021-10-21 16:23 要是我就用 Python 写了，有这个提问的时间，我的 Python 脚本都写好了……
shell 脚本不擅长比较精细的处理。
能大概说明一下python的步骤吗？比如用到什么插件，分成几步？因为python我不太会

你会什么语言就用什么语言呀。（都不会的话建议学一下 Python）
用不上什么插件啥的。

把替换表读进来。
把数据读进来。
查表替换。
输出结果。
完。

yhzii · #5

lilydjwg 写了： ↑2021-10-21 19:15
yhzii 写了： ↑2021-10-21 18:19
lilydjwg 写了： ↑2021-10-21 16:23 要是我就用 Python 写了，有这个提问的时间，我的 Python 脚本都写好了……
shell 脚本不擅长比较精细的处理。
能大概说明一下python的步骤吗？比如用到什么插件，分成几步？因为python我不太会
你会什么语言就用什么语言呀。（都不会的话建议学一下 Python）
用不上什么插件啥的。

把替换表读进来。
把数据读进来。
查表替换。
输出结果。
完。

好的，我去试试。多谢了

yhzii · #6

yhzii 写了： ↑2021-10-21 20:24
lilydjwg 写了： ↑2021-10-21 19:15
yhzii 写了： ↑2021-10-21 18:19
lilydjwg 写了： ↑2021-10-21 16:23 要是我就用 Python 写了，有这个提问的时间，我的 Python 脚本都写好了……
shell 脚本不擅长比较精细的处理。
能大概说明一下python的步骤吗？比如用到什么插件，分成几步？因为python我不太会

把多个文件中的180条蛋白序列ID替换为物种编号

把多个文件中的180条蛋白序列ID替换为物种编号

Re: 把多个文件中的180条蛋白序列ID替换为物种编号

Re: 把多个文件中的180条蛋白序列ID替换为物种编号

Re: 把多个文件中的180条蛋白序列ID替换为物种编号

Re: 把多个文件中的180条蛋白序列ID替换为物种编号

Re: 把多个文件中的180条蛋白序列ID替换为物种编号