论文地址:PEER:A Comprehensive and Multi-Task Benchmark for Protein Sequence Understanding
PEER:蛋白质序列表征评估benchmark
Abstract
提出蛋白质序列表征评估的benchmark,包括 protein function prediction, protein localization prediction, protein structure prediction, protein-protein interaction prediction, and protein-ligand interaction prediction。此外,还调研了不同方法在多任务学习设置上的性能,实验表明大规模预训练的蛋白质语言模型性能最好
Introduction
受到ImageNet和GLUE的启发,希望构建一个蛋白质的全面基准数据集,包含了17个生物相关的任务覆盖了不同方面的蛋白质理解。测试了CNN,LSTM,Transformers和大规模的预训练模型等