期刊:《scientific reports》(nature 子刊)
JCR分区:Q1

随着抗癌肽(anticcancer peptides,ACPs)在癌症治疗中的广泛应用,人们提出了几种基于机器学习的ACP识别方法。尽管现有方法具有较高的预测精度,但此类模型使用了大量描述符和复杂的集成方法,因此导致低解释性,从而对生物学家和生物化学家构成挑战。因此,有必要开发一种简单、可解释和有效的预测因子,以准确识别ACP,并为合理设计具有临床应用潜力的新抗癌肽提供手段。在此,我们提出了一种新的灵活评分卡方法 #flexible scoring card method(FSCM)

该方法利用局部和全局序列信息的倾向评分来开发基于序列的ACP预测器(iACP FSCM),以提高预测精度和模型的可解释性。

据我们所知,iACP FSCM代表了第一个基于序列的ACP预测因子,通过使用FSCM衍生的倾向评分,深入理解肽抗癌活性增强的分子基础。

独立测试结果表明,iACP FSCM的准确度为0.825和0.910,分别根据主要数据集和备选数据集进行评估。比较基准测试的结果表明,iACP FSCM在主数据集上的准确度和MCC分别显著提高7%和17%,优于其他七个现有的ACP预测值。

此外,iACP-FSCM(0.910)与最先进的集成模型AntiCP2.0(0.920)在可选数据集上的结果非常相似。

#平常的结果相近的话,也没关系。

比较结果表明,考虑到iACP FSCM的简单性、可解释性和可推广性,它是最适合ACP识别和表征的选择。人们高度预期,iACP FSCM可能是一个强大的工具,用于快速筛选和识别有临床应用前景的ACP。

抗癌肽(ACPs)是对癌细胞具有选择性和毒性的小肽。由于其固有的高渗透性、高选择性和易修饰性,合成肽基药物和疫苗1-3代表了一类有前途的治疗剂。设计的ACPs可以提高亲和力、选择性和稳定性,从而增强癌细胞的清除能力。氨基酸残基对ACPs抗癌活性的影响取决于阳离子、疏水和两亲性质,螺旋结构驱动细胞通透性。特别是,阳离子氨基酸残基(即赖氨酸、精氨酸和组氨酸)可以破坏并穿透癌细胞膜,从而诱导细胞毒性,而阴离子氨基酸(即谷氨酸和天冬氨酸)则具有抗癌细胞增殖的活性。此外,疏水性氨基酸残基(即苯丙氨酸、色氨酸和酪氨酸)对癌症细胞毒活性发挥作用1,4,5。此外,由阳离子和疏水性氨基酸形成的ACPs的二级结构在反应中起着关键作用.肽-癌细胞-膜相互作用固有地导致癌细胞分裂和死亡1,6。因此,有必要开发一种简单、可解释和有效的预测因子,以实现准确的ACP识别,并促进具有良好临床应用前景的新抗癌肽的合理设计。

在过去的几年里,大多数现有的方法都是通过使用机器学习(ML)和统计方法应用于多肽序列信息,以区分ACPs和非acps。现有方法的更多细节在两篇综合综述论文s2,3中进行了总结。在不同类型的ML方法,包括支持向量机(SVM)(即,antip8, Hajisharifi等人的方法9,ACPP24, iACP10, LiWang的方法11,iACP-GAEnsC12, TargetACP14和ACPred19)和合集方法(即MLACP13、ACPred19、PTPD21、ACP-DL22、PEPred-Suite20、ACPred-FL15ACPred-Fuse18、PPTPP23)antip_2.025)被广泛用于开发ACP预测因子。

#下了功夫去翻阅文献

正如最近的一篇综述所总结的那样,我们可以看到TargetACP是通过整合分裂的氨基酸组成和伪位置-而开发出来的具体的评分矩阵描述符14,其表现优于基于svm的预测符8 - 12,19,24。在同时,提供了最先进的集成方法,包括PEPred-Suite20和ACPred-Fuse18Rao等人收集的数据集上评估的最高预测精度。

在ACPred-Fuse中,确实如此使用随机森林(RF)模型结合114个特征描述开发。然后,总共是114训练RF模型生成类信息和概率信息用于开发最终模型。

最近,Agrawal等人提出了一种名为antip2.0的更新版本,并提供了两个具有最多pep-的高质量基准数据集(即主数据集和备选数据集)潮汐。antip2.0采用氨基酸组成的极端随机化树(ETree)算法开发(AAC)和二肽组成(DPC)。

在独立测试结果的基础上报告了之前的工作可以发现,与现有的其他ACP预测因子(如:antip8、iACP10、ACPred19, ACPred-FL15, ACPred-Fuse18, PEPred-Suite20)。总而言之,在现有的基础上已经取得了很大的进步方法。然而,现有ACP预测器的两个潜在缺陷促使我们开发一种新的ACP本研究的预测因子。

首先,它们的可解释机制不容易被理解和实现生物学家和生物化学家的观点。现有的ACP模型没有提供一个直接的解释ACPs的生物活性的潜在机制。同时,简单易行可解释的模型在进一步分析多肽的抗癌活性特征时更加有用。其次,其准确性和概括性还有待提高。

考虑到这些问题,我们在此提议开发一种新的基于ml的预测器,称为iACP-FSCM,以进一步提高预测精度,并阐明调控多肽抗癌活性的特性。本文提出的用于预测和分析acp的iACP-FSCM方法的概念框架如图1所示。iACP-FSCM在ACPs预测和表征方面的主要贡献如下。

图1所示。建议的iACP-FSCM系统流程图。iACP-FSCM建议的发展包括以下五个主要步骤:(i)准备训练和独立数据集,(ii)使用统计方法计算初始倾向得分(init-PS), (iii)使用遗传算法(GA)估计优化的倾向得分(opti-PS), (iv)评估iACP-FSCM的预测能力,(v)利用倾向评分和对接方法对ACPs进行表征。

== 首先==,我们提出了一种新颖的、灵活的评分卡方法(FSCM),该方法可以仅利用序列信息有效、简单地预测和表征具有抗癌活性的多肽。FSCM方法是由Huang等人26和Charoenkwan等人27开发的SCM方法的更新版本,它利用了局部和全局顺序信息的倾向评分。

其次,不同于所提供的相当复杂的分类机制。本文提出的iACP-FSCM方法仅使用组成和倾向分数之间的加权和分数来识别acp,该方法易于被生物学家和生物化学家理解和实现。

第三,fscm衍生的倾向评分可以被用来识别信息性的物理化学性质(PCPs),这可能提供关于ACPs局部和全局性质的关键信息。

最后,比较结果显示,iACP-FSCM在ACP的识别和表征方面优于目前最先进的ACP预测器。本文所介绍的iACP-FSCM网络服务器已被证明是健壮的,因为它具有卓越的预测精度、可解释性和公开可用性,这有助于生物学家识别具有潜在生物活性的acp。

此外,提出的FSCM方法在估计氨基酸和二肽的倾向评分方面有很大的潜力,这些可用于预测和分析多肽的各种生物活性,如溶血肽28、抗高血压肽29和抗病毒肽20,23。

数据集

为了与现有的方法进行公平的比较,本文采用了从antip_2.025中收集到的最新且高质量的基准数据集(即主数据集和备用数据集)来开发和验证本文提出的iACP-FSCM模型。这两个数据集都可以从https://web下载。Iiitd .edu.in/ragha va/antic p2/downl load .php。

主数据集由861个实验验证的ACPs和861个AMPs组成,替代数据集由970个实验验证的970个ACPs和970个随机多肽组成。

主数据集和备选数据集上的所有肽都是唯一的。为了避免在预测模型中被高估,将主数据集和备选数据集按照80:20的比例随机分为训练集(main - tr和ALTER-TR)和独立集(main - ts和ALTER-TS)。关于构建主数据集和备选数据集的进一步细节,在antip_2.025的原始工作中提供。

蛋白质特征提取

在本研究中,我们使用了由3种不同的特征编码(AAC、DPC和末端组合)生成的11个特征类来表示肽序列作为固定长度的特征向量。在这里,我们将在下面的小节中简要描述每个特征编码的定义。

氨基酸组成。AAC是给定肽p中任意氨基酸的比例。AAC描述符可以表示为:
AAC§ = (aac1, aac2,…aac20)

其中aaci是第i个氨基酸(aai)的标准化组成。AAC描述子的维数为20。
二肽成分。DPC是给定肽p中任意两个相邻氨基酸(aai, aaj)的比例。DPC描述符可以表示为:
DPC§ = (dpc1, dpc2, . . . , dpc400)

其中lpci是第i个二肽(dpi)的归一化组成。DPC描述符的维数是400。

终端区域的组成。记住,N -糖基上的信息是重要的生物活性peptides7, 8日,19日,30-33,我们因此DPC信息计算使用第一个5、10和15 N的残留物(也就是说,它们被N10 N15,分别)和C末端(例如C5, C10 C15,分别)。此外,我们还将这些末端序列与它们的DPC进行了如下连接:N5C5, N10C10和N15C15。终端区域描述符的DPC维数为400。

*Flexible scoring card method. (灵活的卡片计分方法)

原始的SCM方法仅使用全局顺序信息(即20个氨基酸(APS)和400个二肽(DPS)倾向评分)来预测和分析蛋白质。

受此方法的启发,我们开发并实现了一种新的灵活的基于scm的方法,称为FSCM,通过利用多肽的局部和全局序列信息,进一步提高预测的准确性和可解释性。

DPS被用于提供局部序列信息,因为它们比APS具有更好的预测性能和提供更多的信息。FSCM方法对N- (N5PS、N10PS和N15PS)和C- (C5PS、C10PS和C15PS)端以及它们的联合端序列(N5C5PS、N10C10PS和N15C15PS)上400个二肽的倾向评分进行了估计。

在提出的iACPFSCM中,我们建立了11个FSCM模型,分别使用不同的倾向分数在主数据集和备选数据集的N-和c -末端的氨基酸、二肽和二肽。下面,我们简要介绍C15PS在主数据集上的基本概念和优化过程,因为其他类型的倾向得分可以在相同的过程中估计,而无需进行重大修改。
阶段1:准备培训(MAIN-TR)和独立(MAIN-TS)数据集,用于开发和评估上述建议的模型。

第二阶段:计算C末端前15个残基上400个二肽的初始倾向分数(initiit - c15ps)。根据Charoenkwan等人的34 - 37,初始化c15ps估计如下:

Step 1:计算在ACP和非ACP中发现的所有400个二肽的频率。
例如,KK在ACP类和非ACP类的出现频率分别为280次和40次。

KK在一类出现ACP

Step 2:计算ACP类和非ACP类二肽的总数量与每种二肽的比值。
例如,ACP类和非ACP类的二肽总数分别为450和200。因此,KK二肽在ACP类和非ACP类(分别称为NPS+和NPS-)中的归一化成分分别为0.622和0.2。

#280/450=0.62

2

Step 3:用NPS-减去NPS+计算每个二肽的得分。例如DE二肽的得分为0.422(0.622-0.2)。

Step 4:将每个二肽的分数归一化到0-1000的范围内。

第三阶段:
使用GA算法估计优化后的400个二肽(opti-C15PS)的倾向评分和阈值。本研究中使用的GA算法的更多细节可以在补充信息S1中找到。获得最佳opti-C15PS,相应的阈值进行健身function26, 27日,预测性能的AUC (W1)和皮尔逊相关系数(W2) init-C15PS和opti-C15PS之间是线性组合十倍交叉验证和评估的过程.
F(opti − C15PS) = W1 × AUC + W2 × R

其中,W1和W2分别为0.9和0.1。此外,W1和W2的权重是根据我们之前的研究设定的27,34 - 37

第四阶段:
使用第三阶段的opti-C15PS计算20个氨基酸的倾向分数。以赖氨酸为例,对40种含赖氨酸的二肽的倾向评分取平均,计算出赖氨酸的倾向评分。

:第五阶段:
利用评分函数S§和Phase 3的opti-C15PS预测未知肽§。如果S§大于阈值,则预测查询肽P为ACP,否则预测P为非ACP

其中DPi和PSi分别代表optiC15PS中第i个二肽的出现频率和倾向评分,其中i = 1, 2, 3,…,400

第六阶段:
利用准确度(Ac)、灵敏度(Sn)、特异性(Sp)和Matthew’s系数相关(MCC) 4个被广泛应用的二值分类问题指标,评估模型的预测能力38,39。受试者工作特征(ROC)曲线被绘制,以进一步研究该模型使用阈值无关参数的预测性能。关于这些指标定义的更多细节可以在补充数据S1中找到。

多肽抗癌活性的表征

20个氨基酸的倾向评分是提供信息的PCPs,用于提供对抗癌活性的基础和重要因素的深入了解。其中,各氨基酸的倾向得分反映了其对多肽生物学、功能和结构性质的影响。众所周知,PCPs是与生物物理和生化反应相关的最直观的特征描述物之一。信息性PCPs由iACP-FSCM方法根据三个主要步骤测定。首先,将不适用(NA)作为其氨基酸指标的PCPs剔除,共531个PCPs40用于本研究。其次,计算了531种PCPs氨基酸倾向得分之间的皮尔逊相关系数®值。最后,将R绝对值大于0.5的pcp作为候选pcp进行进一步分析

研究可重复性

为了确保模型的可重复性和重现性,所有代码和基准数据集(即主数据集和备用数据集)都可以在GitHub的https:// github.com/Shoom buato ng/Datas et-Code/tree/ master r/iACP-FSCM上获得。

结果与讨论

对主数据集的性能评估。在本研究中,我们利用AAC、DPC和终端组成的3种不同的特征编码(即N5、C5、N5C5、N10、C10、N10C10、N15、C15和N15C15)生成11个特征类。特别是,这导致产生了11种倾向评分(即APS、DPS、N5PS、C5PS、N5C5PS、N10PS、C10PS、N10C10PS、N15PS、C15PS和N15C15PS)。为了研究哪些类型的倾向得分有利于区分acp和非acp,我们在主数据集上通过十倍交叉验证和独立测试对不同类型的倾向得分进行了性能比较。

对于每种类型的倾向分数,GA算法生成10组倾向分数,然后用于开发10种不同的FSCM分类器。

表1和表2分别列出了通过十倍交叉验证和独立测试从每种倾向得分的最优集获得的最佳预测结果(图2)。
·
由表1和补充表S1可以看出,使用C15PS得到的最佳Acc为0.754,MCC为0.496,AUC为0.762(图3A)。同时,N5C5PS和N5PS的使用表现良好,相应的第二和第三高的Ac/MCC分别为0.750/0.508和0.750/0.504。如表1所示,广泛使用的DPS (Ac为0.726,AUC为0.754)在五项评价指标上的表现与C15PS相当。在独立测试结果的情况下,表2显示,C15PS也取得了比其他类型的倾向得分更好的性能,Ac为0.825,MCC为0.646(图3B)。同时,N15C15PS和N15PS表现良好,独立检验第二高和第三高,Ac分别为0.796和0.783。因此,我们选择基于fscm的分类器结合C15末端400个二肽(C15PS)的倾向分数作为使用主数据集进行ACP识别的最佳分类器。

这些结果表明,局部序列信息在区分acp和非acp时比全局序列信息起着更重要的作用。

可选数据集的性能评估

在本节中,使用与主数据集中使用的相同的实验设置(从原始工作中获得)来确定哪种类型的倾向得分对于区分替代数据集中的ACPs和随机肽是最有效的。使用各种类型的倾向评分进行了一系列的性能比较实验,并通过十倍交叉验证和独立检验对其结果进行了比较,如表3和表4所示

从表3,可以看出该模型提供最高的交流与对应的值为0.884的0.770和0.924的AUC MCC通过使用APS(图3 c),而模型提供第二个和第三个最高的Ac值0.872和0.867,分别获得使用DPS和N15C15PS,分别。从独立检验的结果来看(表2),APS和DPS在排名最高的2个分类器中,预测结果也最高。此外,DPS的性能略优于APS (Ac为0.910 vs 0.889, MCC为0.820 vs 0.779)。同时,我们发现APS比从AUC值推导出的DPS特征具有非常大的可比性(图3D)。因此,我们选择基于fscm的分类器结合全序列(APS)中20个氨基酸的倾向分数作为备选数据集上ACP识别的最佳分类器。为了方便起见,FSCM方法与选定的倾向评分(主要数据集和备选数据集分别为C15PS和APS)一起被称为iACP-FSCM。基于上述观察,可以证明iACP-FSCM对主要数据集和备选数据集都能提供令人满意的结果,因为acp的成分信息影响了癌细胞细胞膜的相互作用、穿透细胞膜、然后通过它们的物理化学性质(如两性性、疏水性和二级结构)来判断癌细胞的细胞毒性1。

表3。在可选数据集上评估具有各种序列特征的FSCM模型的交叉验证结果。

iACP-FSCM与现有方法的比较

为了进一步评估所提出的iACP-FSCM的预测效率和有效性,我们在相同的基准数据集上比较了其与现有方法的性能。表5列出了iACP-FSCM与现有方法在主数据集和备用数据集上经过独立测试的性能比较。表5中已有方法(即AntiCP8、iACP10、ACPred19、PEPred-Suite20、ACPred-FL15、ACPred-Fuse18和AntiCP_2.025)的预测结果直接来自于work。

从表5的结果可以看出,iACP-FSCM的性能明显优于现有方法,Ac(0.825)、Sp(0.903)、MCC(0.646)最高。在主数据集上,与最先进的方法相比,Ac、Sp和MCC分别提高了7%、17%和14%。此外,与现有的包括PEPred-Suite、ACPred-FL和ACPred-Fuse的集成方法相比,iACP-FSCM实现了大于14%的Ac增长。虽然AntiCP和ACPred的Sn值高于iACP-FSCM,但相应的Sp和MCC值明显低于iACP-FSCM。在备选数据集的对比结果中,我们注意到,AntiCP_2.0的准确率最高,为0.920,MCC为0.840(表S3)。与此同时,从ACP(0.900, 0.800)和iACP-FSCM(0.889, 0.779)分别获得了第二和第三好的ACP预测因子(Ac, MCC)。虽然与我们提出的iACP-FSCM相比,AntiCP_2.0得到了更好的预测结果,但对生物学家和生物化学家的解释性和实用价值有限。另一方面,iACP-FSCM提供的倾向评分可能提供与acp局部和全局特性相关的关键信息,易于理解和实现。此外,提出的iACP-FSCM具有良好的可解释性和预测性能,是一种更实用的方法。总之,这些结果表明,iACP-FSCM在主数据集和备选数据集的简洁性、可解释性和通用性方面都提供了更令人印象深刻的预测性能

使用倾向评分来描述多肽的抗癌活性。

与支持向量机和集成方法等黑箱建模方法不同,iACP-FSCM方法的优势在于,从FSCM方法获得的氨基酸和二肽的倾向评分估计值可以很容易地识别出信息丰富的pcp,从而更深入地了解抗癌活性肽的特征。表6记录了从DPS中得到的20个氨基酸为ACPs的倾向分数(图2),使用Matlab (R2020a)进行计算。倾向性得分最高的5个氨基酸分别为Tyr、Trp、His、Met和Lys(355.55、328.60、317.03、311.58和296.78),倾向性得分最低的5个氨基酸分别为Gln、Val、Gly、Cys和Arg(198.45、212.55、225.08、226.38和229.63)。以400个二肽为ACPs的倾向性得分为例,图2显示排名前5位的二肽倾向得分最高的二肽为KK、LW、GH、HI和MY,而倾向得分最低的五种二肽为KG、LD、LV、CR和TT。

在生物学过程中,癌细胞的发育主要是由电离辐射机制对细胞造成的自由基损伤引起的,尤其是DNA损伤5。同时,活性氧具有致癌、生长阻滞、细胞毒性和不可逆损伤等作用。ACPs上的氨基酸组成可作为细胞的抗氧化剂和食物来源。有趣的是,倾向得分最高的五种氨基酸被报道为抗氧化活性的重要因素。由于Tyr和Trp侧链上有富电子的芳香环,Met侧链上有两个孤电子对的硫原子和His侧链上有一个孤电子的氮原子容易被氧化41。在抗氧化氨基酸中,Trp在天然多肽中含量较低,但在生物分子活性中起着至关重要的作用,且易被化学修饰42。虽然,他是其中排名前5的GH、HI等含His的二肽之一。此外,AH和LH在斑马鱼胚胎模型中表现出抗血管生成活性,但无明显的抗癌潜力43。

众所周知,癌症的代谢主要集中在糖酵解和三羧酸循环。许多癌细胞的增殖高度依赖于谷氨酰胺和丝氨酸的摄取,而这两种氨基酸是消耗最多的营养物质。Choi和Coloff提出,Gln作为发育不全的代谢物,在TCA循环中发挥着至关重要的作用,维持线粒体ATP的产生45。同时,肿瘤的进化利用了谷氨酰胺作为替代燃料,以优化养分利用。同样,作为支链氨基酸之一的缬氨酸,可以作为TCA循环的燃料46。Gln和Gly为碱基的合成提供必需的碳和氮源,有利于细胞通过DNA/RNA合成的能量消耗过程47。虽然Gly是倾向评分最低的五大氨基酸之一,但含有Gly或Pro的二肽在体外肿瘤人类细胞系如A549肺癌细胞系48中具有良好的细胞毒性。在分析了fscm衍生的倾向分数后,这些结果表明,具有高倾向分数的氨基酸可能在通过氧化保护过程显示抗癌活性方面很重要,而具有低倾向分数的氨基酸在作为癌细胞的饮食来源方面可能是重要的,同时也在抗癌活性方面提供了相互矛盾的效果。

使用信息丰富的物理化学特性来描述抗癌活性

本节利用iACP-FSCM方法对其抗癌活性的基础和重要因素进行了更深入的了解。在之前的研究中,多肽的理化性质(如氨基酸序列、长度、净电荷、二级结构、两亲性和疏水性)对其溶血活性、穿透能力和抗癌/抗肿瘤活性起着至关重要的作用1,19,49 - 52。从iACP-FSCM中选取的三个重要PCPs由MITS020101(两亲性指数)、QIAN88011(6窗口位置alpha-helix的权重)和JOND750101(疏水性)组成,如表6所示。此外,补充表S4给出了前20个信息性pcp的详细信息。

众所周知,Trp的倾向值为328.20,是一种常见的氨基酸,具有两亲性、α螺旋性和疏水性。Lee等人研究了Pep27类似物的抗癌活性与其溶血活性和疏水性之间的关系。他们发现,Trp取代Pep27类似肽后,在RP-HPLC保留时间的基础上增加了Pep27的疏水性。(11Ser→Trp)和(13Qln→Trp)取代的Pep27anal2具有最强的疏水性,RP-HPLC保留时间为22.50 min, IC50 (10-28 μM)和IC90 (35-55 μM)在5个癌细胞系41中表现出最强的抗癌活性。这个观察结果与之前的53,54,这表明,通过疏水Trp或Phe拉伸,对六聚肽RRWQWR和RRWWRF的末端capping和环化,或对短肽KNK10 (knkkkgkkgkkngkkngkhngwk)和GKH17 (gkhknk17)的末端标记,可以增强ACPs的稳定性并抑制蛋白降解。

表6显示Lys, His和Arg(即阳离子氨基酸)为两亲性指数(MITS020101)和α -螺旋(QIAN88011)性质提供了可接受的倾向分数。这三种氨基酸通过两亲性α -螺旋结构转变来描述,这种转变将赖氨酸分离在一面,而Ile分离在另一面,并与带负电荷的细胞膜相互作用,从而产生较高的抗癌活性53,55。此外,八组氨酸-八精氨酸(H8R8)肽是一种常见的阳离子细胞穿透肽,具有核内体逃逸能力。修饰后的H8R8是脂质修饰的阳离子肽(即硬脂基H8R8和维生素E琥珀酸-H8R8),具有两亲性、可生物降解和脂质结构的功能,可增加活性氧的产生,减少细胞生物能和药物外排,触发细胞凋亡和G1细胞周期阻滞。线粒体去极化从而导致癌细胞毒性和死亡。由于Trp的吲哚侧链倾向于与脂质双分子层的界面区相互作用,而肽上的Lys和Arg侧链提供正电荷和氢键能力以吸引带负电荷的细胞膜磷脂头群54,57,58。此外,芳香残基的侧链(如色氨酸和苯丙氨酸),其中主环的一侧形成疏水面,与胶束相互作用6。含有Trp、Phe、Lys、His或Arg的ACPs与癌细胞细胞膜之间的这种相互作用在癌细胞被消灭的情况下经常被发现。上述iACP-FSCM的结果与前人的研究结果(6,53 - 59)一致,其中ACPs的物理化学性质(即两亲性、螺旋结构和疏水性)与ACPs与细胞表面的相互作用有关。这种相互作用导致ACPs转变为螺旋结构,使脂肪侧链的空间排列有利于膜插入。螺旋构象的转向稳定促进了链内氢键并介导了主干的疏水性,从而导致肽更深地插入脂质双层59。

结论

在本研究中,我们首次提出了一个计算模型,称为iACP-FSCM,通过使用新的FSCM方法获得的局部和全局顺序信息的倾向分数,用于ACP的识别和表征。结果表明,iACP-FSCM可以很容易地通过加权和评分和单一阈值来识别acp。这与使用大量ML分类器和特征描述符方案开发的复杂集成分类器进行了比较。此外,fscm衍生的倾向评分可以被用来识别信息丰富的物理化学性质,这些性质可能提供与ACPs局部和整体性质相关的关键信息。基准比较结果验证了该方法的有效性和鲁棒性。我们进一步应用iACP-FSCM鉴定了潜在的抗HIF-1α的多肽类药物,并获得了一系列潜在的抗HIF-1α的多肽。有了这些有希望的结果,iACP-FSCM有望成为一种重要的工具,用于在各种类型的癌细胞合成前对有希望的acp进行快速筛选。为了开发一种方便的生物信息学工具,所提议的模型被部署为一个网络服务器,该服务器可在http://camt.pytho nanyw here.com/iACP-FSCM公开获得。由于本研究提出的FSCM方法的高潜力,该方法可以很容易地用于预测和表征其他治疗性肽,如细胞穿透肽63、抗病毒肽20、23和预测抗高血压肽20、23、溶血肽31。

利用一种新的灵活记分卡方法改进肽抗癌活性的预测和表征相关推荐

  1. SaltStack介绍——SaltStack是一种新的基础设施管理方法开发软件,简单易部署,可伸缩的足以管理成千上万的服务器,和足够快的速度控制,与他们交流...

    SaltStack介绍和架构解析 简介 SaltStack是一种新的基础设施管理方法开发软件,简单易部署,可伸缩的足以管理成千上万的服务器,和足够快的速度控制,与他们交流,以毫秒为单位.SaltSta ...

  2. 一种新的满意度调查方法 NPS(net promoter score 净推荐值)

    r语言中计算NPS的包: https://cran.r-project.org/web/packages/NPS/index.html 在企业与客户的互动中,最关键的环节就是有效地收集客户反馈,作为决 ...

  3. Google Earth Engine(GEE)——Landsat TOA影像一种新的去云方法

    利用光学仪器获取的地球观测卫星图像需要自动和准确的云检测.云层检测的多时空方法通常比其单一场景的方法更强大,因为云层的存在在不同的采集中变化很大,而表面在广义上可以假设是静止的.然而,两个实际的限制通 ...

  4. python中ra_consumers-在Python中并行化处理的一种简单、灵活的方法。-Andrew Rabert Documentation Example...

    作者:Andrew Rabert 作者邮箱:arabert@nullsum.net 首页:https://github.com/nvllsvm/consumers 文档:None 下载链接 consu ...

  5. 一种新的高级抖动分离解析方法

    一种新的高级抖动分离解析方法 A new analytic approach for advanced jitter separation 抖动分量的分析是现代通信系统调试中一项越来越重要的任务.一方 ...

  6. python 水位_一种适用于利用图像识别水位的水位尺的制作方法

    本实用新型涉及水利信息化领域,特别涉及一种适用于利用图像识别水位的水位尺. 背景技术: 水位是反映江河.水库等水体涨落的重要指标.掌握水位变化情况对做好涉水工程规划建设与管理.防汛抗旱,群众避险转移等 ...

  7. LIOM: 一种新的激光惯性里程计和建图方法

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者:robot L | 来源:知乎 https://zhuanlan.zhihu.com/p/137 ...

  8. 矩阵奇异值计算的一种新方法——基于R语言实现

    传统奇异值分解 奇异值分解技术(Singular Value Decomposition,SVD)是一种矩阵分解方法,实际上是计算矩阵的特征值.若A是实对称矩阵,并且矩阵的A的阶次为n,则存在正交矩阵 ...

  9. 单目全向立体相机的标定(一种新的相机形式)

    点云PCL免费知识星球,点云论文速读. 文章:Calibration Method of the Monocular Omnidirectional Stereo Camera 作者:Ryota Ka ...

  10. Andrej Karpathy发文谈神经网络:这不仅仅是分类器,这是一种新的软件开发思想

    作者: 晓凡 概要:有越来越多的传统编程语言(C.C++.Java)等程序员开始学习机器学习/深度学习,而对机器学习/深度学习的研究人员来说,编程也是必备技巧. 有越来越多的传统编程语言(C.C++. ...

最新文章

  1. MongoDB基础教程系列--目录结构
  2. Winform中怎样重写窗体关闭事件实现验证密码通过才能关闭窗体
  3. js添加多个子节点_DOM节点
  4. 两个计算机系统安装,如何在一台电脑上同时重装两个系统|戴尔电脑怎么安装两个系统...
  5. switch omega - VNP
  6. (pytorch-深度学习系列)pytorch避免过拟合-权重衰减的实现-学习笔记
  7. android adb 静默安装,Android_如何静默安装
  8. node.js 异步_Node.js v14中的异步本地存储是什么?
  9. 【Shell教程】二----Shell变量,通配符,转义符
  10. 假期的游戏陪玩市场,有人挣钱有人被骗
  11. 央采数据库集采:甲骨文、微软、腾讯、阿里等 21 家中标
  12. fft_fft_control
  13. designer pyqt5 界面切换_PyQT5堆叠布局:切换界面(QStackedLayout)
  14. Pointnet网络结构与代码解读
  15. BERT模型—2.BERT模型预训练与微调
  16. 179. 最大数 largestNumber
  17. 区域工业互联网市场成绩单,百度智能云开物第二
  18. 《数据挖掘导论》 - 读书笔记(3) - 数据 [2016-8-13]
  19. 怎样让windows xp自动登录
  20. (2)组合数学-拉丁方

热门文章

  1. 国家或地区内期货市场竞争格局的变迁
  2. 使用 Android Studio 内置的模拟器体验原生安卓
  3. 虚幻4全自动连续射击
  4. Java Simon--性能瓶颈分析工具
  5. 计算机usb显示不出来怎么办,U盘在电脑上显示不出来怎么办
  6. wrapper.and的用法
  7. 洛谷【P1195】口袋的天空
  8. 删除硬盘文件夹失败解决方法
  9. QQ邮箱发送验证码(springboot、redis整合)
  10. 历史大盘跌停记录,2016大盘跌停原因