利用中心性在蛋白质相互作用网络中挖掘关键蛋白质的研究
来源:wenku163.com 资料编号:WK1637547 资料等级:★★★★★ %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9AWK1637547
资料介绍
利用中心性在蛋白质相互作用网络中挖掘关键蛋白质的研究(附答辩记录)(包含选题审批表,任务书,开题报告,中期检查报告,毕业论文17600字)
摘 要:关键蛋白质是生物体生存和繁殖所必需的蛋白质,在生命活动中扮演重要角色。关键蛋白质的识别对于生命科学的研究具有重要意义,在疾病诊治和药物设计等方面也具有重要的应用价值。随着高通量技术的发展,可获得的蛋白质相互作用数据日益丰富,基于蛋白质网络的关键蛋白质识别成为新的研究热点。
由于关键蛋白质在生命活动中扮演重要角色,因此对于关键蛋白质的预测与识别成为一项重要的研究工作。在生物学上,关键蛋白质的识别主要是依靠生物实验的方法。通过这些实验技术得到的结论虽然是明确和有效的,但是代价高效率低,并且适用的物种范围有限。因此,利用计算生物学的方法来预测关键蛋白质成为该领域新的发展方向。本课题主要研究基于蛋白质网络的关键蛋白质的识别,重点介绍各种加权与非加权中心性测度方法在关键蛋白质挖掘中的应用。
关键词:蛋白质网络;关键蛋白质;拓扑中心性;加权中心性
Identifying Essential Proteins Based on Centrality in Protein Interaction Networks
Abstract: Essential proteins are proteins that are necessary for organism’s survival and propagation. The discovery of essential proteins is important for understanding the minimal requirements of cellular survival and drug design. With the development of high throughput technologies, protein-protein interaction data are increasing fast and available conveniently, which makes it is possible to identify essential proteins from protein interaction network.
As essential proteins play an important role in the biological organism, it has become an important research work to identify essential proteins. In biology, the identification of essential proteins rely on the biological experiments. The experimental methods can identify essential proteins clearly and effectively. However,they have high cost and the applicable range of the species is limited. Therefore, researchers focused on the computational methods for predicting essential proteins. In the paper, we identify essential proteins based on the centrality of proteins in protein network. Here, the centrality includes six centralities in weighted and un-weighted protein interaction network.
Key words: protein interaction networks; the key protein; edge clustering coefficient;centrality
研究目的
中心性测度是一组基于图论的集中反映节点重要性的指标,并且作为一种主流方法得到了广泛应用。因此,本节我们将把中心性测度应用于关键蛋白质识别研究,通过实验验证关键蛋白质与节点拓扑之间的相关性,并对实验结果进行分析和评价。
研究内容
本课题只要讲述蛋白质网络中关键蛋白质的挖掘,重点讲述节点度中心性和加权中心性的研究特性,其主要内容包括:
1) 蛋白质相互作用网络:在蛋白质网络中,结构与功能的相关性表现为蛋白质在生物功能上的重要性和其在网络中对应节点所处拓扑位置之间的密切联系。
2) 节点度中心性:从全局整体上分析蛋白质网络的拓扑特征,进而研究关键蛋白质和节点拓扑之间的关系。引入六个节点中心性测度,介绍每个测度参数所表示的意义,并将它们用于关键蛋白质的识别。
3) 加权中心性:在加权网络上利用中心性测度进行关键蛋白质识别,并验证该方法的有效性。
2 蛋白质相互作用网络
研究方法
本文将采用一种基于“排序—筛选”原则的统计方法,来评估各种测度参数在识别关键蛋白质方面的效率和精度。具体做法是,对于实验所选的蛋白质网络数据集,计算网络中每个节点的六种中心性测度,将蛋白质按照每种测度参数由大到小进行排序,再按顺序选出一定数量的蛋白质作为预测的蛋白质,与已知的关键蛋白质数据集比对,从而得到各个测度参数的预测准确率。
预期成果
节点的中心性测度仍然是关键蛋白质识别领域的一项重要技术,是衡量了网络中节点关键性的重要指标。
目 录
摘 要 1
关键词 1
1 前言 2
1.1 研究背景 2
1.2 研究现状 3
1.3 研究内容 4
2 蛋白质相互作用网络 4
2.1 概述 4
2.2 蛋白质相互作用网络的幂规律特性 6
2.2.1 度(degree) 6
2.2.2 幂规律特性 6
3 节点中心性 8
3.1 节点中心性测度的研究 8
3.2 基于中心性在蛋白质相互作用网络中挖掘关键蛋白质的研究 10
3.3 本章小结 12
4 加权中心性 13
4.1 概述 13
4.2 加权网络上的中心性测度 13
4.3 基于中心性在加权蛋白质相互作用网络挖掘中关键蛋白质的研究 16
4.2.1 加权网络上的关键蛋白质识别实验 16
4.2.2 实验数据 16
4.2.3 实验结果分析 16
4.2.4 本章小结 20
5 结束语 20
参考文献 21
致 谢 27
|