一种基于组合特征的大肠杆菌σ70启动子识别算法 |
| |
作者姓名: | 杜耀华 敖伟 倪青山 王正志 |
| |
作者单位: | 国防科技大学,机电工程与自动化学院,湖南,长沙,410073 |
| |
基金项目: | 国家自然科学基金资助项目(60471003) |
| |
摘 要: | 启动子识别是研究基因转录调控的重要环节,但目前算法的识别正确率偏低.在深入分析启动子生物特征的基础上,提出了一种基于多种特征组合的大肠杆菌σ70启动子识别算法,在启动子序列的组成特征、信号特征和结构特征中选取10种典型特征,以此为依据,对位于非编码区和编码区内部的启动子分别加以识别.首先通过特征描述模型分别计算各种特征在启动子序列和非启动子序列中的得分,将特征得分组合成10维特征向量,再利用二次判别分析法在特征向量集上进行训练和识别.在实际数据集中进行的刀切法测试验证了算法的有效性.对位于非编码区的启动子,平均正确率达到了86.7%,明显优于其它算法;对位于编码区内部的启动子,平均正确率也达到了82.4%.算法还具有良好的可扩展性,能够方便地容纳新特征,使识别性能不断提高.
|
关 键 词: | 大肠杆菌 σ70启动子识别 组合特征 二次判别分析法 刀切法 |
文章编号: | 1001-2486(2005)06-0113-07 |
收稿时间: | 2005-06-13 |
修稿时间: | 2005-06-13 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《国防科技大学学报》浏览原始摘要信息 |
|
点击此处可从《国防科技大学学报》下载免费的PDF全文 |
|