蛋白质结构PDB文件详细解释
欢迎您关注“ BioEngX 生化工程实验室 ”微信公众平台!...
蛋白质数据库Protein Data Bank(PDB)是一个包含蛋白质、核酸等生物大分子的结构数据的数据库,网址是http://www.rcsb.org。PDB可以经由网络免费访问,是结构生物学研究中的重要资源。为了确保PDB资料的完备与权威,各个主要的科学杂志、基金组织会要求科学家将自己的研究成果提交给PDB。PDB数据库存储结构数据的文件是PDB文件,每一个蛋白质或核酸都对应着一个编号,即PDB ID, 文件的扩展名为.pdb。PDB文件可以由各种3D 结构显示软件打开,比如pymol,Swiss-PDB viewer,VMD 等。
PDB文件里面的信息是有严格的格式的。各行数据, 如标识, 原子名, 原子序号, 残基名称, 残基序号等, 不仅要按照严格的顺序书写, 而且各项所占的空符串长度, 及其所处的各行的位置都是严格规定。今天小编就为大家介绍一下PDB文件中信息的格式。
一. 标题部分
1. HEADER: 分子类, 公布日期, ID号
2. OBSLTE: 注明此ID号已改为新号
3. TITLE: 说明实验方法类型
4. CAVEAT: 可能的错误提示
5. COMPND: 化合物分子组成(比如 蛋白质以及配体)
6. SOURCE: 化合物来源(比如来源大肠杆菌的某种酶)
7. KEYWDS: 关键词
8. EXPDTA: 测定结构所用的实验方法
9. AUTHOR: 结构测定者
10.REVDAT: 修订日期及相关内容
11.SPRSDE: 已撤销或更改的相关记录
12.JRNL: 发表坐标集的文献
13.REMARK REMARK 1: 有关文献
REMARK 2: 最大分辨率
REMARK 3: 用到的程序和统计方法. 该记录用来记述结构优化的方法和相关统计数据.
REMARK 4-999: 其他信息
二. 一级结构
1. DBREF: 其他数据库的有关记录
2. SEQADV: PDB与其他数据库内记录的出入
3. SEQRES: 残基序列
4. MODRES: 对标准残基的修饰
三. 杂因子
1. HET: 非标准残基
2. HETNAM: 非标准残基的名称
3. HETSNY: 非标准残基的同义字
4. FORMOL: 非标准残基的化学式
四. 二级结构
1. HELIX: 螺旋
2. SHEET: 折叠片
3. TURN: 转角
五. 连接注释
1. SSBOND: 二硫键
2. LINK: 残基间化学键
3. HYDBND: 氢键
4. SLTBRG: 盐桥
5. CISPEP: 顺式残基
六. 晶胞特征及坐标变换
1. CRYST1: 晶胞参数(NMR除外).
该记录用来记述晶胞结构参数(a, b, c, α, β, γ, 空间群)以及Z值(单位结构中的聚和链数).
2. ORIGXn: 直角-PDB坐标
3. SCALEn: 直角-分数结晶学坐标(n=1, 2, 3, NMR除外).
该记录介绍数据中直角坐标向部分晶体学坐标的转换.
4. MTRIXn: 非晶相对称
5. TVECT: 转换因子
七. 坐标部分
1. MODEL: 多亚基时示亚基号
当一个PDB文件中包含多个结构时(例:NMR结构解析), 该记录出现在各个模型的第一行. MODEL记录行的第11-14列上记入模型序号. 序号从1开始顺序记入, 在11-14列中从右起写. 比如说有30个模型, 则第1至9号模型, 该行的7-13列空白, 在14列上记入1-9的数字; 第10-30号模型, 该行的7-12列空白, 13-14列上记入10-30的数字.
2. ATOM: 标准基团的原子坐标
该记录记述了标准氨基酸以及核酸的原子名, 残基名, 直角坐标, 占有率, 温度因子等信息.
3. SIGATM: 标准差
4. ANISOU: 温度因子
5. SIGUIJ: 各种温度因素导致的标准差
6. TER: 链末端
该记录表示链的末端,在每个聚合链的末端都必须有TER记录, 但是由于无序序列而造成的链的中断处不需要该记录.
7. HETATM: 非标准基团原子坐标
该记录记述了标准氨基酸以及核酸以外的化合物的原子名, 残基名, 直角坐标, 占有率, 温度因子等信息.
8. ENDMDL: 亚基结束
与MODEL记录成对出现, 记述在各模型的链末端的TER记录之后.
八. 连通性部分
1. CONECT: 原子间的连通性有关记录
九. 簿记
1. MASTER: 版权拥有者
2. END: 文件结束
该记录标志PDB文件的结束, 是必需的记录.我们最后再看一下PDB文件中坐标部分每一列的含义:
示例
说明
列
说明
1 - 6
记录类型
7 - 11
原子序号
13 - 16
原子名称往往从第14位开始写, 占四个字符的原子名称才会从第13位开始写
17
额外定位符
18 - 20
残基名称
22
原子所属的链
23 - 26
残基序列号
27
残基插入代码
28 - 30
留空
31 - 38
x坐标
39 - 46
y坐标
47 - 54
z坐标
55 - 60
占有率
61 - 66
温度因子
67 - 72
留空
73 - 76
区段标识
77 - 78
元素符号, 右对齐
79 - 80
原子电荷
更多精彩内容,请访问我们的官网:http://www.bioengx.com
历史文章
点击下列链接,浏览历史好评文章~~
- 全看懂证明你是猴子请来的生物学霸!
- 莫受魏则西事件影响,误解了免疫治疗
- 纳尼!啤酒与生物工艺也能扯上关系? 一篇文章让你彻底读懂啤酒!
- 同样都是动物,为啥会有红肉和白肉之分?
- 减肥,我们是专业的!
- 卖肾换iphone"时代"或将被终结!这到底是为什么?
- 世界首例婴儿白血病患者被成功治愈!
- 锅里加点盐真的能加速煮沸水吗?
- 癌症为何难以根治?
- 等你老了,估计可以少担心一种疾病的发生了~
- 晒被子后的“太阳味”是螨虫被烤死的味道?
- 喝酒脸红的人, 酒量到底能不能练出来
- PCR进化,超进化,究极进化~~~
- 菌落PCR 101
- 巢式PCR 101
- 降落式PCR 101
- 提取质粒DNA和基因组DNA的区别
- Km, Kcat 傻傻分不清楚
- Western Blot 常见问题和处理方法
- 一张图,掌握Western Blot中的化学发光法!
- DNA电泳常见问题与对策
- 分子生物学实验室内常见有毒物质及防护措施
- 提纯你的DNA样本,很急、很关键!
- 关于Bradford Assay, 你可能不知道的事
- 利用Photoshop为免疫印迹做图技巧
- 你知道为什么DNA 比RNA 稳定吗?
- DNA 测序技术的发展:第三代测序法
BioEngX是一个生化领域人才深度交流的平台:你可以在这里分享实验技术与经验,表达自己的科研领悟与想法;你同样可以在这里向大众普及生化知识或是解释科学现象。这虽然是一个快节奏的时代,微博大行其道,但思想的交流与碰撞绝不是140个字所能承付起的。因此每一个作者将在我们网站中拥有一个博客账户。如果你有发声的愿望,乐于表达与分享,欢迎加入我们。扫描二维码,加入到BioEngX Writer Pool,分享你的知识,传播你的能量。
BioEngX
BioEngX---活跃在移动端的无国界学术圈持续推送生化工程领域科普文章、科研动态、实验技术及海外名校本科研究生课程安排、博士/博士后职位信息等。
http://www.bioengx.com/
关注 BioEngX生化工程实验室
微信扫一扫关注公众号