可康家园

第十六期可康人

人类疾病与基因简介

作者:张伟光(天津可康医药技术开发有限公司 学术部 研究事务经理)

1染色体

染色体(chromosome 是真核细胞在有丝分裂或减数分裂时DNA存在的特定形式,由染色质丝螺旋缠绕,逐渐缩短变粗形成。

染色体(chromosome)来自希腊语χρῶμα(色度,颜色)和σῶμα(体细胞,),描述了它们对特定染料的强染色。染色体由德国科学家von Waldeyer-Hartz创造,取代了发现细胞分裂的德国生物学家Walther Flemming提出的染色质(chromatin)。

1879年德国生物学家弗莱明(Fleming·w)把细胞核中的丝状和粒状的物质,用染料染红,观察发现这些物质平时散漫地分布在细胞核中,当细胞分裂时,散漫的染色物体便浓缩,形成一定数目和一定形状的条状物,到分裂完成时,条状物又疏松为散漫状。

1883年美国遗传学家、生物学家沃尔特·萨顿提出了遗传基因在染色体上的学说。

1888年正式被命名为染色体。

1902年美国生物学家沃尔特·萨顿和鲍维里通过观察发现细胞的减数分裂时染色体与基因具有明显的平行关系,并推测基因位于染色体上。

1928年摩尔根通过果蝇杂交实验证实了染色体是基因的载体,从而获得了生理医学诺贝尔奖。

19534月《自然》杂志刊登了美国的沃森和英国的克里克在英国剑桥大学合作的研究成果:DNA双螺旋结构的分子模型,被誉为20世纪以来生物学方面最伟大的发现。

1956年,美籍华裔遗传学家Joe Hin Tjio1919–2001)和Levan首次发现人的体细胞的染色体数目为46条,标志着人类细胞遗传学的建立。46条染色体按其大小、形态配成23对,第一对到第二十二对叫做常染色体,为男女共有,第二十三对是一对性染色体(Sex Chromosome),雄性个体细胞的性染色体对为XY;雌性则为XX

2 基因

基因(遗传因子)是产生一条多肽链或功能RNA所需的全部核苷酸序列。基因支持着生命的基本构造和性能。储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息。环境和遗传的互相依赖,演绎着生命的繁衍、细胞分裂和蛋白质合成等重要生理过程。生物体的生、长、衰、病、老、死等一切生命现象都与基因有关。它也是决定生命健康的内在因素。因此,基因具有双重属性:物质性(存在方式)和信息性(根本属性)。

20世纪50年代以后,随着分子遗传学的发展,尤其是沃森和克里克提出DNA双螺旋结构以后,人们进一步认识了基因的本质,即基因是具有遗传效应的DNA片段。研究结果还表明,每条染色体只含有12DNA分子,每个DNA分子上有多个基因,每个基因含有成百上千个脱氧核苷酸。自从RNA病毒发现之后,基因的存在方式不仅仅只存在于DNA上,还存在于RNA上。由于不同基因的脱氧核糖核苷酸的排列顺序(碱基序列)不同,因此,不同的基因就含有不同的遗传信息。

3基因分类

3.1结构基因

基因中编码RNA或蛋白质的碱基序列。

1)原核生物结构基因:连续的,RNA合成不需要剪接加工;

2)真核生物结构基因:由外显子(编码序列)和内含子(非编码序列)两部分组成。

3.2 非结构基因

结构基因两侧的一段不编码的DNA片段(即侧翼序列),参与基因表达调控。

1)顺式作用元件:能影响基因表达,但不编码RNA和蛋白质的DNA序列;

其中包括:启动子、上游启动子元件、反应元件、增强子、沉默子、Poly(A)加尾信号。

2)反式作用因子:能识别和结合特定的顺式作用元件,并影响基因转录的一类蛋白质或RNA [2] 

4染色体和基因的关系

人类染色体可分为两种类型:常染色体(体染色体)和性染色体(异体染色体)。某些遗传特征与一个人的性别有关,并通过性染色体传播。常染色体因此包含其余部分的遗传信息。

人类细胞有23对染色体(22对常染色体和一对性染色体),即每个细胞共有46个染色单体。除此之外,人类细胞还有数百个线粒体染色体拷贝。

基因数量是估计值,因为它部分基于基因预测。总染色体长度也是估计值,是基于未测序异染色质区域的大小估计的。如下:

染色体

基因数量

总的碱基对数量

碱基占比

测序的碱基对

测序的碱基对占比

X

800

154,913,754

5.0

151,058,754

97.51%

Y

200

57,741,652

1.9

25,121,652

43.51%

1

2000

247,199,719

8.0

224,999,719

91.02%

2

1300

242,751,149

7.9

237,712,649

97.92%

3

1000

199,446,827

6.5

194,704,827

97.62%

4

1000

191,263,063

6.2

187,297,063

97.93%

5

900

180,837,866

5.9

177,702,766

98.27%

6

1000

170,896,993

5.5

167,273,993

97.88%

7

900

158,821,424

5.2

154,952,424

97.56%

8

700

146,274,826

4.7

142,612,826

97.50%

9

800

140,442,298

4.6

120,312,298

85.67%

10

700

135,374,737

4.4

131,624,737

97.23%

11

1300

134,452,384

4.4

131,130,853

97.53%

12

1100

132,289,534

4.3

130,303,534

98.50%

13

300

114,127,980

3.7

95,559,980

83.73%

14

800

106,360,585

3.5

88,290,585

83.01%

15

600

100,338,915

3.3

81,341,915

81.07%

16

800

88,822,254

2.9

78,884,754

88.81%

17

1200

78,654,742

2.6

77,800,220

98.91%

18

200

76,117,153

2.5

74,656,155

98.08%

19

1500

63,806,651

2.1

55,785,651

87.43%

20

500

62,435,965

2.0

59,505,254

95.31%

21

200

46,944,323

1.5

34,171,998

72.79%

22

500

49,528,953

1.6

34,893,953

70.45%

总计

21,000

3,079,843,747

100.0

2,857,698,560

92.79%

5 人类遗传病

受精卵或母体受到环境或遗传的影响,引起的下一代遗传物质改变(包括基因和染色体两部分)形成的先天疾病,称之遗传病,主要可分为单基因遗传病、多基因遗传病和染色体异常遗传病三类。夫妇携带遗传病基因可以通过生殖传递,近亲结婚或夫妇有共同的血缘关系也有高于常人的几率生下遗传缺陷患者。是难以诊断和治疗,父母的血缘关系越远对后代危害就越轻。遗传病症状分家族遗传病和普通遗传病。

5.1 染色体病或染色体综合征

遗传物质的改变在染色体水平上可见,表现为数目或结构上的改变。由于染色体病累及的基因数目较多,故症状通常很严重,累及多器官、多系统的畸变和功能改变。

5.2 单基因病

目前已经发现6500余种单基因病,主要是指一对等位基因的突变导致的疾病,由显性基因和隐性基因突变所致。所谓显性基因是指等位基因(一对同源染色体同位置上控制相对性状的基因)中只要其中之一发生了突变即可导致疾病的基因。隐性基因是指只有当一对等位基因同时发生了突变才能致病的基因。

5.3多基因病

顾名思义,这类疾病涉及多个基因起作用,与单基因病不同的是这些基因没有显性和隐性的关系,每个基因只有微效累加的作用,因此同样的病不同的人由于可能涉及的致病基因数目上的不同,其病情严重程度、复发风险均可有明显的不同,且表现出家族聚集现象,如唇裂就有轻有重,有些人同时还伴有腭裂。值得注意的是多基因病除与遗传有关外,环境因素影响也相当大,故又称多因子病。很多常见病如哮喘、唇裂、精神分裂症、无脑儿、高血压、先天性心血管疾病、癫痫等均为多基因病。

6 染色体对应的人体疾病

1号染色体:为第一大染色体。

2号染色体:是第二大染色体,含有能编码人体最大蛋白基因(由3.3万多个AA组成的激酶)。

3号染色体:在单个染色体水平发现的蛋白质编码基因最多,其中包括许多重要的chemokine受体基因簇,复合人类癌症基因(如FHIT)。

4号染色体:可能包含与亨廷顿氏病、多囊肾、肌肉萎缩症、沃夫贺许宏氏症(一种因4号染色体短臂缺失导致的先天智障)等罕见疾病相关的基因。

5号染色体:包含许多染色体内部副本,是基因密度最低点的染色体之一。

6号染色体:包含导致遗传性血色素沉着病、帕金森氏症、癫痫等疾病的基因。这一染色体上基因的异常也是造成精神分裂症、癌症和心脏病等多种遗传性疾病的原因。此外,还包含一些MHC

7号染色体:第一个等臂染色体,其测序成功有助于研究治疗囊性纤维化、孤独症、耳聋、抽动——秽语综合征、视网膜色素变性、肾母细胞瘤、白血病和淋巴瘤等多种癌症以及其他疾病。

8号染色体:含有大脑和免疫功能的遗传基因(可能与人类进化密切相关)。

9号染色体95个基因与疾病有关,其中之一可抑制肿瘤形成。

10号染色体:85个基因与疾病有关。这些基因的突变可能引发乳腺癌、前列腺癌和脑癌等。还有一些基因与复杂的代谢疾病和精神疾病有关(如I型糖尿病、精神分裂症和阿耳茨海默氏症等)。

11号染色体:人类856个嗅觉受体基因中40%以上是定位在这个染色体上,还有86个未知分子机制的相关基因,包括几个mendelian traits、癌症和易感基因位点。

12号染色体:有一个目前在人类基因组上发现的最大的连锁不平衡,还有若干在特定类型的癌症、运动失调症、以及还可能包括阿尔茨海默氏症在内的疾病中发生突变的基因。

13号染色体:染色体密度小(6.5gene./Mb),包括与乳腺癌相关的BRCA2基因,和与眼癌、精神分裂症有关的基因。

14号染色体:大约有60多个与遗传疾病密切相关的基因,其中包括一个此前已被发现与阿尔茨海默症有联系的基因。还有另2个对于人体免疫系统具有重要意义基因以及一些与其它病症有关的基因。

15号染色体:是目前已知的7个大片段扩增的人类染色体之一,这一染色体复制的不寻常之处就在于这种片段扩增集中在两个相隔甚远的区域——15号染色体长臂近端和远端,而不是沿染色体分布,其中远端区域包含了可引起Prader-Willi Angelman综合症的基因缺失。而且大部分染色体之间的复制都有一个共同的祖先。

16号染色体:是DNA修复基因所在之处。对16号染色体分析的结果还会对重金属的解毒和运输有重要意义。

17号染色体:很特殊的染色体,包括多种与疾病有关的基因[如乳腺癌基因BRCA1、神经纤维瘤基因NF1、修复DNA损伤有关的基因TP53SMSSmith-Magenis综合症)和CMT1A]

18号染色体:仅三种染色体异常(形成三倍体)的人可以长大,其中就包含了18号染色体。另外还有许多遗传疾病是由于18号染色体的三倍体或非整倍而造成的。尽管基因密度低,但它所有哺乳动物进化上保守的非编码蛋白区域所占比例与整个基因组范围的平均值相接近。

19号染色体:包括与遗传性高胆固醇和抗胰岛素糖尿病相关的基因,人体遭到辐射或其他环境污染,控制DNA修复的基因也在该染色体上。

20号染色体:是被破译的第一对具有典型长短臂结构的人类染色体,为糖尿病、肥胖症、小儿湿疹等疾病的治疗找到了新方法。

21号染色体:最短的染色体,发现许多与疾病相关的基因均分布在这一染色体上,特别是先天愚型、早老性痴呆、癫痫等一些神经系统的疾病。

22号染色体:与先天性心脏病、免疫功能低下、精神分裂症、智力低下、出生缺陷以及许多恶性肿瘤如白血病等有关。

X号染色体:X染色体上一旦出现某个基因,就不会在进化中再失去它。同时X染色体与遗传性疾病高度相关,还有许多与智力缺陷有关的基因以及人类基因组中称为DMD的最大基因。

Y号染色体:这个一向被认为很脆弱的性染色体内部存在一些回文结构,可能有着基因修复作用,使它在一定程度上能够自我修复有害的基因变异。这一成果增进了人们对男性不育症的了解,有助于研究更好的诊断和治疗方法。它还将重新激起有关性别的进化历程的争论。