You are on page 1of 72

SINH HỌC PHÂN TỬ

Chương III
Gen và genome của sinh vật
Cấu trúc của gen
Gen là một đơn vị di truyền quyết định or đóng góp vào việc hình một tính
trạng của cơ thể sinh vật. Thông tin di truyền của gen được mã hoá trong
DNA dựa trên trình tự đặc hiệu của các nucleotide. Gen có chức năng sản
xuất ra phân tử RNA hoặc một chuỗi polypeptide.
 Gen mã hoá tạo ra polypeptide th«ng qua hai quá trình:
 Thứ nhất, gen cấu trúc hoạt động làm khuôn để sản sinh ra một phân tử
mRNA (quá trình phiên mã).
 Thứ 2, phân tử mRNA riêng biệt tương tác với các cấu tử khác như:
ribosome, RNA vận chuyển mang a.amin (tRNA) và thông qua phản ứng
của một số enzyme để sản sinh ra một phân tử protein (quá trình dịch
mã).
Central Dogma
DNA
Transcription

RNA
Translation

Protein
Cellular Activity
CÊu tróc gen cña sinh vËt nh©n
chuẩn

Promoter
Khung đọc mã

Bắt đầu
Kết thúc
phien mã
dịch mã

Bắt đầu
Hộp dịch mã Kết thúc
AGGA/ UAA phiên mã
Intron UAG
CAAT
UGA
AUG

5’ 3’

Tín hiệu
Hộp Exon
chuyển
TATA AATAAT
peptit
Vị trí gắn Tín hiệu
riboxom poly A
hóa

Vùng upstream
Vùng downstream
Các exon và intron của gen
 Exon là trình tự mang thông tin di truyền,
thường được dịch mã sang protein.
 Intron hay trình tự câm, n»m xen kẽ và không
mang thông tin di truyền. Chúng được phiên
mã đến tiền mRNA nhưng không được dịch
mã thµnh protein. C¸c intron bÞ
c¾t bá trong qu¸ trình biÕn ®æi
tiÒn mRNA thµnh mRNA (chín hay
hoạt động).
Vïng khởi động (promoter)

Bắt đầu phiên mã


Vùng trình tự của
gen điều khiển
5’ Hộp CAAT Hộp TATA 3’

DNA GGCCAATCT TATAAAA


-75
-25 +1

Vùng khởi động phiên mã của gen ở eukaryote


C¸c
dÊu
hiÖu
gắn
chuçi
poly A
Khung đọc mở (open reading frame)
 Phần DNA của gen mã hóa protein được gọi là
khung đọc mở. Mỗi bộ 3 nucleotide của khung đọc
mở tương ứng với một codon mã hóa cho một acid
amin. Khung đọc mở được đọc từ đầu 5’ --- 3’ dọc
theo phân tử mRNA,®äc tõng m· mét vµ
®äc kh«ng chång chÐo. Khung đọc mở bắt
đầu bằng 1 mã khởi đầu: AUG hoặc GUG và kết
thúc bởi một trong 3 mã kết thúc
sau:UAA/UAG/UGA.
Chức năng cña gen
Chức năng cña gen thÓ hiÖn ë 3 qu¸
trình:
 a- T¸i bản DNA

 b- Phiªn m· tạo ra mRNA, hoÆc: rRNA

hay tRNA.
 c- DÞch m· hay sinh tæng hîp protein

dựa trên khu«n mRNA xuyên qua


ribosome để l¾p r¸p các acid amin nhê
các tRNA vận chuyển đến.
Ho¹t ®éng cña
gen
Genome và cấu trúc
genome
 Genome là khái niệm dùng để
chỉ toàn bộ lượng DNA có trong
một tế bào sinh vËt, bao gồm
tất cả các gen và các đoạn DNA
giữa các gen.
Cấu trúc của genome
 Genome của eukaryote rất phức tạp
về cấu trúc và chức năng. HÇu hÕt
c¸c eukaryote đều chøa thông tin di
truyền nằm trong c¸c tæ chøc kh¸c
nhau như:
 nh©n
 ty thÓ
 lôc l¹p (ë c¸c sinh vËt cã qu¸ trình quang hîp)
 Ngoài ra còn ở một số virus, viroid, vi khuẩn sống ký sinh.
Genome nhân
 Độ lớn tùy sinh vật:
 10 Mb - > 100.000 Mb
 Thường tương quan thuận với tính
phức tạp của tổ chức cơ thể.
 Genome của sinh vật bậc cao thường lớn
hơn sinh vật bậc thấp.
 Số lượng gen.
 Lượng DNA lặp lại. Thường genome lớn
chứa số bản sao các trình tự lặp lại cao.
Đặc điểm cấu trúc
 Genome của nhân được cấu trúc nên từ một
bộ các cặp nhiễm sắc thể tương đồng (nhị bội
khác so với prokaryote đơn bội).
 Mỗi nhiễm sắc thể thường chứa một phân tử
DNA, trừ NST khổng lồ của ruồi dấm và một số Vi
khuẩn.
 Genome cña nh©n ë các loµi kh¸c nhau chøa
hµm l­îng DNA kh¸c nhau.
 Bộ nhiễm sắc thể trong nhân có sè l­îng, kích
thước vµ hình dạng xác định kh¸c nhau đặc trưng
theo loµi.
Bảng. Hàm lượng DNA, số gen và
nhiễm sắc thể trong một số sinh vật
Loài DNA tổng số Số Số lượng
(bp) nhiễm gen
sắc thể
(2x)
Vi khuẩn (Escherichia coli) 4.639.221 1 4.405

Nấm men (Saccharomyces 12.068.000 16 6.200


cerevisiae)
97.000.000 12 19.000
Tuyến trùng (Caenorhabditis
elegans) 125.000.000 10 25.500

Thực vật (Arabidopsis thaliana) 180.000.000 18 13.600

Ruồi dấm (Drosophila 480.000.000 24 57.000


melanogaster)
2.500.000.000 40 30.000-
Thực vật ( lúa-Oryza sativa) 35.000
3.200.000.000 46
30.000-
Chuột (Mus musculus)
C¸c lo¹i DNA trong genome nh©n
 (i) Lo¹i DNA lÆp l¹i ë møc ®é cao
 Th­êng chiÕm khoảng 10 % DNA cña mçi tÕ bµo.
 Lµ c¸c trình tù ng¾n d­íi 10 bÆp baz¬ vµ cã 105 - 107
bản sao cho mçi genome. Những trình tù nµy th­êng
kh«ng m· ho¸ vµ th­êng g¾n víi c¸c vïng chuyªn biÖt
trªn nhiÔm s¾c thÓ nh­ lµ centromere hay telomere
 C¸c tụ điểm (domain) cña c¸c DNA lÆp l¹i nhiÒu lÇn tạo
nên c¸c vùng NST ®Ëm ®Æc kh¸c nhau trong chu kú tÕ
bµo, so s¸nh víi những vïng khác cña nhiÔm s¾c thÓ, ®­
îc gäi lµ thÓ dÞ s¾c.
C¸c lo¹i DNA trong genom nh©n
 (ii) Lo¹i DNA cã trình tù lÆp l¹i thÊp hoÆc trung
bình,
 ChiÕm khoảng 20 %.
 Lo¹i nµy chøa c¸c ®o¹n lÆp l¹i cã kÝch th­íc lín h¬n (100
cÆp baz¬), ®­îc lÆp l¹i tõ mét vài ®Õn hµng nghìn lÇn
vµ th­êng xen kÏ víi c¸c trình tù chØ lÆp l¹i mét lÇn däc
theo nhiÔm s¾c thÓ. Mét sè trong chúng cã chøc năng
m· ho¸ tạo ra rRNA, mRNA hay 5S rRNA;
 VÝ dô 2 gen tạo histone vµ RNA ribosom lµ c¸c gen lặp lại nhiÒu
lÇn trong genome nh©n. Genom nh©n cña V. faba cã khoảng
4750 gen tạo ra rRNA trong khi đó genom cña V.sativa chØ cã
1875.
C¸c lo¹i DNA trong genome nh©n
 (iii) Lo¹i DNA chøa trình tù duy nhÊt.
 ChiÕm khoảng 70 % DNA.
 ChØ cã mét bản vµ những trình tù nµy chØ
lÆp l¹i ®«i lÇn, m· ho¸ cho c¸c protein.
Trong hÇu hÕt c¸c c©y trång, chØ cã
khoảng 20 - 40 % cña bé genome lµ cã
chøa trình tù DNA chØ lÆp l¹i mét lÇn.
Genome ty thÓ
 Đé lín rÊt biÕn ®éng vµ kh«ng t­¬ng øng víi
tÝnh phøc t¹p cña sinh vËt.
 Genome ty thÓ ®éng vËt th­êng nhá víi tæ chøc di
truyÒn ®­îc gãi gän, c¸c gen ®­îc s¾p xÕp s¸t nhau
víi Ýt khoảng trèng ë giữa.
 Genome ty thÓ ë thùc vËt lín h¬n genome ty thÓ ë
®éng vËt cã vó vµ nÊm men.
 KÝch th­íc genome ty thể kh¸c nhau rÊt lín giữa c¸c loµi. Ví
dụ, genome ty thÓ của Brassica campestris cã độ lớn 218
kb, còn của Cucumis melo là 2400 kb.
 Tæ chøc di truyÒn cña gen ty thể thùc vËt còng Ýt gãi gän
h¬n và nhiều gen cã thể chøa introns.
 Sè l­îng bản sao cña genome ty thÓ cßn ch­a
®­îc biÕt râ. Mçi ty thÓ cña ng­êi cã khoảng
10 ph©n tö gièng nhau (khoảng 8000/1 tÕ
bµo) trong khi ë S. cerevisiae sè l­îng này là
khoảng 6500, gần 100 genome /1 ty thể.
 Tồn tại chủ yếu ở dạng mạch vòng, đôi khi có
xuất hiện dạng mạch thẳng như: nÊm men,
Paramecium, Chlamydomonas )
Thông tin di truyền trong genome ty thể
 Genome ty thể chứa các gen mã hóa cho
rRNA của ty thể và một số enzyme
protein tham gia vào chuỗi hô hấp.
 Ngoài ra, ty thể còn chứa gen mã hóa
tRNA, Protein ribosome và một số protein
khác liên quan đến quá trình phiên mã,
dịch mã, và vận chuyển các protein khác
vào ty thể từ tế bào chất.
 Số lượng gen trong ty thể rất biến động,
phụ thuộc vào loài: ví dụ ở tảo xanh là 12,
ở arabidopsis thaliana là 52 và ở vi khuẩn
Reclinomonas americana là 92.
Bảng.C¸c gen ®· ®­îc x¸c ®Þnh trong genom
tyChøc
thÓ năng/ sản phÈm Gen

Bé m¸y dÞch m·

RNA ribosome rrn5, rrn18, rrn26

Protein ribosomea  
B¸n ph©n tö nhá rps1,rps3, rps7, rps12
  rps13, rps14, rps19
B¸n ph©n tö lín rp12, rp15, rp116
RNA vËn chuyÓn Ýt nhÊt lµ 16
C¸c b¸n ph©n tö cña c¸c phøc hîp chuçi h« hÊp

NADH dehydrogenase nad1, nad2, nad3,


nad4, nad41, nad5,
nad6, nad7, nad9
Cytochrome b cob

Cytochrome c oxidase cox I, coxII, coxIII

ATP synthase atp1, atp16, atp9

Cytochrome c biogenesis Ýt nhÊt lµ 4 gen

Khung ®äc mã bảo thủ (conserved open Ýt nhÊt ®· biÕt 10 gen


reading frames)
Genome lôc l¹p
 Lôc l¹p còng chứa DNA ë d¹ng c¸c ph©n tö
cã cÊu tróc vßng. Mçi lôc l¹p vµ ty thÓ chøa
nhiÒu phân tử DNA, tuy nhiên mçi chúng đều
chøa c¸c gen gièng nhau.
Thông tin di truyền chứa trong
genome lục lạp
 HÇu hÕt genome cña lôc l¹p cã khoảng
200 gen. C¸c gen nµy m· ho¸ cho c¸c
RNA ribosome vµ vËn chuyÓn ®ång thêi
m· ho¸ cho protein cña ribosome vµ c¸c
protein cã liªn quan ®Õn ho¹t ®éng
quang hîp.
Bảng. C¸c gen lôc l¹p cña thùc vËt bËc cao và chức năng
của chúng
Gen Sè Chøc năng Ghi chó
intron
trnL - 1 tRNA  
UAA
TrnI - 1 tRNA  
GAU
TrnA - 1 tRNA  
UGC
TrnV - 1 TRNA  
UAC
TrnG - 1 tRNA  
UCC
TrnK - 1 tRNA  
UUU
Rps12 3 Protein Ribosome G¾n Trans
exons
Rps16 1 Protein Ribosome  
Bảng. C¸c gen lôc l¹p cña thùc vËt bËc cao và chức năng
của chúng
Gen Sè Chøc năng   Ghi chó
intron
Rpl2 1 Protein Ribosome Kh«ng cã
intron ë
spinach
Rpl16 1 Protein Ribosome  

RpoCl 1 Protein Ribosome Kh«ng cã


intron ë lóa vµ
ng«
ClpP 2 B¸n ph©n tö xóc Kh«ng cã
t¸c thuû ph©n intron ë lóa vµ
protein phô thuéc lóa mú
PetB 1 Phøc
ATP hîp  
cytochrome blf,
cytochrome b6
PetD 1 Phøc hîp  
cytochrome blf,
b¸n ph©n tö IV
Bảng. C¸c gen lôc l¹p cña thùc vËt bËc cao và chức năng
của chúng

Gen Số Chức năng Ghi chú


intron

AtpF 1 B¸n ph©n tö cña  


ATP synthase
NdhA 1 B¸n ph©n tö NADH  
dehydrogenase

NdhB 1 B¸n ph©n tö NADH  


dehydrogenase

23 Sr ADN 1 23S rRNA  


Hình. S¬ ®å cÊu
tróc genome lôc
l¹p c©y lóa.
Gen và genome của
prokaryote
Cấu trúc gen của prokaryote

Gen điều hòa Gen operator


Promoter Các gen cấu trúc

5’ I P O Z Y A 3’
DNA

3’ 5’

Hình. Cấu trúc operon lactose của


E.coli.
Hình. Vùng khởi động phiên mã của
gen ở prokaryote

Bắt đầu phiên mã

5’ Vùng -35 Hộp Pribnov 3’

DNA TTGACA TATAAT


-35
-10 +1
genome của virus
 Virus thường có lượng thông tin di truyền ít hơn
nhiều so với sinh vật eukaryote.
 Genome của virus có thể là DNA hoặc RNA.
 DNA của virus có thể là chuỗi đơn (ở thực khuẩn
thể) hay chuỗi kép. DNA của virus có cấu trúc
đặc biệt ở dạng vòng: hai chuỗi DNA nối cộng
hóa trị với nhau tạo thành hình vòng khép kín
liên tục, không có đầu 3’ và 5’.
 DNA của virus gồm hàng nghìn đến hàng chục
nghìn nucleotide.
Bảng. Kích cỡ DNA và thể virus (viral particle) của một số thực khuẩn
thể

Virus Độ lớn của Chiều dài Đường kính


DNA virus của DNA chiều dài của
(bp) virus (nm) thể virus (nm)

φ X174 5.386 1.939 25


T7 39.936 14.377 78
λ (lambda) 48.502 17.460 190
T4 168.889 60.800 210
Genome của vi khuẩn
 DNA của vi khuẩn được nằm trong nhiễm
sắc thể. Phần lớn các vi khuẩn chỉ có một
nhiễm sắc thể/tÕ bµo.
 DNA của vi khuẩn cũng ở dạng vòng,
chuỗi kép. Trên DNA có chứa các gen mã
hóa cho một protein đặc thù.
 Ngoài nhiễm sắc thể chính, vi khuẩn còn
chứa dạng DNA khác được gọi là plasmid
có kích thước bé hơn, dạng vòng, cã khả
năng tù nh©n bản. C¸c plasmid th­êng
chøa mét sè gen cã tÝnh ®Æc thï rÊt cao
Các dạng Plasmid ở vi khuẩn
 F plasmid: mang th«ng tin di truyền vÒ giíi tÝnh
cña chóng vµ cã thÓ ®­îc chuyÓn tõ tÕ bµo VK
nµy sang tÕ bµo VK kh¸c th«ng qua qu¸ trình tiÕp
hîp.
 R – plasmid: mang ®Æc tÝnh chèng chÞu víi
kh¸ng sinh
 Degradative plasmid : mang c¸c gen ®Æc hiÖu
cã khả năng sö dông c¸c chÊt trao ®æi bÊt th­
êng
 Cryp plasmid: kh«ng mang gen m· ho¸ bÊt kú
chøc năng nµo
Plasmid
KÝch th­íc plasmid cã thÓ từ mét ®Õn vµi trăm Kb.
Mçi plasmid cã chøa mét trình tù gèc t¸i bản DNA
(ORI). Kh«ng cã vïng nµy thì chóng kh«ng thÓ tù
nh©n lªn trong tÕ bµo ký chñ.
Mét sè plasmid cã mÆt khoảng tõ 10 ®Õn 100 bản
sao trong mét tÕ bµo chñ, ®©y lµ những plasmid cã
sè l­îng bản sao lín.
Mét sè plasmid kh¸c chØ chøa tõ 1 ®Õn 4 bản sao
trong mét tÕ bµo vµ ®­îc gäi lµ plasmid cã sè l­îng
bản sao thÊp.
L­îng DNA plasmid trong mét TB vi khuÈn Ýt khi v­ît
qu¸ 0,1 ®Õn 5% DNA tæng sè của vi khuẩn.
DNA cã trình tù lÆp l¹i
trong genome
DNA cã trình tù lÆp l¹i liÒn kÒ
(Tandemly repeated DNA)
 C¸c DNA cã trình tù lÆp l¹i liÒn kÒ hay cßn gäi lµ c¸c DNA
vÖ tinh. Gäi lµ c¸c DNA vÖ tinh vì c¸c ®o¹n DNA nµy cã
chøa những trình tù DNA ®­îc lÆp l¹i liÒn nhau hình thµnh
nªn c¸c băng vÖ tinh khi ph©n tÝch DNA cña genome
b»ng ph­¬ng ph¸p ly t©m chªnh lÖch tû träng (density
gradient centrifugation).
 Mét genome cã thÓ chøa nhiÒu lo¹i DNA vÖ tinh víi ®¬n
vÞ lÆp l¹i kh¸c nhau. Ьn vÞ lÆp l¹i cña c¸c DNA vÖ tinh
thay ®æi tõ vµi (< 5bp) ®Õn hµng trăm cÆp baz¬
(>200bp). DNA vÖ tinh th­êng tìm thÊy ë t©m ®éng hoÆc
vïng dÞ nhiÔm s¾c trªn nhiÔm s¾c thÓ. Chóng thuéc
nhãm c¸c DNA cã trình tù lÆp l¹i cao
Minisatellite vµ
microsatellite

Minisatellite vµ microsatellite còng ®­îc gäi lµ c¸c


DNA vÖ tinh dï chóng kh«ng xuÊt hiÖn c¸c băng vÖ
tinh khi ph©n tÝch tû trọng DNA.
 Minisatellite lµ c¸c ®o¹n DNA cã ®¬n vÞ lÆp l¹i d­íi 25 bp,
cã chiÒu dµi khoảng 20 kb
 Microsatellite th­êng dïng ®Ó chØ DNA cã ®¬n vÞ lÆp l¹i
ng¾n th­êng lµ 4 bp hoÆc ng¾n h¬n vµ cã chiÒu dµi th­
êng nhá h¬n150bp.
 VÝ dô Motif 5’-TTAGGG-3’ ®­îc lÆp l¹i hµng trăm lÇn ë ®Çu cuèi
cña nhiÔm s¾c thÓ ng­êi lµ mét d¹ng minisatellite ®iÓn hình.
 Microsatellite còn được gọi là các SSR. Ở cây lúa, các dạng SSR là
(GA)n, (GT)n, (AT)n, (GGT)n
C¸c trình tù lÆp l¹i ®­îc ph©n
bè rải r¸c trong genome
 Cơ chế phổ biến nhất đối với những
trình tự này đó là sự di chuyển vị trí
(transposition).
 Chính các yếu tố di truyền có khả
năng di động (mobile genetic
elements) giữa các vị trí khác nhau
trong một hay nhiều genome đã tạo
ra các trình tự lặp lại phân bố rải
rác trong genome và góp phần làm
đa dạng di truyền giữa các cá thể
trong loài.
Cơ chế di chuyển

Dựa vào cơ chế di chuyển, các yếu tố có


khả năng di động (còn gọi là các yếu tố
chuyển vị) có thể xếp thành hai nhóm:
 Nhóm các yếu tố di chuyển thông qua trung
gian RNA (RNA transposons hay
retroelements)
 Nhóm các yếu tố di chuyển không cần RNA
(DNA transposons)
(i) Nhóm các yếu tố di chuyển thông qua
trung gian RNA (RNA transposons)
 Tổng hợp một bản sao RNA
của yếu tố di chuyển
Cơ chế di chuyển (transposon) thông qua hoạt
động phiên mã

Retrotransposon
 Tổng hợp DNA từ bản RNA
được phiên mã. Quá trình này
có sự tham gia của enzyme
phiên mã ngược (reverse
Phiên mã transcriptase). Thường enzyme
này được mã hoá bởi gen nằm
ngay trong đoạn transposon
Phiên mã ngược
 Bản sao DNA của transposon
RNA
tổ hợp vào genome. Chúng có
cDNA
thể được tổ hợp lại trong cùng
Tái tổ hợp một nhiễm sắc thể trên đó có
mang đơn vị lặp lại nguyên
thuỷ hoặc cũng có thể được
chèn vào một nhiễm sắc thể
Bản sao của khác
Retrotransposon
Retrotransposon

Kết quả của quá trình trên là có hai


Hình. Retrotransposition bản sao của transposon ở các vị trí
khác nhau trong hệ gen.
+Retrovirus
(a) Retrovirus

LTR gag pol env LTR ~7 kb

Tổ chức di truyền của retrovirus

 Là virus có genome cấu trúc từ phân tử RNA. Khi xâm nhiễm vào tế bào ký
chủ, genome RNA của virus được sao chép thành DNA bởi enzyme phiên
mã ngược reverse transcriptase được mã hoá bởi gen pol của virus, råi
sau ®ã bản sao DNA tổ hợp vào genome của tế bào chủ. Các virus mới có
thể được tạo thành bằng việc sao chép đoạn DNA mới tổ hợp vào thành
RNA và bọc gói bằng protein vỏ virus được mã hoá bởi gen env trong hệ
gen của virus.
+Các retrovirus nội sinh
 ( Endogenous retrovirus, ERVs) là genome của retrovirus khi
được tổ hợp vào nhiễm sắc thể của tế bào vật ký chủ, chủ yếu là
động vật có xương sống. Một số trong chúng vần còn hoạt tính,
thậm chí ở một giai đoạn phát triển nào đó của tế bào, chúng có thể
tổng hợp nên các virus nội sinh. Tuy nhiên điều này hầu như không
xảy ra. Các trình tự này hầu như không còn hoạt động và được tìm
thấy ở nhiều vị trí trong genome. Trong genome của người, những
trình tự như vậy có khoảng 1000 bản sao. Phổ biến hơn là những
phiên bản được rút ngắn của chúng hay gọi là các yếu tố giống
retroviruss (retrovirus-like element ), được gọi tắt la RTVLs và có
khoảng 20 000 bản trong genome của người.
+Retrotransposon:
(b)Ty1/copia retrotransposon

LTR gag pol LTR ~7 kb

 • Là các đoạn có trình tự tương tự như các ERV tuy nhiên chúng được tìm
thấy chủ yếu trong các eukaryote như thực vật, nấm và động vật không
xương sống. Các retrotransposon thường có số lượng bản sao lớn và tồn tại
ở nhiều dạng khác nhau. Ví dụ ở Ngô, hầu hết các trình tự lặp lại phân bố
rộng trong genome là các retrotransposon và các yếu tố này chiếm đến gần
một nửa genome. Nhóm này được chia thành hai nhóm phụ là :
 • Nhóm Ty3/gypsy (Ty3 đặc trưng ở nấm men và gypsy đặc trưng ở
ruồi giấm. Nhóm này cũng chứa một nhóm các gen giống như ERV
 • Nhóm Ty1/copia. Nhóm này thiếu gen env mã hoá protein vá cña
retrovirus. Sù v¾ng mÆt cña env cã nghÜa lµ chóng
kh«ng thể hình thµnh c¸c thÓ gièng virus.
(a) Retrovirus

LTR gag pol env LTR ~7 kb

(b)Ty1/copia retrotransposon

LTR gag pol LTR ~7 kb

(c) LINE poly A

gag ? pol ~6 kb

poly A
(d) SINE
~0,3 kb

Hình XX. Các retroelement


Các yếu tố LTR (long terminal
repeats)
 Ba yếu tố ở trên còn được gọi chung là các yếu tố
LTR do có chứa các trình tự dài lặp lại ở hai đầu vµ
cuối vốn đóng vai trò quan trọng trong quá trính di
chuyển vị trí của chúng. Kích thước phân tử của các
LTR từ dµi vài trăm đến 10 kb.
 Các yếu tố khác không chứa LTR được gọi là
retroposon và chúng đặc trưng ở động vật có vú.
Nhóm này bao gồm:
Retroposon
 Các yếu tố khác không chứa LTR được
gọi là retroposon và chúng đặc trưng ở
động vật có vú. Nhóm này bao gồm:
 LINES
 SINES
LINEs (long interspersed nuclear
elements)
 Các yếu tố LINE có chứa gen mã hoá cho gag protein và enzyme
polymerase có chức năng giống như enzyme phiên mã ngược, Gen mã hoá
cho endonuclease env cũng được mã hoá bởi yếu tố này và enzyme này có
nhiệm vụ thúc đẩy sự tổ hợp của các yếu tố chuyển vị ‘retro” vào gen.
 Sự xen đoạn của LINE được lặp đi lặp lại bởi quá trình tái bản trực tiếp
và gắn của DNA mục tiêu.
 Hình XX mô tả yếu tố LINE1 của người có chiều dài 6,1 kb và có 3.500
bản sao với độ dài nguyên vẹn. Với các trình tự được rút ngắn hơn thì có
tới hàng trăm nghìn bản sao của LINE1 trong tế bào của người

(c) LINE poly A

gag ? pol ~6 kb
SINEs (short interspersed nuclear
elements)
 Yếu tố này không có gen mã hoá tạo enzyme phiên mã ngược nhưng
vẫn có khả năng chuyển vị. Có thể chúng di chuyển bằng cách “mượn”
enzyme phiên mã ngược được tổng hợp bởi một retrotransposon khác.
 SINE có độ lớn từ 100 đến 300 bp.
 SINE rất phổ biến ở động vật
 ví dụ như chuỗi Alu ở người có mặt tới hàng triệu bản sao. Alu có thể có
nguồn gốc từ các gen mã hoá cho 7SL RNA có vai trò điều khiển sự di
chuyển của protein xung quanh tế bào. Yếu tố Alu có thể được tạo ra ban
đầu bởi quá trình phiên mã ngược ngẫu nhiên của 7SL RNA sau đó DNA
tạo ra tái tổ hợp vào genome của người. Do Alu được phiên mã một cách
chủ động nên thường xuất hiện một lượng lớn Alu RNA trong tÕ bào, tạo
ra khả năng lớn để khuyếch đại yếu tố này. Trong thực vật SINE tương đối
hiếm.

poly A
(d) SINE
~0,3 kb
(ii) Nhóm các yếu tố di chuyển không
cần RNA (DNA transposons)
 Một số yếu tố chuyển vị có khả năng di chuyển một cách trực tiếp hơn mà
không cần qua trung gian RNA. Chúng di chuyển bằng cách cắt và tổ hợp
trực tiếp cấc đoạn DNA. Có hai cơ chế giải thích cho sự chuyển vị của
các yếu tố này, đó là:
 +Sự di chuyển có tính tự tái bản (replicative transposition): Phiên
bản của các yếu tố chuyển vị được sao chép từ vị trí ban đầu và tái tổ hợp
vào vị trí míi mục tiêu. Sau mỗi lần di chuyển thì số lượng bản sao được
tăng lên.
 + Sự di chuyển có tính bảo thủ (conservative transposition) các yếu
tố chuyển vị có thể tách ra khỏi vị trí ban đầu và sau đó là tái tổ hợp lại ở
một vị trí mới. Trong trường hợp này, số lượng của các transposon là
không thay đổi.
Vị trí cho Vị trí nhận

Cơ chế tự tái bản, số


lượng transposon tăng
lên sau mỗi lần sao
chép
Cơ chế bảo tồn, số
Vị trí cho Vị trí nhận lượng transposon
không tăng lên

Vị trí cho Vị trí nhận

Hình XX. Cơ chế chuyển vị các DNA transposon


Cấu trúc Ac và Ds ở ngô
 Ac lµ yÕu tè di ®éng . Ac cã ®é dµi
4563bp, ®­îc giíi h¹n hai ®Çu bëi hai IR cã
chiÒu dµi 11 bp. YÕu tè Ac m· ho¸ cho mét
mRNA cã ®é dµi 3.5 – kb, cã mét ®Çu 5'
UTR 650bp (UTR-vïng kh«ng dÞch m·
untranslated region) vµ mét khung ®äc më
m· ho¸ mét protein cã 807 amino acid
(enzyme transposase). Đo¹n Ac cã 4 intron,
chia
Ac trình tù
a
®ã bthµnh 5 exon.
c d 4563
bp
1 2 3 4 5
11b 11b
p p
Ds
 TÊt cả c¸c yÕu tè nhảy, ®· ®­îc x¸c ®Þnh trình tù ®Òu cã
hai ®Çu cuèi IR gièng yÕu tè Ac. HÇu hÕt Ds cã tÝnh t­¬ng
®ång víi c¸c yÕu tè Ac nh­ng th­êng ng¾n h¬n, râ rµng ®ã
lµ do sù mÊt ®o¹n cña Ac.
 C¸c yÕu tè Ds kh«ng cã ®o¹n ORF ®Çy ®ñ, chóng kh«ng
sản sinh ra transposase ho¹t ®éng vµ vì thÕ kh«ng thÓ tù
di chuyÓn ®­îc. Tuy nhiªn, Ds cã thÓ di chuyÓn nÕu Ac
còng cã mÆt trong genom vì Ac sản sinh ra c¸c enzyme
transposase vµ chóng sÏ dÞch chuyÓn c¸c yÕu tè Ds.
Ac a b c d 4563bp

1 2 3 4 5
11bp 11bp

Ac 4563bp

11bp 11bp

Ds9 ∇ 194 bp
4369bp

11bp 11bp

Ds6 2042bp
∇ 2521 bp

11bp 11bp

Hình XX. So sánh cấu trúc yếu tố Ac và Ds ở Ngô. ∇ mất đoạn


DNA transposon của
prokaryote
(a) IS
ITR Transposase ITR

~0,3 kb

(b) Composite transposon


IS Gen kháng kháng sinh IS
2,5~10 kb

Resolvase
(c) Transposon dạng Tn3 Transposase
Gen kháng kháng sinh

~5 kb
ITR ITR

(d) Transposable phage Gen tổ hợp và Gen lysis Gen protein vỏ


tái bản
~38 kb

ITR ITR
IS (insertion sequence) hay các trình tự xen đoạn
 Các IS là những đơn vị độc lập, chúng chỉ mã hoá cho một hoặc hai gen
mã hoá cho enzyme transposase cần thiết cho sự chuyển vị của chúng.
 ở E. coli, người ta tìm thấy khoảng 20 yếu tố IS với các dạng khác nhau.
Điển hình là yếu tố IS1, IS2 và IS10R. IS1 có chiều dài 786bp với 4-9 bản
sao trên nhiễm sắc thể của E.coli.
 IS2 có từ 0-12 bản sao trên nhiễm sắc thể của E coli và một bản trên
plasmid F.
 Nguyên tố IS10R được tìm thấy trên các R plasmid.
 Trong prokaryote, các IS có kích thước thay đổi từ 768 bp đến 5000 bp.
và chiếm khoảng 0,3% hệ gen của prokaryote.
Cơ chế chuyển vị của IS
 Các IS có thể chuyển vị theo cả cơ chế tái bản và bảo thủ. Chúng
chèn vào nhiễm sắc thể ở những vị trí có tính ngẫu nhiên, gây ra
đột biến thông qua hoạt động xáo trộn trình tự mã di truyền của
một gen hay làm xáo trộn vùng điều hoà hoạt động của gen.
 Những promoter nằm trong các IS có thể gây ảnh hưởng làm thay
đổi sự biểu hiện của gen kế cận. Khi chuyển vị theo cơ chế tái bản,
sự tái bản chính xác của IS nguyên thuỷ là cần thiết. Enzyme
transposase nhận biết các trình tự IR (inverted repeat) của IS để
khởi động tiến trình chuyển vị.
 Tần xuất chuyển vị của mối IS là tư 10-5 – 10-7 trong mỗi thế hệ.
(hìnhXX)
IS

5’ ACAGTTCAG CTGAACTGT 5’
3’ TGTCAÂGTC GACTACACA 3’
IR IR
chèn vào

vị trí mục tiêu


cắt
5’ TCGAT 5’
DNA nhiễm sắc thể
3’ AGCTA 3’

cắt

IS chèn vào

5’ TCGAT ACAGTTCAG CTGAACTGT 5’


3’ TGTCAÂGTC GACTACACA AGCTA
3’
IR IR

ADN polymerase và ADN ligase


sủă chữa khoảng trống

5’ TCGAT ACAGTTCAG CTGAACTGT TCGAT 5’


3’ AGCTA TGTCAÂGTC GACTACACA AGCTA 3’

Chuỗi nucleotitde lặp lại trực tiếp (direact repeat) ở vị trí IS được chèn vào

Sơ đồ quá trình tổ hợp của nguyên tố IS vào DNA nhiễm sắc thể
+ transposon Tn:
 • Composite transposon: Yếu tố này về cơ bản chính là một đoạn
DNA có gắn đoạn IS ở hai đầu và mang 1 hoặc vài gen thường mã hoá
cho khả năng kháng l¹i kháng sinh. Sự chuyển vị của composite
transposon được hoạt hoá bởi enzyme transposase mã hoá bởi 1 hoặc cả
hai đoạn IS ở hai đầu. Yếu tố thuộc nhóm này chuyển vị theo có chế bảo
thủ

(b) Composite transposon

IS Gen kháng l¹i kháng IS


sinh
2,5~10 kb
+ transposon Tn:
 Non composite transposon hay Tn3-type
transposon. Yếu tố này có gen chuyển vị riêng vi
thÕ không cần yếu tố xen (đoạn IS) để chuyển vị.
Sự chuyển vị của yếu tố Tn có tính tự tái bản.

Resolvase
(c) Transposon dạng Tn3
Transposase
Gen kháng kháng sinh

~5 kb

ITR ITR
+ Transposable phage:
 Là virus ký sinh trong vi khuẩn. Sự di chuyển của chúng có tính tái bản
như một phần trong một chu kỳ lây nhiễm bình thường của chúng.
 Ví dụ điển hình cho nhóm này là thực khuẩn thể Mu. Cũng như các
thực khuẩn thể λ , phage Mu có khả năng hoạt động trong chu kỳ phân
giải hoặc xâm nhập vào pha phân giải (lysogenic phase). Mu chuyển vị
theo cơ chế tự tái bản và gây ra sự kiện đột biến. Chính vì thể Mu là
viết tắt của ‘mutator’ tức là thể gây đột biến.Trong Phage, Mu là một
đoạn DNA thẳng có độ lớn khoảng 37 kb chứa các gen cã liên quan
đến quá trình di chuyển và các gen mã hoá cho các protein cấu trúc có
chức năng đóng gói DNA để tạo thể phage mới.
Thực khuẩn thể Mu
 Giống như các transposon khác,Mu có giới hạn ở hai đầu
bởi các đoạn nucleotide lặp lại ngược chiều (IR) và chúng
tạo ra các đoạn ngắn lặp lại cùng chiều dài 5 bp của
genome vật chủ tại vị trí ghép vào. Đáng chú ý là khi đóng
gói tạo thể phage mới, hai đầu của Mu luôn có các đoạn
DNA của vi khuẩn tại vị trí mà Mu ghép vào. Các đoạn này
sẽ được phân huỷ khi Mu tiếp tục sự xâm nhiễm của mình.

DNA vi khuẩn DNA vi khuẩn
Mu DNA vi khuẩn
(~50 bp) (~1000 bp)
(38 kb)

Ghép vào genome tế bào chủ


loại bỏ DNA vi khuẩn
genome E. coli
genome E. coli

Các bản sao Mu di chuyển


và ghép vào genome vi
khuẩn

Đóng gói Mu trong thể phage mới

Hình XX. Sự di chuyển của thực khuẩn thể Mu theo cơ


chế tự tái bản
Tổ chức genome của người
Genome người
3000 Mb

Gen và trình tự Trình tự DNA


liên quan đến gen giữa các gen
900 Mb 2100Mb

DNA mã hóa DNA không Trình tự lặp lại


mã hóa DNA lặp lại
90 Mb duy nhất và
810Mb 420 Mb
có bản sao thấp
1680 Mb

Pseudo- Intron,
Các đoạn DNA lặp lại DNA lặp lại
Gene leader,
gen liền kề phân bố
trailer
rải rác

Strachan & Read,1996.


Pseudogene lµ gen rÊt gièng DNA Micro-
víi mét gen ®· biÕt ë locus satellite satellite LTRs SINEs
kh¸c nh­ng kh«ng cã chøc
n¨ng do ®ét biÕn thªm
hoÆc mÊt mét cÊu tróc lµm
mÊt kh¶ n¨ng phiªn hoÆc mini- DNA
satellite LINEs transposon
dÞch m· gen
Hình. Tæ chøc hÖ gen cña ng­
ADN lặp lại trong nhiễm sắc thể thực vật
Transposon tagging
 Mét sè yÕu tè chuyển vị ®· ®­îc nh©n dßng vµ ®ang ®­îc sö
dông ®Ó ph©n lËp c¸c gen ®ét biÕn tõ c¸c th­ viÖn genome
được xây dựng tõ các thùc vËt cã chøa ®ét biÕn chÌn đoạn gây nên
bởi c¸c yÕu tè chuyển vị ®ång d¹ng tøc cã chøa c¸c yÕu tè
chuyển vị gièng nhau. Ph­¬ng h­íng nµy sö dông DNA của yÕu
tè chuyển vị nh­ lµ mét ®o¹n mẫu dò (probe) cho c¸c allele ®ét
biÕn, sau ®ã lµ b­íc nhËn d¹ng c¸c trình tù liÒn kÒ ®¹i diÖn
cho gene vµ kÕ theo lµ sö dông DNA nµy ®Ó ph©n lËp gen
tõ th­ viÖn genome cña mét c©y d¹i. Danh s¸ch c¸c gen
ph©n lËp theo c¸ch nµy ®­îc chØ ra ë bảng 5.2.
 S¬ ®å mét ch­¬ng trình cña transposon tagging ®­îc tãm t¾t ë hình XX. Mét yÕu tè
Ds vµ mét yÕu tè Ac (sAc) æn ®Þnh ®· ®­îc ®­a riªng rÏ vµo genome cña c¸c c©y
d¹i d¹ng bình th­êng kh¸c nhau. C¸c c©y nµy ®­îc lai vµ mét sè c©y ®êi F1 t¹o ra sÏ
thõa h­ëng các yÕu tè sAc vµ Ds. Với sAc sản sinh ra c¸c enzyme nhẩy, yÕu tè Ds ®­
îc di chuyÓn trong c¸c c©y F1 nµy vµ cã thÓ tình cê ®­îc chÌn vµo gen ®ang quan
t©m (Ph) ®Ó t¹o ra mét ®ét biÕn chÌn, Ph::Ds. NÕu c¸c qu¸ trình ®ét biÕn nµy t¹o
ra mét alen lÆn mµ sÏ g©y ra sù thay ®æi trong kiÓu gen cña c¸c c¸ thÓ ®ång
d¹ng, c¸c c©y cã ®ét biÕn Ph::Ds cã thÓ ®­îc x¸c ®Þnh b»ng viÖc lai c¸c c©y F1 víi
c¸c c©y mang gen lÆn æn ®Þnh ®ång d¹ng (ph/ph). HÇu hÕt c¸c c©y con t¹o ra
cña qu¸ trình lai nµy sÏ lµ dÞ hîp tö, Ph/ph víi mét kiÓu hình bình th­ßng nh­ng rÊt Ýt
c¸c c©y sÏ thõa h­ëng alen Ph::Ds tõ bè mÑ f1 vµ do c©y bè mÑ kh¸c sÏ cung cÊp
mét alen lÆn æn ®Þnh (ph), c¸c c©y nµy (Ph::Ds/ph) sÏ cã kiÓu gen ®ét biÕn.
P1
P2
Ph Ds Ph sAc

Ph Ph
Dạng dại + Ds Dạng dại + sAc

Ph Ds
Đột biến
chèn đoạn
Ph: : Ds
di chuyển

Transposase
Ph
sAc

Ph

x Hạt phấn F1

Ph

lai thử Đột biến điểm


Ph: : Ds
11bp ITR

Kiểu hình đột


biến
Ph

Hình XX. Sơ đồ phương pháp transposon

You might also like