Pytanie:
W jaki sposób określa się granice genu?
ghchinoy
2011-12-19 22:16:43 UTC
view on stackexchange narkive permalink

Jakie procesy i metody statystyczne są używane przez genetyków / biologów molekularnych, aby wiedzieć, gdzie jeden gen się zaczyna, a gdzie kończy?

Do czego odnosi się tag „basic”?
Pomyślałem, że to pytanie było bardziej fundamentalne, aby zasiać grupę, więc oznaczyłem je jako „podstawowe”. Jeśli to nie jest protokół, możesz go usunąć.
@ghchinoy: Zmieniłem tag, zakładając, że jest to [metatag] (http://blog.stackoverflow.com/2010/08/the-death-of-meta-tags/) (chociaż to _ jest_ pytanie o pary zasad)
Dla wyjaśnienia: mówimy tutaj o * genach kodujących białka *, prawda? Jest o wiele więcej, w przypadku których metody są zupełnie inne.
@KonradRudolph, czy mógłbyś odnieść się do innych typów genów i metod? Dzięki.
@ghchinoy Jako przykład, obecnie pracuję nad genami tRNA, a ponieważ używają oni innej polimerazy, ich promotor i strona terminacji wyglądają znacząco inaczej. To samo dotyczy wszystkich innych niekodujących RNA, a ponadto istnieją rzeczy takie jak pseudogeny i LINE / SINE (te zwykle nie są uważane za geny, ale ze względu na ich podobieństwo do niekodujących genów RNA komplikują analizę). Mimo to istnieją metody bioinformatyczne umożliwiające znalezienie tych genów. O ile wiem, używają głównie wyszukiwania motywów.
Cztery odpowiedzi:
#1
+12
agrimaldi
2011-12-20 00:02:46 UTC
view on stackexchange narkive permalink

Znam tylko jedno naiwne podejście do określania granic genu: RACE-PCR. Istnieją dwa rodzaje WYŚCIGÓW 3 'i 5', które pozwalają znaleźć odpowiednie końce.

Uzasadnienie jest następujące:

  • Wykonujesz odwrotność transkrypcja interesującego transkryptu przy użyciu specyficznego startera. Na tym etapie masz specyficzne jednoniciowe cDNA.

  • Następnie dodajesz odcinek identycznych nukleotydów zwany ogonem homopolimerowym w 5 'cDNA.

  • Wreszcie wykonujesz PCR używając jednego specyficznego startera i jednego uniwersalnego startera, który rozpoznaje ogon homopolimerowy. Możesz sekwencjonować zamplifikowane cDNA i znaleźć jego lokalizację w genomie z rozdzielczością 1 pz.

W przypadku 3'RACE koncepcja jest taka sama, ale ogon poli-A jest używany zamiast generować go samodzielnie za pomocą transferu terminala.

Zobacz ten dokument, aby zapoznać się ze szczegółowym protokołem:

Sambrook J, Russell DW . 2006. Szybka amplifikacja 5 'końców cDNA (5'-RACE). Protokoły CSH 2006.

Ponadto odpowiedni artykuł w Wikipedii zawiera więcej szczegółów na temat tego, co dzieje się na każdym etapie, ale uwaga, wystąpił błąd: jest powiedział, że dla 5'RACE terminal transferaza dołącza homopolimerowy ogon w 3 ', podczas gdy dodaje go w 5'

-1: to może być dobre podejście, aby zobaczyć granice ORF (szczerze mówiąc, nie zawsze potrzebujesz RACE, prosta PCR też może działać), a nie genu. A co z promotorem i elementami regulacyjnymi? Jaka jest również korzyść w porównaniu, powiedzmy, z podejściem bioinformatycznym po sekwencjonowaniu?
@nico: więc zgodnie z podaną definicją gen nie ma granic.
@nico: Ok, rozumiem twój punkt widzenia, ale nie sądzę, by OP miał na myśli taką definicję genu. Ponadto całkowicie się zgadzam, że nowe technologie, takie jak sekwencja RNA, dają bardziej kompleksową odpowiedź na adnotację genomu.
możemy godzinami dyskutować o prawidłowej definicji genu, ale nie sądzę, aby było wiele do omówienia na temat faktu, że promotor jest częścią genu. A przez retrotranskrypcję mRNA nie otrzymujesz promotora.
#2
+8
Gergana Vandova
2011-12-20 00:20:29 UTC
view on stackexchange narkive permalink

Istnieje różne oprogramowanie, w którym możesz wprowadzić swoją sekwencję (powiedzmy całą sekwencję genomu) i może ono zidentyfikować za Ciebie przypuszczalne otwarte ramki odczytu (ORF), tj. kodony start i kodony stop. Następnie, używając tych domniemanych genów, możesz przeprowadzić dopasowanie sekwencji za pomocą BLAST, a następnie, na podstawie wyników, możesz potwierdzić, że są to naprawdę ORF. Ponieważ jest to podejście statystyczne, możesz następnie zweryfikować swoje wyniki w mokrym laboratorium, jak sugerował agrimaldi.

Ale * jak * to oprogramowanie określa granice genów? Czego szukają, co wskazuje na granicę genów?
Może należałoby zadać inne pytanie, a konkretnie o to, jakie techniki programistyczne są używane? Może z tagiem bioinformatycznym.
@RichardSmith Zasadniczo szukają kodonów startowych (ATG, GTG), które definiują początek otwartej ramki odczytu (ORF) i kodonów stop (TAG, TAA, TGA), które definiują koniec ORF, a także sprawdzają, czy liczba zasad między kodonem start i kodonem stop jest podzielna o 3.
@ghchinoy Tak, to może być interesujące, ale nie sądzę, że jest to bardziej skomplikowane, niż już wyjaśniłem Richardowi. Możesz oczywiście dodać jeszcze kilka „sprawdzeń”, które oprogramowanie może wykonać, np. Długość ORF.
#3
+6
KAM
2011-12-24 18:28:09 UTC
view on stackexchange narkive permalink

Jeśli Twoim celem jest zdefiniowanie granic jednostki transkrypcyjnej (części DNA, która podlega transkrypcji), powyższa odpowiedź jest dokładna, chociaż wiele osób używa raczej homologii do sklonowanych cDNA niż reakcji RACE. To podejście ma tę zaletę, że definiuje jednocześnie alternatywne formy składania.

Jeśli twoim celem jest zdefiniowanie „końców” genu, można to zrobić tylko empirycznie i funkcjonalnie, ponieważ elementy kontrolne (granice, wzmacniacze itp.) są niemożliwe do rozpoznania za pomocą informatyki, a nawet jeśli znajdzie się wzmacniacze, nie jest pewne, że te wzmacniacze są używane z określonymi genami. Niektóre geny mogą mieć długość miliony par zasad, więc setki innych genów są przeplatane. „Złotym standardem” definiowania granic genów jest ratowanie fenotypu utraty funkcji mutacji z transgenem zawierającym interesujący gen. Jeśli DNA, które jest transformowane z powrotem do organizmu, może odzyskać stan mutacji genu typu dzikiego, zakłada się, że wszystkie ważne części tego genu znajdują się w transgenie.

#4
+3
AnnaF
2011-12-19 23:04:57 UTC
view on stackexchange narkive permalink

Ogólnie rzecz biorąc, sekwencjonujesz genom, a następnie szukasz wskazówek. Zwykle poprzedzające gen są specyficzne sekwencje, które pomagają sprzętowi translacyjnemu rozpoznać „cześć, tu zaczynamy”, a także regiony, w których mogą wiązać się białka, które służą do wzmacniania lub hamowania translacji genu.

Komputery można zaprogramować, aby przeszukiwać sekwencję i wyszukiwać potencjalnych kandydatów do bliższego przyjrzenia się ludziom.



To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 3.0, w ramach której jest rozpowszechniana.
Loading...