Mathematische & Statistische Methoden für genetische Analyse
Genetics ist ein Zweig der sich mit der Untersuchung von Genen , Variation, und erbliche in Tieren und Pflanzen betroffen Biologie. Mathematik und Statistik spielen eine große Rolle in der Disziplin der Genetik , insbesondere die Teildisziplin der Populationsgenetik . Populationsgenetik sucht die Häufigkeit und Verteilung verschiedener Allele in einer bestimmten Population von Organismen , und wie sie auf andere Populationen von Organismen betreffen . Allele sind Teile des genetischen Codes , die mit bestimmten Attributen verknüpft sind. Durchschnittswerte für
Die einfachste Form der statistischen Analyse ist der Durchschnitt. Es gibt drei Arten von Mittelwert: Mittelwert, Median und Modus. Der Mittelwert wird bestimmt, indem die Summe einer Reihe von Daten und Dividieren dieser Summe durch die Anzahl der Datenpunkte gefunden. Der Median wird durch alle Datenpunkte in der Reihenfolge der Größe und der Auswahl der mittleren Datenpunkt gefunden. Der Modus ist einfach der Datenwert, der am häufigsten erscheint. Alle drei Arten der Durchschnitt in der Populationsgenetik verwendet, aber die häufigste ist der Mittelwert .
Variance
Die Varianz ist ein Maß dafür, wie viel die Werte in ein Satz von Daten variieren. Die Varianz von s ^ 2 symbolisiert , oder ein Sigma eckigen Symbol . Die Varianz wird bestimmt, indem die Summe der Quadrate der Differenzen zwischen jedem Wert und dem Mittelwert , und dann Dividieren durch eine weniger als die Anzahl der Datenpunkte berechnet. Ein Beispiel der Varianz könnte beinhalten die Anzahl der Punkte auf einer bestimmten Art der Käfer . Angenommen, es gibt fünf Käfer in der Gruppe und die Anzahl von Punkten auf jeder Käfer sind 5, 5, 6 , 6 und 8 wird der Mittelwert : .
(5 + 5 + 6 + 6 + 8) /5 = 6
Die Varianz wird wie folgt berechnet:
[( 5-6 ) ^ 2 + ( 5-6 ) ^ 2 + ( 6-6 ) ^ 2 + ( 6 - 6 ) ^ 2 + ( 8-6 ) ^ 2 ] /( 5 - 1 ) = 1,5
das gibt uns einen Hinweis auf die Verbreitung der Werte
Standard Deviation
Die Standardabweichung ist ein weiteres Maß für die Ausbreitung . Es ist die Quadratwurzel der Varianz . Es hat den Vorteil, dass es die gleichen Einheiten wie die Datensatz sie abgeleitet wird . Im obigen Beispiel wird der Standardabweichung gegeben ist :
(1.5) ^ (0,5) = 1,22474
Dies zeigt an, dass die Standardabweichung der Anzahl der Punkte auf der Population der Käfer ist etwa 1,22 Spots.
Korrelation
Korrelation ist ein Maß für die Menge der Zusammenhang zwischen zwei Datensätzen . In der Populationsgenetik , könnte Korrelationen verwendet, um die Beziehung zwischen dem Besitz bestimmter Gene und Vorkommen von bestimmten Eigenschaften zu untersuchen. Korrelation wird durch eine mit dem Index r xy, wobei x und y sind Variablen der zwei Sätze von Daten symbolisiert. Korrelationen sind immer zwischen -1 und 1 . -1 Bedeutet, es gibt eine negative Korrelation , 0 bedeutet keine Korrelation , und 1 bedeutet, dass es eine positive Korrelation .
Regression
Regression ist ein statistisches Werkzeug benutzt, um die Beziehung zwischen zwei Variablen zu finden. Der Regressionskoeffizient b wird das Symbol mit dem Index yx , wobei y und x die Variablen der beiden Sätze von Daten. Der Regressionskoeffizient misst die vorhergesagte Änderung in y- Variable pro eine Einheitsänderung in der Variablen x .
Genetische Störungen Nomenklatur
Bei der Diskussion über genetische Erkrankung , gibt es verschiedene technische Begriffe, die beschreiben den Verlauf der Erkrankung in der allgemeinen Bevölkerung. Diese Begriffe gehören Inzidenz, Prävalenz , Mortalität und Lebenszeitrisiko . Das Auftreten einer genetischen Störung der Anteil der Personen in der Bevölkerung mit einem bestimmten genetischen Erkrankung. Die Prävalenz von einer genetischen Störung ist die Zahl der in einem bestimmten Untergruppe , wie beispielsweise einer bestimmten Altersgruppe , die eine bestimmte genetische Erkrankung aufweisen. Mortalität bezieht sich auf die Zahl der Menschen in einer bestimmten Gruppe , die von einer bestimmten Erkrankung pro Jahr sterben. Ein Beispiel für eine Mortalitätsstatistikkönnte " 10 000 Menschen in den Vereinigten Staaten starb Syndrom X im Jahr 2010. " Lebenszeitrisiko ist die mittlere Risiko der Entwicklung einer bestimmten genetischen Störung irgendwann in das Leben eines Menschen .