Z PRAKTYKI Joanna Dąbrowska, Żanetta Makowska, Magdalena Spólnicka, Emilia Szabłowska-Gnap Teoretyczne podstawy analizy mieszaniny DNA w multipleksowych systemach STR Jeśli dasz jeden wynik mieszaniny 10 ekspertom, to otrzymasz 10 możliwych wniosków Peter Gill Wstęp Zestawy do amplifikacji (namnażania) DNA wykorzystywane współcześnie w kryminalistycznych badaniach genetycznych charakteryzują się dużą czułością oraz odpornością na inhibitory reakcji PCR, co znacząco zwiększa szansę na uzyskanie profilu DNA nawet z tzw. trudnych śladów, jakimi niewątpliwie są ślady kontaktowe. W przypadku takich śladów często uzyskuje się wyniki w postaci mieszanych profili DNA, które mogą nie tylko stanowić spore wyzwanie dla eksperta, lecz także budzić wątpliwości u odbiorców opinii. Niezmiernie ważne staje się zatem opracowanie w języku polskim jednolitych zagadnień teoretycznych bazujących na światowych pu- blikacjach naukowych, które będą stanowiły podstawę do oceny profili DNA pochodzących od więcej niż jednej osoby. Niniejszy artykuł został przygotowany z myślą o osobach wykonujących badania DNA i traktujących je jako pomocne w analizowaniu wyników, ze szczególnym uwzględnieniem mieszanin DNA oraz opracowywania na ich podstawie wniosków, które wykorzystywane są później przez organy procesowe. Analizę mieszanin DNA należy przeprowadzać z wielką ostrożnością. Niezwykle istotne jest, aby ich analiza odbywała się niezależnie od wyników uzyskanych dla profili DNA oznaczonych z materiału porównawczego. Cały proces powinien być dokładnie zaplanowany i przeprowadzony według przemyślanego, logicznego schematu. Za przykład może służyć schemat zaproponowany przez Clytona in. (ryc. 1) [1]. W artykule przedstawiony będzie szczegółowy opis poszczególnych etapów analizy mieszanin DNA według schematu zamieszczonego na rycinie 1. Etapy w interpretacji mieszanin DNA KROK 1 Identyfikacja mieszaniny DNA i oznaczenie ujawnionych alleli KROK 2 Identyfikacja liczby osób, od których pochodzi DNA w mieszaninie KROK 3 Określenie proporcji (stopnia) zmieszania składników mieszaniny DNA KROK 4 Wyznaczenie dopuszczalnych kombinacji genotypów dla każdego locus KROK 5 Określenie proporcji (stopnia) zmieszania składników mieszaniny DNA Ryc. 1. Analiza mieszanin DNA według schematu opracowanego przez Claytona i in. Fig. 1. DNA mixture analysis according to Clayton et al. Źródło: (ryc. 1–10) autorzy 16 PROBLEMY KRYMINALISTYKI 280(2) 2013 Z PRAKTYKI Krok 1 Identyfikacja mieszaniny DNA i oznaczenie ujawnionych alleli W pierwszym etapie analizy wyniku należy stwierdzić obecność mieszaniny DNA w badanej próbce. W tym celu należy zwrócić szczególną uwagę na obecność w co najmniej jednym locus trzech lub więcej pików odpowiadających allelom (ryc. 2), pamiętając o możliwości występowania dodatkowych pików w postaci artefaktów (np. podprążków – stutterów, N-pików lub podciągnięć koloru – pull-upów), które charakteryzują się określonymi cechami ułatwiającymi ich rozpoznanie i odróżnienie od właściwych pików. Dodatkowo należy uwzględnić możliwość wystąpienia zjawiska wypadania alleli, tzw. drop-out. Osoba analizująca wyniki badań DNA powinna również umieć odróżnić rozmaite zjawiska genetyczne od mieszanin DNA, ponieważ dodatkowe piki zaobserwowane szczególnie w jednym locus mogą być wynikiem mutacji, np. translokacji, trisomii czy mutacji somatycznych [2]. Ponadto należy sprawdzić, czy długości oznaczonych alleli w stosunku do odpowiadających im alleli w drabinie mieszczą się w przedziale ± 0,5 pz. (pary zasad). Ewentualne przesunięcia prążków w stosunku do odpowiedniego prążka w drabinie powinny być stałe we wszystkich układach. W trakcie analizy wyników uwzględnia się również zbalansowanie pików dla każdego locus oddzielnie. Niezbalansowanie pików w układzie heterozygotycznym jest dopuszczalne na poziomie 40% (tzn. że stosunek pól powierzchni pików – mniejszego do większego – musi zawierać się w granicach od 0,6 do 1) (ryc. 3). W większości przypadków niezbalansowanie dwóch pików w obrębie jednego locus może wskazywać na obec- ność mieszaniny DNA. Należy jednak pamiętać, że amplifikacja preferencyjna jednego allela w stosunku do drugiego w danym locus może być również wynikiem zbyt małej ilości DNA (efekt stochastyczny) lub mutacji w obrębie miejsca wiązania startera reakcji PCR [1–4]. Krok 2 Identyfikacja liczby osób, od których pochodzi DNA w mieszaninie Maksymalna liczba alleli w danym locus dla mieszaniny od dwóch osób to 4. W związku z tym oznaczenie 5 lub 6 alleli w układzie wskazuje na obecność w badanej próbce DNA pochodzącego od trzech osób lub większej ich liczby, co w praktyce trudno jest jednoznacznie ustalić [1]. Ogólnie można założyć, że obecność w poszczególnych loci: • 2, 3, 4 alleli to obecność DNA dwóch osób (ryc. 4) • od 5 do 6 alleli to obecność DNA co najmniej trzech osób (ryc. 5) • > 6 alleli to obecność DNA co najmniej czterech osób (ryc. 6) Krok 3 Określenie proporcji (stopnia) zmieszania składników mieszaniny DNA Krok ten przeprowadza się wyłącznie podczas analizy mieszanin DNA pochodzącego od dwóch osób. Do określenia relacji pomiędzy pikami reprezentującymi odpowiednie allele w danym układzie wykorzystuje się tzw. dane ilościowe, tj. wysokości pików lub pola ich powierzchni. W praktyce można wyznaczyć dwa parametry analizy Ryc. 2. Przykład występowania wielokrotnych alleli w locus Fig. 2. Example of occurence of multi alleles in locus Ryc. 3. Przykład zbalansowania alleli w układach heterozygotycznych (wpn – wysokość piku niższego, wpw – wysokość piku wyższego, PHR – peak height ratio – różnica w wysokościach pików) Fig. 3. Example of allelic balance in heterozygotic locus (wpn – lower peak height, wpw – upper peak height, PHR – peak height ratio) PROBLEMY KRYMINALISTYKI 280(2) 2013 17 Z PRAKTYKI Ryc. 4. Przykład mieszaniny DNA dwóch osób Fig. 4. Example of DNA mixture from two persons Ryc. 5. Przykład mieszaniny DNA co najmniej trzech osób Fig. 5. Example of DNA mixture from at least three persons 18 PROBLEMY KRYMINALISTYKI 280(2) 2013 Z PRAKTYKI Ryc. 6. Przykład mieszaniny DNA co najmniej czterech osób Fig. 6. Example of DNA mixture from at least four persons mieszanin DNA pod kątem określenia relacji pomiędzy pikami, tj. stopień zmieszania (Mr) lub proporcje zmieszania (Mx) poszczególnych składników: a) stopień zmieszania poszczególnych składników (Mr – mixing ratio) wyraża stosunek sumy pól powierzchni (wysokości) pików jednego składnika mieszaniny do sumy pól powierzchni (wysokości) pików drugiego składnika, b) proporcje zmieszania poszczególnych składników (Mx – mixing proportion) wyrażają sumę pól powierzch- ni (wysokości) pików mniejszego składnika mieszaniny w stosunku do sumy pól powierzchni (wysokości) wszystkich pików oznaczonych w danym układzie. Wartości Mr i/lub Mx wyznacza się dla każdej rozpatrywanej konfiguracji alleli w poszczególnych loci. Biorąc pod uwagę liczbę oznaczonych alleli w danym locus oraz uwzględniając możliwość nakładania się sygnału pochodzącego od dwóch niezależnych alleli o takiej samej wielkości, stosuje się odpowiednie wzory, które zestawiono w tabeli (tab. 1) [2]. Tabela 1 Określanie wartości proporcji i stopnia zmieszania składników mieszaniny DNA Determination of proportion and level of DNA mixture components Liczba alleli w układzie Składnik mniejszy Składnik większy 4 allele 1, 2 3, 4 1, 1 2, 3 2, 3 1, 1 1, 2 1, 3 3 allele PROBLEMY KRYMINALISTYKI 280(2) 2013 Mx Mr 19 Z PRAKTYKI Liczba alleli w układzie Składnik mniejszy Składnik większy 1, 1 2, 2 1, 2 2, 2 1, 1 1, 2 1, 2 1, 1 2 allele 1 allel Mx Mr 1, 2 brak informacji brak informacji 1, 1 brak informacji brak informacji Źródło: (tab. 1–7) opracowanie własne Zależności pomiędzy proporcją zmieszania (Mx) a stopniem zmieszania (Mr) wyrażają poniższe wzory: Najbardziej wiarygodnymi wynikami odzwierciedlającymi proporcje zmieszania składników mieszaniny są te, które wyznacza się dla układów z oznaczonymi 4 allelami. Jeżeli jest to możliwe, należy wybrać te układy, w których piki mniejszego składnika mieszaniny nie znajdują się w pozycjach sttuterów większego składnika. Przy założeniu, że analizowana mieszanina DNA pochodzi od dwóch osób, w układzie z czterema allelami nie występuje zjawisko tzw. współdzielenia piku przez dwa niezależne allele o takiej samej wielkości, co może mieć miejsce w układach z oznaczonymi trzema lub dwoma allelami. W przypadku mieszanin DNA męskiego i żeńskiego do wyznaczenia proporcji składników mieszaniny wykorzystuje się układ amelogeniny, przy czym należy pamiętać o sprawdzeniu uzyskanych wyników dla amelogeniny z wynikami obliczonych proporcji dla innych loci [1, 2, 3]. W zależności od stopnia zmieszania DNA pochodzącego od dwóch osób mieszaniny można podzielić na następujące typy: • typ A – mieszanina zbalansowana, bez wyraźnie zdefiniowanego składnika większego i mniejszego (ryc. 7) • typ B – mieszanina, w której można wyraźnie odróżnić składnik większy i mniejszy (ryc. 8) Ryc. 8. Przykład mieszaniny DNA typu B Fig. 8. Example of DNA type B mixture • typ C – mieszanina o dużej dysproporcji pomiędzy tworzącymi ją składnikami; mniejszy składnik na niskim poziomie (ryc. 9) Ryc. 9. Przykład mieszaniny DNA typu C Fig. 9. Example of DNA type C mixture Ryc. 7. Przykład mieszaniny DNA typu A Fig. 7. Example of DNA type A mixture 20 PROBLEMY KRYMINALISTYKI 280(2) 2013 Z PRAKTYKI • typ D – większość pików mieszaniny ma wysokość poniżej 150 RFU (relative fluorescence units) (ryc. 10) [5] , gdzie φ1 wyraża pole powierzchni (wysokości) mniejszego piku φ2 wyraża pole powierzchni (wysokości) większego piku. Jeżeli w rozpatrywanej konfiguracji jeden z pików jest wspólny dla dwóch niezależnych alleli, to wtedy zbalansowanie heterozygot oblicza się według wzoru: , gdzie Ryc. 10. Przykład mieszaniny DNA typu D Fig. 10. Example of DNA type D mixture Krok 4 Wyznaczenie dopuszczalnych kombinacji genotypów dla każdego locus Na tym etapie analizy mieszaniny DNA wyniki uzyskane z badań próbki porównawczej nie mogą mieć wpływu na interpretację. Na wstępie dla analizowanej mieszaniny DNA zakłada się dopuszczalność wszystkich możliwych kombinacji alleli oznaczonych dla poszczególnych loci, które wyznacza się niezależnie dla każdego układu. Wyznaczając kombinacje alleli, jako punkt odniesienia można wykorzystać model Evetta. Jest to metoda jakościowa, która nie uwzględnia aspektów ilościowych profilu (tj. wartości pól powierzchni lub wysokości pików). Zgodnie z przywołanym modelem dla czterech alleli w locus istnieją trzy możliwe kombinacje par alleli. Dla locus z oznaczonymi trzema allelami można wyznaczyć sześć kombinacji par alleli, natomiast w przypadku ujawnienia dwóch alleli w locus możliwe są cztery kombinacje genotypów (tab. 2). W locus z oznaczonym jednym allelem jedyną możliwością jest to, że obie osoby w danym układzie będą miały identyczne allele (układ homozygotyczny) [1]. Wiele kombinacji genotypów wyznaczonych z wykorzystaniem danych jakościowych można wykluczyć na podstawie dwóch parametrów uwzględniających dane ilościowe stanowiące niejako filtry, na podstawie których dokonuje się selekcji i rozstrzyga, czy rozpatrywana kombinacja genotypów jest dopuszczalna, czy też można ją wykluczyć z dalszej analizy. Pierwszym parametrem jest stopień zbalansowania heterozygot (Hb) w rozpatrywanych konfiguracjach alleli. W sytuacji gdy wyklucza się możliwość nakładania się sygnałów dwóch alleli, zbalansowanie heterozygoty (Hb) wyraża się stosunkiem pola powierzchni (wysokości) mniejszego piku na elektroforegramie do pola powierzchni (wysokości) większego piku: PROBLEMY KRYMINALISTYKI 280(2) 2013 wyraża pole powierzchni (wysokość) wspólnego piku reprezentującego dwa niezależne allele o takiej samej wielkości φ1 i φ2 stanowią pola powierzchni (wysokości) pików alleli nienależących do pary. Drugim parametrem stosowanym przy ocenie dopuszczalności danych kombinacji genotypów w analizowanym locus jest stopień zmieszania (Mr) lub proporcje zmieszania (Mx) poszczególnych składników. Parametry te zostały omówione w części opisującej krok 3 schematu analizy mieszanin DNA zaproponowanego przez Clytona i in. Wyznaczone niezależnie dla każdego locus wszystkie dopuszczalne kombinacje genotypów wykorzystywane są następnie w kolejnym etapie interpretacji mieszanin do analizy porównawczej z profilem DNA próbki referencyjnej, a także do analizy statystycznej [2]. φs Tabela 2 Możliwe kombinacje genotypów dla mieszaniny DNA z ujawnionymi 2, 3 lub 4 allelami w locus Possible genotype combinations for DNA mixtures with detected 2, 3 or 4 alleles in locus Dla 4 alleli a, b, c, d a,b a,c a,d c,d b,d b,c c,d b,d b,c a,b a,c a,d Dla 3 alleli a, b, c a,a b,b c,c a,b b,c a,b b,c a,c a,b a,c a,c b,c b,c a,c a,b a,c a,c b,c a,a b,b c,c a,b b,c a,b Dla 2 alleli a, b a,a a,b a,a a,b a,b b,b b,b a,b a,b b,b b,b a,a a,a a,b Klucz: kombinacje odwrócone zostały oznaczone czcionką koloru czerwonego. 21 Z PRAKTYKI Krok 5 Porównanie otrzymanego wyniku z profilem DNA próbki referencyjnej Chcąc uniknąć stronniczości niezwykle istotne jest dopilnowanie, by opisane powyżej kroki przeprowadzane były niezależnie od wyników uzyskanych dla próbek referencyjnych. Dopiero na tym etapie dopuszcza się porównanie wyników. O ile opiniowanie w przypadku pojedynczego profilu DNA raczej nie przysparza problemów ekspertowi, o tyle analiza porównawcza mieszanin DNA jest bardziej skomplikowana. W przypadku gdy w analizowanej mieszaninie DNA pochodzącego od dwóch osób obecne są wszystkie allele charakterystyczne dla profilu DNA próbki referencyjnej i pasują do wyznaczonych na podstawie analizy ilościowej dopuszczalnych kombinacji genotypów, istnieje prawdopodobieństwo, że jednym ze składników analizowanej mieszaniny jest DNA oznaczone z próbki porównawczej. Odwrotna sytuacja ma miejsce, gdy w badanych układach analizowanej mieszaniny DNA brakuje alleli charakterystycznych dla profilu DNA próbki referencyjnej. Wówczas należy rozważyć wykluczenie obecności DNA osoby stanowiącej źródło materiału referencyjnego. Opiniowanie wykluczające obecność DNA oznaczonego z próbki porównawczej w analizowanej mieszaninie ma miejsce również wtedy, gdy w badanej próbce obecne są wszystkie allele charakterystyczne dla profilu DNA próbki referencyjnej, ale nie pasują one do żadnej z wyznaczonych dopuszczalnych kombinacji genotypów [3]. Ze względu na to, że sposób wyrażania mocy dowodowej wyników uzyskanych w ramach opinii genetycznej może budzić wiele kontrowersji, uzyskane wyniki oraz wnioskowanie na ich podstawie powinno być wsparte odpowiednio dobranymi metodami statystycznymi. Metody statystyczne wykorzystywane w analizie wyników profilowania Do analizy statystycznej wykorzystywane są różne metody opierające się na częstości występowania alleli w danej populacji, których zastosowanie uzależnione jest od złożoności otrzymanego wyniku badań. Prawdopodobieństwo przypadkowej zgodności Prawdopodobieństwo przypadkowej zgodności jest stosowane w odniesieniu do pojedynczych profili DNA. Na wstępie analizy w metodzie tej przyjmuje się hipotezę oznaczaną jako hipotezę zerową (H0) odnoszącą się do pochodzenia DNA w badanym śladzie. Hipoteza zerowa zakłada, że DNA otrzymane z materiału dowodowego nie pochodzi od osoby podejrzanej, pomimo zgodności wszystkich alleli w zakresie badanych układów, a może 22 pochodzić od innej przypadkowej osoby z populacji, niespokrewnionej z osobą podejrzaną. Formalnie prawdopodobieństwo przypadkowej zgodności zapisuje się wzorem: Pr(E/H0), co należy rozumieć jako prawdopodobieństwo dowodu (E) przy założeniu hipotezy zerowej (H0). Podczas analizy wszystkie badane układy są rozpatrywane niezależnie. Dla loci, w których oznaczono dwa allele (konfiguracja heterozygoty), częstość występowania danej konfiguracji alleli, np. A i B, oblicza się, stosując wzór: Pr(E/H0)= 2pApB, gdzie pA i pB oznaczają częstości występowania alleli A i B w populacji. Dla locus z ujawnionym pojedynczym allelem, np. C, częstość jego występowania w konfiguracji homozygoty oblicza się według wzoru: Pr(E/H0)= (pC)2, gdzie pC oznacza częstość występowania allela C w populacji. Wynik końcowy, stanowiący iloczyn wartości uzyskanych dla poszczególnych loci, wyraża, jakie jest prawdopodobieństwo, że przypadkowa osoba z danej populacji, poza osobą podejrzaną i z nią niespokrewnioną, mogłaby mieć taki sam profil DNA. Wartość prawdopodobieństwa przypadkowej zgodności określa jednocześnie, z jaką częstością w populacji występuje profil DNA otrzymany z badanej próbki. Im mniejsza jest wartość prawdopodobieństwa przypadkowej zgodności, tym bardziej prawdopodobne jest, że DNA z badanego śladu pochodzi od osoby podejrzanej. Przykładowo, gdy wartość prawdopodobieństwa przypadkowej zgodności wynosi np. 0,000001 oznacza to, że w przybliżeniu jedna osoba na milion niespokrewnionych osób w danej populacji może mieć DNA o profilu zgodnym z profilem DNA uzyskanym z badanego śladu [2]. W przypadku analizy statystycznej opierającej się na prawdopodobieństwie przypadkowej zgodności istnieje możliwość uwzględnienia współczynnika pochodzenia Fst (coancestry coefficient), który definiowany jest dla całej populacji. Współczynnik ten określa, jakie jest prawdopodobieństwo, że dwa allele wzięte losowo od dwóch różnych osób, również losowo wybranych z populacji, są identyczne z pochodzenia. Współczynnik ten w zależności od rodzaju populacji, dla której jest określany, wynosi odpowiednio: • Fst = 0,01 dla populacji typowych, • Fst = 0,03 dla małych odosobnionych populacji lub populacji trudno poddających się asymilacji. PROBLEMY KRYMINALISTYKI 280(2) 2013 Z PRAKTYKI Prawdopodobieństwo włączenia (Pi – inclusion) i wykluczenia (Pex – exclusion) Zgodnie z zaleceniami International Society of Forensic Genetics (ISFG) prawdopodobieństwo wykluczenia i prawdopodobieństwo włączenia w analizie wyników uzyskanych dla mieszanin DNA od dwóch osób lub większej ich liczby powinno się stosować w przypadkach, w których wyklucza się możliwość wystąpienia zjawiska wypadania alleli. Metody te są powszechnie stosowane, zwłaszcza w przypadku mieszanin DNA pochodzącego od dwóch osób, w których możliwe jest wyraźne rozróżnienie składnika większego i mniejszego. Jeżeli wszystkie allele charakterystyczne dla DNA oznaczonego z materiału porównawczego są obecne wśród pików profilu analizowanej mieszaniny DNA, nie można wykluczyć obecności DNA tej osoby w otrzymanej mieszaninie i możliwe jest warunkowe opiniowanie, którego siła uzależniona jest od wartości prawdopodobieństwa włączenia/wykluczenia [2, 3, 6]. Prawdopodobieństwo włączenia (Pi) przyjmuje założenie, że możliwe są wszystkie kombinacje geneotypów w danym locus, które nie mogą być wykluczone z mieszaniny DNA. Każdy z układów rozpatrywany jest niezależnie. Prawdopodobieństwo włączenia (Pi) oblicza się na podstawie wzoru: Pi = (pA + pB + pC + ... + pn)2, gdzie • pA, pB, pC – częstości alleli A, B, C • pn – częstość ostatniego allela w locus. Analogicznie jak w przypadku prawdopodobieństwa przypadkowej zgodności wynik końcowy stanowi iloczyn wartości wyznaczonych dla każdego locus niezależnie. Prawdopodobieństwo wykluczenia (Pex) określa, z jakim prawdopodobieństwem przypadkowa osoba z populacji może być wykluczona jako źródło DNA w badanym śladzie. Podobnie, jak w przypadku prawdopodobieństwa przypadkowej zgodności, każdy układ alleli rozpatrywany jest niezależnie. Dla konfiguracji heterozygoty (np. A i B) – locus z ujawnionymi dwoma allelami – wartość prawdopodobieństwa wykluczenia oblicza się na podstawie wzoru: Pex = 1 – 2pApB, zaś dla konfiguracji homozygoty (np. C) – locus z ujawnionym jednym allelem – prawdopodobieństwo wykluczenia wynosi: Pex = 1 – (pC)2 Wynik końcowy, będący iloczynem wartości otrzymanych dla poszczególnych loci, określa, jakie jest prawdopodobieństwo potwierdzenia hipotezy zerowej, że przy- PROBLEMY KRYMINALISTYKI 280(2) 2013 padkowa osoba z populacji będzie mogła być wykluczona jako źródło DNA w badanym śladzie. Im wyższa jest wartość prawdopodobieństwa wykluczenia, tym bardziej prawdopodobna jest słuszność przyjętego na wstępie założenia (H0). W porównaniu z wynikiem prawdopodobieństwa przypadkowej zgodności wynik prawdopodobieństwa wykluczenia jest trudniej interpretować pod względem siły dowodowej analizowanego wyniku. Prawdopodobieństwo włączenia i prawdopodobieństwo wykluczenia są metodami komplementarnymi i podlegają następującym zależnościom [4]: Pex = 1 – Pi Pex (1…n) = 1 – [Pi1 x Pi2 x … x Pin] Iloraz wiarygodności LR (likelihood ratio) Zgodnie z rekomendacją opracowaną przez ISFG preferowanym sposobem interpretacji mieszanin DNA jest iloczyn prawdopodobieństwa warunkowego najczęściej dwóch hipotez, który służy do wyrażania siły dowodu – profilu DNA otrzymanego ze śladu. Jedną z nich jest hipoteza oskarżyciela (oznaczana jako Hp), która zakłada, że badany ślad biologiczny pozostawiony został na miejscu zdarzenia przez osobę podejrzaną, co wynika ze zgodności profili DNA uzyskanego z materiału dowodowego i porównawczego. Drugą hipotezą jest hipoteza obrońcy (oznaczana jako Hd), która zakłada, że DNA w śladzie pochodzi od przypadkowej osoby z populacji, niespokrewnionej z osobą podejrzaną, o profilu wykazującym zgodność z profilem DNA uzyskanym z materiału dowodowego. Szansa, że to osoba podejrzana zostawiła na miejscu zdarzenia ślad biologiczny (tzw. szansa a posteriori) stanowi iloczyn szans przemawiających za przyjęciem takiej hipotezy przed wykonaniem badań biologicznych (szanse a priori) i wartości LR: szanse a posteriori = LR x szanse a priori Wartość LR wyraża stosunek prawdopodobieństwa dowodu z badań DNA przy założeniu dwóch hipotez (oskarżyciela i obrońcy), co zapisuje się w postaci wzoru [2]: gdzie: E – dowód z badań DNA Hp – hipoteza oskarżyciela Hd – hipoteza obrońcy W przypadku mieszanin DNA pochodzącego od dwóch osób rozpatrywane hipotezy można sklasyfikować w trzy zasadnicze grupy [2]: Hp – mieszanina zawiera DNA ofiary (podejrzanego) i podejrzanego (ofiary) 23 Z PRAKTYKI Hd – mieszanina zawiera DNA ofiary (podejrzanego) i nieznanej osoby Hp – mieszanina zawiera DNA ofiary 1 (podejrzanego 1) i ofiary 2 (podejrzanego 2) Hd – mieszanina zawiera DNA pochodzące od dwóch nieznanych, niespokrewnionych osób Hp – mieszanina zawiera DNA ofiary (podejrzanego) i nieznanej, niespokrewnionej osoby Hd – mieszanina zawiera DNA pochodzący od dwóch nieznanych, niespokrewnionych osób. W zależności od rozpatrywanej grupy hipotez co do pochodzenia DNA w mieszaninie oraz od liczby alleli oznaczonych w danym locus w obliczeniach wartości LR stosuje się odpowiednie wzory przedstawione w tabelach poniżej (tab. 3, 4 i 5) [2]. Tabela 3 Obliczanie wartości LR dla mieszaniny DNA pochodzącego od dwóch osób, do której stosuje się hipotezy z grupy I Calculation of LR for DNA mixture originating from two persons, where group I hypothesis is applicable Analizowana mieszanina – oznaczone allele Genotyp DNA ofiary Genotyp DNA osoby podejrzanej A1, A2, A3, A4 A1 , A 2 A3 , A 4 A1, A2, A3 A1 , A 2 A1, A3; A2, A3; A3, A3 A1, A2, A3 A1 , A 1 A2 , A 3 A1, A2 A1 , A 2 A1, A1; A1, A2; A2, A2 A1, A2 A1 , A 1 A1, A2; A2, A2 A1, A1 A1 , A 1 A1 , A 1 LR Tabela 4 Obliczanie wartości LR dla mieszaniny DNA pochodzącego od dwóch osób, do której stosuje się hipotezy z grupy II Calculation of LR for DNA mixture originating from two persons, where group II hypothesis is applicable Analizowana mieszanina – oznaczone allele Genotyp DNA podejrzanego 1 Genotyp DNA podejrzanego 2 LR A1, A2, A3, A4 A1, A2, A3 A1, A 2 Każda kombinacja genotypów składająca się z alleli oznaczonych w badanych układach A1 24 PROBLEMY KRYMINALISTYKI 280(2) 2013 Z PRAKTYKI Tabela 5 Obliczanie wartości LR dla mieszaniny DNA pochodzącego od dwóch osób, do której stosuje się hipotezy z grupy III Calculation of LR for DNA mixture originating from two persons, where group III hypothesis is applicable Analizowana mieszanina – oznaczone allele Genotyp DNA znanego podejrzanego A1 , A 2 , A 3 , A 4 A1, A2 A1 , A 2 , A 3 A1, A2 A1 , A 2 , A 3 A1, A1 A1, A2 A1, A2 A1, A2 A1, A1 A1, A1 A1, A1 Wartość LR oblicza się dla każdego locus niezależnie na podstawie częstości konfiguracji alleli w danym locus, a wynik końcowy stanowi iloczyn wartości uzyskanych dla poszczególnych układów. Obliczoną wartość LR dla analizowanego profilu DNA należy zinterpretować pod względem siły dowodu i wyrazić ją słownie. Zestawienie zależności pomiędzy numeryczną wartością LR a słownym wyrażeniem siły dowodowej otrzymanego wyniku zamieszczone zostało w tabeli (tab. 6) opracowanej przez Forensic Science Service (FSS) [2]. Jeżeli wartość LR = 1 oznacza to, że wynik z badań DNA jest nierozstrzygający, gdyż szanse przemawiające za hipotezą oskarżyciela, po uwzględnieniu wyniku z badań DNA (szanse a posteriori), nie zmieniają się w stosunku do szans potwierdzających słuszność twierdzenia oskarżyciela przed wykonaniem badań DNA (szans a priori). W przypadku gdy wartość LR > 1, szanse, że hipoteza oskarżyciela jest słuszna, są wzmocnione przez dowód z badań DNA. Natomiast jeśli wartość LR < 1, analizowany wynik genotypowania DNA przemawia za hipotezą obrońcy, osłabiając tym samym stanowisko oskarżyciela. Wyżej opisane metody statystyczne wykorzystywane razem bądź niezależnie wspomagają analizę wyników z badań DNA, a ich wybór uzależniony jest od otrzymanego wyniku genotypowania DNA (tab. 7). PROBLEMY KRYMINALISTYKI 280(2) 2013 LR Tabela 6 Zależności pomiędzy numeryczną wartością LR a słownym wyrażeniem siły dowodowej wyniku Relationship between LR numerical value and evidential strength of results Wartość LR Siła dowodu 1 000 000 + D. supermocny 100 000 D. bardzo mocny 10 000 D. mocny 1000 D. umiarkowanie mocny 100 D. umiarkowany 10 D. ograniczony 1 D. nierozstrzygający 0,1 D. ograniczony 0,01 D. umiarkowany 0,001 D. umiarkowanie mocny 0,0001 D. mocny 0,00001 D. bardzo mocny 0,000001 D. super mocny Wspierana hipoteza Hp Hd 25 Z PRAKTYKI Tabela 7 Zestawienie wykorzystania metod statystycznych w zależności od otrzymanego wyniku genotypowania DNA Collation of use of statistical methods depending on the result of DNA genotyping Mieszanina Profil DNA Mieszanina DNA trzech Metody jednej DNA dwóch osób lub statystyczne osoby osób większej ich liczby Prawdopodobieństwo przypadkowej zgodności X Prawdopodobieństwo włączenia/ wykluczenia LR X X X X X Uwzględniając omówione w niniejszym opracowaniu zagadnienia związane z analizą wyników uzyskanych z badań genetycznych, poniżej przedstawiono w skrócie przykładowy sposób postępowania podczas analizy mieszanin DNA pochodzącego od dwóch osób lub większej ich liczby. Przykładowy sposób postępowania podczas analizy mieszanin DNA pochodzącego od dwóch osób Na wstępie analizy mieszanin DNA pochodzącego od dwóch osób wykorzystuje się dane jakościowe pozwalające na wyznaczenie wszystkich możliwych kombinacji alleli w locus. Następnie kombinacje te są weryfikowane na podstawie danych ilościowych (tj. pola powierzchni lub wysokości pików) przez ocenę dwóch parametrów, tj. stopnia zbalansowania heterozygot oraz stopnia/proporcji zmieszania składników mieszaniny DNA. Analiza oparta na wyżej wymienionych parametrach jest możliwa tylko w przypadku mieszanin z wyraźnie wyodrębnionymi poszczególnymi składnikami – mieszaniny typu B i C. Zaakceptowane dopuszczalne kombinacje genotypów są wykorzystywane do dalszej analizy porównawczej z profilem DNA oznaczonym dla próbki referencyjnej, jak również do analizy statystycznej. Sytuacja komplikuje się, gdy mamy do czynienia z mieszaninami DNA typu A (bez wyodrębnionego składnika mniejszego i większego), ponieważ w takich przypadkach nie ma możliwości se- 26 lekcji wyznaczonych kombinacji genotypów. W związku z powyższym w analizie wykorzystywane są wszystkie możliwe kombinacje. W przypadku mieszanin DNA pochodzącego od dwóch osób możliwe jest wykorzystanie wszystkich wyżej opisanych metod statystycznych, a rodzaj zastosowanej metody zależy od typu, do jakiego dana mieszanina została zakwalifikowana. Przykładowy sposób postępowania podczas analizy mieszanin DNA pochodzącego od więcej niż dwóch osób Interpretacja wyników genotypowania mieszanin DNA pochodzącego od więcej niż dwóch osób wymaga zawsze indywidualnego podejścia i jest uzależniona od stopnia złożoności oraz jakości uzyskanego wyniku, a także od pochodzenia śladu. W interpretacji tego typu wyników badań DNA pomija się etap analizy z wykorzystaniem danych ilościowych. W analizie statystycznej wykorzystuje się prawdopodobieństwo włączenia lub prawdopodobieństwo wykluczenia. Zaletą metody prawdopodobieństwa włączenia lub wykluczenia DNA przypadkowej osoby z populacji zastosowanej w analizie mieszanin DNA jest to, że nie wymaga ona ustalenia faktycznej liczby osób, od których pochodzi DNA w badanej próbce. Zastosowanie ilorazu wiarygodności (LR) w analizie mieszanin DNA pochodzącego od więcej niż dwóch osób jest utrudnione, gdyż wymaga ustalenia faktycznej liczby osób, od których pochodzi DNA w badanej próbce, co w przypadku takich mieszanin jest często niemożliwe. Utrudnione jest również rozpatrywanie hipotez co do pochodzenia DNA w śladzie. W przypadku interpretacji mieszanin DNA pochodzącego od więcej niż dwóch osób, w zależności od wyniku analizy statystycznej, tj. wartości prawdopodobieństwa włączenia (wykluczenia), możliwe jest warunkowe opiniowanie stwierdzające, że w otrzymanej mieszaninie obecne są cechy DNA osoby, od której pobrano materiał porównawczy i „mogą one od niej pochodzić” lub że „nie można wykluczyć” obecności DNA tej osoby w dowodowej mieszaninie DNA. Z praktyki wynika, że większość mieszanin DNA pochodzącego od więcej niż dwóch osób, ze względu na trudności w ich interpretacji, nie kwalifikuje się do przeprowadzenia analizy porównawczej. BIBLIOGRAFIA 1. T.M. Clayton, J.P. Whitaker, R. Sparkes, P. Gill: Analysis and interpretation of mixed forensic stains using DNA STR profiling, Forensic Science International, 1998. 2. J. Buckleton, C.M. Triggs, S.J. Walsh: Forensic DNA Evidence Interpretation, CRC Press, London, 2005. PROBLEMY KRYMINALISTYKI 280(2) 2013 Z PRAKTYKI 3. P. Gill, C.H. Brenner, J.S. Buckleton, A. Carracedo, M. Krawczak, W.R. Mayr, N. Morling, M. Prinz, P.M. Schneider, B.S. Weir: DNA commission of the International Society of Forensic Genetics: Recommendations on the interpretation of mixtures, Forensic Science International, 2006. 4. J.M. Butler: Forensic DNA Typing, Elsevier Academic Press, second edition, 2005. 5. P.M. Schneider, R. Fimmers, W. Keil, G.Molsberger, D. Patzelt. W. Pflug, T. Rothämel, H. Schmitter, H. Schneider, B. Brinkmann: Allgemeine Empfehlungen der Spurenkommission zur Bewertung von DNA-Mischspuren. 6. N. Rudin, K. Inman: Forensic DNA Analysis, CRC Press, second edition, 2002. wyniku oraz zachowaniem szczególnej ostrożności przy formułowaniu wniosków. Artykuł powstał z myślą o opracowaniu jednolitych podstaw teoretycznych w języku polskim bazujących na światowych publikacjach naukowych będących pomocnym narzędziem w analizie wyników badań DNA, ze szczególnym uwzględnieniem mieszanin DNA. Słowa kluczowe: mieszanina DNA, stopień zmieszania, proporcje zmieszania, balans heterozygotyczny, prawdopodobieństwo przypadkowej zgodności, iloraz wiarygodności, prawdopodobieństwo wykluczenia, prawdopodobieństwo włączenia. Summary The analysis of DNA biological traces originating from more than two persons belongs to one of the most challenging tasks of forensic DNA experts. DNA mixtures require not only excellent research background of the expert but also their ability to provide the most pertinent analysis of findings, conducted in line with generally approved principles. On top of Streszczenie Analiza śladów biologicznych zawierających DNA od dwóch osób lub większej ich liczby jest jednym z najtrudniejszych wyzwań stojących this, the forensic expert, when analyzing DNA results, should be able to utilize proper statistical methods whilst taking particular care in formulating the results. The paper has been elaborated with the view of devel- przed ekspertami z zakresu kryminalistycznych badań genetycznych. Tego oping uniform theoretical basis for examiners in Poland, and which are rodzaju ślady wymagają od eksperta wykonującego badania, poza doskonałym warsztatem badawczym, także umiejętności poprawnej analizy based on worldwide scientific publications helpful in interpreting DNA analytical findings with a particular emphasis on DNA mixtures. wyników przeprowadzonej zgodnie z ogólnie przyjętymi na świecie zasadami. Ponadto ekspert, analizując wyniki badań DNA, powinien wykazać Keywords: DNA mixture, mixture level, mixture proportion, heterozygotic balance, random match probability, likelihood ratio, prob- się poprawnym zastosowaniem metod analizy statystycznej otrzymanego ability of exclusion, probability of inclusion. PROBLEMY KRYMINALISTYKI 280(2) 2013 27