Z PRAKTYKI
Wpływ
typu rejestratora
na rozmieszczenie formantów
sygnału
mowy
Ryc.1.Rozmieszczeniemikrofonówurzą dzeńrejestruj ących
Fig. 1.Placementot microphones connected to recordingdevices
Rozwój myś li technicznej w dzi e-dzinie nagrywania i odtwarzania dźwięku z wykorzystaniem nośn ików magnetycz nych. zapoczątkowany przezValdemaraPoulsena ponad sto lat temu [1]. był jedną z przesłanek powstania pół wieku pó źn iej działu kryminalistyki o nazwie "fonoskopia" (łac. fono - dżwięk , skopeo - pa-trzeć) . Przedmiotem badań fonosko-pijnych są dzisiaj analizy wszelkich zapisów sygnałówakustycznyc h bez względuna typnośnikai rejestratora.
Utworzenie pierwszej w Polsce placówki fonoskopii niemal zbi egło się w czasie ze skonstruowaniem w 1963 r. przez firmę Philips pi erwo-wzoru kasety magnetofonowej typu Compact [4] . Był to krok milowy w upowszechnianiu rejestracji ma-gnetycznej dźwięku, który przez lata stanowił najbardziej popularny no
-śnik, obecnie wypieranyprzez gene-rację cyfrową.
Zarówno w przypadku techniki analogowej,jak i cyfrowej rynek za-akceptował cały szereg nośni ków, począwszy od wspomnianej kasety typu Compa ct, przez mik ro kasetę (różnych formatów,zależ n ie od pro-ducenta) , liczne typy i standardy ka-set wideo rejestruj ących ści eż kę dżwię kową, do taśm DAT, dyktafo -nów cyfrowych z wbudowanymi lub wymiennymi pamięciami pół prze wodnikowymi flash, komputerowych. dysków twardych itd. Przedmiotem zleconych badańfonoskopijnych
mo-gą być nagrania dokonane na
wszystk ichtypachdostępnych nośn i kówdżwięku. Wzakrestakichbadań najczęściej wchodzi spisanie treści rozmowydowodo wej,badanie a uten-tycz n ości nagrania i identyfikacja
mówców.
Jednym z etapów identyfikacji
mówcówjest analizarozmieszczen ia
formantów w widmie sygnał u mowy. Ich układ jest bowiem zależny m.in. od anatomiczne go ukształtowania
struktur zaangażowanych w mówi e-nie [3].Silna korelacja rozm
ieszcze-nia formantów w wypowiedziach
do-wodowych i porównawczych to jedno z kryteriów(przy identyfikacji mówcy oprócz analizy formantowej przepro-wadza się także analizęstrukturyję zykowej wypowiedzi), pozwalające na sformułowanie wniosku.że auto -rem obydwu porównywanych wypo -wiedzi jest tensam mówca.W pra k-tycznych zastosowaniachanalizy f or-mantowej korelacja ta nigdy jedna k nie osiąga wartości zupełnej (współ czynnik korelacjir=1).Wpływana nią bowiemszeregczynników,takichjak subtelne różnice pomiędzyposzcze -gólnymi realizacjami słownymi tych
samych Ciągówalofonów,różnicaja -kościnagrania dowodowego ip orów-nawczego czy błąd
pomiaru[S].W p rak-tyce badań fon osko-pijnych do utrwa lenia
wypowiedzi p orów-nawczych wy korzy-stuje sięprofesjon al-ne urządzeni a reje -strujące mowę , po -nadto czynnoś ć ta najczęściej odbywa się w warun kach zbliżonychdost udyj-nych. Zapisy d owo-dowerealizowanesą z użyciem różnych typów rejestratorów analogowyc h i cyfro
-wych,przy czym wię kszość r ejestra-torów cyfrowych wykorzystuje zjaw i-skokompresji,wtymtakźetzw. kom-presji stratnej (w celu wydł uż e n i a czasu nagrywania), która wzależno
ści od zastosowanego stopnia
wpły-wa na jakość utrwalanego sygnał u mowy. Powstała zatem konieczność rozstrzygnięcia wątpliwości , czy sto-sowanie różnych rejestratorów ma wpływ na rozmieszczenieformantów w widmiesygnałudowodowego i po-równawczego.Celem wyjaśnien ian
i-niejszego problemu przeprowadzono
stosowny eksperyment w warunkach
izolacji akustycznej. Material imetody
Materiał do badań stanowiły wy-powiedzi mężczyzny, utrwa lane rów -nocześn i e przez pięć rejestratorów. Dobór warunkowanybyłchęcią prze-śledzenia ewentualnych zmian roz -kładu formantów - w odniesieniu do zapisu analogowego - przy różnych typach rejestratorów cyfrowych. Wy-korzystano:
• Analogowy magnetofon r epor-terskifirmy Marantz, model CP 430; prędkośćprzesuwutaśmy- 4,75 cm/s,
taśmę kompaktową firmy TDK typu D60. Dourządzenia podłączonodwa mikrofony pojemnościowe firmy
Z
P
RAKTYKI
Ryc. 2. Widokpomieszczeniabadawczego - komorybezechowej Fig. 2.Examination (oom
Schoeps, symbol CMC6U (P12-48), z końcówką MK-4 ocharakterystyce kardioidalnej. Para rozstawiona (ustawienie A-B). Wykorzystano przedwzmacniacz firmy SONOSAX typu SX-M2.
• Dysk twardy komputera. Zapis na dyskuod bywał sięw nastepujący sposób:syg nał z mikrofonustojące go firmy Creative (bez ozn aczeń , charakterystykakierunkowa) poprzez zewnętrzną kartę dźwiękową (USB) ExdigySound Blasterfirmy Creative transmitowanybyłzuż ycie msieci i n-temetowej ikomputerowegoo progra-mowaniaonazwie "Skype",służące
go do internetowych rozmów tele fo-nicznych w standardzie VolP (ang. Voice over Inlemet Protocotv .
Na-stępn iena drugimzestawieko mpute-rowym, poprzez wewnętrzną ka rtę AC97 firmy ASUS, rejestrowano sygnał zwrot ny, wykorzystuj ąc
oprogramowanie Cool Edit Pro w wersji 2.0firmySyntrillium.
• Cyfrowydyktafon firmy O lym-pus, model DW-90, tryb SP (Nor -mai), częstotliwość próbkowania
11 kHz. Urządzenie rejestruje z kompresją bezstratną w postaci plikówWAVE.
• Porladisc (Mini Disc) firmy HHB,model MDP500.Urządzenie zapisuje dźwię k na nośnikach mi-nidisc w postaci PCM, częstotl i wośćpróbkowania- 44,1 kHz, roz-dzielczość 16 bitów,z wy korzysta-niem kodu ATRAC4.5. Jesttosy s-tem stratnej kompresji dźwięku ,
w którym dane ulegają redukcji w proporcji 5:1 z wykorzystaniem fi-zjologicznych własności słyszenia
(np. maskowanie tonów cichych przez współbrzmiące tony głośne o sąsiednich częstotliwościach) , co jest wykorzystywane przez liczne a l-gorytmy kompresji stratnej [2]. Do
urządzen ia podłączonodwam ikrofo-ny pojemnościowe firmy Schoeps; pierwszyo symboluCCM40ich arak-terystyce kardioidalnej, a drugi Osymbolu BLM03C i charakterystyce dookólnej.
PROBLEMY KRYMINALISTYKI253/06
• Telefon komórkowy firmy S ie-mens, model SL45i (u rządzen i e nie
było połączone z siecią telefonii ko-mórkowej- usunięto ka rtęSIM).Da -ne audio zapisywane są w pamięci telefonu,zwłasnąkompresjąstratną,
do plików w formacie.vmo. Przebieg eksperymentu
Spiker(męźczyzna,30 lat) znajdo-wał się w komorze bezechowej, będącej w wyposaże ni u Akademii Górniczo-Hutniczej wKrakowie.Wła sności komory: objętość 60 m3, p o-ziom ciśnienia akustycznego (SPL) ok. 16dBw charakterystyceA. Przed
mówcą, w od ległości ok. 1 mod ust, nawyściełanym stoliku umieszczono mikrofony podłączone do opisanych
powyźej rejestratorów. Ze wzg lędu na poziom generowanych zakłóceń zestaw komputerowy znajdował się na zewnątrz pomieszczenia badaw -czego.
Eksperyment rozpoczęto od od -czytaniasamogłosekw kolejności: a, e, y,o,u,i. Następ ni e mówca wy po-wi ed ział wcześ niej dobrane słowa
i zdania: "mama","byłem", "borsuk",
"kino", "umizgi", "wymyty", "bolo", .berqen", "lufa", "gaderypoluki" oraz "Jakaładna dziśpogoda",.Dużydom stał daleko","Muzyka buduje
harmo-nijnyład". W celu eliminacji przypad -kowych błędów językowych , samo
-głoski i kwestie zdaniowe po wtórzo-notrzykrotnie.Zgromadzonymateriał dźwiękowy został następnie za rchi-wizowany nadysku twardymko mpu-terawpostaci plików.wav z k odowa-niemWindowsPCM,oczęstotliwości próbkowania44,1 kHzi r
ozdzielczo-ści 16 bitów.
Kolejnym etapem eksperymentu byłaanalizawidmowa dlawszystkich
nagrańpodkątemwyznaczeniapoło źenia poszczegó lnych formantów w odpowiadających sobiealofonach. Na wstępi e, z wykorzystaniem k om-puterowego oprogramowania Cool Edit Pro w wersji 2.1. firmy Synt ril-lium, przeprowadzono ana lizę spe
k-tralnąstruktury zarejestrowanego sy-gnału. Badanie wyko
-nano na tym samym
dla wszystkich próbek odcinku czasowym ,
zawierającym ciszę. Następn ie przystąpio
no do pomiarów s
y-gnału mowy.Przep ro-wadzonoje dwuetapo -wo. Najpierw za pomo -cą komputerowego oprogramowania Praat (wersja 4.2.04)zostały zmierzone wartości formantów dla poje -dynczych samogłosek
oraz dla samogłose k w otoczeniu f onetycz-nym. Dobór i wartości
położenia formantów realizowano tzw.sposobemręcznym. Drugim eta-pembyłaanaliza spektralnasygnału, a do jej przeprowadzenia wykorzy -stano wyźej opisane oprogramo wa-nie Cool Edit Pro (ustawienia: FFT -16384,okno Hanninga).W tejczęści eksperymentuzliczanomaksima am-plitud zaznaczone uprzednio w tych samych miejscach położenia samo
-głosek i o tej samejdługości cza so-wej dla wszystkich analizowanych próbek. Uzyskane wyniki badań ze-stawionowformie tabelarycznej i na
Z
P
RAKTYKI
", : ; ·· ,H
Ayc.3. Spektrogramwypowiedzitestowej utrwalonejzużyci emrej estratoraMarantz
Fig.3.Spectrogramo/test utterancerecorded with Maramz aevtce
Wynikii dyskusja
ich podstawie przeprowadzono
anali-zę.
Analiza korelacji położenia
for-mantów została przeprowadzona
w odniesieniu do zapisu
analogowe-go, uzyskanego z użyciem
magneto-fonu firmy Marantz, model GP 430.
Prezentowaneponiżejwykresy
kore-lacji to odniesienieuzyskanych
wyni-ków dlanagrań cyfrowychdo
pomia-rów rozkładu formantów w zapisie analogowym.
Zaprezentowanorównież
spektro-gramyprzedstawiające rozkład
ener-gii w tej samej wypowiedzi,
utrwalo-nej z wykorzystaniem sześciu torów
transmisji.
W wyniku analizy położenia
for-mantów każdorazowo uzyskano bar
-dzo wysoki, zbliżony do 1, współ
czynnik korelacji.Ma toistotnywpływ
napraktykę fonoskopijną,gdyż
wyko-rzystanietak różnych urządzeń
reje-strujących niewprowadziło istotnych
różnicw rozkładziemaksimów
lokal-nych w widmie sygnału mowy,
uwzględnianym w procesie
identyfi-kacji mówców. Dla biegłych i techni
-ków kryminalistykikonkluzja ta
ozna-cza,żedo utrwalenia wypowiedzi
po-równawczych nie jest wymagane
użycie takiego samego rejestratora
jak dowodowy. Zakres
przeprowa-dzonego eksperymentu nieuprawnia
do wnioskowania owpływienapoło
żenie formantów transmisji telefo-nicznej czy innych nietestowanych
urządzeń.
Odwołanie się do praktyki
fono-skopijnej pozwala dostrzec, że
uzy-skana wysoka korelacja położenia
formantów w obrębie rejestratorów
użytychdo eksperymentujest
silniej-sza niż w realiach
kryminalistycz-nych.W nagraniach dowodowych
do-datkowopojawiają się bowiem
czyn-niki, które nie wystąpiły w
ekspery-mencie,jak np.odmienny stan emo
-cjonalny mówcy w trakcie wy
powie-dzi dowodowych i porównawczych,
2'J101łJ _ -.F-=~----J
IE
,~-
%
-l
::
-
(=9996 c o 1000 2000 3000 4000Ryc.4.Stopi e ńkorelacji wypowiedzi utrwalonychzużyciemrejestratorówMarantajportadisc (mikrofon kardioidalny).POlliżejspektrogram...,.powiedzitestowejutrwalonejzużyciemrejest ratoraportadisc (
mi-krofonkardioidalny).
Fig.4.Co"elationotutterancesrecordedwfthMarantz devicesandportadisc (cordioidal microphone ). Be/ow:spectrogramottest utterance recordedwith portadisc(carriioidafmicrophone)
",
...
..
---.-Ryc.5.StopieńkorelacjiwypowiedziutrwalonychzużyciemrejestratorówMarantziportadisc (mikrofon dook6 Iny).Poniżejspektrogram wypowiedzitestowej utrwalonej zużyciemrejestratoraportadisc( mikro-fon dook6Iny).
Fig.5.Corre/ation ot utterancesrecorded with Marantz deviceeand portadisc (surround micropnon e).
Be/ow: spectrogram ot test utterance recorded with portadisc(surroundmicrophone)
Z PRAKTYKI
(=9993 1000 2000 3000 4000 --4000 3500 3000~
ł=
1500 1000 500 0'--'- _ - - --' O 4500, - -- - - , 4000 3500 . 3000;
E=
1500 _ 1000 500OL-'--- - - ' O 1000 2000 3000 4000Ryc.6.Stopieńkorelacjiwypowiedziutrwalonych zużyciemrejestratorów
Maran tziOlymp us.Poniż ejspektrog ram wypowiedzitestowejutrwalonej zużyciemrejestratoraOlympus.
Fig.6.Correlationotutteranc esreeordedwith Marantz and Siem ens
devices.Belo w:spectrog ramottest utterancerecordedwithOlympus recorded
Ryc.7.Stopieńkorelacjiwypowiedziutrwalonychzużyciemrejestratorów
MarantziSie mens.Poniżejspektrogramwypowiedzi testowejutrwalonej zużyciemrejestratora Siemens.
Fig.7.Correlationot urterancesreco rdedw/thMarantz an d Siemens
devices.Betow:spectrogramot testutterancerecorded withSiemens recorder
Ryc.8.Stopieńkorelacjiwypowiedziutrwalonychzużyciemrejestratorów
Maranl ziVolP,Poniżejspekt rogramwypowiedzitestowejutrwalonejzuży
ciemrejestr atora VolP,
Fig. 8.Cortets tionot uttera nce srecordedwith Maran tzand VolPdevices.
Belo w:spectrogramottest ut!eran ce reco rdedwith VolPrecoraer
GrzegorzŚlusarczyk
Jacek Rzeszotarski
TadeuszSikora
Jacek Wierzbicki
zdj.: autorzy
- uogólnienie uzyskanych wyn
i-ków na nagrania utrwalone z wyk
o-rzystaniem transmisji telefon icznej
wymaga przeprowadzenia kolejnego
eksperymentu.
BIBLIOGRAFIA
1. Blalr Benson K.: Audio Engine
-ering Handbook,McGraw-HiII Book
Com-pany,1988.
2.Halnes R.: Cyfrowe przetwarzanie
dźwięku,Wydawnictwo MIKOM, War
sza-wa 2002.
3.Jassem W.:Podstawyfonetyki ak
u-stycznej, Państwowe Wydawnictwo Na-ukowe,Warszawa1973.
4.KominekM.:zaczęło się odfo
no-grafu, Polskie Wydawn ictwo Muzyczne,
Kraków 1986.
5. Rzeszotarski J., Witkowska
-Pa-wiak W.:Identyfikacja mówców wobrębie
materiału dowodowego, .Problerny K
ry-minalistyki"2004.nr246,s.15-18. Wnioski
sposób rejestracji
idobórpróbekza
-wsze wpływa na
osłabienie kore
la-cji roz kładu fo r-mantów, tak że nie jest ona rów -na1. 4000 Na podstawie przeprow ad z o
-nych badań s
for-mułowano nastę pującewnioski: - sposób zapi -su rejestratorów cyfrowych uży tych w
ekspery-mencie nie wpły
wa w istotny
spo-sób na rozmies
z-czenie formantów w widmie syg nału
mowy;
- identyfikacjamówcóww oparciu
o analizę formantową nie wymaga
wiernego odwzorowaniaspecyfikiza
-pisu dowodowego wnagraniuporów
-nawczym; 3000 2000 1000 ,,"p 4000 3500 3000
~
=
ł 1500 1000 500 O'--'- - - _ - - - - -' Onie zawsze pełna zgodność ciągów
alofo nów w badanych samogło
skach.
Odrębne zagadnieni e stanowi
błąd pomiaru polożen ia formantów.
Należy przyjąć, że jest to jeden
z czynników, który bez względu na