Formant Frekanslar ve Pitch Shifting

Fonetik ve Formant Frekanslar

‘Formant’, 1900’lerin başında Latince’den Almanca’ya ve daha sonra da İngilizce’ye alınmış, ‘biçimlendirici’ anlamına gelen bir terimdir. Ses bilgisi (fonetik), formant kelimesini ünlü (sesli) harflerin fonetik özelliğini belirleyen ve biçimlendiren frekanslar olarak tanımlar. En alt formant frekansı f1 olarak etiketlendirilir. Ünlü harflerin formant frekans sayısı dört ile altı arasında değişir ama bir ünlü harfin anlaşılabilir olması için üç formant frekans (F1, F2 ve F3) yeterlidir. Bildiğimiz gibi Türkçede sekiz adet ünlü harf vardır: a, e, ı, i, o, ö, u ve ü. Bunların ilk üç format frekansları (F1, F2 ve F3) yazının sonunda verilen tablodaki gibidir.

Tabloda verilen frekanslar yaklaşık değerlerdir. Dikkatlice bakıldığında tüm ünlü harflerin ilk üç formant frekanslarının 300 Hz – 3 kHz arasında olduğu görülecektir. Yukarıda da belirttiğim gibi bir ünlü harfin anlaşılabilir olması için ilk üç formant frekansı yeterlidir. Telefon hatlarının frekans aralığının dar olması, iletilen sesin kaliteli olmaması ancak konuşmaların rahatlıkla anlaşılabilmesinin sebebi de budur. Telefon hatlarının frekans aralığı 300 Hz – 3.5 kHz’dir, bu da tüm ünlü harflerin ilk üç formant frekansını kapsamaktadır.

Spektogram_Goruntusu

Spektogram görüntüsü.

 

Formant frekanslar spektogram ile görüntülenebilir.

Formant frekanslar spektogram ile görüntülenebilir.

 

Formant Frekanslar ve Akustik Rezonans

Formant frekansların ses ile ilgisi burada bitmiyor. Diğer bir deyişle formant frekanslar sadece fonetik ile ilgili değil… İşin bir de akustik rezonans yönü var. Dil, ağız yapısı ve sinüslere bağlı olarak her insanda farklı formantlar, diğer bir deyişle sabit rezonans noktaları bulunur. Bunlar insanın sesinin karakteristiğini belirler. Konuşurken veya şarkı söylerken, hangi sesi veya hangi notayı çıkartırsak çıkartalım bu rezonans noktaları değişmez. Diğer bir deyişle bu rezonans noktalarının frekansları, çıkarttığımız seslerin frekanslarından tamamen bağımsızdır.

Formant sadece insan sesleri için geçerli bir kavram değildir; enstrümanlarda da sabit rezonans noktaları bulunur. Tıpkı insan sesinde olduğu gibi, bu sabit rezonans noktaları, formantlar, enstrümanın ses karakteristiğini belirler. Örnek olarak bir akustik gitarda hangi notayı çalarsanız çalın, gitarın gövde rezonansı değişmez, sabittir. Çalınan notaların frekansları ile gövde rezonansındaki frekanslar birbirlerinden bağımsızdır.

 

Pitch Shifting

Ses teknolojisi açısından formantların önemi ‘pitch shifting’ ve ‘sampling’ işlemleri sırasında karşımıza çıkıyor. Pitch shifting, bir sesin perdesini (pitch) değiştiren, kaydıran (transpoze eden), işleme verilen isimdir. Bu işlemi yapan cihaza ‘pitch shifter’ adı verilir. ‘Sampling’ ise, artık günümüzde müzik teknolojisi ile uğraşan herkesi bildiği üzere, örnekleme işlemidir. Standart bir pitch shifter üzerinde iki ana parametre bulunur: ‘Amount’ ve ‘Fine Tuning’. Amount parametresi sesin perdesinin alçaltılması (aşağıya kaydırılmasını) veya yükseltilmesini (yukarıya kaydırılmasını) kontrol eder. Birim olarak yarım müzikal ses (semitone) kullanılır. Örnek olarak +1 değeri, sesin perdesini yarım ses, +2 değeri ise iki yarım (diğer bir deşişle bir tam ses) yükseltir. Bir başka örnek olarak, -12 değeri, sesin perdesini 12 yarım ses (bir oktav) düşürür. Fine Tuning parametresi ince ayar için kullanılır. Bu parametre yarım müzikal sesi 100 eşit parçaya böler. Her bir parça ‘cent’ olarak adlandırılır.

 

Sampling

Standart bir sampler, bir bakıma pitch shifter mantığı ile çalışır. Örnek olarak herhangi bir enstrümandan sampler’a “do” notası kaydettiniz ve bunu da klavyede üçüncü oktavda “do” notasına karşılık gelecek şekilde atadınız (‘assign’ ettiniz). Klavyede, üçüncü oktavdaki “do” notasına bastığınızda sampler kaydedilmiş sesi çalar. Eğer tüm klavyeye tek bir örnek (sample) dağıtılmışsa bu durumda, örnek olarak üçüncü oktavda “re” notasına bastığınızda, sampler, kaydedilmiş örneği iki yarım ses (bir tam ses) yükseltip çalar. Analog bantları hızlandırdığınızda sesin perdesi (pitch) yükselir, yavaşlattığınızda ise düşer. Aynı şekilde pitch shifter ya da sampler üzerinde sesin notasını, diğer bir deyişle perdesini, yükselttiğinizde sesin süresi kısalır; eğer sesin perdesini düşürürseniz sesin süresi uzar, ses “yavaşlar”. Normal bir şekilde okunmuş bir cümle, sampler üzerinde bu şekilde bir oktav aşağıdan okutulduğunda canavar sesine, 7-8 yarım ses yukarıdan okutulduğunda ise bir çizgi film kahramanının sesine dönüşebilir.

Waves Tune

Waves Tune

 

Pitch Shifting ve Formant Frekanslar

Günümüzde kullanılan hemen hemen tüm pitch shifter’ların üzerinde ‘time correction’ (süre düzeltme) seçeneği bulunur. Bu pitch shifter’lar sesin perdesini alçaltır veya yükseltirken sesin orijinal süresini korur; süre olarak uzama veya kısalma olmaz. Sesin perdesini değiştirirken sadece süresini korumak sonucun doğal olmasını sağlamaz. Bunun sebebi ise formantlar, sesin karakteristiğini oluşturan sabit rezonans noktalarıdır. İnsan sesinde veya akustik bir enstrümanda nota değiştirildiğinde formantlar sabit kalır. Pitch shifter ile dijital olarak nota kaydırıldığında, notanın perdesi ile birlikte formantlar da, diğer bir deyişle sabit kalması gereken rezonans frekansları da, kaydırılır. Örnek olarak bir erkek sesi, bir çizgi film karakterinin sesine dönüşebilir. Bu sebepten dolayı insan sesinde bir veya iki yarım ses, enstrümanlar da ise en fazla bir kaç tam sesten fazla yapılan perde kaydırmalarında sonuç doğallıktan uzaklaşır. Yapılan küçük değişiklikler, her ne kadar sonuç kulağa fazla yapay gelmese de, yine de sesin veya enstrümanın karakteristiğini değiştirir.

 

Formant Corrected Pitch Shifter

Bu problemin üstesinden gelebilmek için formantları tespit edip, modelleme yaparak bu formantları koruyan ve sesin perdesini değiştiren cihaz ve plug-in’lere ‘formant corrected’ pitch shifter adı verilmektedir. Bu, aslında çok özel bir cihaz ya da plug-in değil. En azından artık değil. Vokal kayıtlarının düzeltilmesinde kullanılan ve günümüzde standart haline gelen Antares Auto Tune, Celemony Melodyne, Waves Tune gibi programların tamamında ‘formant correction’ özelliği bulunuyor.

Antares Auto Tune

Antares Auto Tune

 

Tablo: Ünlü harfler ve ilk üç formant frekansları 

Ünlü Harf

F1

F2

F3

a

600 Hz

1300 Hz

2700 Hz

e

500 Hz

1800 Hz

2600 Hz

ı

500 Hz

1500 Hz

2700 Hz

i

300 Hz

2100 Hz

3000 Hz

o

500 Hz

1000 Hz

2700 Hz

ö

500 Hz

1500 Hz

2500 Hz

u

300 Hz

900 Hz

2400 Hz

ü

400 Hz

1600 Hz

2300 Hz

 

@UfukOnen (Twitter)

Ses ve müzik teknolojileri, müzik prodüksiyonu, ses tasarımı ve benzeri alanlar ile ilgili haberler, düşünceler ve paylaşımlar için beni Twitter’da takip edebilirsiniz: https://twitter.com/UfukOnen

 

Sound_2012_07_Temmuz

Bu yazı Sound dergisinin Temmuz 2012 sayısında yayınlanmıştır. © 2012 Ufuk Önen. Bu yazının tüm hakları saklıdır. İzinsiz olarak kullanılamaz, kaynak gösterilmeden ve link verilmeden alıntı yapılamaz.

 

 

Comments are closed.