Sanal Gerçeklik İçin Ses: Ambisonics Format-B (2. Bölüm)

Bu yazı iki bölümden oluşmaktadır. İlk bölüm için tıklayınız.

Birinci bölümde “Ambisonics Nedir?”, “Ambisonics B-Format”, “Dinleme Alanı Açısından Ambisonics ile Stereo ve Standart Surround Sistemler Arasındaki Fark”, “Kanal ve Hoparlör Sayısı Açısından Ambisonics ile Stereo ve Standart Surround Sistemler Arasındaki Fark” ve “Neden Ambisonics Format-B?” başlıkları ile Ambisonics B-Format’ı incelemeye başlamıştım. Bu yazıda kaldığım yerden devam ediyorum. Eğer birinci bölümü okumadıysanız buraya tıklayarak yazıya ulaşabilirsiniz.

 

Ambisonics B-Format Çalışma Prensibi

Yukarıda da belirttiğim gibi, 360˚ video ve sanal gerçeklik uygulamaları için en yaygın olarak kullanılan ambisonics formatı, dört kanal ses taşıyan, First-Order Ambisonics olarak da bilinen B-Format’tır. Daha detaylı üç boyutlu alanlar oluşturmak için second-order (9 kanal), third-order (16 kanal), fourth-order (25 kanal), fifth-order (36 kanal), sixth-order (49 kanal) ve daha yüksek ambisonics formatları da bulunmaktadır ancak ticari olarak bunların uygulaması (en azından şu an için) yoktur.

Peki, standart surround sistemler altı ya da sekiz kanal ile yatay bir dinleme alanı oluşturabilirken Ambisonics B-Format sadece dört kanal ile (hem yatay hem de dikey boyutları olan) küre şeklindeki bir dinleme alanını nasıl oluşturuyor?

Format-B’de bulunan dört kanal W, X, Y ve Z olarak adlandırılır. Her kanal küre şeklindeki dinleme alanının farklı bir armonik bileşenini (spherical harmonic component) temsil eder. Basitçe ele alacak olursak, her bir kanalı, farklı bir yöne bakan bir mikrofon olarak düşünebiliriz. Dört kanal, kürenin içinde farklı yönlere bakan dört farklı mikrofondan oluşmaktadır.

Ambisonics kayıtlar için kullanılan bu dört mikrofonun biri omni-directional, diğer üçü ise figure-of-8 (bi-directional) polar pattern’a sahiptir. Kanallara göre bu mikrofonların dağılımı şöyledir:

  • W – omni-directional – kürenin içindeki tüm sesleri almak için
  • X – figure-of-8 – ön ve arka yönler için
  • Y – figure-of-8 – sol ve sağ yönler için
  • Z – figure-of-8 – yukarı ve aşağı yönler için

Ambisonics, M-S (mid-side) stereo tekniğinin üç boyutlu şekli olarak açıklanabilir: M-S tekniğinde M (mid) için omni-directional veya cardioid mikrofon, S (side) için ise figure-of-8 (bi-directional) mikrofon kullanılır. Bi-directional mikrofonlarda iki kapsül bulunur. Ön kapsüle gelen sesler pozitif, arka kapsüle gelen sesler ise negatif (fazları ters) olarak kaydedilir. Daha sonra M ve S mikrofonlarından gelen sinyaller M-S matriks devresi ile birleştirilerek stereo panorama oluşturulur. Mid mikrofonundan gelen sinyal her iki kanala eşit olarak; bi-directional side mikrofondan gelen sinyal ise pozitif taraf sol, negatif taraf sağ olacak şekilde dağıtılır.

Stereo: Sol Kanal = (M) + (S) | Sağ Kanal = (M) + (-S)

Aynı prensip ambisonics format için de geçerlidir. M-S tekniğindeki M, ambisonics tekniğindeki W; M/S tekniğindeki S ise ambisonics tekniğindeki X olarak düşünülebilir.

MS = WX (ön arka)

Bu, ambisonics tekniğinde bulunan diğer kanallar için de geçerlidir:

MS = WY (sol sağ) | MS = WZ (yukarı aşağı)

Bu sebepten dolayı, yukarıda da belirttiğim gibi, ambisonics, M-S tekniğinin üç boyutlu şekli olarak kabul edilebilir. First-Order Ambisonics Format-B, bu teknik sayesinde sadece dört kanal ses kullanarak (hem yatay hem de dikey boyutları olan) küre şeklindeki bir dinleme alanını nasıl oluşturabilmektedir.

 

FuMa ve AmbiX

Ambisonics Format-B’nin kanal dizilimi olarak iki farklı versiyonu bulunuyor: FuMa ve AmbiX. FuMa, kanal dizilimi olarak WXYZ; AmbiX ise WYZX kullanıyor:

  • FuMa = WXYZ
  • AmbiX = WYZX

AmbiX, YouTube ve Waves gibi servis ve firmaların tercih ettiği, FuMa’ya göre daha yaygın olarak kullanılan bir dizilimdir.

 

Ambisonics Formatta Kayıt

Teorik olarak bir omni-directional ve üç bi-directional (figure-of-8) mikrofonu bir araya getirip Ambisonics B-Format’ta kayıt yapmak mümkündür. Diğer yandan, uygulama sırasında dört mikrofonu kapsülleri aynı noktaya gelecek şekilde yerleştirmek çok zordur. Yerleştirilse bile yukarı-aşağı yönündeki mikrofondan gelen sinyal özellikle üst frekanslarda comb-filtering problemine yol açmaktadır. Bu sebepten dolayı doğrudan B-Format’ta yapılan kayıtlarında genelde üç mikrofon kullanılır ve WXY kanalları kaydedilir; dikey boyut (X) kullanılmaz.

Dr Halliday tarafından Nimbus için tasarlanan B-Format mikrofon kümesi. Fotoğraf: Paul Hodges. Creative Commons lisansı altında kullanılmıştır.

 

Bu problemi aşmak için dört cardioid kapsülden oluşan tetrahedral mikrofonlar geliştirilmiştir. Bu mikrofonlar Ambisonics A-Format’ında kayıt yaparlar. Yapılan bu kayıtlar daha sonra B-Format’a dönüştürülür.

Günümüzde 360˚ video ve sanal gerçekli uygulamaları için ambisonics formatta kayıt yapmak amacıyla farklı firmalar tarafından geliştirilmiş, farklı fiyatlara sahip çeşitli mikrofonlar bulunmaktadır. Örnek olarak Sennheiser AMBEO VR, Soundfield SPS200, Core Sound TetraMic ve Twirling720 Lite’ı sayabiliriz. Bu mikrofonlar A-Format’ta kayıt yapıp daha sonra kaydı mikrofon ile birlikte gelen bir program ya da plug-in aracılığı ile B-Format’a çevirirler.

 

Mono, Stereo ve Surround Sinyallerin Ambisonics B-Format için Kodlanması

Mono, stereo ve surround sinyalleri bir plug-in ya da program aracılığı ile Ambisonics B-Format’a uygun bir şekilde kodlayabilirsiniz. Bu sayede hazır B-Format kayıtlara yeni sesler ekleyebilir, eldeki sesleri kullanarak sıfırdan bir B-Format miks yaratabilir ya da 5.1 veya 7.1 surround formattaki bir kaydı B-Format’a dönüştürebilirsiniz.

Waves, bu işleri kolay yolla yapmak isteyen kullanıcılar için 2017 Ekim ayında B360 Ambisonics Encoder plug-in’ini piyasaya sürdü. B360, girişte mono, stereo, 5.1 surround ve 7.1 surround formatlarını destekliyor; çıkışı ise AmbiX sıralaması ile (WYZX) First-Order Ambisonics B-Format olarak kodlayabiliyor.

Örnek olarak, bir mono sinyali B360 aracılığı ile küre biçimindeki dinleme alanın istediğiniz herhangi bir yerine yerleştirip dört kanal Ambisonics B-Format çıkış alabilirsiniz.

Waves B360 mono

 

Aynı şekilde, stereo (iki kanal) ve surround (5.1 için altı, 7.1 için sekiz kanal) formatındaki kayıtların kanallarını B360 plug-in’i aracılığı ile küre biçimindeki dinleme alanı içinde istediğiniz noktalara yerleştirip, dört kanal Ambisonics B-Format çıkış alabilirsiniz.

Waves 360 surround

 

Waves B360’ın yanı sıra B-Format’ta ses dağılımı ve kodlama yapmak başka plug-in’ler de bulunuyor. Bunlara örnek olarak Soundfield SPS200 mikrofonu ile birlikte ücretsiz olarak gelen Soundfield SurroundZone2 (Mac: AAX, AU, VST | Win: AAX, VST) ve Harpex (498.-Euro | Mac: AAX, AU, VST | Win: AAX, VST) plug-in’lerini sayabiliriz.

 

Dinleme Sistemleri

Teorik olarak Ambisonics B-Format’taki kayıtların herhangi bir ses sisteminde dinlenmesi mümkün. Bunun için dört kanal ambisonics formatındaki kaydın, dinleme yapılacak sisteme göre decode edilmesi gerekiyor. Bu işlemi M-S kayıtların stereo sistemler için decode edilmesine benzetebiliriz. Decode işleminde dört kanalın her biri farklı kazanç ve faz ayarı ile dinleme yapılacak ses sisteminde bulunan hoparlörlere dağıtılır. Dağılıma ve ses sistemine göre bazı kanallar bir hoparlörde aynı fazdayken, diğerleri ters fazla olabilir.

360˚ video ve sanal gerçeklik uygulamalarında kullanıcılar sesi genelde kulaklık üzerinden dinlediklerinden dolayı son yıllarda ambisonics miksler için kulaklıklar referans ve hedef olarak alınmaya başlanmıştır. Diğer bir sebep de ambisonics kayıtlar için tasarlanan ve birçok hoparlörden oluşan ses sistemlerinin çok pahalı olmasıdır. Kulaklıklarda üç boyutlu ses dağılımı binaural tekniği ile mümkün olmaktadır. Bu uygulama için ambisonics miksin çıkışı hoparlörler yerine binaural işlemciye gönderilir. Binaural işlemci sesleri hoparlörlerin olması gerektiği yerlere konumlandırır ya da diğer bir deyişle, kulaklıkla dinleme yaparken seslerin dinleyici tarafından o noktalardaymış gibi algılanmasını sağlar.

Daha önce Waves’in Nx Virtual Mix Room plug-in’i ve Nx Head Tracker donanımı ile ilgili bir yazı yazmıştım (okumak için tıklayınız). Nx Virtual Mix Room plug-in’i içinde bulunan Nx Ambisonics adlı bir eklenti ile Ambisonics B-Format’taki kayıt ve mikslerinizi standart bir kulaklık ile dinleyebilirsiniz. Eğer işi bir adım daha ileri götürmek isterseniz, herhangi bir kulaklığa takılabilen Waves Nx Head Tracker donanımı sayesinde üç boyutlu dinleme alanı içinde seslerin konumlarını sizin kafa hareketlerinize göre konumlandırmak da mümkün. Bu plug-in’leri ve donanımı ayrı ayrı ya da 360˚ Ambisonics Tools seti ile paket halinde temin edebilirsiniz.

 

Teknik terimler için müzik teknolojisi, müzik prodüksiyonu ve ses kayıt terimleri sözlüğüne göz atabilirsiniz.

Benzer paylaşımlar için beni Facebook ve Twitter‘da takip edebilir, haberler için mesaj listeme üye olabilirsiniz. Teşekkürler.

Başlık fotoğrafı: Samuel Zeller (Unsplash) | Manipülasyon: Ufuk Önen

Fotoğraf: Andrew Robles (Unsplash)

© 2017 Ufuk Önen. Her hakkı saklıdır. İzinsiz kullanılamaz.

One Response to Sanal Gerçeklik İçin Ses: Ambisonics Format-B (2. Bölüm)

  1. Pingback: Sanal Gerçeklik İçin Ses: Ambisonics Format-B (1. Bölüm)