DSD Nedir, Ne Değildir?

Mecmua’da daha önce yazdığım “24 bit ne getirir, ne götürür?” yazısında 24 bit’lik yüksek çözünürlüklü ses dosyaları ile 16 bit’lik CD kalitesindeki dosyaları karşılaştırmıştım. Yüksek çözünürlük sınıfının en üst sınırını oluşturan DSD formatını konuya dahil etmemiştim çünkü bu tür müzik dosyalarına sahip değildim. Yakın zamanda bu standartta bazı kayıtlar elime geçince hemen bir inceleme macerasına giriştim.

DSD hakkında temel bilgilerle başlayalım. Bildiğiniz gibi, sesin sayısala dönüştürülmesi için çok küçük bir zaman diliminde örnekleme alınıyor. Birim zamanda alınan örnekleme 16 bit boyutunda ise 65.536 seviyeye karşılık geliyor. Yani, kaydedilen her bir örnekleme diliminde sesin en üst seviyesi ile en alt seviyesi arasında 65.536 basamak fark oluyor. CD kalitesinde bu örnekleme saniyede 44.100 kere yapılıyor. Şayet kayıt 24 bit ise bu örnekleme 16 bit’in 256 katı, yani 16.777.216 basamaktan oluşuyor. DSD denilen yöntem ise bir bit’lik örneklemelerden oluşuyor. Yani örneklemenin sadece iki seviyesi var: bir veya sıfır, hepsi bu. “Bu nasıl yüksek çözünürlük?” dediğinizi duyar gibiyim. Bu haliyle, olabilecek en düşük çözünürlüktür gibi duruyor. Ancak iş burada bitmiyor. Çözünürlüğe etki eden bir faktör daha var, o da örneklemenin ne sıklıkta alındığı. CD kalitesinde her bir örneğin saniyenin 44.100’de birinde alındığını hatırlayın. DSD formatında ise sadece iki değeri olabilen her bir örnekleme saniyenin en çok 2.822.400’de birinde alınıyor. Yazıyla: saniyenin ikimilyonsekizyüzyirmiikibindörtyüzde biri! Bu kadar ufak mı ufak bir zaman dilimine ulaştığınızda o anki sesi sadece iki değere indirgediğinizde bile muazzam bir çözünürlük elde ediyorsunuz.

Bedava peynirin sadece fare kapanında bulunduğunu unutmayalım, bu muazzam çözünürlüğün bir bedeli olacağını hemen tahmin edebiliriz. Bu bedel de çok yüksek gürültü oranı oluyor. Sayısallaştırma gürültüsü olarak adlandırabileceğimiz bir doğal fenomen DSD kayıtlarının başının derdi. Ancak özel bir teknik kullanılarak bu gürültü, duyduğumuz ses frekans bölgesinden yukarıya, ultrasonik bölgeye taşınıyor ve bize yüksek çözünürlüklü harika bir ses kalıyor. En azından teorik olarak iddia edilen durum bu. Gerçekte olan bitenin teorik olarak iddia edilene ne kadar uyduğunu merak ediyordum ama dediğim gibi elimde DSD kayıt yoktu. Sonsuz bilgi kaynağı internet ise DSD konusunda tam bir muamma kaynağına dönüşüyor. Biraz araştırsanız böyle temel bir konuda nasıl bu kadar çelişkili bilgilerin olabildiğine şaşırıp kalırsınız; ortalık tam anlamıyla birbiriyle çelişen iddialarla dolu.

DSD dosyaları elime geçince merakıma yenilerek, dinlemeden önce bilgisayarda analizlerini yapmaya karar verdim. Önce spektrogram ile başladım. Ike Quebec’in Minor Impulse yorumunun görüntüsü aşağıdadır.

Yatay eksen şarkının süresini gösteriyor: 6 dakika 14 saniye. Düşey eksen ise frekans bandını. Normal ses dosyalarında alıştığımızın çok ötesinde, 176 KHz’e kadar uzanıyor frekans genişliği. Çok güzel de, burada bir terslik olduğunu hemen görüyorsunuz. Ses sinyali, yani müziğin kendisi en fazla 25 KHz’e kadar çıkıyor. Sonra, yaklaşık 35 KHz’e kadar sessiz bir alan ve hemen arkasından başlayan ve kalan bütün frekans bandını dolduran muazzam bir gürültü var. Gürültü seviyesi de öyle az buz değil. İşin teorik kısmını açıklarken yüksek gürültünün ultrasonik bölgeye

taşındığından bahsetmiştim ama doğrusu seviyesinin bu kadar yüksek olduğunu ve bu kadar geniş bir frekans bandını kapladığını bilmiyordum.

Tahmin edeceğiniz gibi DSD dosyalarının boyutları çok büyük ve yukarıdaki spektrograma göre ses sinyali bu dosyanın küçük bir bölümünü kaplıyor. Yaklaşık 6 dakikalık şarkı 265 MB boyutunda ve bu dosyanın yaklaşık %80’i bangır bangır gürültü!

Şimdi biraz düşünelim, bu formatı yaratanlar herhalde bu durumun tuhaflığının farkındadırlar. Zaten, tutmuşlar gürültüyü 35 KHz gibi duyamayacağımız bir frekans sınırının üzerine taşımışlar. Yukarısından bize ne, biz duyabildiğimiz kısma bakarız diye düşünebilirsiniz. Ancak sesin doğası bizi şaşırtmaktan geri kalmıyor. Bildiğiniz gibi, ses sinyallerinin harmonikleri vardır ve bu harmonik frekansları asıl sesin çok ötesine ulaşır. Gürültü de bu durumdan muaf değil. Ses dosyasının %80’ini dolduran gürültü sinyalleri duyduğumuz frekans bandını da mutlaka etkiler. Gerçi, DSD uyumlu DAC’lar yüksek frekansları filtreleyip sadece duyduğumuz sesleri amplifikatöre besliyorlar ama bu işlem acaba ne kadar başarılı?

Bir deneme yapmaya karar verdim ve yukarıdaki DSD dosyasını AUDACITY programı ile yine 24 bit’lik ancak CD dengi olan 44.1KHz örnekleme sıklığındaki FLAC formatına dönüştürdüm.

Bu dosyanın spektrogramı budur. Frekans aralığı 22 KHz’de bittiğinden üstteki DSD spektrogramıyla uyumlu olsun diye yüksekliği azaltarak iki grafiği denk hale getirdim.

DSD dosyasındaki ses bölümü aynen burada da duruyor ama o muazzam gürültü kısmı artık yok. Dikkatinizi çekebilecek bir farklılık genel ses seviyesindeki azalma olacaktır. Sanki dinamik aralık daha artmış, dinamik sıkıştırma ortadan kalkmış gibi duruyor ama biliyoruz ki DSD dosyasında bir dinamik sıkıştırma yok. Öyleyse neden baskın ses frekanslarını gösteren yeşil alanlar daha azalmış duruyor? Sakın yukarıda bahsettiğim gibi gürültülü kısmı atınca gürültünün ses sinyaline olan etkisi ortadan kalkmış olmasın?

Tek dosya ile yanıltıcı sonuç alınabilir diye ikinci bir analiz yapmaya karar verdim. Bu sefer, Ichiro Kobayashi yönetiminde Çek Filarmoni orkestrasından Mahler’in ikinci senfonisinin ilk bölümünü aldım.

Yine aynı tablo karşımızda, müziğin kendisi dosyanın küçük bir bölümünü oluşturuyor. Gerisi bir gürültü ki sormayın. Tamam, DAC’ın bu istenmeyen kısmın çoğunu filtrelediğini varsayıyoruz ancak yine de dosyadaki bu kadar yoğun gürültü asıl sesi mutlaka olumsuz etkiler. Ayrıca, bu gürültünün amplifikatöre ulaşabilen bölümü sinyalin hoparlörleri beslemek için yükseltilmesi aşamasında da distorsiyona sebep olacaktır.

Yine dosyayı 24 Bit 44.1 KHz formatına dönüştürüp sonucuna bakalım.

İşte size pırıl pırıl bir ses ve yine genel ses şiddeti azalmış. Bu görüntü tekrar ortaya çıkınca ses sinyalini biraz daha detaylı inceleyelim diyorum.

DSD dosyasının rastgele bir yerinden dört saniyelik bir kesit alıyorum.

Aynı kesiti bir de dönüştürdüğüm FLAC dosyasından çıkartıyorum.

Sesin yükseldiği bölümlerde görünüm birbirine yakınsa da daha sessiz kısımlarda bariz bir fark var. FLAC dosyasındaki sinyal seviyesi daha düşük. Normalde bu dinamik aralığın daha yüksek olduğuna işaret eder ama burada böyle bir durum olmaması gerekir.

Kafa karıştırıcı bir tablo var karşımızda. İşi biraz daha detaylandırdığımızda durum netleşmeye başlıyor.

Yukarıdaki dalga grafiklerini 2 milisaniye boyutuna kadar daraltınca DSD dosyasından aldığım görüntü budur.

Problemli bir sinyal bu. Bu kadar küçük bir aralıkta saf ses sinyalini görebilmeliydik.

Aynı 2 milisaniyelik aralığı FLAC dosyasından alınca bakın nasıl görülüyor.

Parazitlerden arınmış, olması gerektiği gibi bir ses sinyali var karşımızda. Demek ki DSD dosyasındaki o muazzam gürültü bulutu nazik ses sinyalimizi bozuyor. O zaman ne anladık, bütün bu ultra yüksek çözünürlük tantanasından?

Tabii, objektif analizler işin içyüzünü aydınlatsa da esas olan duyduğumuz ses. Bu yüzden her iki dosyayı da dinlemeye karar verdim. DSD her sistemde, olduğu gibi çalınamayabiliyor. Kendi sistemimde herhangi bir dönüşüme uğramadan oynatıldığından emin olmak istedim. Linux tabanlı bilgisayarımda çalışan MPD sunucusunun gösterdiği bilgiler dosyanın okunabildiğini gösteriyor.

Kırmızı okla işaret ettiğim satır DSD dosyasının dönüştürülmeden çalındığını işaret ediyor. DAC üzerindeki örnekleme frekansı LED’i de dosyanın DSD olarak USB üzerinden girişe ulaştığını gösteriyor.

Geriye kaldı müziği dinlemek. Mahler’in 2. senfonisinin nefis yorumunu her iki dosyadan dinlediğimde FLAC olanı kesinlikle tercih ettiğime karar verdim. DSD dosyası, dalga grafiklerinde görüldüğü gibi daha yüksek ses seviyesine sahip. Yani DAC yüksek frekans parazitlerini tam olarak filtrelemiyor. Bunun sonucunda sanki dinamik sıkıştırma yapılmış gibi bir etki ortaya çıkıyor. Ayrıca, diğer dosyaya göre daha parlak, sentetik bir ses var.

Yine de, bütün bu incelemeden sonra tarafsız olamayacağım için iyi müziğe aşina üç kişi ile gayrı resmi bir kör dinleme testi yaptım. Her üç kişiye de hiç bir ön bilgi vermeden, sadece aynı kayıtı iki kere dinleteceğimi ve birini tercih edip etmeyeceklerini sordum. Sonuç tam bir DSD hezimeti oldu. Teste katılanların hepsi gayet kararlı bir şekilde FLAC dosyasından yaptıkları dinletiyi tercih etti.

Sonuç olarak, DSD formatının bir pazarlama yöntemi olduğu yönünde ciddi bir yargım oluştu. Makul bir FLAC kayıpsız dosyası iyi bir kayıt ve mastering süreciyle birleştiğinde gerçekten çok iyi bir sonuca ulaşabiliyor. Tecrübe ve incelemelerim sonucunda şahsi fikrim 24/96 yani 24 bit, 96 KHz örnekleme frekansındaki dosyaların bütün formatlar içinde en ideali olduklarıdır. Hatta buna analog müzik de dahil diyebilirim.

Bütün bu anlattıklarım sizi şüpheye düşürdüyse yukarıda anlattığım denemeyi kendi sisteminizde yapabilmeniz için, bahsettiğim kayıtların iki dakikalık bölümlerini aşağıdaki link’e yüklüyorum. Sisteminiz DSD ve FLAC formatlarını çalabiliyorsa bu dosyaları indirip bir dinleyin ve kendiniz karar verin. Telif hakkı sorunu olmasın diye sadece ikişer dakikalık iki dosyanın bulunduğu klasörün adresi:

https://app.box.com/s/b0zvpiyaf0dtdshjxzjube5ec92aok5a

Bakalım sizler ne diyeceksiniz bu konuda?

Kendi kullanıcı geri bildirimi anketinizi oluşturun

Aykut Turhan
www.pirekare.blogspot.com