Kayıpsız ve Kayıplı Dijital Ses Dosyaları: Fark Nedir?

Artık hepimizin bildiği gibi, dijital ses dosyalarının sıkıştırılarak daha makul boyutlara indirilmesi daha az yer kaplamalarını sağlıyor. Aslında bu sıkıştırma işlemi sadece ses dosyaları için değil, bütün dijital veriler için geçerli. Öyle ki, komple bir işletim sistemini bile sıkıştırarak daha küçük boyutta saklayabilirsiniz.

Müzik söz konusu olduğunda iki türlü sıkıştırma işlemi yapılabiliyor: kayıpsız ve kayıplı sıkıştırma. Kayıpsız sıkıştırmada dosya boyutu küçültülürken içerdiği veri değiştirilmiyor. Yani sıkıştırılmış dosyayı tekrar normal hale döndürdüğünüzde başlangıçtakinin birebir aynısını elde ediyorsunuz. Kayıplı sıkıştırmada ise özgün dosyanın bazı bölümleri atılarak daha yüksek sıkıştırma oranı, dolayısıyla daha küçük dosya boyutu elde ediliyor. Bunun yan etkisi olarak ise içeriğin bir bölümü çöpe atılıyor. İlk türün en önde gelen örneği FLAC formatı, ikincisinin ki ise MP3 formatıdır.

Yüksek çözünürlüklü dosyaları bir kenara koyarsak, dijital ses standardının CD kalitesi dediğimiz format olduğunu görürüz. Bu dijital “ses”, analog sinyalin doğrudan sayısal hale döndürülmüşüdür. Bu “ses”i bilgisayarımızda, müzik çalarımızda saklarken ya da internetten indirirken yerden ve süreden ekonomi yapmak adına sıkıştırma işlemi yapılır. CD içeriğini FLAC dosyası olarak sakladığımızda yarıdan fazla küçültme (sıkıştırma) yapabiliyoruz. Bu dosyayı dinlediğimizde ise CD’deki müziği birebir olarak tekrar elde ediyoruz. Aynı CD’yi MP3 dosyalarına aktardığımızda ortalama onda bir boyutuna indirgeyebiliyoruz ancak buna karşılık bu dosyaları dinlediğimizde CD içeriğine göre biraz “yuvarlatılmış” bir ses alıyoruz. Aşırı sıkıştırma durumunda ise ses bayağı metalikleşebiliyor.

Peki ama MP3 özgün sese ne kadar zarar veriyor, sesin içinden neler kaybediliyor? Bu yazıda esas olarak bu sorunun cevabını sorgulayacağız.

Önce MP3 ile ilgili iki konuyu hatırlamakta fayda var. Birincisi, MP3 farklı sıkıştırma oranları uygulayabiliyor. En yüksek kalite, en az sıkıştırma yapılan 320 kbps formatında elde ediliyor. Bir saniyede alınan veri miktarını gösteren bu değer 256, 196, 128 ve daha aşağı da olabilir. Genellikle 196 kbps altına inildiğinde seste bariz fark edilebilen “renk” değişiklikleri ortaya çıkıyor.

İkinci nokta ise, her MP3 dosyasının aynı olmaması. Şöyle açıklayayım, ses sıkıştırılırken farklı programlar farklı algoritmalar kullanıyor. Yani, sıkıştırma işlemini yapan programlar neyi atıp neyi saklayacaklarına farklı şekillerde karar veriyor. Tabii, bu işlemin ortak yönleri var, tamamen apayrı algoritmalardan bahsetmiyoruz. Yine de, temel ortak özelliklerin yanında duran bu küçük algoritma farklılıkları sonucu bir miktar etkiliyor.

Daha fazla teknik detaya girmeyelim ancak merak edenler için küçük bir bilgi daha vereyim. Müziğin nesini atıyoruz da dosya küçülüyor? Yüksek frekanslardan başlıyoruz. İnsan kulağının en hassas olduğu ses yine insan sesi. Yani insan sesinin frekans aralığı. Bu aralığın altında ve üstünde taviz verilebilecek çok yer var, buralarda tasarrufa gidebiliriz. Bir de, daha 1950’lerde çok iyi anlaşılmış olan psiko-akustik sistem bize bazı hileler yapma imkanı veriyor. Biliyoruz ki aynı anda kulağımıza ulaşan iki ayrı frekanstaki sesten alçak frekanslı olan yüksek frekanslı olanını maskeliyor. Bu bilgiye sahip olunca ses kaydınızda bulunan ve tam aynı anda tınlayan iki sesten tiz olanını dosyadan atarsanız dinlediğinizde bu eksikliği pek hissetmezsiniz. Bunun gibi tekniklerle veri azaltılıp sıkıştırma gerçekleştiriliyor. Yalnız dikkat, bütün bu yöntemler kayıplı sıkıştırma için geçerli. Kayıpsız sıkıştırma apayrı bir metod kullanarak herşeyi tekrar eski haline getiriyor.

Gelin şimdi kayıplı format ile kayıpsız olanın karşılaştırmasını yapalım. Bu karşılaştırma için ilk olarak odyofillerin meraklı olduğu Lyn Stanley’in bir kaydını seçtim: George Shearing’in bir bestesi olan Lullaby of Birdland.

Şarkının CD’den FLAC’a dönüşümünü Linux işletim sisteminin standart araçları ile yaptım.

Yukarıdaki grafikte x ekseni (yatay eksen) şarkının süresini gösteriyor: toplam 2 dakika 57 saniye. Y ekseni (dikey eksen) ise frekans aralığını gösteriyor. CD kalitesindeki standart 22 kHz’e kadar uzandığından skala burada bitiyor. Ses şiddeti grafiğin sağında bulunan skaladaki renkler ile ayırt ediliyor. Kırmızı en yüksek sesi gösterirken mor en düşük olanı belirtiyor.

Şarkı boyunca 5 kHz seviyesine kadar olan sesler daha bariz, 5 kHz üzerindekiler gittikçe azalıyor. Çok normal bu, enstrumanların ve şarkıcının sesi en çok 250 Hz-5 kHz aralığında. 22 kHz tepe noktasına kadar ise sesler sürekli mevcut, siyah fon neredeyse hiç görünmüyor. Güzel bir kayıt.

Şimdi gelin aynı şarkının MP3 görüntülerine bakalım. MP3 dönüşümlerini bu konuda başarılı kabul edilen SoX programı ile yaptım. İlk önce, olabilecek en yüksek kalitede yani 320 kbps standandartındaki dosya.

Frekans aralığını aşağıdan yukarıya doğru taradığımızda 15 kHz sınırının hemen üstünde şarkı boyunca bir eşik olduğunu fark ediyoruz. Yani, bu sınırın üzerisindeki seslerin bir bölümü çıkartılmış. 20 kHz seviyesine ulaştığımızda ise buradan sonra tam sessizlik görüyoruz. Bunların anlamı şu: malum, yetişkinlerin büyük çoğunluğu 16 kHz üzerindeki sesleri duymaz, 20 Hz – 20 kHz idealizasyonu olsa olsa 20’li yaşların ortasına kadar -ki o bile şaibeli- geçerlidir. Bunu bilen MP3, 16 kHz üzerindeki sesleri ciddi olarak azaltmış, 20 kHz üzerini ise ”kim duyacak bunları?” diyerek tamamen süpürmüş. 16 kHz’e kadar olan alan aynı duruyormuş gibi görünüyor. Aslında o da tam aynı değil ancak bu grafikten bu kadarı anlaşılıyor.

Bir de biraz daha düşük kalitedeki MP3 görüntüsüne bakalım, ne de olsa yukarıdaki görüntü MP3’ün hi-fi versiyonu.

256 kbps standartındaki bu dosyada sıkıştırma oranı daha yüksek, dosya boyutu daha küçük. Bu demektir ki çöpe atılan veri daha fazla. Nitekim bunu hemen görüyoruz. 16 kHz eşiği iyice belirginleşmiş. Yani, bu frekansın üzerinde kalan sesler iyice azalmış. Tam sessizlik seviyesi ise 20 kHz’den 18 kHz’e çekilmiş: bu frekansın üzerinde hiç sinyal yok.

Tek örnek yanıltıcı olabilir diye ikinci bir şarkıya daha bakalım. Bu kez, Bassface Swing Trio’nun Oh, Lady Be Good yorumunu inceleyelim. Önce yine CD ile birebir aynı olan FLAC dosyası.

22 kHz’e kadar rahat rahat çıkan sesler kayıtta mevcut. Bu arada, bu grafik şarkıdaki dinamik aralığın (en sessiz ve en yüksek sesli bölümler arasındaki fark) ne kadar geniş olduğunu da gösteriyor: çok iyi bir kayıt bu.

Gelelim aynı şarkının MP3 analizlerine. Önce yüksek kaliteli 320 kbps dosyası.

Lyn Stanley’in şarkısındaki durum aynen burada da tekrarlanmış. 16 kHz eşiği belirgin olarak önümüzde duruyor. 20 kHz üzerinde ise hiçbir şey yok.

Şimdi de biraz daha fazla sıkıştırılmış olan 256 kbps dosyasına bakalım.

16 kHz limiti iyice belirgin, yani daha çok filtreleme yapmış. Sessizlik sınırı ise yine 20 kHz’den 18 kHz’e inmiş.

Her iki örnek de kayıplı sıkıştırma ile kayıpsız -aslının aynısı- olanın frekans aralığı olarak farkını bize gösteriyor. Doğal olarak bunun doğrudan sese olan etkisi kişiden kişiye değişecektir. Ne de olsa 20 kHz’e kadar olan sesleri duyduğunu düşünenler ciddi yanılgı içinde olabilir. Tabii, bu konuya bir de şöyle yaklaşanlar var: “Yüksek frekansları duyamayabilirim ama yine de varlıkları veya yokluklarında seste bir fark hissediyorum”. İşin odyofil mistik kısmı beni hiç ilgilendirmediği için buna şöyle yorum yapabilirim. Kulağımız örneğin 17kHz’deki bir tınıyı fiziksel olarak duymuyorsa ve buna rağmen bu sesin yokluğunun bir fark yarattığını iddia ediyorsak, olsa olsa bu frekansın, duyduğumuz bölgeye dahil olabilen alt harmoniklerini algılıyoruzdur. O zaman da şu soruyu sormamız gerekir: Asıl sesi duymadan sadece harmoniğini algılamak ne kadar anlamlı? Evet, duyduğumuz bir şey var ama ne olduğu belirsiz.

Her halükarda, frekans genişliği açısından hassas kulaklar için MP3 sıkıştırması olumsuz bir fark yaratabilir diyelim.

MP3 ile FLAC dosyalarını karşılaştırmak için bir yöntemimiz daha var: Doğrudan ses sinyalinin kendisi. Zamana karşı çizilmiş ses sinyalinin karşılaştırması frekans bandından bağımsız olarak sesin kendi yapısını karşılaştırmamıza imkan verir. Doğrusunu söylemek gerekirse zamanı gösteren x ekseninin skalasını çok abartılı olarak büyütmedikçe FLAC ile MP3 arasında bir fark görmek çok kolay değil. Zaman aralığını iyice küçültüp ses sinyaline baktığımızda ise farklılığı görebiliyoruz.

Bunun grafiği de aşağıdadır. Karşılaştırma kolaylığı açısından iki ses sinyalini aynı pencereye yerleştirdim.

Lullaby of Birdland şarkısının ortalarından çok çok küçük bir bölümünü görüyorsunuz burada. Grafiğin gösterdiği toplam süre yaklaşık 2 milisaniyedir. CD kalitesi 44.1 kHz örnekleme frekansında (yani kaydedilen sesten saniyede 44.100 kere örnekleme alınıp dijitale dönüştürülüyor) olduğundan bu grafikte yaklaşık 90 örnekleme mevcuttur. Bu örnekleme noktaları birleştirildiğinde ses sinyali yeniden karşımıza çıkıyor. Dikkatlice bakarsanız FLAC sinyali ile MP3 sinyalinin birebir aynı olmadığını görebilirsiniz. MP3 biraz daha yumuşatılmış, keskinliği alınmış gibi duruyor. Bu, sıkıştırma algoritması tarafından yapılan bir “ortalama alma” işlemi gibi duruyor.

Bu grafiğe bakarak iki sinyalin ses olarak farkedilebilir bir ayrışması olabileceğini söylemek zor. Fark var ama ne kadar farkedilebilir seviyede? Unutmayın, saniyenin binde ikisinin resmine bakıyorsunuz. Aynı şekilde, ses sinyalinin köşeli olması sizi yanıltmasın. Milisaniye mertebesinde bu normal.

Sonuç olarak, 320 kbps formatındaki yüksek kaliteli MP3 dosyası sesinin, dosya boyutları göz önüne alındığında makul bir kalitede olduğunu söyleyebiliriz. Sıkıştırma arttıkça verilen taviz de artmaya başlıyor. Ayrıca, ele aldığımız MP3 dosyalarının bu işi en iyi yapan programlardan biri tarafından dönüştürüldüğünü de unutmayın. Her MP3 dosyası bu kadar başarılı olmayabilir.

Dosya boyutu ile ilgili özel bir talebimiz yoksa ve yüksek kaliteli bir müzik sistemimiz varsa FLAC formatından (veya muadili bir formattan) vaz geçmemek daha doğru görünüyor. Sesi kaynağındayken sınırlamanın bir mantığı yok bence.

Kendi müzik arşivimin de tamamını FLAC olarak sakladığımı söylemeliyim.

Bu yazının devamı herhalde CD standardı ile yüksek çözünürlüklü kayıtların karşılaştırması olur. Bu konuda sizi şaşırtacak bazı gerçekler olabilir!

Aykut Turhan
Yazarın kişisel sitesine erişmek için tıklayınız 

Tags: