İşitsel programlama notları

0
misafir
Bu yazıda işitsel(audio) programlama konusunda yaptığım küçük bir araştırmanın sonuçlarını paylaşmak istiyorum. Yazının sonuna kısa bir Perl betiği ekleyeceğim. Bunun için Perl ustalarından özür diliyorum. Çünkü henüz çok acemisi olduğum bir dil Perl.
Bilindiği gibi ses, bir dalgadır. Sesin tonunu belirleyen özellik ise frekansıdır. Örneğin uluslararası bir standart olarak kabul edilen 440 Hz frekansı La notasına karşılık gelmektedir. Oktav ve frekans arasında ise şöyle bir ilişki vardır: Bir üst oktavdaki bir notanın frekansı, bir alt oktavdaki aynı adlı notanın frekansının iki katıdır. Örneğin standart La'nın bir üst oktavındaki La'nın frekansı 880 Hz, bir alt oktavındaki La'nın frekansı ise 220 Hz'dir.

Bir dalga biçimi oluşturmanın belki de en basit yolu sin() yani sinüs fonksiyonunu kullanmaktır. Demek ki, örneğin standart La sesini bir saniye boyunca tınlatmak için y=sin(x) fonksiyonunu 440 kez tekrarlamamız gerekiyor. Sinüs fonksiyonundaki x değeri programlama dillerinde radyan cinsinden kullanılıyor. Yani bir saniye boyunca tınlayan La sesinin dalgasının x ekseni 440*2*pi uzunluğunda olacak. Burada hemen akla şu sorular geliyor: Peki ama 440*2*pi uzunluğunda bir doğru üzerinde sonsuz tane nokta vardır, bu noktaların hangilerinin değerlerini alacağız? Peki bilgisayar bunun bir saniye sürdüğünü nereden bilecek?

Bu sorular bizi örnekleme(sampling) kavramına getiriyor. Örnekleme bir ses dalgasının belli noktalarından örnek değerler almak anlamına gelir. Sesi kaydeden ve çalan program aynı örnekleme değerini kullandığında aynı sesi çıkarmaları mümkün olur. Örneğin telefon hatlarında iletilen sesin örnekleme oranı(sampling rate) 8000Hz'dir. Yani ses dalgasından saniyede 8000 örnek alınır. CD kalitesi dediğimizde ise 44100 Hz'lik bir örnekleme oranını anlıyoruz. Demek ki 440 kez tekrarlanan y=sin(x) fonksiyonundan 44100 tane örnek değer alırsak, CD kalitesinde bir saniye boyunca tınlayan bir La sesi elde edebiliriz.

Peki ama bu 44100 değeri bir dosyaya nasıl kaydedeceğiz? Kısaca cevap vermem gerekirse, 16 bit little-endian olarak. Sanırım bunları da açıklamak iyi olacak. 16 bitin anlamı, değerin 0 ile 65535 arasına olmasıdır. Sinüs fonksiyonu -1 ile +1 arasında sonuçlar verdiğinden, sonuca önce bir ekleyerek 0 ile 2 arasında değerler elde etmek sonra da sonucu 0 ile 32767 arasında bir sayıyla çarpmak pratik bir çözüm gibi görünüyor. Bu son sayı sesin yüksekliğini yani volümünü belirleyecektir. Little-endian ise dosyadaki baytların sıralaması ile ilgili bir terim. Örneğin elimizdeki değer heksadesimal olarak xABCD ise bunu dosyaya CD AB şeklinde yazarsak little-endian olarak kaydetmiş oluruz.

Peki ama değerleri öylece yazmak yeterli mi? Müzik çalan programlar bunu okuyabilir mi? Evet, değerleri öylece kaydettiğimizde dosyanın formatı RAW adını alıyor. Yani ham veri. WAV dosyalarını çalabilen hemen hemen her program ham veriyi de çalabiliyor. Çünkü ham veri ile WAV dosyası arasındaki fark sadece WAV dosyalarının başında bir kafa(header) bölümü bulunması. Bu kafa bölümünde dosyanın örnekleme oranı ve mono mu yoksa stereo mu olduğu gibi bilgiler bulunuyor. Ancak bu bilgileri komut satırından da vermek mümkün.

Aşağıda bir saniye uzunluğunda La sesinden oluşan bir dosya oluşturan bir Perl betiği var. Hatta betiğin son satırını değiştirerek istediğiniz frekanstaki bir sesi istediğiniz uzunlukta çalabilir, buna yeni sesler de ekleyebilirsiniz. Programı kullanmak için şu komutu verebilirsiniz: "perl -w betik.pl > dosya.raw". Sonra isterseniz bu dosyayı oggenc ile OGG formatına çevirebilirsiniz "oggenc -r -C 1 dosya.raw". Dinlemek içinse: "ogg123 dosya.ogg" komutu yeterli olacaktır. Sesi nasıl açıp kısacağız sorusuna ise şöyle cevap vermek istiyorum: "Use the source, Luke!".

#!/usr/bin/perl -w
use strict;
my $pi=3.1415927;
my $sr=44100;
sub play
        {
        my $i=0;
        my $freq=shift;
        my $dur=shift;
        my $rate=$freq*2*$pi/($sr-1);
        for ($i=0; $i<$sr*$dur; $i++)
                {
                my $sample=int(15000*(sin($i*$rate)+1));
                printf("%c", $sample%256);
                printf("%c", int($sample/256));
                }
        }
play(440,1);

Görüşler

0
Ragnor
Bu özel makale için teşekkürler. Açıkcası bu konuda yazılmış bir türkçe makale hatırlamıyorum.

Oldukça kolay anlaşılır bir makale. Sayenizde hiçbir fikrimin olmadı ama öğrenmek istediğim bu konuya gayet rahat ve zahmetsizce giriş yapmış bulunmaktayım. Sonunda anladım SDL'in sound modülünü, o bile yeter :).

Tekrar teşekkürler.
0
myavuzselim
Tesekkurler. Denemek için soyle birsey yaptim:
sound.py
sound2.py

sound.py ilk basta hafiften bekledigim temiz sesi cikariyor, ama sonra zurna gibi bir ses cikiyor. Acaba bir yanlisim mi var?
0
myavuzselim
Buldum. Volum 65535/4 'u gecince oluyor. Neden acaba?
0
misafir
anladığım kadarıyla ses yüksekliği üzerinde bir fonksiyon ile oynama yapmışsınız. bu dalga biçimini değiştirmiş olabilir. zaten enstrümanlar arasındaki tını farkları da dalga biçimi farklarına bağlıdır. herhalde kazara zurnanın dalga biçimini elde ettiniz. iyi kurcalamalar.
0
myavuzselim
Dalgayi 0-2 arasinda almak yanlis cikti veriyor. Dalganin her iki tarafi da ust tarafta kaliyor. Dalga uzunlugu 65535/4'den buyuk olunca hata vermesinin sebebi de buymus.
Bunu duzelttikten sonra yine de bozuk cikti aliyordum. Meger bir de binmode(STDOUT) yapmak gerekiyormus. Su sekilde duzeldi:

#!/usr/bin/perl -w

use strict;

binmode(STDOUT);

my $pi=3.1415927;

my $sr=44100;

sub play {

    my $i=0;

    my $freq=shift;

    my $dur=shift;

    my $rate=$freq*2*$pi/($sr-1);

    for ($i=0; $i < $sr*$dur; $i++) {

        my $sample=int(32000*sin($i*$rate));

        print chr($sample & 0xff);

        print chr(($sample >> 8) & 0xff);

    }

}

play(440,1);

0
misafir
galiba haklısınız. signed-unsigned int konusunu es geçmişim. kodu düzelttiğiniz için teşekkür ederim.
0
anonim
Eline sağlık....
0
acemi_
Çok güzel bir makale. Hemen bir deneme de ben yapayım.
0
Tarık
Mükemmel bir konu. Programlamanın ülkemizde bahsedilmeyen bir yüzü.

Örneği windoze altında Active State Perl'de denedim "sonsuz bir beep döngüsü yarattı " normal mi ?

0
misafir
bana pek normal gelmedi. acaba döngünün sonundaki kıvırcık parantezi mi unuttunuz? ama windows'dan ve perl'den daha iyi anlayan arkadaşlar cevap verirse daha iyi olur herhalde.
0
simor
Bende de aynısını yaptı. Active state perl yorumlayıcı linuxtakinden farklımı acaba? Linuxta problem yok.
0
simor
Ayrıca çok ilginç; ses benim ses kartımdan değil de, anakarttaki buzzerdan geliyor. Daha da ilginci linuxta aynı kod ile ses kartından duyuyordum sesi.
Sürekli döngüyü tekrarlıyor ve kendi kendine termine ediyor ve konsolu kapatıyor win2k da.

Şimdi bu, crossplatform hikayesinin sadece belli kurallara bağlı olduğunu mu yoksa active state in bu işi beceremediğini mi gösteriyor .?

teşekkürler..
0
Tarık
çok ilginç. şu an linux tada denedim, döngüye girmeden anlamsız 5 adet ses çaldı (buzzer dan) ve ekrana saçma sapan karakterler bastı.
0
misafir
arkadaşlar, eğer farketmediyseniz diye yazıyorum, bu perl betiği sesi doğrudan çalmıyor. bir ses dosyası oluşturuyor. o dosyayı çalmak için başka bir programa ihtiyacınız var. bilgisayarımda windows kurulu olmadığı için bilmiyorum ama büyüktür işareti acaba windows kabuğunda çalışıyor mu? bunu kontrol edin bence.
0
simor
Ah işte ah insan yarı cahil olunca benim gibi en kötüsü oluyor. O kadar da anlattınız. Ben zaten linuxta sizin yazdığınız gibi denediğimde verilen süre kadar 440 hz çalmıştı. Fakat windowsta, kodunuzdaki perl yolunu windowsa göre uyarlayıp direk ikonun üzerine iki kere tıkladım ve command prompt u açıp çaldı (buzzerdan) . Sonra linuxta da ses dosaysı oluşturmadan çalayım dedim ve evet tarık arkadaşın dediği gibi çaldı. :) Çalması gerekiyormu gerkmiyormu bilmiyorum tabi . kusura bakmayın .. teşekkürler.
0
FZ
Ciddi anlamda algoritmik müzik ile ilgilenen arkadaşlar şu iki adrese baksınlar ve oradaki KeyKit ile Common Music linklerini takip etsinler. Birer hazine gizli:

Web sitelerini dinliyorum gözüm kapalı

fluxus: scheme, 3d, müzik, fft, sıradışı bir deneyim…

Emacs ile caz çalmak mümkün mü?

Kitap olarak da "Notes from the Metalevel"i tavsiye ederim, Common Music'i geliştiren ve Stanford'da bilgisayarlı besteleme konusundaki üstadlardan besteci Heinrich K. Taube'nin kitabı.
0
FZ
Burada formatlamak zor olduğu için benim blog ortamına yazdım ve bu bağlamda birkaç Common Music kodu ile örnekler verdim:

İşitsel Programlama, Common Music ve ötesi…

0
misafir
herzamanki gibi ufuk açıcı olan yorumunuz için teşekkürler...
0
wolverine81
tebrikler cok basarili bir mekale
Görüş belirtmek için giriş yapın...

İlgili Yazılar

YZC Sözlük v0.0.4 Çıktı

anonim

YZC Sözlük yapısal birkaç iyileştirme ile 0.0.4 versiyona ulaşmıştır. Bu versiyonda:

+ Ezberletici kullanılabilir duruma gelmiştir, detaylı ayarlamalar ile.
+ Harf duyarlı kelime arama özelliği eklenmiştir. SQLite veritabanın gücü ile arama fonksiyonlarımız ilerleyen sürümlerde güçlendirilecektir.
+ Sınavcı çalışmalarına başlanmıştır.

Tüm bunlara ek Web Sitesi çalışmalarımızda devam etmektedir. Sözlüğün güncel versiyonuna, ve kaynak kodlarına sitemiz, http://yzcsozluk.yaz-ar.com/'dan ulaşabilirsiniz.

Python tabanlı Türkçe deasciifier

FZ

Kısa süre önce Deniz Yüret'in Türkçe 'deasciifier'ını (turkish-mode, Emacs Lisp ile yapılmış) Python'a çevirdim. Kaynak kod adresi: http://github.com/emres/deasciifier.

'deasciification' ve 'deasciifier' terimlerine aşina olmayanlar için kısa açıklama: Türkçe harfler kullanılmadan, sadece ASCII harfler ile yazılmış Türkçe metinlerin, düzgün şekilde Türkçe harfler kullanılarak yazılmış hale çevrilmesine 'deasciification' denir. Bu duruma bir örnek verelim, girdi metni mesela

"Opusmegi cagristiran catirtilar."

ise, çıktı metni şöyle olmalıdır:

"Öpüşmeği çağrıştıran çatırtılar."

Yüz Yıl Sonraki Programlama Dilleri (ya da Perl vs. Lisp ve Lambda Calculus)

FZ

Deneyimli LISP `hacker´ı Paul Graham bu kez yüzyıl sonra ne tür programlama dilleri kullanabileceğimiz üzerine tahrik edici bir makale yazmış. Nesneye yönelik programlamaya, Java´ya, C++ diline saydıran yazar arada Perl diline de değiniyor.

Hazır konu açılmışken ilginizi çekebileceğini düşündüğüm bir başka yazı ise Mark Jason Dominus´un Perl´in Lambda Calculus içerdiğine dair bir prezentasyonu. (Prezentasyonun diğer adı: 1+1´i hesaplamak için 163 satırlık bir program nasıl yazılır? ;-)

ÖNEMLİ UYARI : `Bios Logosunu Değiştirelim´ Makalesi Hakkında

crematorium

Geçenlerde yazdığım ve FZ arkadaşımızın da duyurduğu Bios Logosunu Değiştirelim makalesi hakkında önemli bir uyarı yapmam gerekiyor.

Kendi makinamda Logo'mu zaten değiştirmiştim. Dün gece logodan sıkıldım ve yeniden değiştirmek istedim. Büyük bir hata yaparak daha önceden içine Logo yüklediğim "Bios Binary" dosyamın üzerine tekrardan bir logo attım ve AWDFLASH ile `flash´ladım. Makinayı yeniden başlattığımda maalesef Bios'umun elimde kaldığını farkettim. Şimdi gelelim uyarıya:

Patoloji Bilgi Sistemi.. Geliştiricisi bir Türk.. veee GPL!

ykarslioglu

Türkiye'de görenlerin koltuklarını kabartan çalışmalar yapılıyor. PATHOS-WEB FREE adlı Anatomik Patoloji ve Sitoloji Bilgi sistemi tamamen patoloji uzmanlarının ihtiyaçları düşünülerek tasarlanmış bir sistem. Mart 2005 tarihinden itibaren SourceForge'da açık kaynak kodlu, GPL lisanslı bir proje olarak Türkçe ve İngilizce versiyonları ile Patoloji Bölümlerinin hizmetine sunuldu. Yazılım, Türkiye'de, aralarında büyük üniversite hastanelerinin de bulunduğu 20'den fazla merkezde, yıllardır büyük bir başarı ile ve güvenle kullanılıyor.