Derlediğimiz tüm ses dosyalarını GPL lisansı altında herkesle paylaşacağız ve sonra da bunları Sphinx, ISIP, Julius ve HTK gibi açık kodlu ses tanıma sistemlerinde kullanılmak üzere akustik modeller olarak 'derleyeceğiz' (HTK'nin dağıtım kısıtlamalarına dikkat edin).
Neden GPL Lisanslı Konuşma Kayıtlarına İhtiyacımız Var?
Açık kodlu konuşma tanıma (konuşmayı metne dönüştürme) sistemleri tarafından kullanılan akustik modellerin çoğu 'kapalı kaynak' şeklindedir. Yani o akustik modelleri oluşturmak için kullanılmış olan ses kayıtlarına ve metinlerine (örn. konuşma derlemi) serbestçe erişmeniz mümkün değildir.
Bunun sebebi açık ve özgür kodlu projeleri, büyük konuşma malzemelerini kısıtlayıcı lisanslarla satın almaya zorlamaktır. Her ne kadar akustik model oluşturmak için kullanılabilecek birkaç küçük özgür lisanslı konuşma derlemi olsa da iyi bir akustik model oluşturmak için kullanılan geniş kapsamlı içerik halen kısıtlayıcı lisanslar ile satın alınmak durumundadır.
Kaynak: ileriseviye.org