oflazer

oflazer


0 takip ediyor | 0 takip ediliyor


Bilgi alanları


İlgi alanları

TDK Türkçe Sözlük olayında son perde ( 58)

Sabanci Üniversitesi'nde yaptığımız bir AB ÇP-5 Projesi çerçevesinde Türkçe için bir kavramsal veri tabanı (WordNet) geliştirmiş bulunuyoruz. http://www.hlst.sabanciuniv.edu/TL/ adresinde deneyebilirsiniz. Türkçe için epey kapsamlı sayılabilir ancak çoğu Türkçe kavram için "sözlük anlamı" yok -- zaman yetmediğinden. Buna şu anda basit bir lisans ile araştırma amacıyla erişebilirsiniz (XML kütüğü olarak). Ancak açık kaynak olarak buna bilgi eklemek amacıyla (yeni kavram/sözcük/sözcük tanımı vs) bir girişimde bulunan olursa biz destek veririz ve sonrasında herkese açık hale getirebiliriz. Bu arada bu yazılarda geçen TDK sözlüğünü 1993-1998 seneleri arasında NATO desteği ile Bilkent Üniversitesi'nde iken yönettiğim "Turkish Natural Language Processing Initiative" projesinde optik karakter tanıma ve yazım düzeltme ile kağıttan bilgisayara aktardık. Halıcı Bilgisayar da bu proje çerçevesinde bunu TDK ile anlaşıp "ürün" haline getirdi. Ancak nedense bu projeye hiç bi referans bulamazsınız bu "ürün"le ilgili literatürde (:-)

TDK Türkçe Sözlük olayında son perde ( 58)

Sabanci Üniversitesi'nde yaptığımız bir AB ÇP-5 Projesi çerçevesinde Türkçe için bir kavramsal veri tabanı (WordNet) geliştirmiş bulunuyoruz. http://www.hlst.sabanciuniv.edu/TL/ adresinde deneyebilirsiniz. Türkçe için epey kapsamlı sayılabilir ancak çoğu Türkçe kavram için "sözlük anlamı" yok -- zaman yetmediğinden. Buna şu anda basit bir lisans ile araştırma amacıyla erişebilirsiniz (XML kütüğü olarak). Ancak açık kaynak olarak buna bilgi eklemek amacıyla (yeni kavram/sözcük/sözcük tanımı vs) bir girişimde bulunan olursa biz destek veririz ve sonrasında herkese açık hale getirebiliriz. Bu arada bu yazılarda geçen TDK sözlüğünü 1993-1998 seneleri arasında NATO desteği ile Bilkent Üniversitesi'nde iken yönettiğim "Turkish Natural Language Processing Initiative" projesinde optik karakter tanıma ve yazım düzeltme ile kağıttan bilgisayara aktardık. Halıcı Bilgisayar da bu proje çerçevesinde bunu TDK ile anlaşıp "ürün" haline getirdi. Ancak nedense bu projeye hiç bi referans bulamazsınız bu "ürün"le ilgili literatürde (:-)

Türkçe İçin Doğal Dil İşleme Çalışmaları ( 2)

Bu konuda yaklaşık 10-12 senedir Türkiye'de çalışmalar yapılıyor. Daha fazla bilgi için benim ev sayfama (people.sabanciuniv.edu/oflazer) ve www.hlst.sabanciuniv.edu sitesine bakabilirsiniz. Ayrıca ODTÜ'de www.lcsl.metu.edu.tr ve www.ii.metu.edu.tr/~corpus sitelerine de bakabilirsiniz.

DDİ çalışmalarında ciddi bir atlama yapmak için makine öğrenmesi ile değişik işleyicilerin otomatik olarak öğrenilmesi için işaretlenmiş kaynaklara gereksinim var. (Mesela yukardaki 2. ODTÜ sitesinde bulabileceğiniz ağaç yapılı derlem bunlardan biri). Su anda bu derlemi kullanarak otomatik olarak (istatistiksel) tümce çözümleyici
geliştirme çalışmaları var. (Edinburgh'da Ruket Çakıcı ve İTÜ'de Gülşen Eryiğit). Bu tip kaynakların geliştirilmesi çok emek yoğun bir süreç ve bunu desteklemek isteyen de çok yok bu aralar. TDK falan gibi kurumlar bu konuda ilgisiz olmasalar bile bilgisizler. Mayıs ayında yapılan bir bilgilendirme çalışması ise kanımca oldukça sonuçsuz kaldı.

Diğer bir nokta da bu konu için ülke içinde talep sıfır. Bizim çalışmalarımıza destek genellikle yurt dışından.

İlgilenenler için çok da harekteli olmayan bir yahoo grubu var.
http://groups.yahoo.com/group/turk-nlp/

Kayıt olmak isterseniz lütfen kendinizi ve DDİ ile ilginizi kısaca açıklayan bir not eklerseniz iyi olur. Neuro-linguistic programlama falan zannedenleri filtrelemek zor oluyor aksi halde.

Kemal Oflazer