Dilbilim ve Linux Buluşması: Morphix-NLP İncelemesi

0
FZ
DDİ (Doğal Dil İşleme, NLP - Natural Language Processing) yaklaşık son 40 yıldır önemli bir araştırma disiplini olagelmiştir. Dilbilim ve bilgisayar bilimleri yöntemlerini bir araya getiren bu alanda pek çok değişik uygulama ve çözüm bekleyen önemli problemler mevcuttur. Farklı dillerdeki çok büyük metin dosyalarını incelemek, örüntüleri (pattern) keşfetmek, dönüşümleri gerçekleştirmek, metinleri otomatik olarak sınıflandırmak, konuşma sentezlemek ve konuşmayı anlayıp metne dönüştürebilmek, bilgisayarları bizim anadilimizi anlayabilir hale getirmek yani onlara semantik yetiler kazandırmak, vs. DDİ dalındaki önemli meselelerden sadece birkaçıdır.
DDİ konusunda çalışan Çinli araştırmacı Zhang Le, dil analizi ve dil işleme konusundaki en önemli yazılımların büyük bir bölümünü tespit edip bunları tek bir bootable CD´ye yani Morphix-NLP içine yerleştirmiş. Söz konusu CD´de 640 MB´ın üzerinde DDİ işleme yazılımı mevcut ve sıkıştırılmış bir dosya sistemi kullanan CD´nin kapasitesine baktığımızda daha pek çok yazılımı içine yerleştirebilecek kadar boş yerin bulunduğunu görebiliyoruz.

İncelemenin devamını buradan okuyabilirsiniz.

Not: Söz konusu yazıyı daha önce yazdığım şu yazıdan tercüme ettim. Dolayısı ile bazı yerleri bir miktar abuk sabuk gelmiş olabilir, önerisi olan varsa bazı terimler için seve seve gerekli değişiklikleri yaparım :)

Görüşler

0
sametc
bu haberi sanırım bir yerden okudum ama nertden tabiiki slashdot.org :))
0
sametc
durun yanlıs anlasılmasın FZ yazmıstı o haberi ordan dikkatimi cekti ondan dedim bunu
0
FZ
Evet, makalenin İngilizce özgün şeklinin haberini Slashdot sitesinde duyurmuştum ve tabii ileriseviye.org da bir süreliğine meşhur slashdot etkisine maruz kaldı :)

İşin güzel yanı ve buradan farkı haber orada çıktıktan sonra birkaç saat içinde haberin altında 140 kadar yorum vardı. Aralarında ise Linux uzmanlarından tutun, dilbilimcilere, antropolojiyle ilgilenenlerden tutun otomatik tercüme ile ilgilenen insana kadar çok farklı kesimden insan vardı, açıkçası bu kadar çok ve farklı yorum beklemiyordum, hem şaşırdım hem sevindim :) Gönül ister ki aynı kültürel ve entelektüel çeşitliliği bu ortamda da yaşayalım ;-)
0
sametc
değilmi FZ insallah oyle bir ortam olur fazlamesai yakında insallah :) bakıyorum son zamanlarda yorumlar azalıyor :( ve fazlamesai sadece bilgisayar ve linux sitesi olarak anılıyor bu yanlıs bu imajı duzeltmek lazım.:) saygılarımla
0
malkocoglu
DDI'de istatistik kullanimi ilginc: Bu fikrin daha ilkel bir sekli, tarihi belgelerin yazarlarini bulmak icin kullanilmisti diye hatirliyorum. ABD'de ilk cikan politik dergilerde gunun onemli adamlari takma isimlerle yazilar yayinliyorlarmis. Bu makalelerin yazarlari tarihi ispatlardan sonradan bulunabilmisti, fakat bazilarinin kim oldugu bir turlu anlasilamadi. Bunun uzerine tarihciler, zamanin unlu adamlarin ozel mektuplarindaki "the", "a", "in" vs gibi kelimeleri sayarak, bu sayilari anonim makaleler ile karsilastirdilar, ve yazarlari tespit ettiler. Kullanilan kelimelerinin sayisinin insandan insana degismesi ilginc, ama biraz dusununce mantikli geliyor. Hepimizin favori kelimeleri var demek ki! (Mesela bu yorumda mesela "bu" kelimesini 5 kere kullanmisim)
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Fluxbox Pencere Yöneticisi Kılavuzu

FZ

LinuxQuestions tarafından 2003 yılının en iyi pencere yöneticisi seçilen Fluxbox'ı anlamak için artık Türkçe bir kaynak mevcut. Değerli FM üyelerinden Mehmet Türker tarafından anadilimize çevrilmiş Fluxbox kurulum, kullanım ve ayar kılavuzunu http://fluxbox.org/docbook/tr/html/ adresine giderek okuyabilirsiniz.

Çeviri, imla, eksiklik, vb. hataların çevirmene iletilmesi çok daha kaliteli bir belgenin ortaya çıkmasına yol açacaktır.

Türkiye Bilişim Ansiklopedisi

FZ

Editörlüğünü Prof. Dr. Tuncer Ören, Tuncer Üney ve Dr. Rifat Çölkesen'in üstlenmiş oldukları Türkiye Bilişim Ansiklopedisi yayınlandı.

1248 sayfalık ansiklopedide bilgisayar bilimleri, bilgisayar mühendisliği gibi alanlardaki öğretim görevlilerinden telekomünikasyon, yazılım ve donanım şirketlerinde çalışan mühendislere kadar pek çok deneyimli yazar geniş bir yelpazede teknik konuları derinlemesine ele alıyor. Hesaplamaya dayalı geometriden genetik algoritmalara, konuşma ve ses sıkıştırma sistemlerinden örüntü tanımaya dek pek çok konunun alandaki yetkin isimler tarafından ele alındığı ansiklopedinin dikkat çekici özelliklerinden biri de Türkçe terim konusundaki hassasiyeti.

POZİTİF Mayıs sayısı çıktı!

batasoy

Ücretsiz bilgisayar dergisi Pozitif'in Mayıs sayısı da 211 sayfalık geniş bir içerikle yayınlandı. Dergiye, www.pozitifpc.com adresinden ulaşabilirsiniz.

Bu ay dergide kendi GNU/Linux dağıtımınızı yapmak, webmin ile sistem yönetimi, para harcamadan soğutma performansını artırmak gibi konulara yer verilmiş.

Özellikle "Kendi Linux dağıtımını hazırlama" konusu pekçok Linux yandaşının ilgisini çekecek

O´Reilly´den 2003´ün En İyi Makaleleri, İpuçları ve Kitapları

FZ

Bilgi işlem dünyasının efsanevi yayıncısı O´Reilly ziyaretçi istatistikleri ve okur görüşlerine dayanarak Top 10 makalelerini, ipuçlarını, kitaplarını, vs. seçti. Python, Mac OS X, RegExp, PHP, Mozilla, Python, RSS, Flash MX, Extreme Programming, Java, mplayer, vs. gibi konularda sene boyunca en çok ilgi görmüş, bilgilendirici, vizyon açıcı makalelerin listesini ONLamp Best of 2003 ve O´Reilly Best of 2003 adreslerinde bulabilirsiniz.

Bu arada FM editörlerinden sundance arkadaşımızın mplayer ile ilgili makalesinin ONLamp Top 10 listesinde ikinci sırayı işgal ettiğine dikkat çekmek isterim. Gönül isterdi ki, dünya çapında network adminleri arasında infial yaratan Netcat and Reverse Telnet makalesi de listeye girsin ;-) Ama olsun, o bizim gönüllerimizde alması gereken yeri çoktan aldı :)

Sistem Çağrıları Nedir ve Nasıl Çalışır?

anonim

Her şey burada başladı. FM'de yayımlanan bir yazıda gördüğüm "kernel mode" ve "user mode" deyimlerini araştırıken bu konuda açık bir Türkçe makale olmadığını farkettim. Bu konudaki araştırmalarım sonucu günlüğüme yazdığım ufak bir bilgi notundaki hataların Sn. Tonguç Yumruk tarafından düzeltilmesi ve gelip giden e-postalar sonucunda aklımdaki soru şuydu: "Sistem Çağrıları Nedir ve Nasıl Çalışır?"

Sorunun cevabı ise artık bu kısa makalede. Faydalı olması dileğiyle...