Dilbilim ve Linux Buluşması: Morphix-NLP İncelemesi

0
FZ
DDİ (Doğal Dil İşleme, NLP - Natural Language Processing) yaklaşık son 40 yıldır önemli bir araştırma disiplini olagelmiştir. Dilbilim ve bilgisayar bilimleri yöntemlerini bir araya getiren bu alanda pek çok değişik uygulama ve çözüm bekleyen önemli problemler mevcuttur. Farklı dillerdeki çok büyük metin dosyalarını incelemek, örüntüleri (pattern) keşfetmek, dönüşümleri gerçekleştirmek, metinleri otomatik olarak sınıflandırmak, konuşma sentezlemek ve konuşmayı anlayıp metne dönüştürebilmek, bilgisayarları bizim anadilimizi anlayabilir hale getirmek yani onlara semantik yetiler kazandırmak, vs. DDİ dalındaki önemli meselelerden sadece birkaçıdır.
DDİ konusunda çalışan Çinli araştırmacı Zhang Le, dil analizi ve dil işleme konusundaki en önemli yazılımların büyük bir bölümünü tespit edip bunları tek bir bootable CD´ye yani Morphix-NLP içine yerleştirmiş. Söz konusu CD´de 640 MB´ın üzerinde DDİ işleme yazılımı mevcut ve sıkıştırılmış bir dosya sistemi kullanan CD´nin kapasitesine baktığımızda daha pek çok yazılımı içine yerleştirebilecek kadar boş yerin bulunduğunu görebiliyoruz.

İncelemenin devamını buradan okuyabilirsiniz.

Not: Söz konusu yazıyı daha önce yazdığım şu yazıdan tercüme ettim. Dolayısı ile bazı yerleri bir miktar abuk sabuk gelmiş olabilir, önerisi olan varsa bazı terimler için seve seve gerekli değişiklikleri yaparım :)

Görüşler

0
sametc
bu haberi sanırım bir yerden okudum ama nertden tabiiki slashdot.org :))
0
sametc
durun yanlıs anlasılmasın FZ yazmıstı o haberi ordan dikkatimi cekti ondan dedim bunu
0
FZ
Evet, makalenin İngilizce özgün şeklinin haberini Slashdot sitesinde duyurmuştum ve tabii ileriseviye.org da bir süreliğine meşhur slashdot etkisine maruz kaldı :)

İşin güzel yanı ve buradan farkı haber orada çıktıktan sonra birkaç saat içinde haberin altında 140 kadar yorum vardı. Aralarında ise Linux uzmanlarından tutun, dilbilimcilere, antropolojiyle ilgilenenlerden tutun otomatik tercüme ile ilgilenen insana kadar çok farklı kesimden insan vardı, açıkçası bu kadar çok ve farklı yorum beklemiyordum, hem şaşırdım hem sevindim :) Gönül ister ki aynı kültürel ve entelektüel çeşitliliği bu ortamda da yaşayalım ;-)
0
sametc
değilmi FZ insallah oyle bir ortam olur fazlamesai yakında insallah :) bakıyorum son zamanlarda yorumlar azalıyor :( ve fazlamesai sadece bilgisayar ve linux sitesi olarak anılıyor bu yanlıs bu imajı duzeltmek lazım.:) saygılarımla
0
malkocoglu
DDI'de istatistik kullanimi ilginc: Bu fikrin daha ilkel bir sekli, tarihi belgelerin yazarlarini bulmak icin kullanilmisti diye hatirliyorum. ABD'de ilk cikan politik dergilerde gunun onemli adamlari takma isimlerle yazilar yayinliyorlarmis. Bu makalelerin yazarlari tarihi ispatlardan sonradan bulunabilmisti, fakat bazilarinin kim oldugu bir turlu anlasilamadi. Bunun uzerine tarihciler, zamanin unlu adamlarin ozel mektuplarindaki "the", "a", "in" vs gibi kelimeleri sayarak, bu sayilari anonim makaleler ile karsilastirdilar, ve yazarlari tespit ettiler. Kullanilan kelimelerinin sayisinin insandan insana degismesi ilginc, ama biraz dusununce mantikli geliyor. Hepimizin favori kelimeleri var demek ki! (Mesela bu yorumda mesela "bu" kelimesini 5 kere kullanmisim)
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Fazla mesai süründürür!

ErdemDemir

Geçen gün kitaplığımı düzenlerken, 10 yıl kadar önce okumuş olduğum Paul Lafargue'ın yazdığı "Tembellik Hakkı" kitabını yeniden okuma şansı buldum. Bir defa daha ezberimi bozan bu kitabı fazlamesai (!) camiasıyla paylaşmak istedim.

Paul Lafargue İnternet Arşivi

"Tembellik Hakkı"

Ve alıntılar, sadece fikir verebilmek için...

`How to Become A Hacker´ Türkçe Çevirisi

Challenger

Ülkemizde ve dünyada, hackerlar; bilgisayar sistemlerine giren, bilgi çalan, sistemleri bozmak için saldırılar düzenleyen kötü niyetli kişiler olarak bilinmekte. Hackerlık konusunda birçok yazı yazılıp çizilmekte ve hackerların ne kadar büyük bir tehlike olduğu anlatılmakta. Oysa hackerlar, sanıldığı gibi bir şeyler bozmaktan ziyade problem çözmek, yeni bir şeyler icad etmek gibi yararlı işlerle uğraşan insanlardır. Üstelik hackerlığın 1960´lı yıllara dayanan bir geçmişi ve bu süreç içerisinde gelişen bir kültürü vardır.

Apache`yi kafeste koşturmak. (v1.1)

conan

Bir kaç zamandır üzerinde çalışmakta olduğum Apache Web Sunucu'sunu chroot çevresinde çalıştırma ile ilgili dökümanımın ilk bölümünü sonunda bitirmiş bulunmaktayım. chroot nedir? gibi sorulara bu versiyonda cevap vermiyorum. Anlamak için ilk etapta "man chroot" yapmanız gerekiyor şimdilik. :( Onun dışında işte dokumanın ilk versiyonu...
(Not: Bu dokumanın en son versiyonuna her zaman gsu.linux.org.tr/~conan adresinden ulaşabilirsiniz. Hataları lütfen "conan at kingdom nokta 2y nokta net" adresine bildiriniz.)

Başka Bir Programcının Kitaplığı

FZ

FM üyelerinden Ragnor, bir programcının kitaplığı nasıl olmalı? başlığı altında bir haber yapmıştı daha önce.

Bu da başka bir programcının lezzetli kütüphanesi.

GNU/Linux dergisi Penguence'nin 2. sayısı çıkıyor...

FZ

Daha önce yine FM'de duyurduğumuz Penguence dergisinin ikinci sayısı (beta) yayınlandı. Dergiye web tarayıcı ile erişmek mümkün. Henüz PDF hali tam hazırlanmamış olmakla birlikte çalışmaları devam ediyor.

Bu sayıdaki konu başlıklarından bir kaçı:

  • OpenOffice.org 2.0'a doğru - Rıdvan Can
  • Ses ve Müzik - Bülent Bolat
  • Aynı dili konuşuyor muyuz? - Yasin Kokarca
  • Açık Anahtarlı Kriptografi - A. Murat Eren
  • Kitap Eleştirisi : Hackers - Sıradışı Bir Dönemin Sıradışı Hikayesi - Ergin Sevinç
  • Oyun Köşesi : Pathological - Doruk Fisek
  • Çekirdek Derlemekten Korkmayın - Murat Koç
  • Kablosuz LAN Protokolleri - Mustafa Şahin
  • Debian Sosyal Sözleşmesi (Çeviri) - Debian Türk Grubu