Dilbilim ve Linux Buluşması: Morphix-NLP İncelemesi

0
FZ
DDİ (Doğal Dil İşleme, NLP - Natural Language Processing) yaklaşık son 40 yıldır önemli bir araştırma disiplini olagelmiştir. Dilbilim ve bilgisayar bilimleri yöntemlerini bir araya getiren bu alanda pek çok değişik uygulama ve çözüm bekleyen önemli problemler mevcuttur. Farklı dillerdeki çok büyük metin dosyalarını incelemek, örüntüleri (pattern) keşfetmek, dönüşümleri gerçekleştirmek, metinleri otomatik olarak sınıflandırmak, konuşma sentezlemek ve konuşmayı anlayıp metne dönüştürebilmek, bilgisayarları bizim anadilimizi anlayabilir hale getirmek yani onlara semantik yetiler kazandırmak, vs. DDİ dalındaki önemli meselelerden sadece birkaçıdır.
DDİ konusunda çalışan Çinli araştırmacı Zhang Le, dil analizi ve dil işleme konusundaki en önemli yazılımların büyük bir bölümünü tespit edip bunları tek bir bootable CD´ye yani Morphix-NLP içine yerleştirmiş. Söz konusu CD´de 640 MB´ın üzerinde DDİ işleme yazılımı mevcut ve sıkıştırılmış bir dosya sistemi kullanan CD´nin kapasitesine baktığımızda daha pek çok yazılımı içine yerleştirebilecek kadar boş yerin bulunduğunu görebiliyoruz.

İncelemenin devamını buradan okuyabilirsiniz.

Not: Söz konusu yazıyı daha önce yazdığım şu yazıdan tercüme ettim. Dolayısı ile bazı yerleri bir miktar abuk sabuk gelmiş olabilir, önerisi olan varsa bazı terimler için seve seve gerekli değişiklikleri yaparım :)

Görüşler

0
sametc
bu haberi sanırım bir yerden okudum ama nertden tabiiki slashdot.org :))
0
sametc
durun yanlıs anlasılmasın FZ yazmıstı o haberi ordan dikkatimi cekti ondan dedim bunu
0
FZ
Evet, makalenin İngilizce özgün şeklinin haberini Slashdot sitesinde duyurmuştum ve tabii ileriseviye.org da bir süreliğine meşhur slashdot etkisine maruz kaldı :)

İşin güzel yanı ve buradan farkı haber orada çıktıktan sonra birkaç saat içinde haberin altında 140 kadar yorum vardı. Aralarında ise Linux uzmanlarından tutun, dilbilimcilere, antropolojiyle ilgilenenlerden tutun otomatik tercüme ile ilgilenen insana kadar çok farklı kesimden insan vardı, açıkçası bu kadar çok ve farklı yorum beklemiyordum, hem şaşırdım hem sevindim :) Gönül ister ki aynı kültürel ve entelektüel çeşitliliği bu ortamda da yaşayalım ;-)
0
sametc
değilmi FZ insallah oyle bir ortam olur fazlamesai yakında insallah :) bakıyorum son zamanlarda yorumlar azalıyor :( ve fazlamesai sadece bilgisayar ve linux sitesi olarak anılıyor bu yanlıs bu imajı duzeltmek lazım.:) saygılarımla
0
malkocoglu
DDI'de istatistik kullanimi ilginc: Bu fikrin daha ilkel bir sekli, tarihi belgelerin yazarlarini bulmak icin kullanilmisti diye hatirliyorum. ABD'de ilk cikan politik dergilerde gunun onemli adamlari takma isimlerle yazilar yayinliyorlarmis. Bu makalelerin yazarlari tarihi ispatlardan sonradan bulunabilmisti, fakat bazilarinin kim oldugu bir turlu anlasilamadi. Bunun uzerine tarihciler, zamanin unlu adamlarin ozel mektuplarindaki "the", "a", "in" vs gibi kelimeleri sayarak, bu sayilari anonim makaleler ile karsilastirdilar, ve yazarlari tespit ettiler. Kullanilan kelimelerinin sayisinin insandan insana degismesi ilginc, ama biraz dusununce mantikli geliyor. Hepimizin favori kelimeleri var demek ki! (Mesela bu yorumda mesela "bu" kelimesini 5 kere kullanmisim)
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Batan Geminin Malları

SHiBuMi

Yer uygun mu bilmiyorum ama söz konusu 14 tane bilgisayar kitabı olunca FM'ye göndermenin en iyisi olacağını düşündüm. Elimdeki 14 adet bilgisayar kitabını satıyorum, hepsi İngilizce ve yurtdışından (çoğu Amazondan) alınmış kitaplar. Hepsi iyi durumda ve kullandığım süre içersinde hepsi bana oldukça faydalı oldular. Artık programlama ile uğraşmayacağım, ama bu kitapların da boşu boşuna kütüphanemde durmasını istemiyorum, ben bu kitaplara zaman içersinde kendi çapımda ciddi paralar ödedim, aranızda bu konularla ilgilenen ve bütçeleri yüzünden bu kitaplara ulaşamayanlar var mutlaka, bu en azından bir fırsat olabilir. Kitapların listesi Word dosyası olarak http://www.angelfire.com/linux/kitap/kitaplar.doc adresinde mevcut, ilgilenenler bana serdar_soydemir@hotmail.com adresinden ulaşabilirler.

Gelişmekte Olan Ülkelerde Kablosuz Ağ Kurulumu

arikan

Creative Commons lisansıyla bedava yayınlanan bu yeni kitap kırsal bölgelerde düşük maliyetle kablosuz ağ kurulumu ve işletimini anlatıyor. Kitap dünyanın çeşitli kırsal bölgelerinde ağ kurmuş ve işletmiş profesyoneller tarafından hazırlanmış.

Var mı yazmak isteyen?

sundance

Internet'in viral etkisi ile yayılması sonucu forum ve blog yazarlarının artmasının, yazan ve düşünen insan sayısını arttırdığını düşünüyorum.

Arkadaşlarla olan sohbetlerde her geçen gün biraz daha fazla kişinin "yahu bir fırsat bulsam da şu kafamdakileri bir yazıya döksem" dediğini, hatta birçoğunun bunu "derli toplu düşünme aracı" olarak gördüğünü farkettim.

Böyle düşünenler için, bir süredir devam eden bir kampanya var, herne kadar Amerika'da olsa da, (Internet her yerde değil mi?) Milli Roman Yazma Ayı, insanları bir aylık bir süre içinde bir roman yazmaya teşvik ediyor.

Teknoloji Seçerken

malkocoglu_2

Bu yazıyı Java bilgi işlem teknolojilerinden biri olan Entity Bean'lerin erken ölümü üzerine yazdık. Zamanında büyük şaşa ile ortaya çıkan bu teknoloji niye böyle erken tedavülden kalktı? Ayrıca bu tecrübeden ders çıkarmak bağlamında, ileride bu tür geleceği olmayan ve külfetli teknolojilerin kokusunu nasıl alabiliriz? Bu yazı bilgi işleme daha çok hitap eden bir yazıdır çünkü 3-4 senede bir yeni bir dehşet teknolojiyle çalkantılar yaratan grup bu olmaktadır. Bu dinamizm tabii ki iyidir fakat bilgi işlem müdürleri ve proje yöneticileri için bu teknoloji enflasyonunda bir seçici turnusol testi lazımdır. Aksi halde sonuç InfoWeek Dergisi Pazartesi Günü Sendromudur; (Masasındaki Infoweek dergisinin yeni sayısını pazartesi günü okuyan yönetici) "XML diye bir şey cıkmış bütün dertlere devaymış! Hemen kullanalım!" . [Proje teknik lideri burada somurtur].

http://www.bilgidata.com/yazi.jsp?dosya=a_ejb_postmortem.xml

Türkçe pyqt kitabı projesi başladı

tetir

Merhaba,

http://www.opendocspublishing.com/pyqt/ adresinde bulunan Boudewijn Rempt'in yazmış olduğu "GUI Programming with Python: QT Edition" adlı kitabı Türkçe konuşan insanların da faydalanabilmesi amacıyla Türkçe'ye çevirmeye karar verdik. Pyqt konusunda Türkçe kaynak sıkıntısı yaşanması ve Python-Qt'nin popülerliği bu kararı almamızda etkili oldu.