Dilbilim ve Linux Buluşması: Morphix-NLP İncelemesi

0
FZ
DDİ (Doğal Dil İşleme, NLP - Natural Language Processing) yaklaşık son 40 yıldır önemli bir araştırma disiplini olagelmiştir. Dilbilim ve bilgisayar bilimleri yöntemlerini bir araya getiren bu alanda pek çok değişik uygulama ve çözüm bekleyen önemli problemler mevcuttur. Farklı dillerdeki çok büyük metin dosyalarını incelemek, örüntüleri (pattern) keşfetmek, dönüşümleri gerçekleştirmek, metinleri otomatik olarak sınıflandırmak, konuşma sentezlemek ve konuşmayı anlayıp metne dönüştürebilmek, bilgisayarları bizim anadilimizi anlayabilir hale getirmek yani onlara semantik yetiler kazandırmak, vs. DDİ dalındaki önemli meselelerden sadece birkaçıdır.
DDİ konusunda çalışan Çinli araştırmacı Zhang Le, dil analizi ve dil işleme konusundaki en önemli yazılımların büyük bir bölümünü tespit edip bunları tek bir bootable CD´ye yani Morphix-NLP içine yerleştirmiş. Söz konusu CD´de 640 MB´ın üzerinde DDİ işleme yazılımı mevcut ve sıkıştırılmış bir dosya sistemi kullanan CD´nin kapasitesine baktığımızda daha pek çok yazılımı içine yerleştirebilecek kadar boş yerin bulunduğunu görebiliyoruz.

İncelemenin devamını buradan okuyabilirsiniz.

Not: Söz konusu yazıyı daha önce yazdığım şu yazıdan tercüme ettim. Dolayısı ile bazı yerleri bir miktar abuk sabuk gelmiş olabilir, önerisi olan varsa bazı terimler için seve seve gerekli değişiklikleri yaparım :)

Görüşler

0
sametc
bu haberi sanırım bir yerden okudum ama nertden tabiiki slashdot.org :))
0
sametc
durun yanlıs anlasılmasın FZ yazmıstı o haberi ordan dikkatimi cekti ondan dedim bunu
0
FZ
Evet, makalenin İngilizce özgün şeklinin haberini Slashdot sitesinde duyurmuştum ve tabii ileriseviye.org da bir süreliğine meşhur slashdot etkisine maruz kaldı :)

İşin güzel yanı ve buradan farkı haber orada çıktıktan sonra birkaç saat içinde haberin altında 140 kadar yorum vardı. Aralarında ise Linux uzmanlarından tutun, dilbilimcilere, antropolojiyle ilgilenenlerden tutun otomatik tercüme ile ilgilenen insana kadar çok farklı kesimden insan vardı, açıkçası bu kadar çok ve farklı yorum beklemiyordum, hem şaşırdım hem sevindim :) Gönül ister ki aynı kültürel ve entelektüel çeşitliliği bu ortamda da yaşayalım ;-)
0
sametc
değilmi FZ insallah oyle bir ortam olur fazlamesai yakında insallah :) bakıyorum son zamanlarda yorumlar azalıyor :( ve fazlamesai sadece bilgisayar ve linux sitesi olarak anılıyor bu yanlıs bu imajı duzeltmek lazım.:) saygılarımla
0
malkocoglu
DDI'de istatistik kullanimi ilginc: Bu fikrin daha ilkel bir sekli, tarihi belgelerin yazarlarini bulmak icin kullanilmisti diye hatirliyorum. ABD'de ilk cikan politik dergilerde gunun onemli adamlari takma isimlerle yazilar yayinliyorlarmis. Bu makalelerin yazarlari tarihi ispatlardan sonradan bulunabilmisti, fakat bazilarinin kim oldugu bir turlu anlasilamadi. Bunun uzerine tarihciler, zamanin unlu adamlarin ozel mektuplarindaki "the", "a", "in" vs gibi kelimeleri sayarak, bu sayilari anonim makaleler ile karsilastirdilar, ve yazarlari tespit ettiler. Kullanilan kelimelerinin sayisinin insandan insana degismesi ilginc, ama biraz dusununce mantikli geliyor. Hepimizin favori kelimeleri var demek ki! (Mesela bu yorumda mesela "bu" kelimesini 5 kere kullanmisim)
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Emacs ile Oracle Sql*Plus ve sql-mode

zekzekus

İş yerinde yoğun olarak Oracle veritabanı ile çalışıyorum. Sorun tespit etmek için sorgular yazıyorum, PL/SQL ifadeleri çalıştırıyorum. Bu işlemleri en rahat yaptığım araç Oracle tarafından sağlanan Sql*Plus. Rahat dediğime bakmayın sade ve son derece hafif olan bu istemcinin insanı deli eden “özellikleri” var. En basitinden yazdığınız uzun bir SQL cümlesinin başında küçük bir hata yaptıysanız, imleci geri götüremiyorsunuz (henüz enter tuşuna basmamış olsanız da). Daha önce yazdığınız komutları listeleyen ve çabuk bir şekilde kullanmanıza olanak veren bir tarihçe (history) özelliği de yok. Emacs editörü (editör demek bir nevi haksızlık oluyor artık) her zaman olduğu gibi bu konuda da devreye giriyor.

Emacs ve sql-mode ile ilgili bilgi veren yazının devamı burada...

Kısıt Koşul Programlama

FZ

Roman Barták'ın "On-line Guide to Constraint Programming" (Kısıt Koşul Programlamaya Giriş) kılavuzu farklı bir yazılım geliştirme paradigması için öenmli bir kılavuz niteliğinde.

Kısıt koşul programlama, kabaca istenen çözümün sağlaması gereken şartların (kısıt koşulların) sunulduğu ve çözümün adım adım tarif edilmediği programlama şekli olarak tanımlanabilir.

Kısıt koşul programlama gitgide popülaritesini artırmaya başladı, Mozart Programming System gibi somut uygulamalar pek çok problemin çözümünde kullanılıyor. NP-zor problemler, yapay zekâ, mantık, elektronik, bilgisayar grafikleri gibi konularda çalışan yazılımcıların kısıt koşul programlama konusunda bilgi sahibi olmalarında fayda var.

Kaynak: Computer Science Daily News

Bilgi İşlem Tasarım Kalıpları

anonim

Tasarım Kalıpları (Design Patterns) adı verilen akım, özellikle bilgi işlem yazılımcıları tarafından son yıllarda çok ilgi görmüştür. Bir tasarım kalıbı basit bir açıklama ile bir nevi reçetedir. Bu reçete, sürekli karşımıza çıkan bir sorun tipine karşı bulunmuş, gene sürekli verilmiş olan ve işe yarar bulunmuş bir çözümdür.

Yazının devamı için buraya tıklayın.

Özgür Yazılımla ilgili bir Özgür Kitap :)

dfisek

M. Ali Vardar, yazdığı üçüncü programlama kitabı "Açık Kodlu Yazılım Geliştirme Araçları"nı yayınevlerine vermek yerine, özgür yazılım meraklılarına özgürce kullanabilecekleri bir elektronik kitap olarak PDF formatında sunmakta ve "eğer kitabı beğendiyseniz bizi destekleyin" diyerek Linux Kullanıcıları Derneği hesabına bağışta bulunmaya davet etmektedir.

Gutenberg Projesi Artık Sesli

melitical

1971 'den beri devam eden Gutenberg Projesi dahilinde artık sesli kitaplar da var. Farklı dillerde sesli kitaplar ücretsiz olarak dinlenebilecek.