Dilbilim ve Linux Buluşması: Morphix-NLP İncelemesi

0
FZ
DDİ (Doğal Dil İşleme, NLP - Natural Language Processing) yaklaşık son 40 yıldır önemli bir araştırma disiplini olagelmiştir. Dilbilim ve bilgisayar bilimleri yöntemlerini bir araya getiren bu alanda pek çok değişik uygulama ve çözüm bekleyen önemli problemler mevcuttur. Farklı dillerdeki çok büyük metin dosyalarını incelemek, örüntüleri (pattern) keşfetmek, dönüşümleri gerçekleştirmek, metinleri otomatik olarak sınıflandırmak, konuşma sentezlemek ve konuşmayı anlayıp metne dönüştürebilmek, bilgisayarları bizim anadilimizi anlayabilir hale getirmek yani onlara semantik yetiler kazandırmak, vs. DDİ dalındaki önemli meselelerden sadece birkaçıdır.
DDİ konusunda çalışan Çinli araştırmacı Zhang Le, dil analizi ve dil işleme konusundaki en önemli yazılımların büyük bir bölümünü tespit edip bunları tek bir bootable CD´ye yani Morphix-NLP içine yerleştirmiş. Söz konusu CD´de 640 MB´ın üzerinde DDİ işleme yazılımı mevcut ve sıkıştırılmış bir dosya sistemi kullanan CD´nin kapasitesine baktığımızda daha pek çok yazılımı içine yerleştirebilecek kadar boş yerin bulunduğunu görebiliyoruz.

İncelemenin devamını buradan okuyabilirsiniz.

Not: Söz konusu yazıyı daha önce yazdığım şu yazıdan tercüme ettim. Dolayısı ile bazı yerleri bir miktar abuk sabuk gelmiş olabilir, önerisi olan varsa bazı terimler için seve seve gerekli değişiklikleri yaparım :)

Görüşler

0
sametc
bu haberi sanırım bir yerden okudum ama nertden tabiiki slashdot.org :))
0
sametc
durun yanlıs anlasılmasın FZ yazmıstı o haberi ordan dikkatimi cekti ondan dedim bunu
0
FZ
Evet, makalenin İngilizce özgün şeklinin haberini Slashdot sitesinde duyurmuştum ve tabii ileriseviye.org da bir süreliğine meşhur slashdot etkisine maruz kaldı :)

İşin güzel yanı ve buradan farkı haber orada çıktıktan sonra birkaç saat içinde haberin altında 140 kadar yorum vardı. Aralarında ise Linux uzmanlarından tutun, dilbilimcilere, antropolojiyle ilgilenenlerden tutun otomatik tercüme ile ilgilenen insana kadar çok farklı kesimden insan vardı, açıkçası bu kadar çok ve farklı yorum beklemiyordum, hem şaşırdım hem sevindim :) Gönül ister ki aynı kültürel ve entelektüel çeşitliliği bu ortamda da yaşayalım ;-)
0
sametc
değilmi FZ insallah oyle bir ortam olur fazlamesai yakında insallah :) bakıyorum son zamanlarda yorumlar azalıyor :( ve fazlamesai sadece bilgisayar ve linux sitesi olarak anılıyor bu yanlıs bu imajı duzeltmek lazım.:) saygılarımla
0
malkocoglu
DDI'de istatistik kullanimi ilginc: Bu fikrin daha ilkel bir sekli, tarihi belgelerin yazarlarini bulmak icin kullanilmisti diye hatirliyorum. ABD'de ilk cikan politik dergilerde gunun onemli adamlari takma isimlerle yazilar yayinliyorlarmis. Bu makalelerin yazarlari tarihi ispatlardan sonradan bulunabilmisti, fakat bazilarinin kim oldugu bir turlu anlasilamadi. Bunun uzerine tarihciler, zamanin unlu adamlarin ozel mektuplarindaki "the", "a", "in" vs gibi kelimeleri sayarak, bu sayilari anonim makaleler ile karsilastirdilar, ve yazarlari tespit ettiler. Kullanilan kelimelerinin sayisinin insandan insana degismesi ilginc, ama biraz dusununce mantikli geliyor. Hepimizin favori kelimeleri var demek ki! (Mesela bu yorumda mesela "bu" kelimesini 5 kere kullanmisim)
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Hızlı ve Kirli Bir mod_chroot Kılavuzu

anonim

Apache ile çalışıyorsanız güvenlik işlemlerinin en başında yer alan şartlardan biri Apache'yi kafes içinde çalıştırmaktır.

Ancak klasik kafesleme yaklaşımları bazen insanın sabrını zorlayacak derecede karmaşık ve problemli olabiliyor ( Kişisel görüş kimseyi bağlamaz :) ) .

Ben kendi çözümümü mod_chroot ile hızlı ve kolay biçimde tamamlarken ortaya bu belge çıktı. Her ne kadar sürç-i lisan ettikse affola...

Hacker Etiği - İş Hayatına Yıkıcı bir Yaklaşım

mentat

Pekka Himanen'in Linus Torvalds ve Manuel Castells ile yazdığı kitap Ayrıntı Yayınlarından Türkçe olarak kitapçılarda ve ben ilk kez Ayrıntı Yayınlarından aldığım bir kitabı iki üç günde bitirebileceğim (tercümesi: kolay okunuyor, iyi anlamda). Ha tabii bu kitabın gayet "ağır" meslelere değinmediği anlamına gelmiyor...

Windows Üzerinde Kaynak Kod Versiyon Kontrol Sistemi ve CVSNT.

ae

Özellikle yazılım geliştirme dünyasında iseniz, yazdığınız kodların güvenilir bir şekilde saklanması, versiyonların takip edilmesi, kodun gelişimine katkıda bulunanların ve kodun kontrol altında tutulması ihtiyacınız doğmuştur. Windows ortamında kaynak kod güvenliğini ve versiyonlama takibini yapabilmek için bir kaç alternatifiniz bulunuyor. Özellikle MS ürünleri ile yazılım gerçekleştiriyor iseniz mutlaka karşınıza çıkmış olan Visual Source Safe, açık kod dünyasından RCS , SVN, CVS ve CVSNT Yabancı terimlerin Türkçeye çevrilmesindeki bazı güçlüklerden dolayı açıklamaların başında Türkçe manasını verip metin içinde orjinal kısaltmaları kullanmaya çalışacağım.

Python 101: Eğlenceli bir programlama diline genel bir bakış

FZ

FM üyelerinden tongucyumruk'un yazdığı Eğlenceli bir programlama dili: Python başlıklı belgeyi FM camiası ile paylaşıyoruz.

Hazır 2.4 sürümü çıkmış iken meraklısı için iyi bir başlangıç olur diye düşündük.

Not:Bu belge LATEX belge hazırlama sistemi ile hazırlanmıştır. LaTeX ile üretilen PDF ve sıkıştırılmış PostScript belgelerini de kağıda kaliteli çıktı almak için kullanabilirsiniz.

LDP 10 Yaşında

yalcink01

01/11/2003 tarihi itibari ile Linux Docementation Project 10. yılını devirdi. Matt Welsh tarafından ilk How-To /* Installation How-To*/nun yazılması ile başlayan ve bugün 14 ayrı dilde 450 den fazla yazara sahip olan LDP bugün için Linux ve Açık Kaynak yazılımlarına kılavuz sağlama konusunda ev sahipliği yapmaya devam ediyor. Eh ne dileyim Nice Mutlu Yıllara!

Duyurunun tam metnine TLDP ana sayfadan ulaşabilirsiniz.