Dilbilim ve Linux Buluşması: Morphix-NLP İncelemesi

0
FZ
DDİ (Doğal Dil İşleme, NLP - Natural Language Processing) yaklaşık son 40 yıldır önemli bir araştırma disiplini olagelmiştir. Dilbilim ve bilgisayar bilimleri yöntemlerini bir araya getiren bu alanda pek çok değişik uygulama ve çözüm bekleyen önemli problemler mevcuttur. Farklı dillerdeki çok büyük metin dosyalarını incelemek, örüntüleri (pattern) keşfetmek, dönüşümleri gerçekleştirmek, metinleri otomatik olarak sınıflandırmak, konuşma sentezlemek ve konuşmayı anlayıp metne dönüştürebilmek, bilgisayarları bizim anadilimizi anlayabilir hale getirmek yani onlara semantik yetiler kazandırmak, vs. DDİ dalındaki önemli meselelerden sadece birkaçıdır.
DDİ konusunda çalışan Çinli araştırmacı Zhang Le, dil analizi ve dil işleme konusundaki en önemli yazılımların büyük bir bölümünü tespit edip bunları tek bir bootable CD´ye yani Morphix-NLP içine yerleştirmiş. Söz konusu CD´de 640 MB´ın üzerinde DDİ işleme yazılımı mevcut ve sıkıştırılmış bir dosya sistemi kullanan CD´nin kapasitesine baktığımızda daha pek çok yazılımı içine yerleştirebilecek kadar boş yerin bulunduğunu görebiliyoruz.

İncelemenin devamını buradan okuyabilirsiniz.

Not: Söz konusu yazıyı daha önce yazdığım şu yazıdan tercüme ettim. Dolayısı ile bazı yerleri bir miktar abuk sabuk gelmiş olabilir, önerisi olan varsa bazı terimler için seve seve gerekli değişiklikleri yaparım :)

Görüşler

0
sametc
bu haberi sanırım bir yerden okudum ama nertden tabiiki slashdot.org :))
0
sametc
durun yanlıs anlasılmasın FZ yazmıstı o haberi ordan dikkatimi cekti ondan dedim bunu
0
FZ
Evet, makalenin İngilizce özgün şeklinin haberini Slashdot sitesinde duyurmuştum ve tabii ileriseviye.org da bir süreliğine meşhur slashdot etkisine maruz kaldı :)

İşin güzel yanı ve buradan farkı haber orada çıktıktan sonra birkaç saat içinde haberin altında 140 kadar yorum vardı. Aralarında ise Linux uzmanlarından tutun, dilbilimcilere, antropolojiyle ilgilenenlerden tutun otomatik tercüme ile ilgilenen insana kadar çok farklı kesimden insan vardı, açıkçası bu kadar çok ve farklı yorum beklemiyordum, hem şaşırdım hem sevindim :) Gönül ister ki aynı kültürel ve entelektüel çeşitliliği bu ortamda da yaşayalım ;-)
0
sametc
değilmi FZ insallah oyle bir ortam olur fazlamesai yakında insallah :) bakıyorum son zamanlarda yorumlar azalıyor :( ve fazlamesai sadece bilgisayar ve linux sitesi olarak anılıyor bu yanlıs bu imajı duzeltmek lazım.:) saygılarımla
0
malkocoglu
DDI'de istatistik kullanimi ilginc: Bu fikrin daha ilkel bir sekli, tarihi belgelerin yazarlarini bulmak icin kullanilmisti diye hatirliyorum. ABD'de ilk cikan politik dergilerde gunun onemli adamlari takma isimlerle yazilar yayinliyorlarmis. Bu makalelerin yazarlari tarihi ispatlardan sonradan bulunabilmisti, fakat bazilarinin kim oldugu bir turlu anlasilamadi. Bunun uzerine tarihciler, zamanin unlu adamlarin ozel mektuplarindaki "the", "a", "in" vs gibi kelimeleri sayarak, bu sayilari anonim makaleler ile karsilastirdilar, ve yazarlari tespit ettiler. Kullanilan kelimelerinin sayisinin insandan insana degismesi ilginc, ama biraz dusununce mantikli geliyor. Hepimizin favori kelimeleri var demek ki! (Mesela bu yorumda mesela "bu" kelimesini 5 kere kullanmisim)
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Administrative tools

HoLY

Dsniff, MRTG, IP Flow Meter, Tcpdump, NTOP, Ngrep ve diğerleri hakkında açıklamada bulunan PDF formatında bir döküman. Neden ve nasıl ağı dinleyebileceğimizi örneklerle de açıklamışlar saolsunlar:) Döküman bu linkte

UNIX´ten Nefret Etmenin Kitabı

tongucyumruk

Ortalıkta M$, DOS, XP, UNIX, Linux vs... gibi kelimelerin olmadığı eski devirlede insanlar Lisp Machine'ler, ITS, TOPS gibi sistemler kullanırdı. O günlerde işletim sistemlerinin görselliği, ikonları vs... pek te önem arzetmezdi çünkü çoğu insan CRT monitörler yerine TeleType'lar (meşhur tty) yoluyla bilgisayarla iletişim kurarlardı. Zamanla sunucu tarafında UNIX ağırlığını koyarken bir yandan da masaüstü diye bir piyasa ortaya çıkmış ve IBM/PC ile Macintosh bu piyasada at koşturur oldular...

Visual Studio Zihninizi Çürütür Mü?

FZ

Yaklaşık 30 yıldır program yazan ve Microsoft Windows programlama kitapları ile saygı duyulan isimler arasında yer alan Charles Petzold'un son makalelerinden Does Visual Studio Rot the Mind? Ruminations on the Psychology and Aesthetics of Coding son zamanlarda okuduğum en güzel yazılardan biri.

Petzold, kullanılan araçların insan düşüncesini inceden inceye nasıl şekillendirdiğine dair mükemmel örnekler vermekle kalmıyor, aynı zamanda konuyu tarihsel bir bakışla da değerlendirip çarpıcı tespitlerde bulunuyor. Sadece Microsoft kullananların, sadece C++ ya da C# kodlayanların değil, GNU/Linux, Java ve VS.NET haricinde IDEler kullananların da okumasında fayda olan bir yazı.

Debian ile Mantıksal Hacim Yönetimi (LVM)

FZ

Türk Debian kullanıcıları camiasının çalışkan ve üretken bireylerinden Serdar Aytekin Debian GNU/Linux kullanarak mantıksal hacim yönetimi (LVM - Logical Volume Management) gerçekleştirmeye dair güzel bir yazı hazırlamış.

İçerik ve seviye olarak orta ve üst düzey sistem yöneticilerine hitap eden bu yazı, "7-8 adet 200 GB'lik SCSI diski bilgisayarıma bağlayıp bunları tek bir disk gibi görmek ya da 3'e bölüp 3 üç farklı disk gibi görmek, sonra istersem kolayca yeni disk takıp hacmi ve dosya sistemini büyütmek istiyorum" gibi cümleler kuran kişilerin işine yarayacak türden.

Bu tür cümlelerin çok değil 4-5 yıl öncesine dek ancak onbinlerce, yüzbinlerce dolarlık makinalar ve ticari UNIX türevi işletim sistemleri barındıran bilgi işlem merkezlerinde kurulduğu ve özel, pahalı yazılımlar gerektirdiği düşünülecek olursa bilgisayarla profesyonel olarak uğraşan bilgi işlemciler için GNU/Linux'un, Debian'ın kıymeti bir kez daha anlaşılır diye düşünüyorum. Bu kadar laftan sonra hadi artık makale adresini versene diyenler için, buyrun: Debian ile Mantıksal Hacim Yönetimi (LVM).

Yeniden Düzenleme (Refactoring) Video Sunumu

malkocoglu

Yazılım mühendisliği dünyasında özellikle XP (eXtreme Programming) gruplarında, "Yeniden Düzenleme" (Refactoring) tekniği oldukça ilgi görmeye başladı. Birim testler mevcut ise, kodumuzun tasarımını değiştirmenin artık bir ismi, değişik teknikleri ve de destekleyen yardımcı programları var.

Emacs üzerine eklenti olarak kullanılan Xrefactory böyle bir program. Xrefactory kuruluşu, kullanılışı (ilk kez video ile) sitemizde yayınlandı.