Bir Türk Programcısı Sinirlenirse: CORSIS - Açık Kodlu Derlem Analiz Yazılımı

0
FZ
Stallman bir yazıcı sürücüsünün kapalı olması yüzünden çıldırıp işe girişmişti. Linus, okulda eğitim için kullandığı Sun Solaris işletim sistemini evde kullanamayacağını görünce Linux çekirdeğini yazmaya başlamıştı. Ian Murdock Linux kurmanın uzman olmayanlar için hiç de kolay olmayacağını fark edip Debian dağıtımını geliştirmeye başlamıştı. Bilgisayar tarihi sinirli programcıların başlarının çaresine bakarken çevreye de epey fayda sağlamalarının örnekleri ile dolu. Şimdi böyle bir örneğin haberini okuyacaksınız:

Çetin Sert, Almanya'da bilgisayarla dil işleme (NLP - Natural Language Processing) konusunda çalışan 23 yaşında genç bir araştırmacı. Sert, Mike Scott tarafından geliştirilmiş ve dil işleme bağlamında sık kullanılan bir yazılım olan Wordsmith'in kısıtlayıcı lisansını, ödenmesi gereken paraları ve bunu evindeki PC'de rahatça kullanamayacağını görüp bu konuda profesörlerinin uyarıları ile karşılaşınca...
Kolları sıvamış, derdini ve öfkesini gayet net bir dille anlatan bir mektuptan sonra önce Tenka Text sonra da nihai olarak CORSIS open-source corpus analysis software ismini verdiği yazılımı geliştirmeye koyulmuş.

MS Windows, Debian GNU/Linux, Sun Solaris gibi sistemlerde çalışan, C# ile yazılmış açık kodlu CORSIS yazılımının rakibi kapalı kodlu sadece MS Windows'ta çalışan Wordsmith ile eğlenceli bir kıyaslamasını da burada görebilirsiniz.

Programcının bloguna ise buradan erişilebilir.

Görüşler

0
Tarık
çok güzel.
0
robertosmix
Arkadaşı takdir ediyorum, keşke herkes böyle olsa. Ama. Bir konu bu kadar da abartılmaz ki canım. Stallmandan, Linusdan konuya girilince ben de uluslararası bir girişimcimiz tanıtılacak zannettim. :)
0
Chaosopher
neden olmasin arkadasimiz henuz 23 yasinda.

comparison kisminda surasi kopartti beni :D

Programmer:Cetin Sert, 23 years old, student|Mike Scott, ???, lecturer

0
towsonu2003
Bu program ne icin kullanilir, bu konuda bir linki olan var mi? madem ki boyle bi program var, kullanalim ;) ama kullanmadan once, ne icin kullanildiigni anlamak gerek :)
0
anilK
Doğal dil işlemede kullanılma amacını taşıyan analiz metin analiz yazılımı(ben bunu anladım :) ). screenhotlara bakarsanız eger incelediği bir dosyadaki text i analiz edip örneğin sık gecen karakter setlerini tespit etmiş.

open-source data mining yazılımı WEKA vardı ,o yazılıma göre daha ozel bir yazılım bu (işlem itibariyle).

0
FZ
Metin madenciliği için (text mining) bu tür bir programın ham metni işlemesinden sonra çıkardığı veriyi Weka'ya geçmek yani CORSIS'i bir tür Weka filtresi olarak da kullanmak mümkün olabilir (en genel anlamda).
0
koraypeksayar
İşte budur diyorum...

Olan birşeyin kötü bir kopyasını yapıp başka bir isim verip başka bir paketle sunmaktan başka bir iş yapan bir programcının yaptığı işi gördüğüm için çok mutlu oldum.

Bu tür insanlara "cesur" diyorlar. Aslında olması gerekenin normali bu. Bu insanlardan çok değil 1000 tane olsa halimiz yaman olmaz :)
0
cetinsert
Öncelikle FM'de böyle bir yazıyı okumanın beni ne kadar mutlu ettiğini belirtmeliyim. Makalede kullanılan dile gösterilen özene hayran kaldım doğrusu ^_^

Yalnız robertosmix'e katılmamak elde değil. Girişte öyle heybetli isimler ve projeler geçiyor ki insan sonunda kıyaslama ve akabinde "yalnızca bu mu yani şimdi?" diye sormadan edemeyebiliyor.

Dert, öfke ve sinirlenme gibi ifadeler aşırı bir asabiyet izlenimi uyandırsa da, insan üniversitesinin ödev için bile olsa basit bir programın kullanılmasına izin veremez durumda olduğunu görünce, kendisini tepki göstermekten alıkoyamıyor. CORSIS de 2006 yaz aylarında yeni yeni öğrenmekte olduğum C# ile neler yapabileceğimi kendime ve öğretim görevlimize göstermek adına başlanmış bir ödevlik bir girişimdi. O ödevden 'derlem inceleme işinin teknik boyutuna gereğinden fazla yoğunlaşılması' nedeniyle gerekçelendirilen bir 'orta' ile geçtim. o_O (İngiliz Dili ve Edebiyatı'nda okuyordum.) Ama o zamanlar ki sinirlenmişlik bugün çalıştığım iş de dahil olmak üzere yaşamımda bir dizi yeni açılıma yol açtı. Yazıda da vurgulandığı gibi biraz dert ve sinir hiç de fena şeyler değil sanırım ^_^

Bugün Haskell ve F# gibi dilleri öğreniyorum ve öyle umuyorum ki funksiyonel programlama önümüzdeki yıllarda (asabi ya da profesyonel) bireysel programcıların tek başlarına dahi daha da büyük kitlelerin ilgisini çekebilecek işe yararlıkta programları kolayca geliştirebilmelerine olanak sağlayacak.

İlginize teşekkürler.

Çetin Sert ^_^
0
FZ
Detaylı yorumlarınız için çok teşekkürler. Blogunuzda F# ile de ilgilenmeye başladığınızı belirtmişsiniz. Sizce ML ve OCaml geleneklerinden gelen ve .NET ortamında fonksiyonel programlama imkanı sunan böyle bir programlama dili doğal dil işleme yazılımları geliştirmede ciddi bir avantaj sağlayabilir mi? Eğer evet ise bunlar neler olabilir mesela? (Veya benzer kıyaslamayı Haskell için yaparsak?)
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Rosetta Stone: Dil Öğrenme Aracı

SHiBuMi

Rosetta Stone, temel mantığı "Yeni bir dili öğrenmenin en iyi yöntemi nedir? Kendi anadilinizi öğrendiğiniz yöntem" olan, çok başarılı bir yabancı dil öğrenme aracı. Sitelerinde de belirttikleri üzere, ilk dilimizi yani anadilimizi, okula bile gitmeden öğreniyoruz. Bunu, gördüklerimizi, işittiklerimizi başka hiçbir dile dayandırmadan yapıyoruz. Aynı yöntemi, yeni bir dil öğrenmek için de rahatlıkla kullanabiliriz.

Avant Browser - IE için çok özellikli bir kabuk (daha az hafıza kullanımı)

crematorium

Bugün innDir.com'u gezerken Avant Browser'i görünce aklıma Conan'ın 25 Mart'da yayınlanan Browser hafıza kullanımı karşılaştırması başlıklı yazısında yazmış olduğu birşey geldi;
"Tab browsing hafıza kullanımı büyük ölçüde azaltıyor. Phoenixde 17 MBlık bir hafıza kârımız görülüyor. Belki IE de bu tip bir teknoloji kullanarak hafıza kullanımı azaltabilir."

NATURAL & ADABAS Kullanım Klavuzu

rasimsen

NATURAL/ADABAS çok eski bir teknoloji olmasına rağmen ingilizce dahi kaynak bulma sıkıntısı olan bir ikili. Bu yüzden ihtiyacım/ihtiyacımız için NATURAL/ADABAS Kullanım Klavuzu adı altında Türkçe içerikli bir Wiki oluşturmaya karar verdim..

Ayrıca bu ultra hızlı dil+db ikilisini performans sorunu olanlarda mutlaka incelemeli (ultra-high performance with transaction speeds of over 300,000 transactions per second).
Bir diğer özelliği de programcı olmayanlar bile rahatça bu dili öğrenebilir ve uygulama geliştirebilirler..

Sitemiz: http://adabas.rasimsen.com

Dr. Knuth Yazılım Patentleri Hakkında Ne Diyor?

anonim

Ustanın TeX kodlarina bakarken, dizindeki bir metin dosyası dikkatimizi cekti. Dr. Knuth'tan Patent Ofisi gorevlilerine yazilmis bir mesajdi bu. Usta soyle diyor:

"Amerikan kongresi bir süre önce, çok akıllıca bir kararla, matematiksel şeylerin patentlenemeyeceğine karar verdi. Zaten başka türlü matematik yapmak mümkün olmazdı; Pitagoras teorimini her kullandığımızda birine telif hakkı mı ödeyecektik?! Bu bağlamda belirtmek gerekiyor ki, bugünlerde insanların büyük bir aceleyle patentlemeye çalıştığı temel algoritmik fikirler bu kadar temel ve herşeye lazım olacak türdendir. Eğer şu anki gidişata izin verilirse, sonuç, yazarlara kelimeler için patent almaya izin vermek gibi olacaktır."

Devami icin: http://www.bilgidata.com/yazi.jsp?dosya=a_knuth.xml

FJAX - Flash ve Ajax

larweda

AJAX, son dönemde çok sıklıkla adını duyduğumuz, ve çoktandır başarılı örneklerini görmeye başladığımız (Gmail, Flickr, Hotmail, Pageflakes vs.) bir web teknolojisi. Bu konuda bir çok kütüphane ve geliştirme aracı da hali hazırda mevcut. Bu araçlara yeni eklenmiş, ama farklı bir bakış açısı getiren bir teknoloji var: FJAX. Araçların hemen hemen hepsi bi javascript kütüphanesi sunarken, FJAX tarayıcı tarafında yapılacak XML yorumlama işini boyut olarak küçük bir flash objesine yaptırıyor. Bu, hem tarayıcının işini kolaylaştırıyor, hem de diğer araçlar gibi geliştirme sürecini azaltmayı hedefliyor. Üstelik bu konuda çalışan insanların çoğunun başının belası olan tarayıcı uyumluluğu problemlerini de azalttığını iddia ediyor.
İncelemek ve indirmek için: www.fjax.net
Fjax'ın geliştiricileri Jay ve Steve McDonald ile webmonkey'in yaptığı detaylı bir röportaj da burada.