Kılavuz: Türkçe imla denetleyicisi

0
m1a2
Haberi önce linux.org.tr`de okudum ve hemen kaynak sayfaya zıpladım. Kılavuz, Linux ortamında çalışan bir Türkçe imlâ denetleyicisi. İşte nicedir görmek istediğim türden bir proje :) Umarım sayıları artar. Haberi hiçbir test yapmadan yazıyorum (arka plânda download devam ediyor), çünkü Türkçe`nin kendine has problemleriyle uğraşmaya yönelik her teşebbüs kutsaldır ve (Sabancı üniversitesinde çalışan ?) proje geliştiricilerini de kutluyorum ;)
Yeri gelmişken bu kapsamda bir projeyi daha zikredeyim. Şu linkte `aspell` üzerinden Türkçe denetlemesi yapma yöntemini tercih etmiş olan bir başka `Türkçeleme çözümü` mevcut. (Projedeki en son aktiviteyi 2001`in 1nci ayı olarak gördüm. Şu an ne durumda onu bilemiyorum.)

P.S. Proje, imlâ denetlemesini de içeren `Computational Linguistics` alanında ülkemizin önde gelen bilimadamlarından Sn. Kemâl Oflazer`in supervisor`lığında yürütülüyor zannediyorum . (Yanlışım varsa ilgili kişiler düzeltsin ;) Hâl böyleyse bu çok güzel bir gelişme. Kemâl Bey`e 4-5 yıl önce -o zaman Bilkent`te idi sanıyorum- bu tür bir projeyi GPL olarak dağıtması konusunda bir istek mail`ı yazmış ve son derece nazik bir dille `intellectual property` gerekçeleriyle bunun mümkün olamayacağı cevabını almıştım. Hadi bakalım hayırlısı! Ben şimdi gidiim de programı deneyeyim. Acaba `spell check over TeX` yapabiliyor mu? Meraklandım...

Görüşler

0
cartman
Acaba ispell ya da aspell'e entegre edilebilir mi?

Çok manyak olurdu walla ya :)
0
m1a2
`kilavuz`un entegrasyonu anlamında bunun mümkün olduğunu sanmıyorum. (`ispell` için kesin olarak imkânsız olduğunu söyleyebilirim, `aspell` için de büyük bir olasılıkla öyle.) Mesele şu: ispell tarzı `her derde deva` imlâ denetleyiciler aslında `ingilizce-almanca vb. türü `dertlere deva`. (Burada teknik olarak falanca dil aileleri denilebilirdi fakat terimleri hatırlayamadım.) Türkçe gibi ek kullanımına dayalı `Çekoslovakyalılaştırılamayan` ;) diller -ki Türkçe başı çekiyor- imlâ denetimi açısından büyük sorun. `ispell` sadece kök kelimeleri içeren bir sözlük veritabanından yanlış hatırlamıyorsam `affix` denilen ek ve kural dosyalarıyla bütün türetilmiş sözcükleri de kapsayan bir sözcük uzayı üreterek işlem yapıyor. İngilizce gibi -regular ?- dillerde bunun algoritmalaştırılması kolay, Türkçe de ise `ne yapsak ta şunu CPU`nun kafasında kurallaştırsak` nevinden zorlu bir algoritmik problem var. Ben bu `ispell` mevzusunu Kemal hocaya sordum ve teknik olarak buna benzer bir açıklama yapmıştı. `aspell` getirdiği soyutlamalarla düzensiz dilleri de içerecek yönde atılmış ileri bir adım, mamaafih bu adım Türkçe`nın kıyısına zor ulaşıyor gibi görünmekte. `aspell` C++ ile yazılan ve mümkün her yerde soyutlama yapıldığını tahmin ettiğim bir `motor`a sahip. Türkçe imlâ`nın etkin denetimi için biraz da bu motora müdahale gerekiyo gibime gelmekte (aspell için Türkçe dat hazırlayan geliştirici arkadaş buralara takılsa da bizi aydınlatsa)... Neyse bu konuda çok afakî laf etmeyeyim, yeterince bilmiyorum zira. Yani dostum, bu imlâ denetimi `tırnağın varsa kaşı` türünde bir çetrefil problem. İşte bu yüzden `kaşıma` girişiminde bulunan bu arkadaşları takdir ettim.

Not. Programı hâlâ deneyemedim, denediğimde bi çift laf edecem...
0
dfisek
aspell'in türkçe eklentileri mevcut. gnu türkçe projesinin sayfasından indirilebiliyor diye hatırlıyorum. netekim öyleymiş.

http://gnu-tr.sourceforge.net/dosyalar/aspell-tr.tar.gz

kurulumu ile ilgili aynı sayfada sık sorulan sorular bölümünde bilgi var.
0
cartman
Sağolasın :)
0
anonim
Bir tesadüf eseri bu sayfaya bir şekilde geldim ve bu imla denetleyicileri tartışmasını gördüm. Benim açımdan daha önce geliştirdiğimiz imla denetleyicisi kodunu ve datasını Türkçe LINUX'a koymakta bir sorun yok - ancak ispell/aspell APIsina uymuyor olabilir. Eğer ilgilenmek isteyen arkadaşlar olursa benimle temasa geçsinler ben ham C kodunu verebilirim.

Kemal Oflazer
oflazer@sabanciuniv.edu
0
m1a2
Hocam saygılar sunarım. İlginizi esirgememişsiniz yine. Böyle bir konu üzerinde çalışmayı planlayan veya halen çalışan arkadaşlar için bundan daha güzel bir fırsat düşünemiyorum. Türkiyedeki akademik camianın açık yazılım platformuna daha aktif katılımını sağlamak açısından gösterdiğiniz bu yaklaşımın bir örnek teşkil etmesini diliyorum. Teşekkürler...
0
m1a2
Haber de unutmuşum. Sn. Kemal Oflazer`in çalışmaları hakkında bir fikir almak için (sadece en son) yayınlarını içeren bir link şu, homepage`i de bu. Yaaa, öyle işte, ülkemizde böyle değerler var. Enseyi karartmamak lâzım ;)
0
cartman
Aslında bu sistem KDE spelling sistemine katılabilir...KDEcilere bi önermek lazım :-)
Görüş belirtmek için giriş yapın...

İlgili Yazılar

NATURAL & ADABAS Kullanım Klavuzu

rasimsen

NATURAL/ADABAS çok eski bir teknoloji olmasına rağmen ingilizce dahi kaynak bulma sıkıntısı olan bir ikili. Bu yüzden ihtiyacım/ihtiyacımız için NATURAL/ADABAS Kullanım Klavuzu adı altında Türkçe içerikli bir Wiki oluşturmaya karar verdim..

Ayrıca bu ultra hızlı dil+db ikilisini performans sorunu olanlarda mutlaka incelemeli (ultra-high performance with transaction speeds of over 300,000 transactions per second).
Bir diğer özelliği de programcı olmayanlar bile rahatça bu dili öğrenebilir ve uygulama geliştirebilirler..

Sitemiz: http://adabas.rasimsen.com

Bir Türk Programcısı Sinirlenirse: CORSIS - Açık Kodlu Derlem Analiz Yazılımı

FZ

Stallman bir yazıcı sürücüsünün kapalı olması yüzünden çıldırıp işe girişmişti. Linus, okulda eğitim için kullandığı Sun Solaris işletim sistemini evde kullanamayacağını görünce Linux çekirdeğini yazmaya başlamıştı. Ian Murdock Linux kurmanın uzman olmayanlar için hiç de kolay olmayacağını fark edip Debian dağıtımını geliştirmeye başlamıştı. Bilgisayar tarihi sinirli programcıların başlarının çaresine bakarken çevreye de epey fayda sağlamalarının örnekleri ile dolu. Şimdi böyle bir örneğin haberini okuyacaksınız:

Çetin Sert, Almanya'da bilgisayarla dil işleme (NLP - Natural Language Processing) konusunda çalışan 23 yaşında genç bir araştırmacı. Sert, Mike Scott tarafından geliştirilmiş ve dil işleme bağlamında sık kullanılan bir yazılım olan Wordsmith'in kısıtlayıcı lisansını, ödenmesi gereken paraları ve bunu evindeki PC'de rahatça kullanamayacağını görüp bu konuda profesörlerinin uyarıları ile karşılaşınca...

DCP-Portal Gelişiyor... v4.5

anonim

Tamamen Türk içerik yönetimi uygulaması DCP-Portal'ın yeni sürümü çıktı. Yönetici alanı yeniden geliştirilen DCP-Portal, 4.5. sürümünde benzerlerinden çok daha kolay ve konfigüre edilebilir bir sistem yönetimi imkanı sunuyor. İçerisinde dosya yükleme, WYSIWYG tarzı bir HTML editör bulunduran yazılım, içerikler eklenirken ve/veya güncellenirken hiçbir HTML bilgisine gerek duymuyor.

Knowlan: Ağınız Kontrolünüzde

FZ

Knowlan, ARP protokolunu kullanan yerel ag IP ve MAC adresi tarayicidir. Knowlan, kodun daha kolay tasinabilmesi icin libpcap ve libnet kutuphanelerini kullanarak yazildi.

Knowlan, yerel agdaki erisilebilen (acik) bilgisayar' larin IP adreslerini ve MAC adreslerini yerel agdaki butun ip adreslerine bir kereye mahsus ARP REQUEST paketi atma ve ARP REPLY paketi gonderen bilgisayarlarin IP ve MAC adreslerini kullaniciya sunma seklinde calismaktadir.

Samba Windows 2003´ü Geçti (~ %250 daha hızlı)

FZ

IT Week Laboratuvarlarında gerçekleştirilen zorlu testlerin sonuçlarına göre açık kodlu dosya ve yazıcı sunucusu Samba aynı işlevleri sunmaya çalışan Windows Server 2003´ten yaklaşık 2.5 kat daha hızlı çalışıyor.

Haberler tam da Microsoft´un NT4 desteğini bitirmeyi açıkladığı günlerde çıktı. Windows Server 2003 ve Samba 3 arasındaki fark Windows 2000 Server ve Samba 2 arasındaki farktan çok daha büyük.