Yeni Deascifier

0
anonim
15 senedir İngilizce klavye ile yazıyorum, ve fena alıştım. F klavyeye de, Türkçeleştirilmiş Q klavyeye bile alışacak vaktim ve isteğim yok. Eh dedim ben de, biraz beyin ve Perl kaslarımı çalıştırayım, ve şu işe kalıcı bir çözüm bulayım. Benim değişmeye niyetim yok, teknoloji bana yardım etsin.
Sonuç, Bilgidata Deascifier programı. Fikir: Daha fakir" alfabeye sahip olan dil İngilizce olduğuna göre, etrafta zaten yazılı olan bir çok Türkçe yazıları kullanıp, bir sözlük oluşturmak. Sözlük şöyle oluşacak. Bu dökümanlara bakarken içinde TR karakter olan her kelime içinde ne zaman bir Türkçe harf görsem, o harfi "fakirleştiriyorum" yani deascify işleminin tersini yapıyorum. Sonra "fakirleştirilmiş" yeni kelimeden halen hatırladığım Türkçe kelimeye bir işaret koyuyorum (Perl hash kullanarak). Bundan sonra TR karakteri kullanmayan metinden aynı hash'i kullanarak ters yönde ara/değiştir yapmak mümkün oluyor.

Daha fazla detay için programın koduna bakabilirsiniz. Lisans LGPL. Tepe tepe kullanılabilir.

Görüşler

0
bio
Ayni isi yapan online bir servis de epeydir var:

http://www.hlst.sabanciuniv.edu/TL/deascii.html
0
afsina
Zemberek web demosunu da kullanabilirsiniz.

http://pisi.uludag.org.tr:8080/zemberek_web/
0
afsina
Bu arada, bahsettiginiz yontem ne yazik ki her zaman islemeyecektir.
Bu konuda istatistiksel (Sabanci universitesi kaynakli uygulamada oldugu gibi) ya da morfolojik cozumleme (zemberekte oldugu gibi) daha iyi sonuc verecektir. Zemberek yonteminin eksikligi belisrsizlik gidericinin zayif olmasi, yani bazen birden fazla sonuc uretildiginden hangisinin secilmesi gerektigi konusunda yanlis karar verebiliyor.
0
afsina
Bu arada, yazida bahsedilen "deasciifier" ters olmus saniyorum, yani ascii karakter iceren kelimenin turkcelestirilmesine deasciifier deniliyor diye biliyorum. asciifier denmeliydi heralde .Sorunlu olan konu zaten deasciifier.
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Anti-Spam E-Posta Adresi Oluşturma (Şifreli IP Adresiyle)

FZ

Bugün Perl Rahipleri tapınağında okuduğum ve spam e-posta konusu ile ilgili bu önemli makaleyi ve Perl kodunu sizinle paylaşmak istedim.

Eğer bir şekilde web sayfanızda e-posta adresinizi yayınlamak istiyorsanız yukarıdaki makaledeki Perl betiğini (script) kullanarak oluşturacağınız dinamik bir e-mail adresinin içine o anda sizin e-posta adresinizi çekmeye çalışan robota ya da spamciye dair bilgileri gömebiliyorsunuz. Nasıl yani diyenler okumaya devam edebilir ;-)

Geleceğin Programlama Dili: Perl 6

FZ

Bazı programlama dillerinin takipçileri vardır, bazılarının fanatikleri. Ancak çok az programlama dili ile ilgili kitapta o programlama dilinin "kültürü"ne ve doğal dil ile ilişkisine dair özel bir bölüm bulabilirsiniz.

Kolayı kolay, imkansızı mümkün kılan Perl dili 16 yıl önce yani 1987 yılında doğduğunda bu kadar yaygınlaşabileceğini ve genişleyeceğini belki de yaratıcısı Larry Wall bile tahmin etmiyordu.

Şimdi ise Larry Wall ve önderliğindeki dahi programcı ekibi binlerce Perl programcısının isteklerini de inceleyerek yeni bir efsaneye imza atmak için geceli gündüzlü çalışıyorlar. Beyler, bayanlar, karşınızda Perl 6'nın hikayesi:

Perl Öğreniyoruz - 4

cayfer

Daha önceki bölümler:
1. bölüm
2. bölüm
3. bölüm
Bu hafta konumuzda çağrışımlı listeler var, Haftaya "regexp"ler! Bu arada merak ettiğim birşey var: Acaba bu Perl tefrikasından yararlanan var mı?

Perl Öğreniyoruz - 3

cayfer

2. bölümün sonunda bu hafta "listeler"den söz edeceğimi söylemiştim.

Listeler (arrays) Perl'in çok güçlü olduğu konulardan birisidir. Perl'de bir listeden söz ederken değişken adının başına bir @ işareti koymalısınız. (Hatırlıyorsanız sayıl (scalar) değişkenlerin adı $ işareti ile başlardı).

Perl Öğreniyoruz - 5

cayfer

1. bölüm 2. bölüm 3. bölüm 4. bölüm
regexp'ler (Regular Expressions)Sözlüğe bakınca
regular: düzenli, muntazam, kurallı, kurallara uygun ve düzenli
expression: deyim, ifade, tabir, anlatım ve dışavurum
karşılıklarını buldum. Bence ingilizce Regular Expression sözcükleri de bu bölümde anlatacağım konuyu tam olarak anlatamıyor; çünkü aslında kavram adını ABD'li matematikçi Kleen'in Düzenli Kümeler Cebiri (Algebra of Regular Sets) üzerindeki çalışmalarından alıyor.