Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

İ.T.Ü ve Internet

redogre

Bu aslında uzun zamandır yazmayı düşündüğüm ama mahkemeye intikal edebileceği için geriye attığım bir konu. Kısa bir özet geçersem, İTÜ yüksek lisans programını öğrenci kayıt sisteminde ki hatalardan dolayı bırakmak zorundayım.

İTÜ lüler bilir, artık kayıt internetten yapılıyor. Ne güzel değil mi? Kayıt olmak için okula gitmek gerekmiyor... Burada yanıldınız işte, çünkü harç dekontunu elden vermek zorundasınız, ayrıca İşbankası'nın online harç ödeme seçeneği var ama İTÜ bunu kabul etmiyor.

@superonline.com ttnet`e @telekom.gov.tr de superonline`a kapalı

wish666

Artık bu kadar olamaz yani. Superonline üzerinden bağlıysanız telekom`un sayfası www.telekom.gov.tr cannot be resolved hatası alıyorsunuz yani dns'i bulamiyorsunuz ve giremiyosunuz.
(Editörün notu: Bu haber`in sözlük anlamı, (ki şu anda doğruluğunu test edemiyorum, TTNET`in ADSL bağlantısından da telekom`un sayfası açılamıyor, sayfa down olabilir)sözlükte sansür olarak geçiyor. Zamanında Ihlas-Net`in islami koşullara uygun olmayan siteleri engellediğini duymuştum (ki onu da hiç deneme şansım olmadı) ama superonline böyle bir engelleme yapıyorsa bu içerik bazlı değil, tam anlamıyla çıkar bazlı bir sansür oluyor. TTNET fiyatları ucuzlattı, internet konusunda tekel olmaya çalışıyor tartışmasında bir taraf değilim ama Internet, kesinlikle sansüre maruz kalmaması gereken bir dünya)

ICQ`da Patladı !

sundance

Akşam eve geldim Butch ile iki satır bir muhabbet edeyim, bir iki yeni projeden bahsedeyim diye Internet`e girdim. O da ne ICQ `Rate Limit Exceed, Please Try To Connect In A Few Minutes` demez mi ?

Şu ana kadar Internet üzerindeki en iyi fikirlerden biri olan ICQ`nun, aynı zamanda Internet üzerindeki en kötü planlanmış ve uygulanan yazılımlardan biri olması bir yana (neden açık hali ile 20küsur mb bu ICQ 2000!) sanırım artık onlar da Türk`ün gücü karşısında yetişemez hale geldiler :)
İddia ediyorum ICQ kullanıcılarının dörtte biri Türk ve bu sayı gittikçe de artıyor :)) Benim aldığım mesajı siz de aldıysanız veya sebebi hakkında bilginiz varsa bir yorumda bulunuverin

Google´den email servisi

sametc

‘Gmail’ adını taşıyacak olan yeni email hizmetinin içinde, gönderilen ve gelen email metinlerini tarayacak bir arama motoru bulunacak. Gmail kullanıcılara 1 gigabyte ücretsiz alan sağlayacak. Bu rakam yaklaşık 500 bin email sayfasını tutabiliyor.
Google, Gmail servisinin finansmanını alışılmadık bir şekilde sağlayacak. Google arama motoru, email metinlerinde geçen konulara ilişkin reklem linklerini emaillere iliştirecek. Örneğin, iletişim kuran iki kullanıcının gitmeyi planladıkları bir konserin bilet satışına dair internet linki email ile beraber gelecek. Google ilk etapta imtiyazlı kullanıcılara açılacak olan deneme servisinin ardından, Gmail’i bir kaç hafta içerisinde internete taşıyacak.
devamı: www.ntvmsnbc.com

İnternet Yurt Dışı Çıkışlarında Rahatlama

malkocoglu

Türk Telekom’un yeni kapasiteleri devreye vermesiyle, Türkiye’nin yurtdışı internete erişim sorunu 27 gün sonra aşıldı. Cezayir depremi sonrası kopan fiber kablolar tamir edildiğinde internete erişim kapasitesi eskisinden daha yüksek olacak.