Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Küçük casuslar artık büyük tehdit

mos

haberde göreceğiniz üzere; bir zamanların -can sıkmaktan öteye gitmeyen- casus yazılımları, hiç küçümsenemeyecek bir pazarın doğmasına sebep olmuşlar.

Babil Kulesi Internette

SHiBuMi

Geçenlerde Internet üzerinde kullanabileceğiniz kaliteli bir İngilizce-Türkçe sözlükten bahsetmiştim. Geçen hafta bir dergi CDsinden çıkan çok daha geniş kapsamlı, yalnızca internete bağlıyken değil, bağlı olmadan da kullanabileceğiniz ve oldukça kolay bir kullanıma sahip bir sözlük programı buldum. Adı Babylon.

ShiftDelete.Net Yayında

berkin

Uzun bir süredir küçük bir arkadaş grubuyla üzerinde çalıştığımız ShiftDelete.Net bir kaç gün önce yayına girdi. Yayına girene kadarki çalışma yoğunluğumuz devam ettiği için bu vakte kadar uzun süredir üyesi olduğum FazlaMesai'yi bu gelişmeden haberdar edemedim.

Droplets > Internet uygulamalarının geleceği

omniheurist

HTML tabanlı internet uygulamalarının programcıya ve kullanıcıya getirdiği birçok zorluklar ve kısıtlar vardır. Request-Response modelinden kaynaklanan tek taraflı update kısıtı, dinamik ve esnek olmayan arayüz, bantgenişliğinin çok verimsiz kullanılması, aynı bilginin tekrar tekrar iletilmek zorunda olması ve farklı programlama pratikleri vb...

Opera Artık Tamamen Bedelsiz ve Reklamsız

wizzyfx

Opera internet tarayıcısının bedelsiz olarak dağıtımına başlandı.