Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

ShiftDelete.Net Yayında

berkin

Uzun bir süredir küçük bir arkadaş grubuyla üzerinde çalıştığımız ShiftDelete.Net bir kaç gün önce yayına girdi. Yayına girene kadarki çalışma yoğunluğumuz devam ettiği için bu vakte kadar uzun süredir üyesi olduğum FazlaMesai'yi bu gelişmeden haberdar edemedim.

Türkiye`den Wired ve Slashdot`a haber: Sağolasın RTÜK

sundance

Bu ilk değil sanırım son da olmayacak, fakat dillere destan gönüllere ferman RTÜK yasası ile, Wired ve Slashdot'a haber olduk.

Gönül isterdi ki IT alanında bir gelişme ile haber olalım, ama kısmet buymuş, neyse hıyarın teki demiş ya `reklamın iyisi kötüsü olmaz` diye herhalde geek patlaması yaşarız bu haberlerle bu yaz :)) Teşekkürler TBMM, teşekkürler hükümet.

Google: Bir kez daha...

sundance

Google bir kez daha yapacağını yaptı. Yaklaşık 700 milyon mesajdan oluşan, 20 yıllık Usenet Arşivini kullanıma açtı

1981`den bu güne gelen bu dev arşiv bugüne kadar eşi benzeri görülmemiş bir dev tarih belgesi. Bizi izlemeye devam edin, sanırım önümüzdeki haftalarda bu arşivden eşelenmiş onlarca önemli olayın haberiyle karşınızda olacağız ;)

Internet Erişimi: DialUp - ADSL - Kablo - Superonline Skyrunner vs. ?

larweda

Son günlerde hepimiz bir taşınma/yer değiştirme olayı yaşadığımız için hep beraber internet bağlantısı alternatifleri araştırmaya giriştik. Aslında ortalıkta envai çeşit (dial-up, leased line, ADSL, ISDN, X25, uydu) alternatif olmasına karşın bir de acı bir gerçek var ki, Türkiye'de hiç bir uygun (hızlı, makul fiyatlı, stabil) internet bağlantı alternatifi yok! Burada olan alternatifler hakkındaki düşüncelerimi paylaşıp, tüm FM dostlarının da düşüncelerini ve tecrübelerini öğrenmek isterim:

Google artık akademisyenlere de hizmet ediyor

loker

Google "'Şimdiye kada akademik dünyadan çok faydalandık şimdi sıra biraz da bizim bir karşılık vermemize geld"' dedi ve Akademik Araştırma Motorunu duyurdu... Beta olan hizmet açıklamaya göre reklamsız ve ücretsiz olarak devam edecek ve akademik referanslar, kütüphaneler ve benzeri kaynaklarda arama yapılmasına olanak sağlayacak.