Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

`Satranç´ta Yenilmek İsteyenlere

sundance

Seti@home ve diğer dağıtık bilgisayar projelerinden sonra ilk defa mesaj kaygısı olmayan ;) bir dağıtık bilgisayar gridi; www.chessbrain.net

Amaç malum 200 lü yıllardan beri oynanan Satranç oyununu en iyi şekilde oynayabilecek bir sistem kurmak.

Yakın zamanda büyük ustalar ile bu gridin maçını göreceğimiz kesin, siz ne dersiniz bir denemeye ?

BIG BROTHER IS WATCHING US !

ganzo66

"ABD Başkanı George W. Bush, terörizmle mücadele yasasını, Cuma günü imzalamıştı. Buna göre, ABD Adalet Bakanlığına bağlı Federal Soruşturma Bürosu FBI yetkililerinin, izleme ve dinleme faaliyetleri inanılmaz ölçüde genişletildi.

Bush‘un imzasının kurumasını beklemeden ve haftasonu olmasına bakmadan Washington‘daki en üst düzey hukukçular ...ülkedeki federal savcılara, 30 sayfalık bir e-mail göndererek, hükümetin, yüksek teknoloji aletlerinin nasıl kullanılacağını anlattılar"

Ekonomik olarak en güçlü 100 ülke/şirket

sundance

2000'de yayınlanan bu rapora göre Dünya'nın en büyük 100 ekonomik gücünün 51'i çok uluslu şirketler.

Her ne kadar raporun yeni halini bulamamış olsak da, bizim için ilginç olanı 22 ve 23 numaralar. Kırmızı çizgi bizden başlıyor.

Türk Projeleri İnternet Gündeminde

anonim

İnternette ülkemiz adına güzel gelişmeler yaşanıyor.San Francisco'da Web 2.0 Expo'nun gerçekleştirildiği şu günlerde başında Türklerin bulunduğu güzel projelerle internet gündemindeyiz.

Daha hızlı ''download''

cbc

"California Institute of Technology", mevcut TCP protokolünü biraz değiştirip, normal paketlerin 266 mbiti aşmadığı yerlerde 925 mbite ulaşmayı başarmışlar. Okuduğum kadarı ile basite indirgeyecek olursam TCP protokolünün hata bulma ve düzeltme kısmı ile oynamışlar.

Yüzeysel bir yazı için buraya, detaylı bilgi için buraya tıklayabilirsiniz.