Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Yeni P2P - IRIS

cazz

Amerika'da, devlet tarafindan gorevlendirilmis bir ekip, var olan P2P teknolojisindeki sorunlari cozme amacli yeni bir P2P agi kuruyormus : IRIS (Infrastructure for Resilient Internet Systems)...

Projeden (ve MIT'den) Hari Balakrishnan soyle demis :

"Sunuculara karsi Denial of Service saldirilarini sona erdirecek!"

Balakrishnan ve arkadaslari , IRIS icin yeni bir arama algoritmasi da gelistireceklermis...

Bakiniz efenim...

`Satranç´ta Yenilmek İsteyenlere

sundance

Seti@home ve diğer dağıtık bilgisayar projelerinden sonra ilk defa mesaj kaygısı olmayan ;) bir dağıtık bilgisayar gridi; www.chessbrain.net

Amaç malum 200 lü yıllardan beri oynanan Satranç oyununu en iyi şekilde oynayabilecek bir sistem kurmak.

Yakın zamanda büyük ustalar ile bu gridin maçını göreceğimiz kesin, siz ne dersiniz bir denemeye ?

Internet`in sopası yok ki..

larweda

www.google.com son günlerde internette en çok kullandığımız arama motoru.. Ama bilerek ya da bilmeyerek şahane bir rastlantıya neden oldular. Google'a gidip "dumb motherfucker" arattırırsanız, en yüksek puanlı sonuç Amerika`nın taze başkanı George.W. Bush hakkında bir site oluyor. Yani basit bir yorumla internet`in en ünlü "dumb motherfucker"ı George.W. Bush oluyor. İlahi adalet mi dersiniz, sanal adalet mi dersiniz, bilmem... :-))

Ayın linki

urxalit

Arkadaşlar bunu ayın linki olarak kabul etmek istiyorum. Akıllının biri pi sayısını link yapmış ve google.com´un PI sayfasına yönlendirmiş. :)

3.14159265358979323846264338327950288419716939937510582097.org

Almak isteyenlere, com ve net domainleri boş. :)
(tabi baştaki 3. hostname)

VII. Türkiye´de İnternet Konferası Yaklaşıyor

adervis

VII. Türkiye'de İnternet Konferası, inet-tr 2002'ye İkibin Kişinin Katılması Bekleniyor!

Bu yıl 19-21 Aralık tarihlerinde İstanbul Harbiye'deki Askeri Müze'de gerçekleştirilecek olan Türkiye'de Türkiye'de internet Konferans'larının sekizincisi inet-tr 2002 Türkiye internetin önünü açacak fikirlerin paylaşılacağı ve tartışılacağı bir platform olmaya devam ediyor.