Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Sadece Türkiye’de Devlet Eliyle Internet Sansürü Var

FZ

Radikal gazetesi bugünkü sayısında, Türkiye'de başını alıp gitmiş fütursuz Internet sansürcülüğüne yukarıdaki manşet ile geniş yer ayırdı.

Gazete, "Avrupa'da 'devlet sansürü' yok" ve "Yasa sorunlu, hâkimler konuya hâkim değil" başlıklı yazıları ile Türkiye'de son yıllarda gittikçe yoğunlaşan Internet sansürünü ve bunun gerçekleştirilme yöntemlerini ağır bir dille eleştirdi.

Türkçe-İngilizce Terim Kütüphanesi

SHiBuMi

Uzun zamandan beri Internette İngilizce doküman hazırlarken kullanabileceğim bir sözlük arıyordum. Şimdiye kadar rastladıklarım ya aşırı derecede kullanışsızdı (aralarında Türkçe sözlük içersinde Türkçe harfleri aramada problem yaşayanlar var) ya da aradığını bulmak mümkün değildi. Biraz önce www.zargan.com daki sözlüğü keşfettim. Bu sözlük terimler sözlüğü olarak geçiyor ama oldukça geniş bir veritabanına sahip ve her aranılanı bulmak mümkün. Ayrıca veritabanı değişik kategorilere ayrılmış ve sonuçlar iş dünyası terimleri, genel sözlük, bilişim sözlüğü vs. diye listelenebiliyor. Oldukça kullanışlı bir sözlük, İngilizce terimlerle sık uğraşanların bir gözatmasını tavsiye ederim.

Babil Kulesi Internette

SHiBuMi

Geçenlerde Internet üzerinde kullanabileceğiniz kaliteli bir İngilizce-Türkçe sözlükten bahsetmiştim. Geçen hafta bir dergi CDsinden çıkan çok daha geniş kapsamlı, yalnızca internete bağlıyken değil, bağlı olmadan da kullanabileceğiniz ve oldukça kolay bir kullanıma sahip bir sözlük programı buldum. Adı Babylon.

Güzel Siteler - 5: Info-4-all

parsifal

Oldukça basit bir site Info-4-all
Bir Dünya haritası ve bu harita üzerinde kıtaların isimleri var. Kıta isimleri üzerine gidince ülke listesi çıkıyor. Bu listeden seçtiğiniz ülkenin gazetelerine verilmiş linklere ulaşabiliyorsunuz.
Bilgiyi dağıtın...

Opera 8 çıktı...

ae

Yıllardır severek kullandığım Opera bugün 8. versiyonunu Windows, Linux degisik isletim sistemlerinin hepsinde birden "Speed, Security and Simplicity: Opera 8" sloganı ile çıkardığını ilan etti.

Muhteşem süper kahramanı ile kabiliyetlerini Opera sitesinden öğrenebilirsiniz.