Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Agent Smith Nasıl Çoğalıyor?

cbc

Popüler furya Matrix'in 2. bölümünde etraf Ajan Smith kaynıyordu. Matrix'in bir yazılım olduğunu bilen herkes nasıl kopyalanacağına dair fikir yürütebilir. Fakat...

E-mail 30 yaşında

butch

Günlük hayatımızın değişmez bir parçası olan e-mail 30 yaşında. İlk mesajı 1971 yılının bu vakitlerinde kendi kendine bir makineden diğerine yollayan Ray Tomlinson, aynı zamanda meşhur @ işaretinin de e-mail adreslerinde kullanılmasının sebebi. Attığı ilk mesajı hatırlamadığını söyleyen Ray Tomlinson, "QWERTYIOP" gibi birşey olabilir demiş. Hikayenin tamamı burada ve şurada.

Uyumayın *.com.tr Jenerik Alan Adları Verilmeye Başlandı!!!

BadsectoR

Bilindiği uzere haksız rekabet yaratmaması için ODTU Bilgi İşlem Dairesi tarafından verilmeyen jenerik alan adları bugün itibariyle başvuru yapılabilir hale geldi. Başvuruları 08/04/2003 saat 10:00 ile 08/05/2003 saat 23:59 arasında href=http://generic.nic.tr/list.php>http://generic.nic.tr/http://generic.nic.tr adresinden kabul eden ODTU bu tarihten sonra noter huzurunda çekilişle!, belkide şimdiye kadar yaptığı tek mantıklı iş olan jenerik alan adlarını vermemeyi bırakıyor.

Yıllardır altyapısını online hale getiremeyen, form/faks/telefon üçgeninde tescil işlemi yaparak süreci uzatan, yurtdışında 7-8 $ civarından tescil yapılırken insanlardan 50$(TL'de değil) isteyerek yüzbinlerce doların yurtdışına çıkmasını sağlayan, başvuru formunu baştan aşağı ingilizce yapan, alan adı yenileme zamanı geldiğinde sahibini ne e-posta ne de faksla uyarmayarak alan adını askıya alan, başvurada yapılan kontakları veritanındaki kontaklarla karıştıran...Daha fazla yazmayacağım. Bu uygulama sonrasında oluşacak haksız rekabetten kimlerin canı yanacak merak ediyorum. http://generic.nic.tr/list.php adresinde tüccarların! başvurularını görebilirsiniz.

Çalıntı laptoplara sınır (ya da biri bizi gözetliyor)

mentat

ÇALINTI ve kayıt dışı cep telefonlarını kullanıma kapatarak, hırsızlıkların önüne geçen hükümet, şimdi de son dönemde yaygınlaşan dizüstü bilgisayar (laptop) çalınmasına karşı yeni bir uygulamayı devreye sokmaya hazırlanıyor. Cep telefonlarını denetime alan yasanın mimarı olan AKP Milletvekili Seyfi Terzibaşıoğlu'nun hazırladığı yasa tasarısında çalıntı ve kayıt dışı dizüstü bilgisayarlar kara listeye alınacak, MAC numarasından takip edilecek ve internet kullanımına kapatılacak. İnternet servisi sağlayan firmalar, yeni yasa ile bunları takiple yükümlendirilecek. Haberin devamı hurriyet.com.tr'de.

Yorum: Haberi okur okumaz tüylerim diken diken oldu. 1984'e dönüyoruz yavaş yavaş..

YouTube Videoları Artık Cepte

melitical

Verizon Wireless firmasıyla youtube arasında yapılan anlaşmaya göre artık Verizon Wireless kullanıcıları youtube videolarını cep telefonlarından izleyebilecekler.