Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Belgelerle Konuşabilmek İçin

FZ

Konu teknoloji olunca belgelere ulaşmak çok zor değil belki ama sosyal meselelere gelince merkezi bir yerden belgelerle desteklenmiş bilgilere ulaşmanın o kadar kolay olduğunu kimse söyleyemez. Hele de yakın tarih olsun gündemdeki politik gelişmeler olsun, ortalıkta, gazetecilerin ağzında binbir söz döner de filanca anlaşmada tam ne diyor, falanca sözleşmede tam olarak ne yazıyor, hangi olayda kimin hakkında ne karar verilmiş, vs., kimse tam bilmez, merak edenlerin büyük bir kısmı da ya araştırmaya üşenir ya da araştırsa bile ulaşmakta güçlük çeker.

Deneyimli gazeteci Levent Pirler tarafından http://www.belgenet.com işte tam da bu boşluğu doldurmaya yönelik değerli Internet kaynaklarından biri. Türkiye'nin yakın geçmişine ve gündemdeki önemli konulara dair hemen her türlü belgeyi burada bulmanız, adı geçen isimlere dair bilgileri edinmeniz mümkün. Son eklenen belgelere dair birkaç örnek vermek gerekirse:AB Kıbrıs Tüzüğü, Lozan Antlaşması: İnönü'nün TBMM Konuşması, KKTC Cumhurbaşkanı Denktaş'ın TBMM konuşması, TBMM Kıbrıs Deklarasyonu, Farklı Dil ve Lehçelerde Yayın Yönetmeliği.

Çalıntı laptoplara sınır (ya da biri bizi gözetliyor)

mentat

ÇALINTI ve kayıt dışı cep telefonlarını kullanıma kapatarak, hırsızlıkların önüne geçen hükümet, şimdi de son dönemde yaygınlaşan dizüstü bilgisayar (laptop) çalınmasına karşı yeni bir uygulamayı devreye sokmaya hazırlanıyor. Cep telefonlarını denetime alan yasanın mimarı olan AKP Milletvekili Seyfi Terzibaşıoğlu'nun hazırladığı yasa tasarısında çalıntı ve kayıt dışı dizüstü bilgisayarlar kara listeye alınacak, MAC numarasından takip edilecek ve internet kullanımına kapatılacak. İnternet servisi sağlayan firmalar, yeni yasa ile bunları takiple yükümlendirilecek. Haberin devamı hurriyet.com.tr'de.

Yorum: Haberi okur okumaz tüylerim diken diken oldu. 1984'e dönüyoruz yavaş yavaş..

Bana Homer'ın resmini yapabilir misin Abidin? CSS ile

sundance

Browserların Web standartlarına uyup uymadığını kontrol eden Acid testi oldukça meşhur. Birçok browserın bu testlerden geçememiş olması da ilginç bir detay.

Bu testin geliştirilmesi de oldukça sıkıntı yaratmış. Fakat bazı arkadaşlar, bir seviye daha ileri taşıyarak, CSS'ler ile Homer Simpson resmi yapmışlar. CSS'e nasıl takla attırılır görmek istiyorsanız animasyona bir göz atın.

Telekom Grevi Başladı!

parsifal

Türk Telekom'da grev bu sabah başladı.

Clixpy ile kullanıcıların neler yaptığını gerçekten görün

wizzyfx

Geçtiğimiz hafta yayına giren Clixpy ile, web sayfanıza küçük bir javascript kodu ekleyerek kullanıcıların sitenizdeki tüm hareketlerini kayıt altına alabilirsiniz.