Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

AramaMA Motoru

parsifal

Fransa'da arama motorları paralı oluyormuş!!!

Merak ettiğim neye göre para alacaklar?
Aranan harf başına mı?
Bulunan sonuçlara göre mi?
Aylık abonelik mi?
Ya bunlar internetin yaygınlaşmasını istemiyorlar, ya da arama motorları kullanıcıları kek sanıyor...

ICANN `.biz’ ve `.info’yu onayladı

pulsar

İnternetle ilgili genel politikaların belirlerlenmesinden sorumlu olan ICANN, yedi yeni alan adı ekinden ‘.biz’ ve ‘.info’yu onayladı. Yeni ekleri kullanan alan adlarını bu yazdan itibaren görebileceğiz.
İnternetin hızla büyümesiyle birlikte özellikle ‘.com’lu alan adları yetersiz kalmaya başlamıştı. Geçen sene alan adı kayıtçılarından yeni alan adı tekliflerini kabul etmeye başlayan ICANN, kasım ayında yedi yeni ek belirlemişti.

Internet, Dil, Sosyoloji

FZ

İnsan dilleri sürekli bir değişim içinde, binlerce yıllık süreçlerde bu mavi gezegende pek çok doğal dil ortaya çıktı, bir kısmı öldü, bir kısmı Baskça, Arnavutça gibi Avrupa'nın göbeğinde izole şekilde varlığını sürdürdü, bir kısmı da zenginleşerek ve diğer dillerle alışveriş halinde günümüze dek geldi.

Sanırım sıra Internet'in doğal dilleri etkilemesine geldi. Etik tartışmaların ötesinde ele alınması gereken, analiz gerektiren bir olgu yavaş yavaş kendini belli etmeye başlıyor.

Bilişim Sohbetleri

butch

itconversations.com BT dünyasından önemli isimlerin, önemli konuşmalarının gerek ses kayıtlarına gerek metinlerine ulaşabileceğiniz bir site.

Lawrence Lessig, Free Culture, Bölüm 1 ile başlayalım mı arşivi oluşturmaya?

GMAIL: pop3 desteği ekledi

mos

1000 mb 'lık e-posta kotası sunmasıyla dikkatleri henüz beta aşamasındayken bile üzerine çekmeyi başaran GMAIL , şimdi de pop3 ve otomatik posta yönlendirme desteği sağlıyor.