Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Tüm kablosuzlar birleşin!

sefalet

Illinoi Üniversitesinden asistan profesör Haiyun Luo ve mezun öğrencisi Nathanael Thompson, komşu kablosuz genel ağ kullanıcılarının ağa erişim verimlerini arttıran bir sistem geliştirdi.Sistemin ismi PERM (Practical End-host collaborative Residential Multihoming).Sistem basit olarak, komşu kablosuz genel ağların bant genişliklerini paylaşmalarını sağlıyor.Sistem bir kullanıcının kullanılmayan bant genişliğini diğer kullanıcının kullanmasını sağlıyor böylece bireysel olarak genel ağa erişim imkanı her kullanıcıda artıyor.

Ergonomik bilgisayar kullanım kılavuzu

sundance

Eve gitsem de bilgisayarla uğraşam diyenlerin acaba ne kadarı saatlerce bilgisayar kullanmanın ergonomik olarak yaratabileceği sorunlardan haberdar. Kaçımız Bilgi'de sunum yaparken Stallman'ın taktığı bilekliğin Carpal Tunnel Sendromu ile ilgili olduğunu ve bunun kalıcı zararlara yol açabildiğini biliyor?

Bu konuda birçok soruya cevap veren, çok güzel bir döküman HP'nin sitesinde yer almakta. Türkçe si de bulunan bu 58 sayfalık dökümanı, bilgisayar başında günde dört saatten fazla zaman geçiren herkese öneriyorum.

YouTube'e Sansür!

tongucyumruk

InternetHaber adlı haber sitesinde yayınlanan bir haberin ardından harekete geçen İstanbul Cumhuriyet Başsavcılığı haberde belirtilen videoyu inceleyerek İstanbul Nöbetçi Sulh Ceza Mahkemesi'ne başvurarak YouTube'e erişimin kapatılmasını istedi. Durumu değerlendiren mahkeme siteye erişimi yasakladı.

İstanbul Şehir Rehberi

okanbatur

İBB, İstanbul Şehir Rehberi sitesini kullanarak, web tarayıcınız ile sokakları ve caddeleri Google Maps'deki gibi goruntuleyip gezebilirsiniz. Arama yapabilirsiniz.

OECD Internet kullanım istatistikleri

sundance

OECD ülkeleri arasında altı ayda bir yapılan istatistiklere göre, Aralık 2006 itibariyle Türkiye, geniş bant kullanımında Meksika'nın hemen önünde yeralmış.(30/31)

Türkiye'nin hemen önünde ise Yunanistan bulunmakta. DSL/Kablo ve Fiber bağlantılarının gözönüne alındığı Bu istatistiklerde önemli bazı veriler var.