Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Türkiye Genel Bilgi Tabloları

fragile

Türkiye il -ilçe - plaka- telefon - postakodu tablolarını incelemek ve yararlanmak isteyenler için şöyle bir döküman halinde hazırladım. Dökümanın alt kısmında ise ufak bir e-devlet eleştirisi var.

Umarım beğenirsiniz.

Internet mimarisinin temeli: Uçdan uca prensibi

arikan

MIT Media Lab Virüssel İletişim Grubu (Viral Communications Group)'ndan David Reed geçtiğimiz günlerde "IP3 Kamu Yararı ödülü" aldı. Reed bu odülü Internet mimarisinin temelini oluşturan dijital ağlarda "end-to-end prensibi"ni (uçdan uca prensibi) geliştirmesiyle kazandı.

VCD Track 02

FZ

İstanbul Bilgi Üniversitesi Görsel İletişim Tasarımı Bölümü öğrencilerinin geçen yıl içinde ürettikleri işlerden zengin bir seçkinin sunulacağıTrack 02 sergisi 14 Haziran - 12 Temmuz tarihleri arasında, İstabul Bilgi Üniversitesi, Taksim Hazırlık binasında izlenebilir.

\r \r Multimedya, web tasarımı gibi yeni medya ürünlerinin yanı sıra grafik tasarım ve fotoğraf gibi daha geleneksel işlerin de monitörlerde izlenebileceği sergide video çalışmalar projeksiyonla gösterilecek. Tasarımcı olsun olmasın, görsel kültüre ilgi duyan herkese açık olan bu sergi sıradışı tasarımlarla genç tasarımcıların beynini ve ruhunu kışkırtacağa benzer.

Türk Telekom Kablosuz Internet tarifelerini belirledi

talat

Türk Telekom'un 42 ilde 400 noktada sunduğu kablosuz internet erişim ücretleri belirlendi. Yarım saat kablosuz internet TTWinet hizmeti 3.11 YTL olacak.

Mashup

esrefatak

Müzik ve eğlence dünyasından ilham alan Web sektörü, baş döndürücü bir kullanıcı deneyimine hazırlanıyor: Mashup Web Applications