Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Türkiye Genel Bilgi Tabloları

fragile

Türkiye il -ilçe - plaka- telefon - postakodu tablolarını incelemek ve yararlanmak isteyenler için şöyle bir döküman halinde hazırladım. Dökümanın alt kısmında ise ufak bir e-devlet eleştirisi var.

Umarım beğenirsiniz.

freehost: özgür hosting

anonim

freewifi'den sonra freehost'da devreye girdi. aynı şekilde destek bekliyor

Birisi Yüksek Hızlı Bağlantı Mı Dedi?

FZ

Bilimadamları Sunnyvale, California'dan Hollanda'daki Amsterdam'a 6.7 GB veriyi 1 dakikadan daha kısa bir sürede yollayarak yeni bir rekora imza attılar.

Stanford Doğrusal Hızlandırıcı Merkezi'ndeki bilimadamları fiberoptik bağlantı üzerinden 6.7 GB'lık veriyi 6800 mil uzağa çok kısa sürede iletmeyi başardılar. Bu çalışmanın gerçekleştirildiği merkez ABD Enerji Bakanlığı'na bağlı olarak Stanford Üniversitesi bünyesinde çalışıyor. Söz konusu verinin bir uçtan diğerine aktarılması yaklaşık 58 saniye sürdü.

Türkiye'nin Yurtdışı Internet Erişimi Üzerine - 1

FZ

Kablo koptu. Yok efendim yedekli. Denizde deprem oldu. Tedbir aldık. Tüh alamadık. Yok yok hallediyoruz konuyu güvenin bize, koskoca kurumuz. A-aa gene gitti hatlar, tüh!... derken Türk Telekom'un yurtdışı Internet çıkış hizmeti arap saçına döndü dönecek. Pekiyi ama bu işin içyüzü nedir? Hong Kong'daki bilgisayarcılar evlere 100 Mbit/s Internet dağıtmak ile meşgul iken parasını tıkır tıkır ödeyen Türkiye Internet kullanıcıları nelere maruz kalmaktadır?

Serdar Güçlü'nün Türkiye'nin Yurtdışı İnternet Erişimi Üzerine - 1 başlıklı makalesi Internet yedeklemesi nedir, ne değildir, civardaki ülkeler bu tür sorunları nasıl çözüyorlar ve Türk Telekom nasıl çözemiyor gibi konulara değiniyor, teknik bir dille gayet güzel anlatıyor. Okuyalım, öğrenelim (ve sonra hesap soralım!)

Siteleri kapatan birimin başkanını dinlemek ister misiniz?

coskung

TİB Internet Dairesi Başkanı Osman Nihat Şen, 6 Kasım akşamı Bilgi Üniversitesi Bilişim Teknolojisi Hukuku Uygulama ve Araştırma Merkezi'nin davetiyle, bir yüksek lisans dersine misafir konuşmacı olarak katılıyor. İlgili merkezin direktörü ve Bilgi Üniv. Hukuk Fakültesi Hocası Leyla Keser Berber'in duyuru metni aşağıda.