Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Web 2.0 Tasarım Eğitim Dökümanları

DemensMagnet

Web 3.0 konseptleri tartışılmaya başlayadursun tüm internet halen Web 2.0'a ayak uydurabilmiş değil. Özellikle de ülkemiz. Halen Web 2.0 nedir? diye soran arkadaşlarımız buradaki makaleyi inceleyebilirler.

AramaMA Motoru

parsifal

Fransa'da arama motorları paralı oluyormuş!!!

Merak ettiğim neye göre para alacaklar?
Aranan harf başına mı?
Bulunan sonuçlara göre mi?
Aylık abonelik mi?
Ya bunlar internetin yaygınlaşmasını istemiyorlar, ya da arama motorları kullanıcıları kek sanıyor...

E-gineer :: Web Mühendislerinin Sitesi

SHiBuMi

Esasında e-gineer.com uzunca bir süredir yayında olan bir site. İçeriği genel olarak Web geliştiricilerini, özel olarak da PHP geliştiricilerini kapsıyor. Özellikle "PHP Hacker's Paradise" başlıklı yazı, bütün programcılar tarafından okunması faydalı bir "yol gösterici". En çok sevdiğim sözlerden birisi de bu siteye ait: "Web gurus know that speed of coding is much more important than speed of code"...

Küçük Dünya Projesi

FZ

Bir insanın dünyadaki herhangi bir başka insanla iletişim kurması için kaç insanla temas etmesi gerekir? 100? 200? 6? Vakti zamanında sosyolog Milgram'ın mektup ile gerçekleştirdiği deneyden sonra bu konu ile ilgili empirik bir çalışma yapılmamıştı. Ta ki Small World Project isimli deneye kadar.

İsterseniz siz de bu deneye kolayca katılabilirsiniz. Tek yapmanız gereken Columbia Üniversitesinin Sosyoloji Bölümündeki ilgili siteye gidip kaydolmak. Hemen ardından adamlar size bir kişi ile ilgili bilgileri gönderiyorlar (mesela bana Norveç'li bir veteriner çıktı :) ve o kişiye ulaşmak için size yardımcı olacak bir arkadaşınıza bir e-mail göndermenizi istiyorlar sitenin ilgili web formu üzerinden (mesela Norveç'te bir tanıdığınız, ya da Norveç'te bir arkadaşı olan bir tanıdığınız olabilir).

Türk usulü CAPTCHA!!!

sundance

Web sitelerine bilgisayar marifetiyle otomatik giriş yapılmasını engellemek amacıyla geliştirilmiş (insan olduğunuzu ispat için, ekranda gösterilen deforme edilmiş harf ve sayıları tanımlayıp tanımlayamadığınızı test eden) CAPTCHA teknolojisini biliyorsunuz.

Başka bir konuyla ilgili dolaşırken rastladığım, Serkan Feyvi'nin blogunda, tesadüfi olarak o anda üretilen imajlara dayalı teknolojinin, Türk usulü uygulamasının haberini Bu nasıl CAPTCHA? başlığı ile okuduğumda gülmekten sandalyemden yuvarlanıyordum...