Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Opera Artık Tamamen Bedelsiz ve Reklamsız

wizzyfx

Opera internet tarayıcısının bedelsiz olarak dağıtımına başlandı.

$1.99'a kadar domain isimleri ama haber bu değil :)

sundance

Godaddy.com bir başka ürünle birlikte alındığı takdirde domain isimlerini $1.99'a kadar düşürmekte.

Fakat asıl haber bunun reklamını Super Bowl'da yapmak için tekrar tekrar başvurup sansür komitesi tarafından reddedilmelerinde. Reddedilen 14 reklamın bir kısmı daha çekilmeden, konsept aşamasında reddedilerek bambaşka bir rekora da imza atmış.. Saldırgan reklamcılık diye buna diyorlar herhalde.

Telefon ve Adsl tarifelerine indirim

anonim

Türk Telekom Genel Müdürü Paul Doany ses iletimine gelecek indirimin Pazartesi günü onaylanarak uygulamaya gireceğini, Adsl ile ilgili indirimin ise yakın zamanda açıklanacağını söylemiş.
Kaynak: Ntvmsnbc

Bilişim Sohbetleri

butch

itconversations.com BT dünyasından önemli isimlerin, önemli konuşmalarının gerek ses kayıtlarına gerek metinlerine ulaşabileceğiniz bir site.

Lawrence Lessig, Free Culture, Bölüm 1 ile başlayalım mı arşivi oluşturmaya?

RÜTÜK unveils the Domin@tion v.1.0

Evil_Empire

Hiç RÜTÜK yasasının arkasında bir komplo teorisi olabileceğini düşündünüz mü? Büyük medya kuruluşlarının hükümetler üzerinde ne gibi yaptırımlar uygulayabileceğini tahmin edebiliriz. BÜYÜKLER, bulundukları yere, büyük yatırımlar yaparak ulaşmışlardır. Genelde bu büyük yatırımları yaparken, uzun vadeli krediler, hükümette söz hakkı, kamu gücü vb. çıkarlarını gözetmişlerdir.

Hükümetler, reklamların ürünüyse ve reklamı medya yaparsa. Halk medyanın tek bir haberiyle gaza gelip, tek haberiyle sakinleşebiliyorsa. Medya kartelinin, alternatif ortamlara bakışı ne kadar ılımlı olabilir? RÜTÜK tüm medyadan sorumlu, sorumsuz değil midir? Meclistekilerin hepsinin bir gazeteci dostu olduğunu varsayarsak, RÜTÜK üzerinde medyanın gücünü tahmin edebilir miyiz?

Ne dersiniz BÜYÜK balık her zaman küçüğünü yutar mı?

Not:yukarıdakı yazının gerçekle ilgisi yoktur ve kişi ya da kuruluş isimleri uydurmadır(!)