Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Slashdot CSS Tasarım Yarışması Sonuçlandı

bio

Geçen ay duyurulan Slashdot CSS tasarım yarışması sonuçlandı. Kazanan tasarım yine koyu yeşil tonlarda, eski tasarımı aratmayacak betlikte. Tasarımcı Alex Bendiken ödül olarak bir laptop, ikinci gelen tasarımın sahibi Peter Lada da ThinkGeek'ten 250$'lık hediye çeki kazandı.

Gerici Bankalar!

sundance

Ben bu geri kafalı, geri teknolojili ve geri zekalı (rolü yapan) bankalardan bıktım...

En son Parsifal, saygıdeğer YapıKredi Bankası Beşiktaş şubesi hesabındaki 10 milyon tl`yi Taksim şubesinden çekmek istediğinde 3,5 milyon tl masraf almakla tehdit edildi!!!

Şahsen bankaların bize uyguladığı bu faşizan `masraf` politikalardan bana gına geldi, ve aklı başında bir vatandaş olarak bu akıl dışı uygulamalar yüzünden kendimi aşağılanmış hissediyorum.

Akdeniz Havzası Fiberoptik Kablo Sistemi

yalcink01

TürkTelekom; "Akdeniz havzasında, uzantıda Avrupa ve Amerika’ya geniş kapsamlı erişim sağlanması amacıyla ülkemizde ve İtalya (Katanya)’da termine olacak bir uluslararası denizaltı fiberoptik kablo sisteminin temin ve tesisi " işi ihalesini sonuçlandırdı. 6 aylık bir süre içerisinde bitirilmesi planlanan bu projeyi 37.000.000 USD bedelle MEDITERRANEAN NAUTILUS LIMITED şirketi gerçekleştirecek. İş hem İtalya hem de Türkiye' de yürütülecek. Bu işin sonunda umarım internet yurtdışı çıkışlarında bir rahatlama meydan gelir. Uzakta, bizim olmayan bir köyde meydana gelen depremle, yıkılmayacak bir internet erişimi dileğiyle.......

NOT: henüz resmi sözleşme imzalanmadı. Ayrıca bu işin sonunda ne kadarlık bir bant genişliği elde edileceği hakkında bir bilğiye ulaşamadım. Şayet bilen varsa, bizide aydınlatırsa sevinirim.

Yeni Hesap Makinamız: Google

FZ

Google bir garipliğe, bir hoşluğa daha imza attı. Artık sitenin arama kısmına çok karmaşık hesapları girip sonuçları anında alabilirsiniz. Her türlü sabit, birim dönüşümü, doğal dildeki hesaplamaları anlama, vs.

Google'ın hesap makinasının yapabildiklerine birkaç örnek:

Bilimsel Kaynakları Taramak İçin Arama Motoru: SCIRUS

FZ

Evet, %99.999 Google kullanırız ama daha spesifik ve bilimsel bilgi içeren arama tarama gerektiğinde http://www.scirus.com adresine bakmakta fayda var. Gayet güzel bir arayüz, sade ama etkili bir işlevsellik sunuyor.

Web sitelerinde veya bilimsel dergilerde ayrı ayrı arama da yapabiliyorsunuz ayrıca arama motorunun arama daraltmak için sağ tarafta sunduğu ipuçları da gayet anlamlı.

Gittikçe çöplüğe dönen Internet ortamında kaliteli bilgiye erişmek için güzel bir araç ve katkıda bulunan bilimadamlarının da bundaki payı azımsanacak gibi değil. Taranan kaynaklar arasında MEDLINE, ScienceDirect, ArXiv.org, CogPrints, NASA, Mathematics Preprint Server ve Computer Science Preprint Server da var.