Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Web Standartları ve Tarayıcılar

yuxel

Acid2 : tarayıcıların web standartlarına uyumunu test etmek için Web Standartları Projesi tarafından desteklenen küçük bir test sayfası.
Test tarayıcıların, HTML4, CSS1, PNG ve pek kullanılmayan Data URL desteğini deniyor .

WriteBoard: Ortaklaşa Belge Üretimi

sefalet

Web tabanlı araçlar yaygınlaşıyor ve aralarında ilginç olanları da yok değil. Writeboard onlardan biri.Arkadaşları "Basecamp" yönetim aracı geliştirmek gibi faliyetlerinden tanıyor olabilirsiniz.

Bu web tabanlı aracın özellikle FM'nin gönüllü bilgi paylaşımcılarının, birlik beraberlik sevdalılarının hatta çeviri bağımlılığı olanların çok işine yarayacağını düşündüm.Kısaca anlatmak gerekirse, web üstünde yazı yazmanızı sağlıyor.Bu yazıyı birden fazla kişi aynı anda veya farklı zamanlarda yazabiliyor.Yapılan değişiklikler RSS ya da e-posta yoluyla öğrenilebiliyor.Uygulama yüzde yüz bedelsiz. (Bizim bakanın adsl tarifesinde belirttiği yüzde yüz indirim gibi değildir, uyarılır)

Daha fazla bilgi ve diğer araçları görmek için:

http://www.37signals.com/

Frontbase, denenmesi gereken bir database server

anonim

Danimarkalı bir firma tarafından bizlere sunulan Frontbase gerçekten denenmesi gereken bir database server. Development lisansı bedava olan bu database server yazılımının en pahalı lisansı $15.000 civarında, Oracle database serverla yaptığınız hereşeyi bu yazılımla da yapabiliyorsunuz adresi ise http://www.frontbase.com

Türk Telekom´dan ISS´lerin kamuoyu yaratma çabalarına cevap

sidar

Türk Telekom, fazlamesai'de de henüz çıkan portal yasaklama ve icq forward haberinde de konu olan ISS'lerin kamuoyu yaratma çabalarına bir cevap yazmış. Yorumsuz olarak sunuyoruz.

url: http://www.telekom.gov.tr/DUYURU/duyuru.htm

.tr Paylaşılamıyor

mrtksn

15 yıldır ODTÜ'den dağıtılan .tr uzantılı alan adlarının tescil hakkını Telekomünikasyon Kurumu devralmak istiyormuş.

Gerekçe olarak ise internet servis sağlayıcılarıyla ilgili yetkilendirmeler, denetlemeler ve numara tahsisiyle ilgili işlemlerin Kurum tarafından yapıldığını, internet alan adları konusunun da kıt kaynaklardan bir tanesi olduğunu, dolayısıyla bu konudaki yetkilendirmenin Telekomünikasyon Kurumu tarafından yapılması gerektiği gösterilmiş. Ancak asıl mesele 1 milyon doları geçen yıllık kar gibi görünüyor.

Haberin tamamını buradan okuyabilirsiniz.