Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Internet´teki Komşular - Gerçek Dünyadaki Komşular

FZ

Sitenize komşu siteleri öğrenmek istemez misiniz? Hayır hayır bilgisayar ağlarından ve ping sürelerinden bahsetmiyorum. Fiziksel olarak size yakın sitelerden bahsediyorum. Hayır, web sayfalarınızın hangi web sunucuda durduğunun bir önemi yok. Önemli olan o sayfaları hazırlayan kişi ya da kurum olarak sizin bulunduğunuz yer.

GeoURL işte tam da bu konuda bizlere yardımcı olmak için geliştirilmiş bir veritabanı. Siteyi ziyaret edip inceledikten sonra kendi sitenizi ve bulunduğunuz yeri sisteme nasıl dahil edeceğinizi buradan öğrendikten sonra kendi sitenizi bu sayfa aracılığı ile (ya da küçük bir betik ile) sisteme ekleyebiliyorsunuz.

Sistemin asıl özelliği sitenize komşu olan siteleri göstermesi. Nasıl bir şeye benzediğini merak ediyorsanız ileriseviye.org'daki alttaki GeoURL düğmesine basın ;-)

Rebol: Bambaşka bir internet dili

sundance

Yaklaşık dört yıl kadar önce Rebol.com ile ilk karşılaştığımda, İmparatorluk güçlerinden kaçan bir grup Amiga Rebel`ın bir ütopya peşinde koştuğunu düşünmüştüm.

Bu gün bir bakayım ne yapmışlar dediğimde ise REBOL`un evrimleşerek yaklaşık 20 platformda çalışan inanılmaz üst düzey bir dilden Internet Operating System diye bir konsepte geçtiğini gördüm.

Sırf konseptin kendisi okumaya değer, öte yandan Rebol`un neler yapabildiği ise tamamen bambaşka bir konu...

Internet'te bir şeyler oluyor!

sundance

ZDNet'te yeralan bu habere göre, Internet'de kaynağı çok belirlenemeyen garip bir trafik var.

Mayıs ortasından beri Internet'te dolaşan bu kaynağı belirsiz ağ aktivitesinin sebebi olarak ISS firması bir hacker programı gösterdi. Fakat diğer güvenlik firmaları bunun başka bir şeyler daha olduğundan şüpheleniyorlar.

Meydana gelen gariplikler arasında TCP/IP Windows size 55,808 byte olmasi (normali 1024 ve civarıdır) ve kaynak adresi olarak IANA tarafından rezerve edilmiş (dolayısıyla, hiçbir standart routerdan geçmemesi gereken) adresler kullanması gösteriliyor. Is there a GHOST in THE SHELL ?

fazlamesai.net'e soralım: İçerik - Her şeye rağmen mi?

anonim

Sundance'in Wikipedia ile ilgili haberde yapmış olduğu Wikipedia Şövalyeleri yorumu :) ile ilgili yorumu temel alırsak, Internet'te içeriğin (bilginin) insanlara ulaştırılırken bu içeriğin sunumu ile ilgili içeriği sunanın sorumlulukları nelerdir sizce?

Örneğin bir PHP sitesindeki Php ile Programlama felsefesi ve Planlama başlıklı yazıda olduğu gibi, imla hataları ve cümle düşüklükleriyle dolu, içeriğin sunumu ile ilgili hiçbir iyileştirme yapılmamış bir belge ilgili o sitenin yönetimi ve o içeriği hazırlayan kişinin sorumlulukları nelerdir?

AOL Bir Şeyler Yapıyor Ama ...

sundance

ICQ`u aldığından beri çok bir hareket görmediğimiz AOL, ICQ lisansını bir şekilde kullanıma açıyor. Ama tam olarak ne yapıyor, nasıl yapıyor biz anlayamadık, anlayan beri gelsin.

Lisansın içinde `10,000 kopyadan fazla dağıtılmaması, 13 yaşından küçüklere verilmemesi` gibi ibareler var
Hayra alamet mi desek, yoksa büyük ölçekte firmaların ne yaptığının farkında olmadan yaptığı bir başka gariplik mi desek bilemiyoruz...