Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Radikal Internet Sitesine Ne Oldu?

FZ

Radikal'in web sitesinde önceki gün bazı sorunlar yaşandı. Gün boyunca haberlere ulaşmak isteyenler dakikalarca beklemek zorunda kaldı. Öğleden sonra ise özellikle MGK Genel Sekreterliği'nin yetkilerini konu eden 'İşte en gizli yönetmelik' başlıklı manşet haber ve İsmet Berkan'ın ilgili yazısı görüntülenemedi. Olayın teknik açıklaması şöyle:

Slashdot CSS Tasarım Yarışması Sonuçlandı

bio

Geçen ay duyurulan Slashdot CSS tasarım yarışması sonuçlandı. Kazanan tasarım yine koyu yeşil tonlarda, eski tasarımı aratmayacak betlikte. Tasarımcı Alex Bendiken ödül olarak bir laptop, ikinci gelen tasarımın sahibi Peter Lada da ThinkGeek'ten 250$'lık hediye çeki kazandı.

www.2ka.org

lazarus

Zamanında hepimizin kurcaladığı Exploit Generator'un yaratıcısı Korhan Kaya çalışmalarını www.2ka.org altında beğenimize sunmuş.

Hollywood - Bittorrent el ele!

larweda

Sürekli tüm P2P kullanıcılarını korsan olarak etiketleyen ve internet paylaşımına savaş açan hollywood, Warner Bros ile bittorrent dünyası ile barış yapmaya hazırlanıyor.
Önümüzdeki yaz sunulacak yeni servisi ile Warner Home Video, DVD olarak piyasaya sürdüğü filmleri aynı zamanda da bittorrent üzerinden yaklaşık olarak DVD fiyatına satışa sunacağı duyuruldu.
Büyük medya devleri fikrini değiştirip akıntıya karşı yüzmekten vazgeçiyor olabilirler mi? Kaynaklar: Forbes news.com news.com slyck.com techdirt

Onbeş satırda P2P uygulaması

sundance

Ed Felten, p2p'nin önüne geçilmesinin ne kadar zor olduğunu anlatmak için Python ile 15 (yazı ile onbeş) satırlık bir p2p uygulaması yazmış.

(Perl okunaklı değil, Python okunaklı diyenler özellikle okusun sınavda soracağız ne anladıklarını ;)

Yaratıcı beyinlerden yaratıcı çözümler.
İlgilenenler için 5K Javascript ile Wolfenstein ya da yine 5K'da Pron Sitesi