Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

memecodes: başımıza memeor yağacak

FZ

Jan Philipp Lenssen, bir yerde programcı olarak çalışıyor, minik bir google blog’u tutuyor, google API’sini kullanarak kendi über arama motorunu yazıyor, sosyal deneyler yapıyor, oyunlar programlıyor, elinden çizim yapmak bile geliyor.

Şimdilerde şöyle kerata bir deneye girişmiş: rastgele kelimelerden oluşan beşbin kadar doküman üretmiş, ve bunları görülebilir yerlere linklemiş. Dolayısıyla bu dokümanlar google ve diğer arama motorları tarafından keşfedilmişler.

Şimdi içinde bu kelimelerin geçtiği bir arama yapıldığında ve aramayı yapan kişi linke tıkladığında sayfamız doğum yapıyor. Yani aranan kelimeleri de içeren yeni bir versiyonunu üretiyor. Bu yeni sayfa da linkleniyor ve dolayısıyla keşfediliyor. Bunlar olurken üzerine tıklanmamış sayfalardan biri de ölüveriyor. Jan Philipp, bir kaç yıl sonra bu sayfalarda bir takım metinlerin oluşma ihtimalini yüksek buluyor.

Haberin detayları ve devamı burada.

Cisco’dan Web’i genişleten yazılım

pulsar

Cisco, internete daha fazla cihazın bağlanmasını sağlayan yeni IP standardını destekleyen yazılımı ay sonunda çıkarıyor.
Dünyanın en büyük ağ ekipmanı sağlayıcısı Cisco Systems, Internet Protocol version 6 (IPv6) kullanan router ve sunucular için geliştirdiği yeni yazılımları mayıs sonunda çıkaracağını duyurdu.

Hukuk ve Kantarın Topuzu

sefalet

Son günlerde gelişen olaylar çerçevesinde kamuoyunda çocuk istismarına yönelik suçlara karşı bir duyarlılık ve eyleme geçme isteği artmıştır. Fakat konu genelağ ve onun kullanımı olunca yerel hukuk yeterli olamamakta ve uygulamada sorunlar yaşanmaktadır. Yeni T.C. Kanunu ile "Bilişim Suçları" (bilişim alanındaki suçlar demek daha doğru görünüyor) bir tanım içine sokulmaya çalışıldı. Bu sayede, ülkeler bazında, en sert tedbirlerin alındığı ceza ve usül kanunlarına sahip olduk. Öyle ki, aşıldığı zannedilen "fişleme", "takip", "gözetleme" gibi pek çok bakımdan eleştirilecek uygulamalar geri gelmiş görünüyor.Özellikle çocuk istismarı ile mücadele etmek gayreti ile bilinçli ve bilinçsiz ve en önemlisi kamuoyunun görüşüne sunulmadan çeşitli uygulamalara geçilip, kanun maddeleri hayata geçirilmiştir.

Açık Ağlar, Kapalı Rejimler

murat09

E - postanızı açtığınızda, haftanın her günü, size birşeyler satmaya çalışan onlarca mesaj buluyorsunuz. Genellikle bu bir ürün oluyor, fakat bazen internet üzerinde ürünler yerine fikirler de sahibini arıyor. Ekranınızda savaş karşıtı bir söylem, yeni hayat tarzı dersleri veren bir gurudan rahatlatıcı sözler, ya da açık açık siyasi propoganda görebiliyorsunuz.

Ripe 52 Toplantısı İstanbul'da

sundance

Internet politikaları konusunda belki de en önemli organizasyonlardan biri olan RIPE'ın bir sonraki toplantısı 24-28 Nisan tarihleri arasında İstanbul'da yer alacak.

Toplantılara $400 avroluk tüm etkinlik ya da 125 avroluk günlük katılım ücretleri ödeyerek isteyen herkes katılabiliyor, öğrenciler için de %50 indirim sözkonusu. Türk Telekom'un ev sahipliğinde yapılan toplantılar, daha sonra "şerrefsizim benim aklıma gelmişti" dememek isteyenler için iyi bir fırsat olabilir ;)