Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Sezer siyaset meydanlık ünlü Rtük yasasını iade etti

sidar

TC Cumhurbaşkanı Sezer, siyaset meydanlarında Ovakışla köylüleri ile tartışılan Türk İnternet'inin (!) önüne set koyacak ünlü Trük (Rtük/türk/tükr) yasasını iade etti. Yorum yapmadan iade gerekçesini yazıyorum:
"İletişim teknolojisinde bir devrim niteliğindeki internet yayıncılığının en baskın yönü, düşünceyi açıklama ve yayma özgürlüğünün, özgün kanaat oluşumunun günümüzdeki en etkin kullanım alanı olmasıdır.

İnternet ortamındaki yayıncılıkta, hukukun üstün kılınması, kişilik haklarının korunması ve bunun yanında da yayın yoluyla düşünce ve ifade özgürlüğü gibi duyarlı alanların dengelenmesi sorunu ortaya çıkmaktadır. Bu sorunlar ancak, ifade özgürlüğü esas alınarak ve yayınlar üzerindeki denetim yargıya bırakılarak sağlanabilir.

İnternet yayıncılığına ilişkin ilkelerin ve öteki düzenlemelerin özel bir yasa ile yapılması en doğru yol olacaktır. Bu yola gidilmeyerek, yayınların düzenlenmesinin tümüyle kamu otoritelerinin takdirine bırakılması ve Basın Yasası'na bağlı kalınması internet yayıncılığının özelliği ile bağdaşmamaktadır. "

Cahilliğin Böylesi: MySQL Tescilli Microsoft Ürünüdür Diyen Hosting Firması!

redogre

Bu haber Hafif.org dan alıntıdır aman gözden kaçmasın diye buraya yazmak istedim.

Hürriyet'e haber olmuş arkadaşlar ama sayfalarında MySQL Microsoft ürünüdür diyecek kadar cahiller: "Gri Hosting database olarak ASP ve PHP'yi sorunsuz destekleyen, Microsoft Corporation Tescilli Markası MySQL database ile MSSQL teknolojisini kullanmaktadır."

Internet'in sahipleri

auselen

Başlık sansasyonel fakat "Asia Green IT System Bilgisayar San. ve Tic. Ltd. Sti." da kim?

http://www.iana.org/domains/root/db adresine denk gelince merak ettim, biraz sed ile güreşip aşağıdaki listeyi oluşturdum.

$ curl -s http://www.iana.org/domains/root/db | xmllint --html --xpath "//table/tbody/tr/td[1]/span/a|//table/tbody/tr/td[2]|//table/tbody/tr/td[3]" - 2>/dev/null...

Hukuk ve Kantarın Topuzu

sefalet

Son günlerde gelişen olaylar çerçevesinde kamuoyunda çocuk istismarına yönelik suçlara karşı bir duyarlılık ve eyleme geçme isteği artmıştır. Fakat konu genelağ ve onun kullanımı olunca yerel hukuk yeterli olamamakta ve uygulamada sorunlar yaşanmaktadır. Yeni T.C. Kanunu ile "Bilişim Suçları" (bilişim alanındaki suçlar demek daha doğru görünüyor) bir tanım içine sokulmaya çalışıldı. Bu sayede, ülkeler bazında, en sert tedbirlerin alındığı ceza ve usül kanunlarına sahip olduk. Öyle ki, aşıldığı zannedilen "fişleme", "takip", "gözetleme" gibi pek çok bakımdan eleştirilecek uygulamalar geri gelmiş görünüyor.Özellikle çocuk istismarı ile mücadele etmek gayreti ile bilinçli ve bilinçsiz ve en önemlisi kamuoyunun görüşüne sunulmadan çeşitli uygulamalara geçilip, kanun maddeleri hayata geçirilmiştir.

İnternet Yasakları ve İnternete Yaklaşımlar

anonim

Internet Yasakları hala çok güncel. 7 Haziran 2009 Pazar günü Istanbul Barosu'nda konu ile ilgili bir konferans düzenleniyor.

Konferans:
İnternet Yasakları ve İnternete Yaklaşımlar
- Dünyayı saran ağ, dikenli tel olmasın! -

Yer: İstanbul Barosu, Orhan Apaydın Konferans Salonu(kroki)
Tarih: 7 Haziran 2009 Pazar Saat: 11.00-17.00