Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Google IRC !

sundance

Web sayfaları, Usenet grupları.pdf, .doc, .ppt uzantılı dosyalar, imajlar derken Google Internet´de arama yapanların vazgeçilmez aracı halini aldı.

Benzerlerinden hep bir kaç tur önde olan ve her seferinde daha önce yapılmamış bir şeylerle ortaya çıkan Google görünüşe göre bu sefer de botlarını IRC kanallarına salmış durumda!

Nasıl bir sonuç çıkar, ne olur bilmiyoruz ama, birçok kullanıcının geyik diye bakıp uzak durduğu, halbuki Open Source camiası başta olmak üzere birçok teknik konuda çok önemli bir ortam olan IRC kanalları da yakında Google´dan sorulacak gibi.

Efendim, biri Büyük Ağabey mi dedi ?

Internet Bedava (mı?)

redogre

Evet genellikle büyük gazetelerin pazar eklerine yaraşır bir başlık oldu ama yarım saat içinde uzun zamandır kullandığım iki servisin artık paralı olduğunu öğrendim.
`Para vermiyorsan buyur sürün` diyen ilk adres FilePlanet. Hani Quakeplanet adlı, güzel Quake mod ları ve haritaları indirdiğimiz Community var ya ... İşte orası dosyaları indirebilmeniz için GameSpy üyeliği istiyor. Tamam GameSpy üyeliği bedava ama işkence bununla bitmiyor. `Buyrun serverlara.` diyor ama o da ne? Tıklayınca güzelim servera `Ama siz para vermemişsiniz, aylık 10, yıllık 50 dolara bu hizmet` diyor. O zaman Public Server kullanırım diyorsanız, 300 kişi sınırlı 2 Amerika serverı, ve 50 kişi sınırlı bir Romanya serverı sizi bekliyor. Önce bir applet ile sıraya giriyorsunuz. Sakın kendi kendinize `Aman bekledim ama 50 kişi var sadece harika alırım dosyamı...` diyorsanız yanıldınız. DSL bağlantı ile 1.3 Mb ı tam 1 saatte indirebildim. Quake ile ilgili birşey istiyorsanız ya parayı bayılacaksınız ya da sürüneceksiniz....

Online Grafik Editörü

DemensMagnet

Sıkça kullandığımız yazılımların web uygulamaları geliştirilmeye devam ediliyor. Word, excel, takvim yazılımları, rss okuyucular derken grafik editörleri web'e taşınmaya başladı. Neredeyse Photoshop kadar kapsamlı geliştirilmiş cellsea Photo Editor karşınızda:
cellsea Photo Editor'ün marifetlerine de buradan ulaşabilirsiniz.

Bir kaç ilginç rakam

conan

Internet üzerine ordan burdan topladığım birkaç istatistiksel veri:

- Google'da şu an ki indexlenmiş web sayfası sayısı: 2,073,418,204
- 2000 yılında tahmin edilen Internet'teki reklam pazarı payı 5 Milyar $
- Fortune 500 listesindeki şirketlerin sadece %30'unun web sayfası var.

Internet mi, o da ne ?

sundance

Cezayir depreminde 2000'e yakın insan ölmüşken, Telekom sayesinde biz depreme Internet Depremi ismini bile koyduk :(

Geçen haftaki deprem sırasında Türkiye'nin de toplam 1Gbit'lik bağlantısının geçtiği sualtı hatları kopmuş ve KabloNet aboneleri başta olmak üzere yurt genelinde ciddi bir Internet sıkıntısı başgöstermişti.

Son alınan haberlere göre problemin giderilmesi için bir gemi yola çıkmış. Bu geminin problemi çözmesi bir miktar zaman alabilirmiş, bu sebeple en azından Yunanistan üzerinden 622Mbitlik bir hattın devreye girmesi için bir hareket başlatılmış.
Mevcut hat kullanımını buradan takip edebilirsiniz.
Not: Çöl Fırtınası harekatı sırasında Irak'ın Internet'i kesilmemişti.