Semantik Web, Doğal Dil İşleme, Veri Madenciliği ve Web 3.0: Calais Web Servisi

0
FZ
Herhangi bir metni (haber, makale, blog girdisi, proje planı) kendisine yollayabileceğiniz bir web servisi olsa. Bu servis yolladığınız metni inceleyip size RDF biçiminde semantik metadata bilgisi geri yollasa. Siz de bu bilgi ile mesela herhangi bir yazıya otomatik olarak 'etiket' (tag) öneren bir Wordpress plug-in'i yazsanız. Nasıl olurdu acaba?
OpenCalais işte tam da yukarıdaki senaryonun kritik bileşenini oluşturan bir web servisi. Standart protokoller aracılığı ile Calais web servisine yolladığınız metin verisi oradaki sunucularda çalışan doğal dil işleme, veri madenciliği ve makina öğrenme algoritmaları ile işleniyor ve size metinde geçen varlıklar (kişiler, mekanlar, ürünler, vs.), gerçekler (Bay X falanca ZYK şirketi İÇİN çalışıyor) ve olaylar (Bayan Z filanca KZN şirketinin YÖNETİCİSİ olarak ATANDI) gibi verileri kolayca işleyebileceğiniz XML tabanlı RDF formatında döndürüyor.

Makul bir yol haritası sunan Reuters şirketi, geliştirdiği bu servisi kullanacak uygulamalar için de 5000$'lık ödüller koymuş durumda (mesela Wordpress blog yazılımına böyle bir semantik özellik kazandırmak için).

Editörün Notu: Tabii ki söz konusu sistem Türkçe için çalışmıyor ve kısa sürede Türkçe için böyle bir web servisin sağlıklı ve bedelsiz ya da çok düşük bedelli şekilde devreye girmesini de Türkçe yazılım ekosisteminden beklemiyoruz.

Görüşler

0
towsonu2003
bu biraz alakasiz ama... bi linux distrosu vardi, live cd, icinde neredeyse butun semantic dil inceleme programlarini barindiriyordu. distrowatch.com'da aradim ama bulamadim, ismini de hatirlamiyorum... aranizda hatirlayan var mi? tesekkurler simdiden.
0
FZ
Morphix NLP'yi kast ediyorsunuz sanırım? (İngilizce çevirisi de burada. Slashdot'taki tartışması da burada. FM tartışması ise burada.)
0
towsonu2003
harika, cok tesekkurler
Görüş belirtmek için giriş yapın...

İlgili Yazılar

RÜTÜK unveils the Domin@tion v.1.0

Evil_Empire

Hiç RÜTÜK yasasının arkasında bir komplo teorisi olabileceğini düşündünüz mü? Büyük medya kuruluşlarının hükümetler üzerinde ne gibi yaptırımlar uygulayabileceğini tahmin edebiliriz. BÜYÜKLER, bulundukları yere, büyük yatırımlar yaparak ulaşmışlardır. Genelde bu büyük yatırımları yaparken, uzun vadeli krediler, hükümette söz hakkı, kamu gücü vb. çıkarlarını gözetmişlerdir.

Hükümetler, reklamların ürünüyse ve reklamı medya yaparsa. Halk medyanın tek bir haberiyle gaza gelip, tek haberiyle sakinleşebiliyorsa. Medya kartelinin, alternatif ortamlara bakışı ne kadar ılımlı olabilir? RÜTÜK tüm medyadan sorumlu, sorumsuz değil midir? Meclistekilerin hepsinin bir gazeteci dostu olduğunu varsayarsak, RÜTÜK üzerinde medyanın gücünü tahmin edebilir miyiz?

Ne dersiniz BÜYÜK balık her zaman küçüğünü yutar mı?

Not:yukarıdakı yazının gerçekle ilgisi yoktur ve kişi ya da kuruluş isimleri uydurmadır(!)

Kredi Kartı Dünyasına hoşgeldiniz!

conan

Kredi kartlarıyla nispeten yeni tanışan ülkemizin, beraberinde getirdiği sorunları da bir kaç yıl içerisinde yaşaması kaçınılmazdı. Hele ki "Türk pratik zekası"nın en çok bulunduğu mekanda yani Türkiye'de yaşıyorsanız bu gibi sorunlarla karşılaşmanız gayet de mümkün. Hele ki bankalar hiç bir sorumluluk kabul etmezken ve de ne yazık ki yargı sistemimiz ağır işlerken bu konuda hakkınızı aramak kanımca hiç bir şekilde mümkün değil. Gelin size kredi kartı hırsızlığının Internet yönünden bahsedeyim azıcık.

PayPal gelmiş niye söylemiyorsunuz?

huseyin

Bu haber teknolojiye uzak gözükse de aslında onunla çok içiçe. Yurt dışında yeni çıkan elektronik cihazlara, bilgisayarlara eBay'den imrenerek bakardım.

Nasıl ödeyeceksin? Satan kişi kredi kartı kabul etmiyor. Tek yol PayPal ama o da Türkiye'yi desteklemiyor. Hüzünle kapatıyorsunuz siteyi. Amerikaya giden birisini bul, derdini anlat ki gelirken sana getirsin

Google´da Nasıl Tepeye Oturursunuz

FZ

Efsanevi arama sitesi Google bilindiği üzere PageRank(tm) diye bir teknoloji kullanıyor ve "A sayfası B sayfasına linkli ise A, B'ye oy vermiştir dolayısı ile B'nin arandığında tepede çıkma şansı artmıştır" şeklinde özetlenebilecek bir mantaliteye göre işliyor. Google firması bunun "demokratik" bir mekanizma olduğunu söylüyor.

Peki ya bir site, bir sürü site oluşturup buralardan kendine link verirse ne olur? İşte bir örnek vakanın network diyagramları ile de desteklenmiş analizi bu konuda epey aydınlatıcı olabilir. Söz konusu durum, kendini üst sıralara yerleştirmeye çalışan organizasyona epey pahalı patlamış olsa gerek (onca sitenin domain isimleri için ödenen paralar falan) ancak "demokratik" olarak sunulan bir algoritmanın nasıl kötüye kullanılabileceğine (taciz etmek de diyebilirsiniz ;-) iyi bir örnek.

Türkiye'nin Yurtdışı Internet Erişimi Üzerine - 1

FZ

Kablo koptu. Yok efendim yedekli. Denizde deprem oldu. Tedbir aldık. Tüh alamadık. Yok yok hallediyoruz konuyu güvenin bize, koskoca kurumuz. A-aa gene gitti hatlar, tüh!... derken Türk Telekom'un yurtdışı Internet çıkış hizmeti arap saçına döndü dönecek. Pekiyi ama bu işin içyüzü nedir? Hong Kong'daki bilgisayarcılar evlere 100 Mbit/s Internet dağıtmak ile meşgul iken parasını tıkır tıkır ödeyen Türkiye Internet kullanıcıları nelere maruz kalmaktadır?

Serdar Güçlü'nün Türkiye'nin Yurtdışı İnternet Erişimi Üzerine - 1 başlıklı makalesi Internet yedeklemesi nedir, ne değildir, civardaki ülkeler bu tür sorunları nasıl çözüyorlar ve Türk Telekom nasıl çözemiyor gibi konulara değiniyor, teknik bir dille gayet güzel anlatıyor. Okuyalım, öğrenelim (ve sonra hesap soralım!)