Irchiver - Araştırma Amaçlı Bilgi Toplayıcı

0
bahadirkandemir
irc.freenode.net'te #fazlamesai'de sohbet ederken, network admini lilo tarafından gönderilen bir global mesaj dikkatimi çekti.

Helsinki Bilgi Teknolojileri Enstitüsü'nde Kompleks Sistem Hesaplamaları Grubu'ndan bir araştırmacı, Ville H. Tuulos, Freenode networkünü bir araştırma için kullanmak istediğini belirtmiş. İlgilenenlerin #searchengine kanalına gelmeleri istendi. Kanala girenlerin sayısı çok fazlaydı, girişler yavaşladığında proje yöneticisi Ville H. Tuulos sunuma başladı...
Google benzeri, IRC için bir arama motoru hayal edin. Google benzeri bir yaklaşımın problemi, web üzerindeki link bilgisine ağırca bağlı olması (PageRank). Ve tabii ki bu sorun IRC'de yok. Bundan başka, IRC webe göre çok daha dinamiktir, tartışma konuları her zaman değişir, vs. Böylece, kelime aramaları yeterli olmaz.

Yaptığımız şey şu, elimizde doğal dildeki konuları yakalayan çeşitli istatistiksel modeller var. Bu konularla ilgiliyseniz, MPCA ve ICA kelimeleri size birşeyler anlatmalıdır. Her istatistiksel çalışmalarda olduğu gibi, büyük miktarda veriye ihtiyaç duyar, ve biz *gerçekten* büyük miktardan bahsediyoruz, 100MB gibi değil.

Şu anda başlangıç için 1.5 terabyte'lık bir disk alanına sahip bir SAN sistemi sipariş ettik. İşte miktar bu kadar. Küçük bir etki alanındaki yapay verilerle çalışamayız. Gerçek yaşam verileriyle çalışmak zorundayız, ve bu yeterli veriye ulaşmamızın tek yolu.

İkinci konu ise, tahmin ettiğiniz gibi, modellerimiz değersiz bilgilerle başarısızlığa uğrayabilir. Birçok network ve kanaldaki tartışmalar gürültüden ibarettir. Freenode bu yönde mükemmel. Yeterli insan var ve tartışmalar gürültü değil.

Şöyle bir sisteme sahip olmak istiyoruz:
a) Bir sorgu yazacaksınız, örneğin linux ile ilgili bir soru ve sistem bu tür tartışmanın nerede yapıldığını söyleyecek.
b) Sistem tartışmaların gerçek zamanlı evrimini gösterecek
c) Birden fazla networkte çalışırken, konuların dünyanın her tarafına nasıl yayıldığını göreceksiniz.
d) İddia ediyorum, bu tartışmaları arttıracak: kişilere göre konuları göreceksiniz. Mesela bir kimsenin uzmanlık alanları nedir, vs.

Eminim olayı anladınız ve gerisini hayal edersiniz.

Yaptığımız herşey açık kaynaklı olacak. GPL'li olacak.


Sunum sonrası lilo soruları sormaya başladı:

lilo: Tüm kanallar loglanacak mı?
tuulos: Burada böyle bir sisteme sahip olmak isteyip istemeyeceğimiz size kalmış. Ama kısa cevap: hayır. Tabii ki her zaman gizlilik hakkınızı koruyabileceksiniz. Bir kamu hizmetinden bahsediyoruz, casusluk aracından değil.
lilo: Kanallar sisteme dahil olup ayrılabilecek mi?
tuulos: Sistem her zaman gizliliğe saygılı olmalı.
lilo: Teknik olarak kullanıcıların sistemden ayrılması uygun mu? Bu veri toplamada sorun yaratmaz mı?
tuulos: Evet, tabii ki. IRC trafiğini düşünün. grep -v tuulos diyebilirsiniz.
lilo: Hostlar tutulacak mı? Yoksa sadece nickler mi tutulacak?
tuulos: Bireysel olarak kullanıcılarla ilgilenmiyoruz. Kişisel şeyleri kayıt etmeyeceğiz, nickler dışında.
lilo: SPAM'ciler sistemi yanıltmanın bir yolunu bulabilir, bunu nasıl engelleyeceksiniz?
tuulos: Bu bir silahlanma yarışı. Sorun şu ki, sistem ne kadar büyükse kandırmak o kadar zordur. Örneğin PageRank'i yanıltmak önemsizdir.
lilo: Başından sonuna kadar sistemin üzerinde çalışacak mısınız?
tuulos: Zorundayız. Başka türlü sistemi kullanılabilir kılamayız.
lilo: Gizlilik bildirgesi olacak mı?
tuulos: Hayır, burada bunu tartışmak için bulunuyoruz (:

Ayrıntlı bilgi için http://cosco.hiit.fi/irchiver/ adresini ziyaret edebilirsiniz.

İlgili Yazılar

freehost: özgür hosting

anonim

freewifi'den sonra freehost'da devreye girdi. aynı şekilde destek bekliyor

Sınırlı Sorumlu ISP kooperatifi

sundance

LinuxJournal`ın bu makalesi, uzun süredir birçoğumuzun hayalini süsleyen bir proje :) Bilgisayar meraklılarının, sağlam bir ekonomik model üstünde biraraya gelip, teknisyenlerin kendileri olduğu bir ISP kooperatifi.

Eğer şu an `üff karışık iş, birileri bu sistemi kursa da biz de katılsak` diyorsanız, sıkın dişinizi bir iki ay daha fazlamesai`yi bekleyin, belki size bir süpriz yapabiliriz ;)

Rebol: Bambaşka bir internet dili

sundance

Yaklaşık dört yıl kadar önce Rebol.com ile ilk karşılaştığımda, İmparatorluk güçlerinden kaçan bir grup Amiga Rebel`ın bir ütopya peşinde koştuğunu düşünmüştüm.

Bu gün bir bakayım ne yapmışlar dediğimde ise REBOL`un evrimleşerek yaklaşık 20 platformda çalışan inanılmaz üst düzey bir dilden Internet Operating System diye bir konsepte geçtiğini gördüm.

Sırf konseptin kendisi okumaya değer, öte yandan Rebol`un neler yapabildiği ise tamamen bambaşka bir konu...

Türkiye Genel Bilgi Tabloları

fragile

Türkiye il -ilçe - plaka- telefon - postakodu tablolarını incelemek ve yararlanmak isteyenler için şöyle bir döküman halinde hazırladım. Dökümanın alt kısmında ise ufak bir e-devlet eleştirisi var.

Umarım beğenirsiniz.

USB ADSL Modemler ve GNU/Linux Ayarları

FZ

Debian GNU/Linux, Türkçeleştirme ve Modem konularından sorumlu Internet bakanımız, değerli FM üyesi roktas bu sefer leziz bir ADSL ve Linux yazısı hazırlayıp sıcak sıcak bize sunmuş. Afiyet olsun.

Karadenizin güzide bir şehrinde sıradan bir Cuma gününün sıradan bir öğle sonrasında çalan bir telefonla başladı hikaye. Türk Telekom'dan arıyorlardı. Telefondaki sesi birilerine benzeterek gaf yaptım önce. Öyle ya Türk Telekom beni niye arasın? Ve üstelik içinde ADSL geçen cümleleri niçin kursun? Mevzu yaklaşık 3-5 ay önce hiçbir şekilde ciddiyet belirtisi göstermeyen bir aleladelikle yaptığım ADSL önbaşvurusuyla alakalı idi. "İlimizde ADSL hizmetine geçiş çalışmaları başladı. Ön başvuruda bulunanlara öncelik veriyoruz, merkez müdürlüğe gelmeniz halinde ADSL sözleşmesi yapabilirsiniz?" Hoppala, ağlasak mı gülsek mi? "Emriniz olur, hemen geliyorum" dediğimde saate bakmayı unutmuştum ve saat 16.30 sularıydı. "Acele etmenize gerek yok, Pazartesi günü de olabilir" cevabını fevkalade şüpheli bir tonla kabul ettim. Ya hafta sonu kararlarından cayarlarsa, ya Pazar günü şehrin bütün eşrafı ayaklanarak Ankara destekli bir müdahaleyle bütün o "/alelade/" ön başvuruların önüne geçerse ya kıymetlimisi elimisden alırlarsa, vesaire vesaire...