Kitap Eleştirisi: Süper Hesap Uzmanları

0
FZ
Makine öğrenmesi konusu ile ilgilendiğim için askere gitmeden önce Ian Ayres'in 'Süper Hesap Uzmanları : Sayılarla Düşünmek Neden Zeki Olmanın Yeni Bir Yoludur' kitabını okumuştum. 2008 yılının Mart ayında Türkçesi yayımlanmış kitabın makine öğrenmesi, veri madenciliği ve genel anlamda istatistiğin gücü ile ilgilenen herkesin okuması gereken türden bir kitap olduğuna inanıyorum. Yani işadamları da bilgisayar yazılımcıları da çözmeye çalıştıkları problemleri daha iyi anlamak ve daha akıllıca çözümler geliştirmek için bu kitaptan feyz alabilirler.

Her ne kadar söz konusu kitap (Freakonomics'in yazarlarıdan) Steven D. Levitt gibi yazarların övgüsüne nail olmuşsa da hem içerik hem de çeviri konusunda bazı eleştirileri hak ediyor. Kitabı okurken not ettiğim bazı noktaları aşağıda listeledim:
Süper Hesap Uzmanları - Kitaptaki 'neural network' terimi "ağ bağlantısı" olarak çevrilmiş, doğrusu 'yapay sinir ağı'dır. Korkunç bir çeviri.

- 'Reverand Thomas Bayes' olarak yazılmış! Papaz demek istiyor yani! Doğrusu 'Papaz Tohamas Bayes' yahut 'Rahip Thomas Bayes' olmalı.

- Kurbağalar içinde bulundukları su yavaş yavaş ısıtıldığı zaman bekleyip ölmezler. Yok öyle bir şey.

- 'Overfitting'e 'taşma' demek yanlış. Taşma denen şey 'overflow' sözcüğünün karşılığı olabilir belki, 'overfitting' başka bir şey. Ayrıca teknik açıklaması da daha iyi yapilabilirdi. Yani bu hem çeviri hem de özgün eser problemi. Maalesef şu anda 'overfitting'e önerebileceğim bir karşılık yok.

- Kitap sürekli 'regresyon' ile veri analizinden ve tahmin yapmaktan bahsediyor. Regresyon çok önemli ve değerli bir teknik, bu doğru, ancak sayılarla düşünüp, 'süper hesap uzmanı' ve daha zeki olmaya çalışırken kullanabileceğimiz başka teknik kalmadı mı?

- Kitaptaki Bayes teoremi çok daha iyi anlatılabilirdi. Bir örnek için bkz. 'An Intuitive Explanation of Bayes’ Theorem'

- Yazar kitabın sonlarına doğru "sondaki notlardan daha detaylı olarak bazı bilgileri ögrenebilirsiniz," diyor ancak kitabın sonunda ben bir notlar bölümü göremedim, sadece teşekkürler bölümü vardı. Acaba yazar mı unuttu, Türkçeye çevirip basan mı, bilemiyorum. Bu epey rahatsız edici bir durum.

- Anekdot okumak keyifli olabilir ama bazı şeyleri temcit pilavi gibi ısıtıp ısıtıp öne sürmek, sadece bir koleksiyonu okura boca etmek... Belki hedef kitle açısından uygun bir tarzdır ama (ya da acaba yazar aslen hukukçu olduğu için filan mi bu şekilde yazmaya alışkın?) temel fikirleri vermek o kadar da zor ve korkutucu olmasa gerek. 250 sayfalık kitap aslında 120 sayfa olarak yazılabilirdi.

- Kitabın sonlarına doğru bahsedilen 'Desk Set' filmi beni benden aldı, çocukken izlediğim çok eğlenceli bir film :) Filmdeki EMERAC bilgisayarı gerçekteki ENIAC'a gönderme olsa gerek. Çok eğlendim tekrar okurken :) (Her eleştiri olumsuz eleştiri olacak diye bir kural yok, değil mi? ;-))

- Kitapla ilgili beni memnun eden birkaç nokta daha: 'doğrudan ögrenme' gibi daha önce haberdar olmadığım bir öğrenme teorisinden haberdar oldum, tıp alanı ve bazı Internet araştırma şirketleriyle de ilgili birkaç şey öğrendim.

Kaynak: http://ileriseviye.org/blog/?p=1258

İlgili Yazılar

Python Paradoksu

FZ

Paul Graham, geçenlerde (2004 Ağustos'unda) kısa bir makale yazmış, bakalım ne demiş:

"Kısa bir süre önce gerçekleştirdiğim bir konuşmada pek çok insanı hayalkırıklığına uğratan bir laf ettim: Python tabanlı bir proje için bulabileceğiniz programcılar, Java tabanlı bir projeye çekebileceğiniz programcılardan daha zeki olacaktır.

Kast ettiğim Java programcılarının aptal olduğu değil. Kast ettiğim şey, Python programcılarının daha akıllı olduğu. Yeni bir programlama dilini sıfırdan öğrenmek çaba gerektirir. Ve insanlar Python'u yeni bir iş bulabilirler diye öğrenmiyorlar; insanlar Python'u öğreniyor çünkü gerçekten programlamayı seviyorlar ve halihazırda kullandıkları dillerden memnun değiller.

Aşık Olacağınız Paylaşım Şekli: shfs

pismikrop

shfs için böyle bir başlık koydum çünkü ben aşık oldum. Artık elimdeki tüm sunucuları güvenli bir şekilde klasörlerimin içine bağlayıp eş-zamanlı iş yapabilirim. Ve iptables'ta tek izinli port ile.

Uzaktaki sunucuda ortak çalışma için öncelikle nfs'i denedik. NFS yerel ağda bir harikaydı. Ama uzaktan erişimi oldukça yavaş ve güvensizdi. Daha güvenli bir paylaşım için shfs biçilmiş bir kaftan. portmap, rpc gibi ek hizmetler gerektirmeyen harika bir paylaşım ortamı.

shfs için sunucu tarafındaki malzemelerimizi sayıyorum: bir adet ssh sunucusu :) istemci tarafındaki malzemelerimiz ise güncel çekirdek sürümünüze ait kernel başlıkları, shfs utils, shfs-source, gcc, module-assistant

Şimdi Debian GNU/Linux ile (ki ben Ubuntu kullanıyorum :) kuruluma sıra geldi...

Versiyon Yönetim Sistemi Olarak SVN Kurulum ve Kullanımı

anonim

Açık kod camiasında en çok tercih edilen versiyon yönetim sistemleri (VYS) Concurrent Versions System(CVS) ve Subversion(SVN)'dir. VYS'leri sadece programların kaynak kodlarını yönetmek için değil ihtiyaçlarımıza ve hayal gücümüze bağlı olarak farklı birçok yerde kullanabiliriz. Mesela geçen günlerde okuduğum makalede bir GNU/Linux sistemde home dizininin nasıl başarıyla yıllardır CVS/SVN'de tutulduğu anlatılıyordu.

Matrix ve Felsefe

FZ

Sizin de kafanız Keanu Revees gibi Matrix'ten sonra karıştıysa bu kitap kesinlikle sizin için yazılmış. Eğer film kafanızı karıştırmadıysa, hemen bir doktora görünün. Matrix'i henüz seyretmediyseniz, o zaman bu kitabı mutlaka okumalısınız. Böylece bu filmin insanlar için neden o kadar önemli olduğunu bulursunuz.

Zemberek Nasıl Çalışır? 1. Bölüm: Sözlük ve Kök Ağacı

FZ

Zemberek bir kelimenin Türkçe olup olmadığına nasıl karar veriyor? Bu basit sorunun cevabı "verilen bir kelimeyi Türkçe kök ve eklerine ayırabilirseniz Türkçedir, ayıramıyorsanız değildir". Kısacası bir kelimenin Türkçe olup olmamasını anlamak için morfolojik analiz yapabilmelisiniz. Türkçe yazım denetimi yapabilmek için önceleri en sık kullanılan kelimelerin bir dosyaya konulup gelen kelimelerin o dosyadan kontrol edilmesi gibi ilk bakışta mantıklı görünen ama biraz inceleyince pratik olmadığı anlaşılan yöntemler de düşünülmüştü. Bu tür yöntemlerin yetersiz olan %98-99 doğrulukla çalışması için bile milyonlarca kelimeyi içermesi gerekir.

Makalenin devamı: http://zembereknlp.blogspot.com/2007/02/zemberek-nasl-alr-1szlk-ve-kk-aac.html