Google bu kadar mı taciz edilir! :(

0
FZ
Geçen hafta bir dostumun ağabeyinin yüksek lisans tezini Internet´e yerleştirmiş ve burada haberini geçmiştim (http://www.fazlamesai.net/modules.php?name=News&file=article&sid=2349). Sonra da arkadaşımın sorması üzerine ona açıklama yapmıştım Google anında yakalar bu yeni belgeyi, PDF´nin de içini açar okur, indeksler filan. Birkaç gün önce Google´a baktığımda ve "veri zarflama" anahtar sözcüklerini arattığımda gerçekten de ilk sayfada ilgili tezin ve bağlantılı linklerin geldiğini gördüm. Arkadaşıma da söyledim, sevindi filan. Ancak bugün baktığımda beni dumura uğratan bir durumla karşılaştım!
13 Eylül 2004 tarihi itibari ile Google´da "veri zarflama" aratınca (http://www.google.com/search?q=veri+zarflama) evet, ilgili tez de geliyor ilk sayfada ama Google´ın ilk döndürdüğü sonuç şöyle bir şey: http://veri-zarflama-analizi.ki.espero-site.com/ Gidip bakmanıza gerek yok, ne olduğunu ben söyleyeyim bir prn0 sitesi! Alan adında veri-zarflama geçen bir prn0 sitesi. Var mı böyle bir şey arkadaş dedim, bir yaşıma daha girdim. Bir arama motoru bu kadar mı taciz edilebilir, bir algoritma bu kadar mı suistimal edilir dedim. (Ofisteki programcı arkadaşlardan birine söylemiştim, tabii o esnada haberim yoktu, aç bir Google´a falancaya bak demiştim, arkadaşım, "vaaay, bu veri zarflama analizi çok güzel bir konuymuş ben de ilgilenmek istiyorum" deyince kıllandım tabii! Sonra da duruma uyandık ;-)

Son söz: Bunun önüne geçmenin bir yolu var mıdır?

Görüşler

0
pirx
Nasıl engellenir onu bilemiyorum ama, işin ilginç yanı adamların alan adında "veri-zarflama" kelimesi yok. Tamamen başka bir kelime. Nasıl oluyorda aranan kelimeden dönen sonuca kendi alan adını ekleyip yönlendiriyor hayret doğrusu. İlk defa karşılaştım bu tip bir durumla.
0
pirx
Bu arada espero-site diye aradım ve bu garip yönlendirmeden nasibini almış pek çok kelimeyle karşılaştım. "bebekler" veya "kısa-mj" gibi.

Bu nasıl bir hinliktir yarabbi. Benim anlamadığım, bu malum içerikli sitelerin hiti artsa ne olacak? Hitine göre reklam alamazlar ya? Veya millet şans eseri siteye girip paralı üyelik sistemine mi kayıt olacaktır diye umuyorlar acaba?
0
abakana
Aaaa... Google' da bişiler ararken ek anahtar kelimeleriniz hazır!

(-xxx) -sex -cum

http://flcd.org/wordpress/index.php?p=53
0
FZ
Oktay biraderimiz çözmüş mevzuyu ;-)
0
murat09
Google nin arama algoritması çok da sağlıklı değil. Misal, siz leylekler üzerine içinde leylek kelimesi geçen ve kolay indexlenebilen (html uzantılı ve hızlı yüklenen mesela) bir site yapsanız, Google'da bunu indeksleyip arşivine alsa bile, eğer site isminizde (subdomainizde de olabilir bu) "leylek" kelimesi geçmiyorsa, içinde leylekler değil de kazlar olan bir siteyi sırf ismi leylekler.leylek.kazlar.com olduğu için arama sıralanmasında sizin o nadide ve güzel sitenizden daha üstlerde görüntüleyecektir.
Aynı örnek en son 23 Nisan Çocuk Bayramı'nda rezilötesi sitelerle karşılaşan ve bilgisayarına yüzlerce malware-spyware bulaşan Türk kullanıcıları içinde verilebilir.
Google her methedildiğinde maalesef kendi içindeki bu aptal arama algoritmasını düzelteceğine, Nasdaq'ta daha da yükselmeye uğraşıyor. http://www.fazlamesai.net/modules.php?name=News&file=article&sid=2365&mode=&order=0&thold=0 'ta "Editörün Notu: Google sessiz ve derinden evrensel bilgi işlem platformu olma yolunda ilerliyor. Amazon da benzer yolda. " demişsiniz. Google ve Amazon neticede birer TICARI firmadır. Bizim gözümüze Google nerdeyse her sitede reklam sokuyorsa, kendisine güvenen kullanıcıların ve bizimde beklediklerimizi vermek zorundadır. (Şahsi kanaatim Google'nin Büyük Biraderin ta kendisi olduğu yönündedir o ayrı mesele) Bu ne mi olabilir, arama algoritmasını anlayıp anlık sub-domain ler yaratan porno/spam sitelerinin bu beklentilerini boşa çıkaracak mantıklı bir arama algoritması kullanmak gibi.
Google algoritması düzelene kadar "Veri zarflama" için doğru arama sonuçları isterseniz şimdilik şu adresi verebilirim:
http://search.msn.com/results.aspx?FORM=MSNH&q=%22veri%20zarflama%22%20
0
malkocoglu_2
||sırf ismi leylekler.leylek.kazlar.com olduğu için
||arama sıralanmasında sizin o nadide ve güzel
||sitenizden daha üstlerde görüntüleyecektir.

Bu da yazilim algoritmasi acisindan mantikli degil mi?

||Google her methedildiğinde maalesef kendi
||içindeki bu aptal arama algoritmasını
||düzelteceğine,
||Nasdaq'ta daha da yükselmeye uğraşıyor.

Google'in arama algoritmasi oteki sirketlerden olan farkinin belkemigini olusturur. 80'lerdeki Hesapsal Ogrenim Teorisinden cikan Support for Vector Machines adli algoritmayi kullaniyorlar, ve bu algoritmayi iyilestirdiler... SVM, yapay ogrenimde en populer algoritmalardan biridir. Google'in da bilahere populer olmasinin sebebi teknolojileridir derim. "Aradigimizi daha rahat buluyoruz" diye insanlar google'i seciyorlar.

En son bahsedilen durumu yakindan incelemedim, fakat Internet'in yapisal eksiklerinden dogan bir durumun bu olayi yarattigi gibi bir ilk intibam var.

||Google ve Amazon neticede birer TICARI firmadır

.. ve bunun sonucu olarak serbest piyasa kurallari isleyecek, bu tip yakinmalar yeteri derecede karliliklarini etkilerse, teknik bir cozum bulunacaktir.

||Bizim gözümüze Google nerdeyse her sitede
||reklam sokuyorsa

Google'in kendi sitesindeki reklamlardan mi bahsediyor sunuz? Bu reklamlarin sayisi hala cok az. Ve bence hala siteyi gayet yalin bir sekilde tutmayi basariyorlar.

0
murat09
1- leylekler.leylek.kazlar.com un içinde leyleklerle ilgili bilgi olmadığı halde daha üstte görüntülenmesi güzel değil, FELAKET bir sonuçtur. Buna ister yazılım algoritması felaketi deyin, isterseniz saçmalık, sonuçta felaket derecede saçma sonuçlar doğurur.
2- '"Aradigimizi daha rahat buluyoruz" diye insanlar google'i seciyorlar' diyorsanız sizde Googlenin hatalarını başka hataları eleştirdiğiniz kadar objektifçe eleştirmelisiniz. Google SVM sinin hata vermesine yol açıyor diye kimsenin Internet'in ana yapısını değiştirmeye kalkmak için yola çıkacağını sanmıyorum.
3- Bilakis rekabet koşullarının rekabet edenlerin teknik donanımını geliştirmesine sebep verdiğini bildiğim için, serbest rekabet ve ticarete destek veririm.
4- Google reklamlarından bahsediyorum, Google'daki reklamlardan değil. Yani pek çok sitede üstte veya yanda küçük yazılarla sponsorlarına tıklattıran Google Ad-Sense'den.

Son olarak;
Google nin güzel dediğiniz ama olmayan domainleri listeleyen bozuk ve saçma algoritması yenilenmedikçe, BT sektöründe son kullanıcılara Google'yi internete çıkış noktası gösterme anlayışı artık değişmeli. Farkında mısınız bilmiyorum, browser adres çubuğuna 'www.leylekler.leylek.com' yazmak yerine Google arama kutusuna artık insanlar adres yazmaya başladı. E-Dönüşümde bu hiçte olumlu bir adım değil. Google Kıble değildir, lütfen -şahsi algılamayınız- hepimiz objektif davranalım.
0
malkocoglu_2
||leylekler.leylek.kazlar.com un içinde leyleklerle
||ilgili bilgi olmadığı halde daha üstte
||görüntülenmesi güzel
||değil, FELAKET bir sonuçtur

Eldeki teknolojinin sInIrlarini bilirseniz, daha gercekci seyler isteyebilirsiniz (bugun icin). Eger indeksleme islemini tamamiyle otomize etmek istiyorsaniz, gunumuzun yapay zeka teknoloji sInIrlari bunlardir. Tabii ki gelisme devam edecektir, ileride de daha iyisi olacaktir.

0
malkocoglu_2
Bir de::

Arama motorlari piyasasi, rekabetin oldukca iyi isledigi piyasalardan biri. Yeni baslayan sirketlere acik, yani piyasaya giris yapabilme (market penetration) diger yazilim sektorlere gore daha cabuk. Mesela isletim sistemi piyasasina giris zordur. Az sayida oyuncu vardir, ve o piyasaya yirtinsaniz bir centik zor atarsiniz; Cunku insanlarin masasinin, dizinin, vs ustunde duran bir seyi degistirmek pesindesiniz. Isiniz, bedavaya satmiyorsaniz, cok zor.

Fakat arama motorlari boyle degil. Kendine guvenen her babayigit makineleri kurar, matematigini, YZ, YO algoritmalarini carklarini kurar ve baslar indekslemeye... Iste BU PIYASA icinde begenilmeyen bir durum icin tek sirketi suclama tonlariyla yermek biraz acaiptir. Kaldi ki bahsettiginiz degisiklik bir acidan basit bir akilli tahmin (heuristic) eklemesi bile olabilir. Ama bahsettiginiz seklin dogru olup olmadigi (bence yanlis) niye yapilmadigi gibi konular, hele bahsettiginiz seviyede bu sekildeki bir piyasanin zirt diye duzeltebilecegi bir sey oldugu icin, niye yapilmamistir sorusunda "merak seviyesi kuskudan daha fazla" bir sekilde yaklasmak (bence) daha iyi olacaktir.


0
sundance
Tabi ki objektif davranalım.

92 yılından beri Internet'e giriyorum. O zamanların gopher bazlı search engineleri dahil olmak üzere Google'ın yaklaşımlarından herhangi birinde (usenet search, text ads, image browsing vs.) yarısı kadar başarılı olmuş bir başka arama motoru dahi göremedim.

Dahası bu yapılan işleri, düz piyasa mantığında (banner boyutları ile oynayarak, daha güzel görseller koyarak vs.) değil, gerçekten surf yapmayı minimum ölçüde etkileyecek (gerek bant genişliği, gerek ekranda yerleşim, gerekse hedef kitle yönelimi) şekilde "akıllı" yapmaları, benim Google'a saygı duymamın sebepleri. İsterseniz bunları tartışalım.

Hal böyleyken, search bar yerine google'ın içine url yazanlar varsa bu bence öncelikle onların salaklığı, sonra Google'ın başarısıdır.

Not: "Algoritmasını düzeltmektense Nasdaq'da değerini arttırmaya çalışıyor" Google'ın NASDAQ'da ne kadar süredir varolduğu ve böyle bir algoritmanın geliştirilmesi/düzeltilmesi gibi şeylerin ne kadar devasa işler olduğu gözönüne alınırsa objektiflikten uzak bir ifade. Bende hafifçe "ulan herkes bir Google da google tutturmuş" tepkisi içeriyor gibi geliyor.
0
FZ
Az önce arama sayfasının dibindeki `` Dissatisfied? Help us improve´´ bağına tıklayıp karşıma gelen forma şikayetimi yazdım. 24/48 saat içinde düzelirse takdir edeceğim adamları ;-)
0
bm
Wildcard DNS kayitlariyla yapiyorlar bunu. Malesef DNS protokolunde 'bu wildcard kayittan geliyor' diye haber vermnin yolu yok. Hatirlarsaniz ayni halti *.com icin Verisign da yemisti. Bir suru sacma sapan ismi deneyerek belki kaydin wildcard olduguna kanaat getirmek mumkun ama o da bu sefer normal kullanimdakilerin de zarar gormesi mevzu bahis oluyor.

Hangi kelime komabinasyonlarinin anahtar olarak google'da veya baska yerde arandigini bir sekilde ogreniyor olmali bu insanlar. Cunku o siteyi bir sekilde googlebot'a buldurmalari lazim. Acaba spyware mi kullaniyorlar yoksa proxy loglarini mi satin aliyorlar? (belki ikisi de). Belki arama motoru sirketleriyle baglantilari var?

0
bio
Muhtemelen spyware.

Sacma subdomain'ler deneyerek wildcard testi yapabilirler, ama kisa vadeli bir cozum olur. Bu durumda spammer'lar wildcard kullanmak yerine gercekten her subdomain'i DNS'e register etme yoluna giderler.

Belki Google'in sadece ikinci seviye alan adlarini indexleyip, subdomain'leri ve directory/dosya adlarini dikkate almamasi dusunulebilir.

Hatta ben Google'in yerinde olsam 20 kisilik bir ekip kurup 7/24 bu tur aramalar yaptirir, spam amacli wildcard domain'leri kara listeye alirim. Sonucta yapay zeka'nin limiti buysa, yapay olmayan zeka da var.

Görüş belirtmek için giriş yapın...

İlgili Yazılar

Eğitim Tasarımcısı Ne İş Yapar?

FZ

"Eğitim tasarımcısı (Instructional Designer) ülkemizde yeni yeni kullanılan, oysa yurtdışında uzun zamandır bilinen bir uzman türü. Öyle ki hayatını bir eğitim tasarımcısı olarak sürdüren Reuben Tozman, e-Magazine dergisinde yayınlanan “Yeni Nesil Eğitim Tasarımcıları” isimli bir makale kaleme almış. Ülkemizde daha tam olarak ne işle iştigal ettikleri bilinmezken, bazı coğrafyalarda eski tipte eğitim tasarımından vazgeçilmesi gerektiğine dair bir makele görünce, derhal bu makaleyi okuyup paylaşmak kaçınılmaz oldu.

Proje Yönetiminde Türkçe Paylaşım Merkezi

anonim

Proje Yönetimini konusunda Türkçe kaynak sıkıntısının önüne geçmek, öğrencisinden uzmanına dek bir paylaşım ortamı hazırlamak amacı ile açılan yeni bir site: PMboard.org

Skype 2.0 Beta Yayınlandı

wizzyfx

Skype 2.0 sürümü ile internet üzerinden ücretsiz video görüşme imkanı da sağlıyor. Şu anda windows için beta versiyonu hazır olan programın final sürümü için ise henüz bir tarih belli değil.

Buradan indirilebilir.

Internet, Dil, Sosyoloji

FZ

İnsan dilleri sürekli bir değişim içinde, binlerce yıllık süreçlerde bu mavi gezegende pek çok doğal dil ortaya çıktı, bir kısmı öldü, bir kısmı Baskça, Arnavutça gibi Avrupa'nın göbeğinde izole şekilde varlığını sürdürdü, bir kısmı da zenginleşerek ve diğer dillerle alışveriş halinde günümüze dek geldi.

Sanırım sıra Internet'in doğal dilleri etkilemesine geldi. Etik tartışmaların ötesinde ele alınması gereken, analiz gerektiren bir olgu yavaş yavaş kendini belli etmeye başlıyor.

Warner Bros ile amatör Harry Potter hayranları arasındaki telif savaşı

larweda

Harry Potter, J. K. Rowling'in çok satan fantazi serisi romanlarının baş kahramanı. Bir süre önce filmini çekmek üzere Harry Potter isminin ve kitaplarının telif haklarını satın alan Warner Bros, adresinde Harry Potter geçen amatör hayran sitelerini zorla ele geçirmeye çalıştı ancak geri adım atmak zorunda kaldı.