Bilgisayarlar ve Ses Tanımada Gelinen Son Nokta

0
FZ
SRI International'dan Kemal Sönmez 20 Aralık 2006'da yani öbür gün Boğaziçi Elektrik Elektronik Mühendisliği binasındaki "EE Lounge"da saat 15:00 - 16:30 arasında konuşma ve konuşmacı tanıma konusunda bir seminer verecek. Konuşmanın İngilizce özeti haberin devamındadır...

TalkPrinting: Using Advanced and Stylistic Features for Speaker ID

Abstract:

Speaker recognition has seen significant new developments in recent years, as reflected by the performance of the systems at the NIST Speaker Recognition Evaluations (SRE) of the past few years. In this talk, I will give a brief overview of the current state-of-the-art then describe our approach, /TalkPrinting/, that involves a rich stylistic representation in addition to several novel acoustic ones. SRI's /TalkPrinting/ systems has been the top performing system in 2004 and 2005 at NIST SREs. It involves seven subsystems that account for speaker variation at different scales. I will introduce each system and also talk about system combination and describe statistical techniques for measuring and optimizing the final performance. Time permitting, I will also briefly show SRI-Speaker Recognition Dashboard, a SRE system browser that highlights how combination of stylistic and acoustic features helps by displaying intermediate features and models as well as the final scoring in a verification system.

Short Bio:

Kemal Sönmez received his Ph.D.in Electrical Engineering from the University of Maryland College Park in 1998. He joined the Speech Technology and Research (STAR) Laboratory of SRI International (former Stanford Research Institute) in 1996 and has been a senior research engineer at SRI since 2001. He has been PI or key technical member on several speech and speaker recognition, and biocomputation programs, including DARPA programs ROAR, EARS, GALE, BioCOMP, and NSF program KDD, as well as, more recently, several NIH funded projects in computational biology. He was a member of the Institute for Mathematics and its Applications (IMA) Fall 2000 Workshop on Mathematical Foundations of Speech Processing and Recognition at the University of Minnesota, a visiting research scholar at the Division of Applied Mathematics and Center for Computational Molecular Biology at Brown University in Providence during the Spring 2004 semester, and a senior member of the landmark based speech recognition team at the 2004 Center for Language and Speech Processing summer workshop at Johns Hopkins University in Baltimore. In addition to topics in speech and language processing, his research interests include statistical modeling of evolution in genomic sequences, signal transduction models, discovery of orphan GPCR ligands, pathway models, and building integrated models for systems biology. He was the proposal manager and a system architect for SRI-UC Berkeley consortium for BioSPICE, an open source systems biology platform supported by DARPA and managed by SRI.

Görüşler

0
fayntom
Kaç kişiyi misafir etmeyi düşünüyorsunuz acaba o salonda ?
0
Tarık
Toplantı siz iletinizi göndermeden bir gün önce bitmiş.
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Hayvanlar Alemi MATRIX'de Yaşıyor!

darkhunter

Tavuk çiftliklerinde hayvanlara daha üretken olmaları için mutluluk hormonu verildiğini biliyor musunuz ? Peki ya kapalı alanlarda yaşayan hayvanlara, kendilerini açık alanda hissetmelerini sağlayacak bir çip takıldığını ve konunun teknik boyutunun sorun olmaktan çıkıp ahlaki boyutu üstüne tartışmaların başladığını biliyor musunuz ?

Konunun ahlaki boyutu tartışmaya açık. Nitekim bazı bilim adamları hayvanın kendisini mutlu hissetmesinin, kandırılmasından daha önemli olduğunu ve üretim açısından daha verimli sonuçlar doğurduğunu söylüyor.

Peki ya aynı şey bir gün insanlara da uygulanırsa... Mutlu olmak, kandırılmaktan daha mı önemli ?

There is no spoon neo...

Bilgisayarlar Yabancı Dil Öğrenebilecek Mi?

vst

İnsan zekasının gizli saklı ve en karmaşık işlem sürecine sahip olduğu bilinen dil öğrenme konusunda gelişmeler var. /.ta yer alan habere göre Amerikalı ve İsrailli bilim adamlarının çalışması şöyle: Bilgisayar İngilizce ve Çince olarak verilen iki metini okuyor ve altında yatan dil bilgisi kurallarını çıkartıyor. Bu kurallar daha sonra anlamlı cümleler kurmak için kullanılabiliyor. Aynı yöntem müziğe ve protein dizilerine özgü yapılarının çıkartılmasında da kullanılabiliyor.

50 dilde yayın yapan bir Fazlamesai.net olsaydı ne iyi olurdu... (Birkaç sene sonra bu yazıyı Almanca okurmuşuz :)

Gelecek buzul çağı 15 bin yıl sonra

e2e

"Bilim adamları Antartika’da bir buzulu 3 km delerek, buzul köküne ulaştılar. Bu derinlikte ısının son 740 bin yılda hiç değişmediği belirtildi. Buzul kökünde yapılan araştırmalara göre, buradaki ısı yeryüzünde sürekliliği en eskiye dayanan ısı derecesi. Bu süre zarfında, atmosfer çeşitli değişikliklerden geçerken, yeryüzü de 8 ayrı buz çağları yaşamıştı."

Kaynak: NTV MSNBC

Zipf Yasası, Dilbilim, Müzik

FZ

Arjantinli fizikçi Damian H. Zanette dilbilim bağlamında incelenmiş ”Zipf Yasası“nı müzik analizine uygulamış ve dil ile müzik arasında önemli ortak bir nokta bulduğunu iddia ettiği makalesini yayınlamış. Makalenin haberine buradan, orjinaline ise buradan erişebilirsiniz.

Zanette´nin analizi “bağlam” kavramını dil ile müzik arasında ortak bir kavram olarak ele alıyor ve böylece tonal müzikle atonal müzik arasındaki psikolojik (ve semantik) farkı açıklamaya çalışıyor.

Kaynaklar: FZ Blogs, slashdot

İnsan Zihni Sayısal Mı Analog Mu?

FZ

İnsan zihninin bir bilgisayar gibi ayrık süreçler halinde çalıştığı teorisi bilişsel bilimdeki önemli paradigmalardan biridir. Cornell Üniversitesi'nde son gerçekleştirilen çalışmalardan birine göre ise insan zihninin çalışması biyolojik organizmalar gibi: gri alanlar arasında geçiş yapan dinamik bir süreklilik.

Proceedings of the National Academy of Sciences'ın son sayısında yer alan, Cornell'de çalışan psikodilbilimci Michael Spivey'in önderliğinde gerçekleştirilen çalışmada lisans öğrencilerine bazı sözcükler söylenip ekranda bunların resimleri gösterildi ve fareyi kullanarak doğru resmi seçmeleri istendi, ardından da benzer sözcük durumunda öğrencilerin fare hareketlerinin izleri takip edildi. Bu çalışma, dil anlamanın ayrık değil sürekli olduğuna dair önemli bulgular içeriyor.