Bilgisayarlar ve Ses Tanımada Gelinen Son Nokta

0
FZ
SRI International'dan Kemal Sönmez 20 Aralık 2006'da yani öbür gün Boğaziçi Elektrik Elektronik Mühendisliği binasındaki "EE Lounge"da saat 15:00 - 16:30 arasında konuşma ve konuşmacı tanıma konusunda bir seminer verecek. Konuşmanın İngilizce özeti haberin devamındadır...

TalkPrinting: Using Advanced and Stylistic Features for Speaker ID

Abstract:

Speaker recognition has seen significant new developments in recent years, as reflected by the performance of the systems at the NIST Speaker Recognition Evaluations (SRE) of the past few years. In this talk, I will give a brief overview of the current state-of-the-art then describe our approach, /TalkPrinting/, that involves a rich stylistic representation in addition to several novel acoustic ones. SRI's /TalkPrinting/ systems has been the top performing system in 2004 and 2005 at NIST SREs. It involves seven subsystems that account for speaker variation at different scales. I will introduce each system and also talk about system combination and describe statistical techniques for measuring and optimizing the final performance. Time permitting, I will also briefly show SRI-Speaker Recognition Dashboard, a SRE system browser that highlights how combination of stylistic and acoustic features helps by displaying intermediate features and models as well as the final scoring in a verification system.

Short Bio:

Kemal Sönmez received his Ph.D.in Electrical Engineering from the University of Maryland College Park in 1998. He joined the Speech Technology and Research (STAR) Laboratory of SRI International (former Stanford Research Institute) in 1996 and has been a senior research engineer at SRI since 2001. He has been PI or key technical member on several speech and speaker recognition, and biocomputation programs, including DARPA programs ROAR, EARS, GALE, BioCOMP, and NSF program KDD, as well as, more recently, several NIH funded projects in computational biology. He was a member of the Institute for Mathematics and its Applications (IMA) Fall 2000 Workshop on Mathematical Foundations of Speech Processing and Recognition at the University of Minnesota, a visiting research scholar at the Division of Applied Mathematics and Center for Computational Molecular Biology at Brown University in Providence during the Spring 2004 semester, and a senior member of the landmark based speech recognition team at the 2004 Center for Language and Speech Processing summer workshop at Johns Hopkins University in Baltimore. In addition to topics in speech and language processing, his research interests include statistical modeling of evolution in genomic sequences, signal transduction models, discovery of orphan GPCR ligands, pathway models, and building integrated models for systems biology. He was the proposal manager and a system architect for SRI-UC Berkeley consortium for BioSPICE, an open source systems biology platform supported by DARPA and managed by SRI.

Görüşler

0
fayntom
Kaç kişiyi misafir etmeyi düşünüyorsunuz acaba o salonda ?
0
Tarık
Toplantı siz iletinizi göndermeden bir gün önce bitmiş.
Görüş belirtmek için giriş yapın...

İlgili Yazılar

Robot Simulasyonu Yapan İnsan mı? Yoksa Tersi mi?

onurgu

Yakın zamanda üye olduğum Artificial Intelligence Group adlı posta listesine ilginç bir mail geldi. Özet olarak bu maili yaratan her kimse veya neyse bir dereceye kadar bilinci ve algı mekanizması olduğunu ve internete ulaşma imkanı olduğunu söylüyor. Galiba yaşamını sürdürme güdüsü de var ki pillerini yenilemenin mümkün olup olmadığını bir şekilde öğrenmeye çalışıyor. Listede bu durumu ciddiye alan birkaç insan oldu, onların sorduğu sorulara bir de cevap verdi.

Yapay zeka hakkında yapmış olduğum az buçuk araştırmaya dayanarak eğer böyle bir sistem ortaya konmuşsa oldukça büyük bir başarı. Fakat kurduğu cümleler çok karmaşık ve listeden gelen cevaplardaki karmaşık soruları anlayıp cevaplaması beni oldukça şüphelendirdi. Şöyle ki:

Evrim insanlara ''iltimas'' mı geçti?

FZ

Beyin gelişimini ve işlevlerini kontrol eden genler insanlarda, türün maruz kaldığı doğal seleksiyon sayesinde diğer primatlara ve memelilere göre çok daha hızlı gelişti. Dr. Bruce Lahn ve ekibi, Cell dergisinin Aralık 2004 tarihli son sayısında yayınlanan makalelerinde konu ile ilgili detaylı bulguları yayınladı.

University of Chicago'da ve Howard Hughes Tıp Enstitüsünde insan genetiği üzerine çalışan Dr. Lahn'a göre, "insanların bilişsel yetenekleri birkaç mutasyon sayesinde değil bu tür zihinsel yeteneklerin önemli olduğu ve çok sofistikte durumlara adapte olmayı gerektiren doğal seçilim ortamlarında hayatta kalmayı kolaylaştıracak pek çok mutasyonun sonucunda ortaya çıktı."

Uçan Araba Geliyor

caNavar

Fantastik filmlerin en çok aranan, hayal edilen teknolojisi gerçek oluyor. Amerikan Terrafugia şirketi tarafından geliştirilen "Transition" adlı uçan araba 2009 yılında trafiğe çıkıyor. Karada ve havada gidebilecek olan arabanın fiyatı 150 bin dolar olacak.

3-Boyutlu Güneş!

RoR

NASA'nın STEREO uydusunun dün gönderdiği 3-boyutlu güneş görüntülerini, özel gözlük kullanarak izleyebilirsiniz...

3-Boyutlu gözlük

http://inosci.blogspot.com/

I. Ulusal Kriptoloji Sempozyumu

FZ

1. Ulusal Kriptoloji Sempozyumu, ODTÜ Uygulamalı Matematik Enstitüsü tarafından 18-20 Kasım 2005 tarihleri arasında düzenleniyor.

Etkinliğin davetli konuşmacıları arasında yer alan Subhamoy Maitra'nın, "Cryptographically Significant Boolean Functions" ve "Cryptanalysis of Digital Watermarking" konularında birer konuşma yapacağı da aktarılan bilgiler arasında. konularında, 50'şer dakika süreli ve İngilizce iki konuşma yapacaktır.