miércoles, 1 de febrero de 2012

Cantamela!: Propuesta formal

Roberto Martínez

Introducción
En los últimos años, el desarrollo de dispositivos móviles inteligentes ha ido avanzando a un paso relativamente rápido, este tipo de dispositivos a venido a revolucionar el campo de la computación y se han hecho populares en la población mexicana.

Actualmente el desarrollo de sistemas operativos móviles robustos dedicados especialmente a dispositivos con pantallas grandes totalmente táctiles, tienen un sin fin de aplicaciones especiales para utilizar el diferente hardware, por lo que tenemos un campo amplio de desarrollo para cubrir las necesidades e innovar con nuevas tecnologías.

Cantamela! vine a innovar a la sociedad mexicana con una aplicación completamente en español para el sistema operativo android, en donde una persona que desee el nombre de una canción simplemente con un toque en la pantalla, usted empieza tararear, cantar o poner cerca de una bocina su dispositivo para que el sistema después de un momento tenga una respuesta y así de fácil obtener el nombre de dicha canción.


Estado de arte
El reconocimiento de contenido de música, no es nada reciente, uno de los primeros servicios que ofrecía esto fue Shazam en el 2002, cabe mencionar que muchos de los avances hechos en este ámbito han sido dirigidos a detectar la infracción de derechos de autor o copyright.
Shazam

Dado el amplio contenido musical que ya existe, no es ninguna tarea trivial el reconocer una canción con sólo parte de ella, se han identificado muchas dificultades para hacer este reconocimiento, como por ejemplo las muchas maneras en que la música es codificada, o si son grabadas en diferentes bit rates que la original, además, se tiene que poder identificar sin importar la calidad de la grabación o la interferencia presente en el medio.

El software existente que reconoce una canción con sólo proveer una parte de ésta, crea una etiqueta denominada como firma o huella digital, la cual es única para cada canción y a través de ella se han creado bases de datos relacionales que facilitan el servicio. Así como hay muchas desventajas al analizar audio en tiempo real, también hay ventajas que facilitan la creación de esta firma digital, tales como el tempo, letra, tonos y ritmo de la canción, con los cuales se define la firma para dicha canción.

El proceso de identificación del algoritmo, es muy similar a la forma en la que los expertos forenses analizan una huella táctil de un sospechoso, pués la comparan con aquellas encontradas en la escena del crimen. En ambos casos, se buscan varios puntos de similitud entre las muestras y así se asegura la credibilidad del servicio.

Shazam al igual que soundhoud son un servicio que hace lo mencionado anteriormente y es soportado por dispositivos Android, iPhone, Blackberry, Nokia, Windows Phone y varios teléfonos Sony Ericcson, una vez que se encuentra la canción buscada en la base de datos, ofrece funcionalidades para ver detalles del artista, álbum, título, género, letra, una imagen del álbum y ligas para descargar la canción desde iTunes o la tienda Amazon MP3.




Midomi ofrece un servicio muy similar, pero en la web, te permite grabar un segmento de audio, para después hacer la búsqueda e identificación, su equivalente móvil es SoundHound. Otra alternativa de escritorio es AudioTag, excepto que se maneja no la grabación directamente, sino que se debe proporcionar un archivo que la contenga.

Existen otras aplicaciones que hacen el proceso de identificación sólo con proveer las notas de la canción, tal como lo hace musipedia, sin tomar en cuenta el tempo ni letra.

Volviendo al aspecto móvil, MusicID es otra aplicación desarrollada para varias plataformas (incluidas iPhone y Android), que ofrece la misma funcionalidad que Shazam y SoundHound, pero por supuesto, cuenta con su propia base de datos de firmas de canciones.

Este servicio de reconocimiento de audio, es ofrecido nativamente en Windows Phone (Mango) en el motor de búsqueda Bing, llamado Bing Music Search. Sin embargo, este servicio no es tan preciso como lo son Shazam y SoundHound, además de que al ser un servicio relativamente nuevo, cuenta con una base de datos más limitada. 

Tecnologías móviles relevantes.
En la siguiente tabla, mostramos un comparativo de los sistemas operativos más importantes.
Haz clic para agrandar

Por lo tanto, podemos ver que android es uno de los sistemas operativos más robustos en el mercado y que tenemos la facilidad con el usuario de llevarlo a diferentes plataformas, para que así puedan usar la aplicación, ya sea en su tablet o smartphone con una buena experiencia.

Nuestra propuesta.
Nuestra idea, es una aplicación completamente nueva en la cual utilizaremos tecnologías que sean libres para cualquier persona, ya que las que existen actualmente en el mercado necesitan de cuotas para obtener referencias de canciones, incluso algunas otras utilizan algoritmos patentados los cuales no se pueden utilizar.


Esperamos que para finales de mayo, con apoyo de librerías gratuitas y usando SDK del sistema operativo android,para poder utilizar lo que es la red wifi al igual que las redes 3g/4g, y el microfono del producto para así poder tener un producto que sea funcional al usuario.


Es un reto realizar una aplicación de esta magnitud, ya que como hemos hablado, hay empresas que llevan años desarrollando este tipo de tecnología, lo que nosotros proponemos es tomar con ayuda de APIs especializadas y así poder realizarlo.


Esperamos utilizar identificación de musica open-source, entre ellos hemos encontrado algunos como echoprint y otro proyecto parecido como MusicBrainz, los cuales estaremos probando durante el semestre.


Algo que tiene de relevante y por lo cual Cantamela! es diferente a las demás, es porque nuestro proyecto será de código abierto para que personas que lo quieran mejorar o estudiarlo, puedan hacerlo, algo que soundhound y shazam no lo tienen.




Referencias.

Autor desconocido. Shazam (service). Fecha de consulta: 31 de enero de 2012. <http://en.wikipedia.org/wiki/Shazam_%28service%29>
Bohbrink, Hannah. Can you name that tune? Song Recognition without Identification. Fecha de consulta: 31 de enero de 2012. <http://forum.davidson.edu/psy379/?p=1390>
K. David. Mango’s Music Search is OK But Doesn’t Trump Shazam. Fecha de consulta: 1 de febrero de 2012. <http://mobilitydigest.com/mangos-music-search-is-ok-but-doesnt-trump-shazam/>
Musipedia. Musipedia: The Open Music Encyclopedia. Fecha de consulta: 31 de enero de 2012. <http://www.musipedia.org/>
Owens, Brad. The Top 5 Sites to Find Song Lyrics Online. Fecha de consulta: 31 de enero de 2012. <http://www.makeuseof.com/tag/the-top-5-sites-to-find-song-lyrics-online/>
Strickland Jonathan. How Content-recognition Software Works. Fecha de consulta: 31 de enero de 2012. <http://computer.howstuffworks.com/content-recognition4.htm>
Stroh, Michael. Q&A: The story behind Music search. Fecha de consulta: 31 de enero de 2012. <http://windowsteamblog.com/windows_phone/b/windowsphone/archive/2011/06/08/q-amp-a-the-story-behind-music-search.aspx>

1 comentario:

  1. Me parece bien. Ojo con la puntuación y la ortografía ;) Pongo 10 puntos por este reporte.

    ResponderEliminar